Unidad 2 Paso 4 - Descripción de la Información PDF

Title Unidad 2 Paso 4 - Descripción de la Información
Author Wilbert Beltran Palomino
Course Estadística
Institution Universidad Nacional Abierta y a Distancia
Pages 47
File Size 3.2 MB
File Type PDF
Total Downloads 6
Total Views 212

Summary

Warning: TT: undefined function: 32TRABAJO COLABORATIVOUnidad 2: Pasó 4. Descripción de la informaciónEstudiantesWilberto Beltrán PalominoCódigo: 8164620Alison Daniela RodríguezCódigo: 1053821165Erika Alejandra Arroyave ArredondoCódigo: 1039760468Edgar Fernando Garzón Arias.Código: 1058846517Grupo d...


Description

TRABAJO COLABORATIVO Unidad 2: Pasó 4. Descripción de la información Estudiantes Wilberto Beltrán Palomino Código: 8164620 Alison Daniela Rodríguez Código: 1053821165 Erika Alejandra Arroyave Arredondo Código: 1039760468 Edgar Fernando Garzón Arias. Código: 1058846517

Grupo del curso 100105_415 Presentado a Marbe Alexandra Cardona

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA 28 de noviembre de 2018 1

INTRODUCCIÓN El presente trabajo colaborativo tiene un alcance para todos los integrantes del grupo colaborativo 100105_415 se realizan ejercicios, realización e interpretación de gráficos con conocimientos referente a las medidas de regresión y correlación lineal simple con variable cualitativas que están relacionadas con el caso estudio de base de datos Calidad en el servicio de urgencias 2018. Medidas de regresión- En estadística, el análisis de la regresión es un proceso estadístico para estimar las relaciones entre variables. Incluye muchas técnicas para el modelado y análisis de diversas variables, cuando la atención se centra en la relación entre una variable dependiente y una o más variables independientes Correlación lineal simple- Relación entre dos variables cuantitativas y además una de ellas puede considerarse como variable dependiente o “respuesta” podemos considerar el uso de la regresión lineal simple. Con la regresión, aparte de medir el grado de asociación entre las dos variables, podremos realizar predicciones de la variable dependiente.

2

JUSTIFICACIÓN En la actualidad la gran mayoría de trabajos e investigaciones se valen de datos estadísticos para emitir conceptos, realizar estudios y tomar decisiones, por tanto es importante conocer la forma en la que se realizan estos y como se dan esos análisis. Además de la realización, es de tener en cuenta también la forma en la que la información llega al público o en efecto a los usuarios finales que puede ser una nación, un departamento, una empresa o un simple grupo de personas que necesitan información sobre algunas variables. Es así que en el presente informe se realizan algunos ejercicios donde se aplican diferentes elementos estadísticos como la creación de gráficas y análisis, mediante el uso de una herramienta informática amigable con el usuario y que permite trabajar con una alta cantidad de datos, que a pesar de su antigüedad sigue siendo muy usada en todos los niveles académicos y profesionales, es por tanto que la herramienta Excel de la Suite de Microsoft es útil para estos análisis y nos permite entender de una forma diferente una gran cantidad de números y datos.

3

OBJETIVOS El objetivo principal de esta actividad es detallar y relacionar variables, para realizar un buen análisis e interpretación de las posibles tendencias que tengan estas a futuro. Afianzar la creación de graficas de dispersión con diferentes variables y entenderlas, logrando así la observación de diferentes elementos que estas nos aportan. Examinar por medio de la correlación la dirección y la fuerza de la asociación entre dos variables cuantitativas. Así conoceremos la intensidad de la relación entre ellas y si, al aumentar el valor de una variable, aumenta o disminuye el valor de la otra variable. Utilizar la regresión lineal para cuantificar la relación que puede ser observada cuando se grafica un diagrama de puntos dispersos correspondientes a dos variables. Buscar la correlación de dos variables para mirar tendencias para solucionar problemas. Aplicar las diferentes medidas adimensionales, trabajar con ellas y saber cómo calcularlas e interpretarlas. Interpretar los resultados obtenidos y brindar una solución a los restos planteados en este trabajo. Describir por medio de la regresión como es la relación entre dos variables, de tal manera que incluso se pueden hacer predicciones sobre una vs la otra.

4

REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE ESTUDIANATE: Wilberto Beltrán Variable Variable X Y EDAD Peso (kg) 3 12,50 31 60,00 62 72,50 64 58,00 4 16,50 65 57,60 55 78,60 1 5,20 18 53,80 42 45,80 23 60,20 8 19,70 71 62,70 53 78,60 20 52,70 2 8,90 73 70,00 25 80,90 35 78,90 5 15,90 24

56,00

23 19 54 19 21 56 43 5 21

52,90 78,50 85,80 65,20 60,00 67,20 85,00 24,50 65,40 5

54 51 26 22 0 26 73 85 7 16 52 4 20 68 54 44 3 81 20 40 40 0 61 23 34 31 17 3 59 19 0 44 75 75 82 33 39 23 37 48

60,60 85,00 57,30 67,90 2,60 75,30 45,20 50,20 23,00 45,00 65,70 16,70 60,50 57,80 60,30 78,50 15,30 65,20 65,60 78,40 57,90 3,40 58,30 56,80 60,00 72,00 58,60 14,20 65,70 60,80 3,10 85,00 60,80 55,90 70,00 73,80 78,50 67,20 67,20 58,80 6

50 94 17 55 59 23 87 34 24 1 19 25 5 24 0 52 24 2 49 68 5 37 54 26 1 33 0 21 13 23 39 19 24 45 57 51 17 26 16 22

62,30 70,20 54,90 78,10 62,90 65,00 62,90 72,90 61,60 9,70 64,30 58,90 18,30 56,90 3,10 45,80 68,90 11,90 65,90 78,00 16,90 85,80 67,20 63,20 9,40 72,90 3,90 63,80 30,50 52,60 85,90 67,90 58,20 55,00 60,50 87,50 55,20 70,00 45,90 54,00 7

25 55 23 58 48 39 36 60 47 17

60,80 65,80 70,80 78,60 87,20 79,50 72,90 67,50 58,20 64,30

Diagrama de dispersión:

Peso

Diagrama de Dispersión 100.00 90.00 80.00 70.00 60.00 50.00 40.00 30.00 20.00 10.00 0.00

y = 0.6007x + 35.544 R² = 0.3749

Peso (kg) Linear (Peso (kg))

1

11

21

31

41

51

61

71

81

91

Edad

Tipo de asociación de las variables

Modelo matemático

En el gráfico de dispersión, los puntos tiene forma ascendente y por tanto la recta que se ajusta tiene una pendiente positiva. EDAD

Peso (kg)

XY

X2

3 31 62 64 4

12.50 60.00 72.50 58.00 16.50

37.5 1860 4495 3712 66

156.25 3600 5256.25 3364 272.25

8

65 55 1 18 42 23 8 71 53 20 2 73 25 35 5 24 23 19 54 19 21 56 43 5 21 54 51 26 22 0 26 73 85 7 16 52 4 20 68 54 9

57.60 78.60 5.20 53.80 45.80 60.20 19.70 62.70 78.60 52.70 8.90 70.00 80.90 78.90 15.90 56.00 52.90 78.50 85.80 65.20 60.00 67.20 85.00 24.50 65.40 60.60 85.00 57.30 67.90 2.60 75.30 45.20 50.20 23.00 45.00 65.70 16.70 60.50 57.80 60.30

3744 4323 5.2 968.4 1923.6 1384.6 157.6 4451.7 4165.8 1054 17.8 5110 2022.5 2761.5 79.5 1344 1216.7 1491.5 4633.2 1238.8 1260 3763.2 3655 122.5 1373.4 3272.4 4335 1489.8 1493.8 0 1957.8 3299.6 4267 161 720 3416.4 66.8 1210 3930.4 3256.2

3317.76 6177.96 27.04 2894.44 2097.64 3624.04 388.09 3931.29 6177.96 2777.29 79.21 4900 6544.81 6225.21 252.81 3136 2798.41 6162.25 7361.64 4251.04 3600 4515.84 7225 600.25 4277.16 3672.36 7225 3283.29 4610.41 6.76 5670.09 2043.04 2520.04 529 2025 4316.49 278.89 3660.25 3340.84 3636.09

44 3 81 20 40 40 0 61 23 34 31 17 3 59 19 0 44 75 75 82 33 39 23 37 48 50 94 17 55 59 23 87 34 24 1 19 25 5 24 0 10

78.50 15.30 65.20 65.60 78.40 57.90 3.40 58.30 56.80 60.00 72.00 58.60 14.20 65.70 60.80 3.10 85.00 60.80 55.90 70.00 73.80 78.50 67.20 67.20 58.80 62.30 70.20 54.90 78.10 62.90 65.00 62.90 72.90 61.60 9.70 64.30 58.90 18.30 56.90 3.10

3454 45.9 5281.2 1312 3136 2316 0 3556.3 1306.4 2040 2232 996.2 42.6 3876.3 1155.2 0 3740 4560 4192.5 5740 2435.4 3061.5 1545.6 2486.4 2822.4 3115 6598.8 933.3 4295.5 3711.1 1495 5472.3 2478.6 1478.4 9.7 1221.7 1472.5 91.5 1365.6 0

6162.25 234.09 4251.04 4303.36 6146.56 3352.41 11.56 3398.89 3226.24 3600 5184 3433.96 201.64 4316.49 3696.64 9.61 7225 3696.64 3124.81 4900 5446.44 6162.25 4515.84 4515.84 3457.44 3881.29 4928.04 3014.01 6099.61 3956.41 4225 3956.41 5314.41 3794.56 94.09 4134.49 3469.21 334.89 3237.61 9.61

52 24 2 49 68 5 37 54 26 1 33 0 21 13 23 39 19 24 45 57 51 17 26 16 22 25 55 23 58 48 39 36 60 47 17 4083

45.80 68.90 11.90 65.90 78.00 16.90 85.80 67.20 63.20 9.40 72.90 3.90 63.80 30.50 52.60 85.90 67.90 58.20 55.00 60.50 87.50 55.20 70.00 45.90 54.00 60.80 65.80 70.80 78.60 87.20 79.50 72.90 67.50 58.20 64.30 6718

2381.6 1653.6 23.8 3229.1 5304 84.5 3174.6 3628.8 1643.2 9.4 2405.7 0 1339.8 396.5 1209.8 3350.1 1290.1 1396.8 2475 3448.5 4462.5 938.4 1820 734.4 1188 1520 3619 1628.4 4558.8 4185.6 3100.5 2624.4 4050 2735.4 1093.1 267091

𝒚 = 𝟎. 𝟔𝟎𝟎𝟕𝒙 + 𝟑𝟓. 𝟓𝟒𝟒 R2

0.3749 11

2097.64 4747.21 141.61 4342.81 6084 285.61 7361.64 4515.84 3994.24 88.36 5314.41 15.21 4070.44 930.25 2766.76 7378.81 4610.41 3387.24 3025 3660.25 7656.25 3047.04 4900 2106.81 2916 3696.64 4329.64 5012.64 6177.96 7603.84 6320.25 5314.41 4556.25 3387.24 4134.49 437809

R Confiabilidad

0.6122 37.5% EL R2 indica que el modelo del grafico explica el 37.5% de la información y el valor de r afirma el peso está relacionado en un 61% con la edad.

% de explicación Grado de relación

61%

Análisis e interpretación de resultados Aunque el grafico solo explica el 37.5% de la información, podemos decir que el peso de 73 pacientes que ingresaron a urgencia según los datos de la tabla de Excel es inversamente proporcional a la edad que tienen, es decir que a mayor edad mayor peso; 47 pacientes arrojan datos dudosos sobre su peso o edad, ya que estadísticamente no tienen relación. Se debe verificar esta última información. Estudiante: Edgar Fernando Garzón Arias. TIEMPO ESPERA PARA TRIAGE ( MINUTOS) 150 178 120 357 110 345 190 35 187 126 346 124 156 245 187 45 248 368 156 128

EDAD 3 31 62 64 4 65 55 1 18 42 23 8 71 53 20 2 73 25 35 5 12

198 225 216 120 234 210 338 287 110 342 246 180 243 159 128 176 190 132 90 196 210 130 65 98 128 245 86 112 196 112 223 58 192 145 196 112 223 58 192 145

24 23 19 54 19 21 56 43 5 21 54 51 26 22 0 26 73 85 7 16 52 4 20 68 54 44 3 81 20 40 40 0 61 23 34 31 17 3 59 19 13

35 156 187 198 210 287 159 90 210 86 58 145 150 178 120 357 110 345 190 35 187 126 346 124 156 245 187 45 248 368 156 128 198 225 216 120 234 210 338 287

0 44 75 75 82 33 39 23 37 48 50 94 17 55 59 23 87 34 24 1 19 25 5 24 0 52 24 2 49 68 5 37 54 26 1 33 0 21 13 23 14

110 342 246 180 243 159 128 176 190 132 90 196 210 130 65 98 128 245 86 112

39 19 24 45 57 51 17 26 16 22 25 55 23 58 48 39 36 60 47 17

Tiempo de espera VS edad 400 Tiempo de espera

350 300

y = 0.5698x + 159.47 R² = 0.0266

250 200

Series1

150

Linear (Series1)

100 50 0

0

20

40

60

80

edad

15

100

Las dos variables no guardan una relación tan definida, excepto para algunos casos en los que las edades más bajas y las más altas guardan una relación en cuanto a los bajos tiempos de atención, eso se puede explicar ya que estas edades son vulnerables y por consiguiente requieren una mayor atención por parte de las entidades prestadoras de salud.

Tipo de asociación de las variables

El modelo que permite predecir el efecto es aplicando la ecuación de la recta pero no es muy confiable, ya que el valor de r2 corresponde a un valor muy bajo y por tanto alejado de 1.

Modelo matemático

R2 R Confiabilidad

0,0266 0,163 R2=0,0266 X 100= 2,66% El porcentaje correlación de explicación es de un 80% 0,163

% de explicación Grado de relación

Estudiante: Erika Alejandra Arroyave Arredondo.

Variable (x) Variable (y)

TIEMPO ESPERA ESTATURA PARA (M) TRIAGE ( MINUTOS) 35

0,45 16

45 58 65 86 90 98 110 112 120 124 126 128 130 132 145 150 156 159 176 178 180 187 190 192 196 198 210 216 223 225 234 243 245 246 248 287 338 342 345 346

0,47 0,53 0,57 0,65 0,73 0,76 0,82 0,85 0,86 0,96 0,98 1 1,03 1,06 1,1 1,16 1,18 1,14 1,5 1,51 1,52 1,53 1,55 1,56 1,57 1,58 1,59 1,6 1,61 1,62 1,63 1,64 1,65 1,66 1,67 1,68 1,69 1,7 1,71 1,72 17

357 368

1,73 1,74 1,75 1,76 1,78 1,79 1,8 1,81 1,86

Diagrama de dispersión:

Tiempo espera para triage VS minutos 2.5 y = 0.0042x + 0.494 R² = 0.8023

Estatura (M)

2 1.5

Series1

1

Linear (Series1) 0.5 0 0

100

200

300

400

Tiempo espera para triage (minutos)

Si hay corrección entre las dos variables, siguen una misma dirección ascendente tienen una correlación con dirección positiva lineal de tendencia reta.

Tipo de asociación de las variables

El modelo matemático que permite predecir el efecto de una variable sobre la otra es Y=a+bx; Y=0,0042x + 0,494 R2=0,8023 Se puede asegurar que la ecuación de la recta es confiable porque el R2 está cerca a uno

Modelo matemático

18

R2 R Confiabilidad

0,8023 0,895 R2=0,8023 X 100= 80,2% El porcentaje correlación de explicación es de un 80% 80%

% de explicación Grado de relación

Análisis e interpretación de resultados El porcentaje correlación de explicación es de un 80% lo que explica que el tiempo (minutos) en espera Triage de las personas en urgencias es proporcional o igual para todos sin importar su estatura (M).

Estudiante: Alison Daniela Rodríguez Variable Y: Peso (Kg) Variable X: Edad

EDAD

Peso (kg)

3 31 62 64 4 65 55 1 18 42 23 8 71 53 20

12,50 60,00 72,50 58,00 16,50 57,60 78,60 5,20 53,80 45,80 60,20 19,70 62,70 78,60 52,70 19

2 73 25 35 5 24 23 19 54 19 21 56 43 5 21 54 51 26 22 0 26 73 85 7 16 52 4 20 68 54 44 3 81 20 40 40

8,90 70,00 80,90 78,90 15,90 56,00 52,90 78,50 85,80 65,20 60,00 67,20 85,00 24,50 65,40 60,60 85,00 57,30 67,90 2,60 75,30 45,20 50,20 23,00 45,00 65,70 16,70 60,50 57,80 60,30 78,50 15,30 65,20 65,60 78,40 57,90

0 61 23 34 31

3,40 58,30 56,80 60,00 72,00 20

17

58,60

3 59 19 0 44 75 75 82 33 39 23 37 48 50 94 17 55 59 23 87 34 24 1 19 25 5 24 0 52 24 2 49 68 5 37 54 26 1 33 0

14,20 65,70 60,80 3,10 85,00 60,80 55,90 70,00 73,80 78,50 67,20 67,20 58,80 62,30 70,20 54,90 78,10 62,90 65,00 62,90 72,90 61,60 9,70 64,30 58,90 18,30 56,90 3,10 45,80 68,90 11,90 65,90 78,00 16,90 85,80 67,20 63,20 9,40 72,90 3,90 21

21 13 23 39 19 24 45 57

63,80 30,50 52,60 85,90 67,90 58,20 55,00 60,50

51

87,50

17 26 16 22 25 55 23 58 48 39 36 60 47 17

55,20 70,00 45,90 54,00 60,80 65,80 70,80 78,60 87,20 79,50 72,90 67,50 58,20 64,30

Diagrama de dispersión:

22

Tipo de asociación de las variables

Modelo matemático

R2 R Confiabilidad

% de explicación Grado de relación

Ascendente positiva No hay mucha relación entre estas variables. El peso, no parece tener mucha de relación con la edad, ya que, si una aumenta, la otra no presenta ningún efecto, como podemos ver en la gráfica, los puntos están muy dispersos, esto indica mucha varianza en los resultados. En las edades más pequeñas, se evidencia una buena relación, pues a medida que se aumenta la edad, el peso también aumenta; pero a medida que aumenta la edad, se evidencia mayor varianza en los resultados indicando poca relación 𝑦 = 0,6007𝑥 + 35,544 Este es el modelo matemático que permite predecir el efecto de una variable sobre la otra. 0,3749 Como el valor de R2 es tan bajo podemos reafirmar que estas variables, tienen muy poca relación. 0,6122 No es confiable ya que como la relación es tan baja, es demasiado difícil predecir un posible resultado (por la variación tan significativa que presentan los datos). El porcentaje de error de la predicción en este caso es de 37,49%, lo cual indica que existe poca relación entre las dos variables estudiadas. 37,49% Grado de relación bajo.

Análisis e interpretación de resultados El peso y la edad de los pacientes que visitaron la sala de urgencias del hospital Vargas Lleras, no se relacionan mucho, ya que se pudo identificar gran varianza entre las edades y sus pesos. Para los pacientes menores de edad, se pudo verificar que a medida que 23

crecen su peso también aumenta, pero en adultos fue muy diferente, pues a medida que su edad aumenta, su peso varió bastante. Estas variables presentan una baja relación, aunque se evidencia además que presentan crecimiento ascendente como resultado de la relación que existe entre estas mismas variables para las edades más bajas. La mayor dispersión de datos se da en las edades adultas (entre los 20 y 80 años), indicando mucha variancia entre la edad y el peso, por tanto poca relación.

24

CONCLUSIONES Las gráficas de dispersión de datos nos permiten relacionar diferentes variables entre sí, para así poder predecir un posible resultado. Dentro del problema estudiado, variables como el peso y la edad, no presentan mucha relación entre sí, es decir, la variación de una no depende de la otra. La línea de tendencia ascendente, indica una relación de tipo creciente. Los puntos en las gráficas, indican el grado de dispersión que presentas las variables que se están relacionado, por ejemplo, en el caso de peso – edad los puntos presentan mayor dispersión a medida que se aumenta la edad. El modelo matemático nos permite predecir el efecto de una variable sobre la otra, por ejemplo, en el caso peso – edad, predecir qué peso tendrían los pacientes de la sala de urgencias del hospital Vargas lleras en unos años. El porcentaje de variación de variables, nos ayuda a determinar el tipo de confiabilidad que se presenta, al momento de hacer una predicción. Entre mayor sea R 2 mayor será la confiabilidad en una predicción.

25

REFERENCIAS BIBLIOGRÁFICAS García, M.S.(2004).Introducción a la estadística económica y empresarial. Paraninfo. (pp.74–98). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052900012&v=2.1&u=unad &it=r&p=GVRL&sw=w&asid=4a9b0a469e755a4327207c94b4c0d549 Montero, J.M. (2007).Regresión y Correlación Simple. Madrid: Paraninfo. (pp.130– 172). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad &it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 Churchill, G.A.(2009).Análisis de Correlación y de Regresión Simple. Mexico City: Cengage Learning. (pp-675–686). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad &it=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41 Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de mercados. Mexico City: Cengage Learning. (pp. 686–695).Recuperado de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad &it=r&p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9 Montero, J.M. (2007).Regresión y Correlación Múltiple. Madrid: Paraninfo. (pp.191– 225). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100012&v=2.1&u=unad &it=r&p=GVRL&sw=w&asid=47eaa8f46c19ad13af26a0a74e510de2

26

Anexos Laboratorios- Regresión y Correlación (consolidado) Wilberto Beltrán (opción 1) 1.1. Sal-Tensión. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después.

a.

X (sal)

Y (Tensión)

1,6

98

2,3

102

3,3

109

4,2

113

4,6

115

5,0

120

Realice el diagrama de dispersión y determine el tipo de asociación entre las variables

Diagrama de dispersión 140

y = 6.1062x + 88.128 R² = 0.987

120

Tensión

100 80 60

Y (Tensión)

40

Linear (Y ...


Similar Free PDFs