Title | Regresión Lineal Simple en Minitab |
---|---|
Author | Irais Islas |
Course | Law in Context |
Institution | Instituto Tecnológico de Querétaro |
Pages | 27 |
File Size | 1.3 MB |
File Type | |
Total Downloads | 22 |
Total Views | 154 |
minitab...
Ingeniería en Materiales Probabilidad y Estadística Lic. Tanis Villasana Barrera Grupo: 8V
Regresión Lineal Simple en Minitab Benítez Islas Irais Gutiérrez Ballato Sol Yaroslab Martínez García Carlos Alan Mejía Mejía Arely Patricia
1
Índice Introducción.......................................................................................................................................................................... 3 Análisis de Regresión Lineal................................................................................................................................................. 6 Análisis de regresión: dist vs. Speed (Valor P, Valor F, Valor T)...........................................................................................7 Gráfica de Regresión Lineal Ajustada...................................................................................................................................8 Predicción para un valor de Y............................................................................................................................................. 10 Graficas de predicción......................................................................................................................................................... 22 Referencias.......................................................................................................................................................................... 26
2
Introducción La regresión lineal simple examina la relación lineal entre dos variables continuas: una respuesta (Y) y un predictor (X). Cuando las dos variables están relacionadas, es posible predecir un valor de respuesta a partir de un valor predictor con una exactitud mayor que la asociada únicamente a las probabilidades. La regresión proporciona la línea que "mejor" se ajusta a los datos. Esta línea se puede utilizar después para:
Examinar cómo cambia la variable de respuesta a medida que cambia la variable predictora.
Predecir el valor de una variable de respuesta (Y) para cualquier variable predictora (X). Para saber si la regresión lineal se ajusta a nuestros datos, se realizan distintas pruebas de hipótesis que consisten en: Valor P- Regresión : La hipótesis nula para la regresión general es que el modelo no explica ninguna variación en la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que el modelo explica la variación en la respuesta cuando no es así. Valor p ≤ α: El modelo explica la variación en la respuesta Si el valor p es menor que o igual al nivel de significancia, usted concluye que el modelo explica la variación en la respuesta. Valor p > α: No hay suficiente evidencia para concluir que el modelo explica la variación en la respuesta Si el valor p es mayor que el nivel de significancia, usted no puede concluir que el modelo explica la variación en la respuesta. Convendría que ajuste un nuevo modelo.
3
Valor P- Regresión : La hipótesis nula para la regresión general es que el modelo no explica ninguna variación en la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que el modelo explica la variación en la respuesta cuando no es así. Valor p ≤ α: El modelo explica la variación en la respuesta Si el valor p es menor que o igual al nivel de significancia, usted concluye que el modelo explica la variación en la respuesta. Valor p > α: No hay suficiente evidencia para concluir que el modelo explica la variación en la respuesta Si el valor p es mayor que el nivel de significancia, usted no puede concluir que el modelo explica la variación en la respuesta. Convendría que ajuste un nuevo modelo. Valor p – Término
El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula. Valor F para el modelo o los términos El valor F es la estadística de prueba usada para determinar si el término está asociado con la respuesta. Valor F para la prueba de falta de ajuste El valor F es la estadística de prueba usada para determinar si al modelo le están faltando los términos de orden superior que incluyan los predictores en el modelo actual. Si desea usar el valor F para determinar si puede rechazar la hipótesis nula, se compara el valor F con su valor crítico.
Valor t El valor t mide la relación entre el coeficiente y su error estándar. Se utiliza el valor t para calcular el valor p, que se utiliza para comprobar si el coeficiente es significativamente diferente de 0. i el valor absoluto del valor t es mayor que el valor crítico, usted rechaza la hipótesis nula. Si el valor absoluto del valor t es menor que el valor crítico, usted no puede rechazar la hipótesis nula.
4
Después de esto se realiza una predicción de nuestro modelo almacenado y predeciremos el valor de la respuesta para las combinaciones de valores de configuración de las variables. El cual sirve para establecer posibles resultados al comportamiento de nuestra “población” utilizada. En el siguiente documento se presentarán en la interpretación de los siguientes datos: speed 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
dist 4 4 7 7 8 9 10 10 10 11 11 12 12 12 12 13 13 13 13 14
speed 2 10 4 22 16 10 18 26 34 17 28 14 20 24 28 26 34 34 46 26
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
dist 14 14 14 15 15 15 16 16 17 17 17 18 18 18 18 19 19 19 20 20
speed 36 60 80 20 26 54 32 40 32 40 50 42 56 76 84 36 46 68 32 48
41 42 43 44 45 46 47 48 49 50
dist 20 20 20 22 23 24 24 24 24 25
52 56 64 66 54 70 92 93 120 85
El análisis de regresión lineal será obtenido a través de Minitab, que es un programa diseñado para ejecutar funciones estadísticas básicas y avanzadas.
5
Análisis de Regresión Lineal Se copian los datos a Minitab
Realizaremos los siguientes pasos Estadística > Regresión > Regresión > Ajustar modelo de Regresión
Aparecerá la siguiente tabla, y proporcionaremos los siguientes datos: Respuesta: Es el valor que queremos obtener con la ecuación (dist) Predictores continuos: Son los valores conocidos (speed) Se da clic en Aceptar. 6
Se obtendrá la siguiente la siguiente tabla:
Análisis de regresión: dist vs. Speed (Valor P, Valor F, Valor T) Análisis de Varianza Fuente
GL SC Ajust. MC Ajust. Valor F
Regresión
Valor p
1
21185
21185.5
89.57
0.000
1
21185
21185.5
89.57
0.000
48
11354
236.5
Falta de ajuste
17
4589
269.9
1.24
0.295
Error puro
31
6765
218.2
Total 49 Resumen del modelo
32539
Speed Error
R-cuad. R-cuad. S R-cuad. (ajustado) (pred) 15.3796 65.11% Coeficientes Término
Coef
Constante -17.58
64.38% 62.14% EE del coef. Valor T Valor p 6.76
-2.60
Speed 3.932 0.416 Ecuación de regresión
9.46
FIV
0.012 0.000 1.00
Dist = -17.58 + 3.932 speed Ajustes y diagnósticos para observaciones poco comunes 7
Ob s
dist
Ajust Resid e Resid est.
23
80.00
37.47 42.53
2.80 R
35
84.00
53.20 30.80
2.03 R
49 120.00
76.80 43.20
2.92 R
Residuo grande R
De la tabla podemos observar que (Valor p) ≤ 0.05 (α), estos resultados indican que la asociación entre la distancia y la aceleración es estadísticamente significativa. Para saber si se rechaza la hipótesis nula comparamos el valor F y valor T con el valor crítico. Para esto se realiza lo siguiente: Calc > Distribuciones de probabilidad > Chi-cuadrada >Probabilidad acumulada inversa. Grados de libertad: 49. Constante de entrada e ingrese 0.95. Aceptar. Función de distribución acumulada inversa Chi-cuadrada con 49 GL P( X ≤ x )
x
0.95 66.3386 Para la prueba de chi-cuadrada, el estadístico de prueba ( Valor F y T) es mayor que el valor crítico, se concluir que hay evidencia estadística para rechazar la hipótesis nula.
Gráfica de Regresión Lineal Ajustada Para graficar seguimos los siguientes pasos: Estadística > Regresión > Gráfica de línea ajustada
8
Aparecerá la siguiente tabla, en la cual escribiremos los siguientes datos, usando los ejes de la siguiente manera: Respuesta (Y): dist Predictor (X): speed Daremos clic en Aceptar
Obtenemos la siguiente grafica de dispersión con la recta de regresión lineal:
9
Gráfica de línea ajustada dist = - 17.58 + 3.932 speed S R-cuad. R-cuad.(ajustado)
120
15.3796 65.1% 64.4%
100
dist
80 60 40 20
0 5
10
15
20
25
speed
En la gráfica podemos ver que S es de 15.3796, lo que implica que los datos están muy separados. R2 es de 65.1% nos muestra que es un buen ajuste de datos, ya que mientras mayor sea el valor de R2, mejor se ajustará el modelo a los datos. Lo mismo sucede con R2 (ajustado) el cual se utiliza para comparar en caso de que haya otros modelos para ayudar a elegir el modelo correcto.
Predicción para un valor de Y Regresión > Regresión > Predecir
Aparecerá la siguiente tabla, proporcionaremos los siguientes datos: 10
Respuesta: dist Ingresar columna de valores: speed Aceptar
Nos dará como resultado nuevos valores a la tabla.
Se obtienen los siguientes datos. En los cuales Ajuste: se calculan ingresando valores de X en la ecuación del modelo para una variable de respuesta. Es decir en nuestra ecuación de regresión para la primera predicción sería 11
dis t
= -17.58 + 3.932 (-1.84946).
EE de Ajuste: Cuanto menor sea el error estándar, más precisa será la respuesta media pronosticada. IC de 95% : Con un nivel de confianza de 95%, usted puede estar 95% seguro de que el intervalo de confianza contiene la media de la población para los valores especificados de las variables incluidas en el modelo. IP de 95% : Podemos estar 95% seguro de que una respuesta individual estará contenida en el intervalo dada la configuración de los predictores. El intervalo de predicción siempre es más ancho que el intervalo de confianza, debido a la incertidumbre adicional incluida en la predicción de una respuesta versus la respuesta media. Predicción para dist Ecuación de regresión dis = -17.58 + 3.932 speed t Configuración Variable
Valor de configuración
speed Predicción Ajuste
4 EE de ajuste
IC de 95%
IP de 95%
- 5.21233 (-12.3295, 8.63062) (-34.4998, 30.8009) 1.84946 Configuración Variable
Valor de configuración
speed Predicción Ajuste
4 EE de ajuste
IC de 95%
IP de 95%
- 5.21233 (-12.3295, 8.63062) (-34.4998, 30.8009) 1.84946 Configuración Variable
Valor de configuración
speed Predicción Ajuste
7 EE de ajuste
IC de 95%
IP de 95%
9.9477 4.11253 (1.67898, 18.2166) (-22.0614, 41.9570) 12
7 Configuración Variable
Valor de configuración
speed Predicción Ajuste
7 EE de ajuste
IC de 95%
IP de 95%
9.9477 4.11253 (1.67898, 18.2166) (-22.0614, 41.9570) 7 Configuración Variable
Valor de configuración
speed Predicción Ajuste
8 EE de ajuste
IC de 95%
IP de 95%
13.880 3.76630 (6.30753, 21.4528) (-17.9563, 45.7166) 2 Configuración Variable
Valor de configuración
speed Predicción Ajuste
9 EE de ajuste
IC de 95%
IP de 95%
17.812 3.43546 (10.9051, 24.7200) (-13.8722, 49.4974) 6 Configuración Variable
Valor de configuración
speed Predicción Ajuste
10 EE de ajuste
IC de 95%
IP de 95%
21.745 3.12492 (15.4619, 28.0281) (-9.80960, 53.2996) 0 Configuración Variable
Valor de 13
configuración speed Predicción Ajuste
10 EE de ajuste
IC de 95%
IP de 95%
21.745 3.12492 (15.4619, 28.0281) (-9.80960, 53.2996) 0 Configuración Variable
Valor de configuración
speed Predicción Ajuste
10 EE de ajuste
IC de 95%
IP de 95%
21.745 3.12492 (15.4619, 28.0281) (-9.80960, 53.2996) 0 Configuración Variable
Valor de configuración
speed Predicción Ajuste
11 EE de ajuste
IC de 95%
IP de 95%
25.677 2.84133 (19.9645, 31.3903) (-5.76862, 57.1234) 4 Configuración Variable
Valor de configuración
speed Predicción Ajuste
11 EE de ajuste
IC de 95%
IP de 95%
25.677 2.84133 (19.9645, 31.3903) (-5.76862, 57.1234) 4 Configuración Variable speed Predicción
Valor de configuración 12 14
Ajuste
EE de ajuste
IC de 95%
IP de 95%
29.609 2.59355 (24.3951, 34.8245) (-1.74953, 60.9691) 8 Configuración Variable
Valor de configuración
speed Predicción Ajuste
12 EE de ajuste
IC de 95%
IP de 95%
29.609 2.59355 (24.3951, 34.8245) (-1.74953, 60.9691) 8 Configuración Variable
Valor de configuración
speed Predicción Ajuste
12 EE de ajuste
IC de 95%
IP de 95%
29.609 2.59355 (24.3951, 34.8245) (-1.74953, 60.9691) 8 Configuración Variable
Valor de configuración
speed Predicción Ajuste
12 EE de ajuste
IC de 95%
IP de 95%
29.609 2.59355 (24.3951, 34.8245) (-1.74953, 60.9691) 8 Configuración Variable
Valor de configuración
speed Predicción Ajuste
13 EE de ajuste
IC de 95%
IP de 95%
33.542 2.39272 (28.7313, 38.3531) (2.24749, 64.8369) 15
2 Configuración Variable
Valor de configuración
speed Predicción Ajuste
13 EE de ajuste
IC de 95%
IP de 95%
33.542 2.39272 (28.7313, 38.3531) (2.24749, 64.8369) 2 Configuración Variable
Valor de configuración
speed Predicción Ajuste
13 EE de ajuste
IC de 95%
IP de 95%
33.542 2.39272 (28.7313, 38.3531) (2.24749, 64.8369) 2 Configuración Variable
Valor de configuración
speed Predicción Ajuste
13 EE de ajuste
IC de 95%
IP de 95%
33.542 2.39272 (28.7313, 38.3531) (2.24749, 64.8369) 2 Configuración Variable
Valor de configuración
speed Predicción Ajuste
14 EE de ajuste
IC de 95%
IP de 95%
37.474 2.25145 (32.9478, 42.0015) (6.22231, 68.7270) 6 Configuración Variable
Valor de 16
configuración speed Predicción Ajuste
14 EE de ajuste
IC de 95%
IP de 95%
37.474 2.25145 (32.9478, 42.0015) (6.22231, 68.7270) 6 Configuración Variable
Valor de configuración
speed Predicción Ajuste
14 EE de ajuste
IC de 95%
IP de 95%
37.474 2.25145 (32.9478, 42.0015) (6.22231, 68.7270) 6 Configuración Variable
Valor de configuración
speed Predicción Ajuste
14 EE de ajuste
IC de 95%
IP de 95%
37.474 2.25145 (32.9478, 42.0015) (6.22231, 68.7270) 6 Configuración Variable
Valor de configuración
speed Predicción Ajuste
15 EE de ajuste
IC de 95%
IP de 95%
41.407 2.18134 (37.0212, 45.7929) (10.1748, 72.6393) 0 Configuración Variable speed Predicción
Valor de configuración 15 17
Ajuste
EE de ajuste
IC de 95%
IP de 95%
41.407 2.18134 (37.0212, 45.7929) (10.1748, 72.6393) 0 Configuración Variable
Valor de configuración
speed Predicción Ajuste
15 EE de ajuste
IC de 95%
IP de 95%
41.407 2.18134 (37.0212, 45.7929) (10.1748, 72.6393) 0 Configuración Variable
Valor de configuración
speed Predicción Ajuste
16 EE de ajuste
IC de 95%
IP de 95%
45.339 2.18924 (40.9377, 49.7412) (14.1050, 76.5739) 4 Configuración Variable
Valor de configuración
speed Predicción Ajuste
16 EE de ajuste
IC de 95%
IP de 95%
45.339 2.18924 (40.9377, 49.7412) (14.1050, 76.5739) 4 Configuración Variable
Valor de configuración
speed Predicción Ajuste
17 EE de ajuste
IC de 95%
IP de 95%
49.271 2.27434 (44.6990, 53.8447) (18.0128, 80.5309) 18
9 Configuración Variable
Valor de configuración
speed Predicción Ajuste
17 EE de ajuste
IC de 95%
IP de 95%
49.271 2.27434 (44.6990, 53.8447) (18.0128, 80.5309) 9 Configuración Variable
Valor de configuración
speed Predicción Ajuste
17 EE de ajuste
IC de 95%
IP de 95%
49.271 2.27434 (44.6990, 53.8447) (18.0128, 80.5309) 9 Configuración Variable
Valor de configuración
speed Predicción Ajuste
18 EE de ajuste
IC de 95%
IP de 95%
53.204 2.42853 (48.3214, 58.0871) (21.8984, 84.5101) 3 Configuración Variable
Valor de configuración
speed Predicción Ajuste
18 EE de ajuste
IC de 95%
IP de 95%
53.204 2.42853 (48.3214, 58.0871) (21.8984, 84.5101) 3 Configuración Variable
Valor de 19
configuración speed Predicción Ajuste
18 EE de ajuste
IC de 95%
IP de 95%
53.204 2.42853 (48.3214, 58.0871) (21.8984, 84.5101) 3 Configuración Variable
Valor de configuración
speed Predicción Ajuste
18 EE de ajuste
IC de 95%
IP de 95%
53.204 2.42853 (48.3214, 58.0871) (21.8984, 84.5101) 3 Configuración Variable
Valor de configuración
speed Predicción Ajuste
19 EE de ajuste
IC de 95%
IP de 95%
57.136 2.63973 (51.8291, 62.4442) (25.7618, 88.5116) 7 Configuración Variable
Valor de configuración
speed Predicción Ajuste
19 EE de ajuste
IC de 95%
IP de 95%
57.136 2.63973 (51.8291, 62.4442) (25.7618, 88.5116) 7 Configuración Variable speed Predicció...