Title | Regresion Reporte |
---|---|
Course | Ingenieria Industrial Estadistica |
Institution | Universidad Autónoma de Aguascalientes |
Pages | 22 |
File Size | 482.4 KB |
File Type | |
Total Downloads | 686 |
Total Views | 747 |
REGRESION IIE MAESTRA LETICIA MARQUEZ Se un de para los siguientes datos, donde tenemos que: Y: Salario Mensual (Miles de pesos) : Anual en la Empresa (Millones de pesos) : Nivel de Media del Trabajador (0 a 10) Un gerente de recursos humanos desea determinar el salario que debe pagar acierta de obr...
REGRESION IIE
MAESTRA LETICIA MARQUEZ
29/3/17
Introducción Se realizará un análisis de regresión para los siguientes datos, donde tenemos que: Y: Salario Mensual (Miles de pesos) 𝑥1 : Producción Anual en la Empresa (Millones de pesos) 𝑥2 : Nivel de Especialización Media del Trabajador (0 a 10) Un gerente de recursos humanos desea determinar el salario que debe pagar acierta categoría de obreros. Para determinar dicho salario que debe pagar a cierta categoría de obreros. Para determinar dicho salario se realiza un estudio en el que intervienen las variables Salario Mensual (en miles de pesos), Nivel de Producción Anual en la Empresa (en millones de pesos) y Nivel de especialización Media del Trabajador (de 0 a 10). El gerente obtiene esta serie de resultados:
1. Diagrama de Dispersión
130 120 100
110
Salario Mensual
140
150
Diagrama de dispersion
200
250
300
350
Producción Anual en la Empresa
Þ= 0.5977789, la producción anual de la empresa tiene una relación moderada positiva con el Saldo Mensual.
130 120 100
110
Salario Mensual
140
150
Diagrama de dispersion
5
6
7
8
Especialización Media del Trabajador
Þ= 0.5090926, la Especialización Media del Trabajador tiene una relación moderada positiva con el Saldo Mensual. 2. Modelo de Regresión Y=56.2208+0.1585𝑥1 +3.6522𝑥2 Por cada unidad que aumente nuestras variables independientes (Producción Anual y Especialización Media del Trabajador), el Saldo Mensual aumentara. β0 Cuando no se conoce la Producción Anual y Especialización Media del Trabajador, el Saldo Mensual será de 56.2208. β1 Cuando la Especialización Media del trabajador es fijo, por cada millón de pesos que aumente la producción anual, el Saldo Mensual aumentara en 0.1585. β2 Cuando la Producción Anual es fija, por cada nivel que aumente la especialización media del trabajador, el Saldo Mensual aumentara en 3.6522.
3. Validar el Modelo
0 -20
-10
Error
10
20
Independenc?a
2
4
6
8
10
tiempo
Si cumple, ya que no tiene patrón.
Error
-20
-10
0
10
20
Homocedasticidad
110
120
130
140
La Homocedasticidad se cumpliría con excepción de 3 datos (3° trabajador, 5° trabajador y 9° trabajador) ya que pueden ser posibles puntos de influencia. Predichos
0 -20
-10
Sample Quantiles
10
20
Normal Q-Q Plot
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
La Normalidad se cumple, con excepción de 3 datos (3° trabajador, 5° trabajador y 9° trabajador) que no se ajustan a la recta, se realizara un análisis de influencia ya que pueden ser posibles puntos de influencia. Theoretical Quantiles
Suma de errores=0 -4.662937e-15, si cumple ya que es prácticamente 0. El modelo sería es válido con excepción de 3 datos (3° trabajador, 5° trabajador y 9° trabajador), ya que esos datos pueden ser puntos de influencia y se requiere hacer el análisis correspondiente. 4. Prueba F (ANOVA) ANOVA Df Sum Sq Mean Sq F value Pr(>F) x1 1 879.91 879.91 4.4446 0.07298 . x2 1 196.68 196.68 0.9935 0.35209 Residuals 7 1385.80 197.97 𝐻0 :𝐵1 = 𝐵2 = 𝐵0 = 0 𝐻1 :𝐵𝑖 ≠ 0
𝑖 = 0,1,2
Valor P (Modelo)= 0.1337 =0.05 Luego cuando Valor P no se rechaza 𝐻0 . Entonces como el Valor P> => 0.1337>0.05 No se rechaza 𝐻0 , por lo tanto el modelo no es significativo. En otras palabras, el modelo no nos va a servir para hacer predicciones.
5. Coeficiente de Determinación
El Sueldo Mensual se explica en un 43.72% con respecto a la Producción Anual y el nivel de Especialización del Trabajador
6. Prueba T 𝐵0 𝐻0 :𝐵0 = 0 𝐻1 :𝐵0 ≠ 0 Valor P (𝐵0 ) =0.0929 =0.05 Como el Valor P> => 0.1337>0.05 No se rechaza 𝐻0 , por lo tanto 𝐵0 no es significativo, en otras palabras puede no haber sueldo base. 𝐵1 𝐻0 :𝐵1 = 0 𝐻1 :𝐵1 ≠ 0 Valor P (𝐵0 ) = 0.1803 =0.05 Como el Valor P> => 0.1803>0.05 No se rechaza 𝐻0 , por lo tanto 𝐵1 no es significativo, en otras palabras la producción anual no afecta en el Sueldo Mensual. 𝐵2 𝐻0 :𝐵2 = 0 𝐻1 :𝐵2 ≠ 0 Valor P (𝐵0 ) = 0.3521 =0.05 Como el Valor P> => 0.3521>0.05
No se rechaza 𝐻0 , por lo tanto 𝐵2 no es significativo, en otras palabras el nivel de especialización Media del Trabajador no afecta en el Sueldo Mensual.
7. Intervalos de Confianza 𝐵0 [-12.13741596, 124.5790730] Con una confianza del 95% se espera que el Sueldo Mensual este entre 12.13741596, 124.5790730].
[-
𝐵1 [-0.09335175, 0.4103259] Con una confianza del 95% se espera que la Producción Anual de la Empresa este entre [0.09335175, 0.4103259].
𝐵2 [-5.01220744, 12.3166270] Con una confianza del 95% se espera que el Nivel de Especialización del Trabajador este entre [-5.01220744, 12.3166270]. 8. Análisis de residuales
[1] 0.27357899 0.55017648 -1.14655971 -0.38071351 -1.48078017 0.43437548 [7] 0.04918523 -0.05991500 1.66314084 0.09751137 Se observa que tenemos 1 dato de influencia que es el del 9° Trabajador, se realizara de nuevo el análisis sin el dato de influencia. 1. Modelo de Regresión Y=41.0685+0.2003𝑥1 +3.7502𝑥2 Por cada unidad que aumente nuestras variables independientes (Producción Anual y Especialización Media del Trabajador), el Saldo Mensual aumentara.
β0 Cuando no se conoce la Producción Anual y Especialización Media del Trabajador, el Saldo Mensual será de 41.0685. β1 Cuando la Especialización Media del trabajador es fijo, por cada millón de pesos que aumente la producción anual, el Saldo Mensual aumentara en 0.2003. β2 Cuando la Producción Anual es fija, por cada nivel que aumente la especialización media del trabajador, el Saldo Mensual aumentara en 3.7502. 2. Validar el Modelo
-5 -15
-10
Error
0
5
Independenc?a
2
4
6 tiempo
8
No cumple ya que tiene patrón.
Se cumpliría la Homocedasticidad si se exceptúan 2 datos (3° Trabajador, 5° Trabajador), se requiere hacer un análisis de influencia de los datos.
Se cumpliría la Normalidad si se exceptúan 2 datos (3° Trabajador, 5° Trabajador) que no se ajustan a la recta, se requiere hacer un análisis de influencia de los datos.
Suma de Errores=0 -2.442491e-15, si cumple porque es prácticamente 0 El modelo sería es válido con excepción de 2 datos (3° trabajador, 5° trabajador), ya que esos datos pueden ser puntos de influencia y se requiere hacer el análisis correspondiente. 3. Prueba F (ANOVA) Df Sum Sq Mean Sq F value Pr(>F) x1 1 1213.45 1213.45 9.8362 0.02016 * x2 1 207.33 207.33 1.6806 0.24247 Residuals 6 740.20 123.37
𝐻0 :𝐵1 = 𝐵2 = 𝐵0 = 0 𝐻1 :𝐵𝑖 ≠ 0
𝑖 = 0,1,2
Valor P (Modelo)= 0.04019 =0.05 Luego cuando Valor P no se rechaza 𝐻0 . Entonces como el Valor P 0.04019 => 0.1347>0.05 No se rechaza 𝐻0 , por lo tanto 𝐵0 no es significativo, en otras palabras puede no haber sueldo base. 𝐵1 𝐻0 :𝐵1 = 0 𝐻1 :𝐵1 ≠ 0 Valor P (𝐵0 ) = 0.0588 =0.05 Como el Valor P> => 0.0588>0.05 No se rechaza 𝐻0 , por lo tanto 𝐵1 no es significativo, en otras palabras la producción anual no afecta en el Sueldo Mensual.
𝐵2 𝐻0 :𝐵2 = 0 𝐻1 :𝐵2 ≠ 0 Valor P (𝐵0 ) = 0.2425 =0.05 Como el Valor P> => 0.2425>0.05 No se rechaza 𝐻0 , por lo tanto 𝐵2 no es significativo, en otras palabras el nivel de especialización Media del Trabajador no afecta en el Sueldo Mensual.
6. Intervalos de Confianza 𝐵0 [-17.07600529, 99.2129855] Con una confianza del 95% se espera que el Sueldo Mensual este entre 17.07600529, 99.2129855].
[-
𝐵1 [-0.01025164, 0.4107844] Con una confianza del 95% se espera que la Producción Anual de la Empresa este entre [0.01025164, 0.4107844].
𝐵2 [-3.32828858, 10.8287063] Con una confianza del 95% se espera que el Nivel de Especialización del Trabajador este entre [-3.32828858, 10.8287063]. 7. Análisis de residuales
[1] 0.54249092 0.78674523 -1.28022012 0.08300613 -1.67948785 0.48607034 [7] 0.31832374 0.42791178 0.31515983 Se observa que tenemos 1 dato de influencia que es el del 5° Trabajador, se realizara de nuevo el análisis sin el dato de influencia.
1. Modelo de Regresión Y= 45.9272+0.2562𝑥1 +0.6698𝑥2 Por cada unidad que aumente nuestras variables independientes (Producción Anual y Especialización Media del Trabajador), el Saldo Mensual aumentara. β0 Cuando no se conoce la Producción Anual y Especialización Media del Trabajador, el Saldo Mensual será de 45.9272. β1 Cuando la Especialización Media del trabajador es fijo, por cada millón de pesos que aumente la producción anual, el Saldo Mensual aumentara en 0.2562. β2 Cuando la Producción Anual es fija, por cada nivel que aumente la especialización media del trabajador, el Saldo Mensual aumentara en 0.6698.
2. Validar el Modelo
Si cumple ya que no tiene patrón.
Se cumpliría la Homocedasticidad si se exceptúa 1 dato (3° Trabajador), se requiere hacer un análisis de influencia de los datos.
Se cumple la Normalidad, con excepción de 1 dato (3° Trabajador) que no se ajusta a la recta, se requiere hacer un análisis de influencia de los datos. Suma de Errores=0 6.52256e-16, si se cumple ya que es prácticamente 0. El modelo sería es válido con excepción de 1 dato (3° trabajador), ya que esos datos pueden ser puntos de influencia y se requiere hacer el análisis correspondiente. 3. Prueba F (ANOVA) Df Sum Sq Mean Sq F value Pr(>F) x1 1 1395.85 1395.85 29.6905 0.002829 ** x2 1 5.18 5.18 0.1102 0.753403 Residuals 5 235.07 47.01
𝐻0 :𝐵1 = 𝐵2 = 𝐵0 = 0 𝐻1 :𝐵𝑖 ≠ 0
𝑖 = 0,1,2
Valor P (Modelo)= 0.007824 =0.05 Luego cuando Valor P no se rechaza 𝐻0 . Entonces como el Valor P 0.0078240.05 No se rechaza 𝐻0 , por lo tanto 𝐵2 no es significativo, en otras palabras el nivel de especialización Media del Trabajador no afecta en el Sueldo Mensual. 6. Intervalos de Confianza 𝐵0 [8.0270608, 83.8272515] Con una confianza del 95% se espera que el Sueldo Mensual este entre [8.0270608, 83.8272515].
𝐵1 [0.1128219, 0.3996344] Con una confianza del 95% se espera que la Producción Anual de la Empresa este entre [0.1128219, 0.3996344].
𝐵2 [-4.5175552, 5.8572208] Con una confianza del 95% se espera que el Nivel de Especialización del Trabajador este entre [-4.5175552, 5.8572208]. 7. Análisis de Residuales [1] -0.35062139 0.37687664 -1.71541972 -0.01248052 0.96091155 0.40028747 [7] 0.74076834 -0.40032235 Se observa que tenemos 1 dato de influencia que es el del 3° Trabajador, se realizara de nuevo el análisis sin el dato de influencia. 1. Modelo de Regresión Y= 39.1122+0.2339𝑥1 +3.2490𝑥2 Por cada unidad que aumente nuestras variables independientes (Producción Anual y Especialización Media del Trabajador), el Saldo Mensual aumentara. β0 Cuando no se conoce la Producción Anual y Especialización Media del Trabajador, el Saldo Mensual será de 39.1122. β1 Cuando la Especialización Media del trabajador es fijo, por cada millón de pesos que aumente la producción anual, el Saldo Mensual aumentara en 0.2339. β2 Cuando la Producción Anual es fija, por cada nivel que aumente la especialización media del trabajador, el Saldo Mensual aumentara en 3.2490.
2. Validar el Modelo
Si cumple ya que no hay patrón.
Si cumple ya que la varianza es contante.
Si cumple ya que los datos se ajustan a la recta. Suma de Errores=0 -3.816392e-16, si cumple ya que es prácticamente 0.
El modelo si es válido ya que cumple todos los supuestos.
3. Prueba F (ANOVA) Df Sum Sq Mean Sq F value Pr(>F) x1 1 1469.93 1469.93 315.912 5.887e-05 *** x2 1 89.95 89.95 19.332 0.01172 * Residuals 4 18.61 4.65
𝐻0 :𝐵1 = 𝐵2 = 𝐵0 = 0 𝐻1 :𝐵𝑖 ≠ 0
𝑖 = 0,1,2
Valor P (Modelo)= 0.000139 =0.05 Luego cuando Valor P no se rechaza 𝐻0 . Entonces como el Valor P 0.0001390.05 Se rechaza 𝐻0 , por lo tanto 𝐵2 es significativo, en otras palabras el nivel de especialización Media del Trabajador si afecta en el Sueldo Mensual. 6. Intervalos de Confianza 𝐵0 [25.9387524 , 52.2857448] Con una confianza del 95% se espera que el Sueldo Mensual este entre [25.9387524 , 52.2857448]. 𝐵1 [0.1843566, 0.2834901] Con una confianza del 95% se espera que la Producción Anual de la Empresa este entre [0.1843566, 0.2834901].
𝐵2 [1.1973466, 5.3005657] Con una confianza del 95% se espera que el Nivel de Especialización del Trabajador este entre [1.1973466, 5.3005657]. 7. Análisis de Residuales [1] 0.01079515 1.15140731 -0.66190904 -0.22908287 -0.32950124 1.04792302 [7] -0.98963232 No tenemos ningún punto de influencia. ANEXO #####CODIGO REG MULTIPLE #BORRAR DATOS ANTERIORES QUE TENGA R ALMACENADOS rm(list=ls(all=TRUE)) ### ENTRADA DE DATOS datos...