Title | Ejemplos DE Regresión Lineal Múltiple |
---|---|
Author | May AH Gutierrez |
Course | Estadistica |
Institution | Universidad Nacional Federico Villarreal |
Pages | 6 |
File Size | 298.6 KB |
File Type | |
Total Downloads | 23 |
Total Views | 175 |
regresion lineal multiple ...
ESTADÍSTICA II
C/04/06/2020
EJEMPLOS DE REGRESIÓN LINEAL MÚLTIPLE 1. El dueño de Showtime Movie Theater, Inc., desea estimar el ingreso bruto semanal en función de los gastos en publicidad. A continuación se presentan los datos históricos de 10 semanas.
Ingreso semanal (en miles de dólares) Y
Publicidad en tv (en miles de dólares) X1
Publicidad en periódico (en miles de dólares) X2
96
5
1.5
90
2
2
95
4
1.5
92
2.5
2.5
95
3
3.3
94
3.5
2.3
94
2.5
4.2
94
3
2.5
a) Obtenga una ecuación de regresión estimada en la que los montos gastados en publicidad en televisión y en periódicos sean las variables independientes.
Coeficientes Intercepción 83.2300917 Variable X 1 2.29018362 Variable X 2 1.3009891
b) Interprete los coeficientes de la ecuación estimada. 𝛽1 = 2.290, es el incremento promedio del ingreso semanal en miles de dólares, por el incremento de 1000 dólares en publicidad en tv mientras que la otra variable independiente permanece constante. 𝛽2 = 1.301, es el incremento promedio del ingreso semanal en miles de dólares, por el incremento de 1000 dólares en publicidad en periódico mientras que la otra variable independiente permanece constante.
ESTADÍSTICA II
C/04/06/2020
c) ¿Cuál es el ingreso semanal bruto en una semana en la que se gastan $3500 en publicidad en televisión y $1800 en publicidad en periódicos? Y
=
83.23 + 2.290 X1 + 1.301 X2 = 83.23 + 2.290(3.5) + 1.301(1.8) =93.5868 = 93.59
y = 93.59× 1000 = 93590 y = 93590 es el ingreso semanal de gastar $3500 en publicidad en televisión y $1800 en publicidad en periódicos. d) Calcular el coeficiente de determinación.
Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado
0.95866344
0.9190356
0.88664984
Coeficiente de determinación: 0.9190356 Coeficiente de determinación ajustado: 0.88664984 88.66% de las variaciones del ingreso semanal en miles de dólares son explicadas por las variaciones de la publicidad en TV y periódico. SE CÚLMINARA EL /09/06/2020 e) Obtener la prueba global de significancia para el modelo. f) Obtener la prueba T de significancia para cada uno de los parámetros del modelo. C/06/06/2020 2. Salaberry vende casas en la costa este de Estados Unidos. Una de las preguntas más frecuentes de los compradores potenciales es: si compramos esta casa, cuanto gastaremos en calefacción durante el invierno? Al departamento de investigación de Salaberry se le pidió desarrollar algunas directrices respecto de los costos de calefacción de casas unifamiliares. Se considera que tres variables se relacionan con los costos de calefacción: La temperatura externa diaria media, El número de pulgadas de aislamiento en el ático y La antigüedad en años del calentador. Para el estudio, el departamento de investigación de Salaberry seleccionó una muestra aleatoria de 20 casas de venta reciente. Determino el costo de calefacción de cada casa en e nero pasado, así como la temperatura externa en enero en la región, el número de pulgadas de aislamiento en el ático y la edad del calentador. La información muestral se reporta en la tabla
ESTADÍSTICA II
C/04/06/2020
Costo de calefacción ($)
Temperatura externa media (°F)
Aislamiento del ático (pulgadas)
Antigüedad del calentador (años)
250
35
3
6
360
29
4
10
165
36
7
3
43
60
6
9
92
65
5
6
200
30
5
5
355
10
6
7
290
7
10
10
230
21
9
11
120
55
2
5
73
54
12
4
205
48
5
1
400
20
5
15
320
39
4
7
72
60
8
6
272
20
5
8
94
58
7
3
190
40
8
11
235
27
9
8
139
30
7
5
a) Obtenga una ecuación de regresión estimada en la temperatura, aislamiento y antigüedad del calentador sean las variables independientes. Coeficientes
Intercepción
427.193803
Variable X 1
-4.58266263
Variable X 2
-14.8308627
Variable X 3
6.10103206
y = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝛽3 𝑥3 y = 427.194 − 4.583𝑥1 − 14.831𝑥2 + 6.101𝑥3 Ecuación de regresión lineal múltiple. b) Interprete los coeficientes de la ecuación estimada. 𝛽1 = −4.583 Es la disminución promedio del costo de calefacción por el incremento de 1 °F en la temperatura.
ESTADÍSTICA II
C/04/06/2020
𝛽2 = −14.831 Es la disminución promedio del costo de calefacción por el incremento de 1 pulgada en el aislamiento del ático. 𝛽3 = 6.101 Es el incremento promedio del costo de calefacción por el incremento de 1 año en la antigüedad del calentador. c) ¿Cuál es el costo de calefacción cuando la temperatura es 30 °F, aislamiento es 5 pulgadas y la antigüedad es de 5 años? y = 427.194 − 4.583𝑥1 − 14.831𝑥2 + 6.101𝑥3 y = 427.194 − 4.583(30) − 14.831(5) + 6.101(5) y = 427.194 – 137.49 – 74.155 + 30.505 = 246.054 y = 246.054 es el costo de calefacción cuando la temperatura es 30 °F, aislamiento es 5 pulgadas y la antigüedad es de 5 años. d) Calcular el coeficiente de determinación. Estadísticas de la regresión Coeficiente de correlación 0.8967553 múltiple Coeficiente de determinación 0.80417007 R^2 R^2 ajustado 0.76745195
76.75% son las variaciones existentes en el costo de calefacción que son explicadas por las variaciones de la temperatura, aislamiento del ático y antigüedad del calefactor. e) Obtener la prueba global de significancia para el modelo. 1) Formulación de Hipótesis 𝐻0 : 𝛽1 = 𝛽2 = 𝛽3 = 0 𝐻1 : Uno o más de los parámetros del modelo no son iguales a cero. 2) Estadístico de Prueba ANÁLISIS DE VARIANZA Grados de libertad Regresión Residuos Total
3 16 19
Suma de cuadrados 171220.473 41695.2772 212915.75
Promedio de los cuadrados 57073.4909 2605.95482
𝐹= 3) Valor crítico Valor- p =0.0000066
𝐶𝑀𝑅 𝐶𝑀𝐸
F 21.901182
Valor crítico de F 6.5618E-06
= 21.90
< 𝜶 = 𝟎. 𝟎𝟓, por lo tanto se rechaza la 𝐻0
Conclusión: Uno o más de los parámetros del modelo no son iguales a cero, esto significa que por lo menos existe una variable independiente que afecta al costo de calefacción (y).
ESTADÍSTICA II
C/04/06/2020
f) Obtener la prueba T de significancia para cada uno de los parámetros del modelo. Coeficientes
Error típico
Estadístico t
Probabilidad
Intercepción
427.193803
59.6014293
7.16750937
2.2376E-06
Variable X 1
-4.58266263
0.77231935
-5.93363692
2.1004E-05
Variable X 2
-14.8308627
4.75441228
-3.11938928
0.00660596
Variable X 3
6.10103206
4.01212017
1.52065038
0.14786248
Para 𝜷𝟏 1) Formulación de la Hipótesis 𝐻0 : 𝛽1 = 0 𝐻1 : 𝛽1 ≠ 0 2) Estadístico de prueba 𝑇=
𝑏𝑖 𝑠𝑏𝑖
= -5.93363692
3) Valor crítico Valor-p = 0.000021< 𝛼 = 0.05 por lo tanto se rechaza la 𝐻0 Conclusión: el coeficiente de la temperatura es 𝛽1 ≠ 0 , esto implica que afecta a la V.D costo de calefacción. Para 𝜷𝟐 1) Formulación de la Hipótesis 𝐻0 : 𝛽2 = 0 𝐻1 : 𝛽2 ≠ 0 2) Estadístico de prueba 𝑏
𝑇 = 𝑠 𝑖 = -3.11938928 𝑏𝑖
3) Valor crítico Valor-p = 0.00660596< 𝛼 = 0.05 por lo tanto se rechaza la 𝐻0 Conclusión: el coeficiente del aislamiento del ático 𝛽2 ≠ 0 , esto implica que afecta a la V.D costo de calefacción. Para 𝜷𝟑 1) Formulación de la Hipótesis 𝐻0 : 𝛽3 = 0
ESTADÍSTICA II
C/04/06/2020
𝐻1 : 𝛽3 ≠ 0 2) Estadístico de prueba 𝑇=
𝑏𝑖 𝑠𝑏𝑖
= 1.52065038
3) Valor crítico Valor-p= 0.14786248 > 𝛼 = 0.05 por lo tanto no se rechaza la 𝐻0 Conclusión: el coeficiente de la antigüedad del calefactor 𝛽3 = 0 , esto implica que no afecta a la V.D costo de calefacción. TAREA 3. Se sometió a prueba un grupo de camiones ligeros con motores que utilizan diesel como combustible para saber si la humedad, la temperatura del aire y la presión barométrica influyen en la cantidad de óxido nitroso que emiten (en ppm). Las emisiones se midieron en distinto momentos y en diversas condiciones experimentales. Los datos se presentan en la tabla. Óxido nitroso Y 0.90 0.91 0.96 0.89 1.00 1.10 1.15 1.03 0.77 1.07 1.07 0.94 1.10 1.10 1.10 0.91 0.87 0.78 0.82 0.95
Humedad X1 72.4 41.6 34.3 35.1 10.7 12.9 8.3 20.1 72.2 24.0 23.2 47.4 31.5 10.6 11.2 73.3 75.4 96.6 107.4 54.9
Temperatura X2 76.3 70.3 77.1 68.0 79.0 67.4 66.8 76.9 77.7 67.7 76.8 86.6 76.9 86.3 86.0 76.3 77.9 78.7 86.8 70.9
Presión X3 29.13 29.35 29.24 29.27 29.78 29.39 29.69 29.48 29.09 29.60 29.38 29.35 29.63 29.56 29.48 29.40 29.28 29.29 29.03 29.37
a) Ajuste este modelo de regresión lineal múltiple a los datos con los que cuenta. b) Interprete los coeficientes de la ecuación estimada. c) Estime la cantidad de óxido nitroso que emiten los camiones en las siguientes condiciones: 50% de humedad, temperatura de 76˚F y una presión barométrica de 29.30. d) Determinar la prueba global de significancia para el modelo de regresión múltiple. e) Determinar la prueba individual de los parámetros del modelo....