Title | Tutorías EE2. Tema 5.MLS |
---|---|
Course | Estadística 2 |
Institution | Universidad Complutense de Madrid |
Pages | 14 |
File Size | 636 KB |
File Type | |
Total Downloads | 105 |
Total Views | 138 |
Download Tutorías EE2. Tema 5.MLS PDF
TUTORÍAS ESTADÍSTICA EMPRESARIAL II TEMA 5: REGRESIÓN LINEAL SIMPLE
CURSO 2015/2016
Sofía Tirado Sarti
5.REGRESIÓN LINEAL SIMPLE 5.1.INTRODUCCIÓN
Un modelo de regresión es un modelo que permite describir cómo influye una variable X sobre otra variable Y . Y: Es la variable que queremos explicar. (Variable dependiente o respuesta o endógena) X: La variable usada para explicar el comportamiento de la Y. (Variable independiente o explicativa o exógena) Ejemplos: Estimar el precio de una vivienda en función de su superficie. Aproximar la calificación obtenida en una materia según el número de horas de estudio semanal. Predecir la tasa de paro para cada edad
Si consideramos que la relación que liga Y con X es lineal: Modelo Lineal Simple
ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA
2
5.REGRESIÓN LINEAL SIMPLE
5.2.MODELO DE REGRESIÓN LINEAL(I)
El modelo de regresión lineal simple(MLS) supone que:
yt 1 2 xt ,2 t , t 1, 2 , donde: • Yt representa el valor de la variable y para el individuo t, o valor de la variable y en el periodo t (dependiendo del tipo de datos con el que estemos trabajando) • Xt,1 (que no aparece explícitamente en la representación del MLS) es una variable que toma siempre el valor 1, y está asociada al parámetro β1 • Xt,2,variable explicativa del MLS asociada al parámetro β2, representa el valor de la variable explicativa para la observación(o periodo) t. • β1 y β2 son parámetros poblacionales desconocido • εt ,perturbación aleatoria o término de error, es una variable aleatoria Ruido Blanco, que refleja todos los factores distintos de X que influyen sobre la y, pero que ninguno de ellos es relevante individualmente. t ~ N (0; 2 ), t , y E ( t s ) 0, t s ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA
3
5.REGRESIÓN LINEAL SIMPLE
5.2.MODELO DE REGRESIÓN LINEAL(II)
β1 conocido como la “constante” mide el valor esperado de la variable yt cuando la variable explicativa xt,2 valga 0, es decir:
E ( yt xt , 2 xt ,3 xt ,k 0) 1 β2, conocido como la “pendiente,” mide el efecto parcial de la variable explicativa xt,2, sobre la yt , si la variable x es continua, nos indica cómo varía Y ante un cambio unitario en X:
yt 2 xt ,2
El objetivo va a ser obtener estimaciones de los parámetros desconocidos, β1 y β2, para poder calcular la recta de regresión que se ajuste lo mejor posible a los datos.
ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA
4
5.REGRESIÓN LINEAL SIMPLE
5.2.MODELO DE REGRESIÓN LINEAL(III)
Si el modelo es lineal, una estimación posible es una recta llamada RECTA DE AJUSTE. La distancia entre cada punto de la nube y la recta de ajuste es el residuo.
ˆ i βˆ 1 βˆ 2 Xi Y
Y Valor observado(dato)de Y para xi
residuo
ˆi yi yˆi
Β2=Pendiente
Valor ajustado o estimado de Y para xi Β1=constante xi ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA
X 5
5.REGRESIÓN LINEAL SIMPLE
5.3.ESTIMACIÓN MLS:MINIMOS CUADRADOS ORDINARIOS
Objetivo: Estimar los parámetros de una regresión simple de forma que se cumpla algún criterio de optimalidad. Si el criterio es minimizar la suma de los cuadrados de los residuos: MÍNIMOS CUADRADOS ORDINARIOS(MCO). El error cometido en la estimación (residuo) es el estimador de la perturbación, y por tanto el objetivo a minimizar.
min SCR min
n
ˆ
2 i
i 1
Solución:
min
(y yˆ ) i
2
i
min
[y (ˆ ˆ x )]
n n xt 2 ˆ 1 t 1 βˆ ( XX) 1 Xy n n ˆ 2 xt 2 xt22 βˆ XX
ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA
i
1
1
2
2
i
n yt t 1 n yt xt 2 Xy
6
5.REGRESIÓN LINEAL SIMPLE EJEMPLO LIBRO NEWBOLD(I)
Un agente inmobiliario quiere examinar la relación existente entre el precio de venta de una casa y su tamaño(medido en metros cuadrados).Para ello dispone de una muestra aleatoria de 10 casas: Precio casas (miles euros)
Superficie (m2)
245
1400
312
1600
279
1700
308
1875
199
1100
219
1550
405
2350
324
2450
319
1425
255
1700
ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA
7
5.REGRESIÓN LINEAL SIMPLE EJEMPLO LIBRO NEWBOLD(II)
Variable dependiente (Y) = Precio casa (en miles de euros) Variable independiente (X) = metros cuadrados
Precio(miles euros)
REPRESENTACIÓN GRÁFICA DE LA RELACIÓN:DIAGRAMA DE DISPERSIÓN 450 400 350 300 250 200 150 100 50 0 0
500
1000
1500
2000
2500
3000
Superficie(metros cuadrados) ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA
8
5.REGRESIÓN LINEAL SIMPLE EJEMPLO LIBRO NEWBOLD(III)
Formulamos el siguiente modelo econométrico:
Precio t 1 2superficie t t, t 1 ,2 , Con los datos disponibles, vamos a estimar los parámetros poblacionales (desconocidos) a través del método MCO, Así, se tiene que:
1
n n sup erficiet ˆ1 t 1 ˆ ( XX) 1 Xy β n ˆ n 2 sup erficie t sup erficie t2 βˆ XX
n precio t t 1 n precio erficie sup t t Xy
1 ˆ1 10 17150 2865 ˆ1 1.97160356 0.00109131 2865 98.24833 ˆ 17150 30983750 5085975 ˆ 0.00109131 0.00000064 5085975 0. 10977 2 2
MODELO ESTIMADO:
preciot 98,2483 0,1097 superficie t
ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA
9
5.REGRESIÓN LINEAL SIMPLE EJEMPLO LIBRO NEWBOLD(III)
Precio(miles euros)
450
Constante
400 350 300
Pendiente ˆ2 0,1097
250 200 150 100 50 0
ˆ1 98, 2483
0
500
1000
1500
2000
2500
300
Superficie(metros cuadrados)
ˆ1 98, 2483 Indica que el precio esperado con independencia de la superficie de la casa es
de 98,24 miles de euros ˆ2 0,1097 Por casa metro cuadrado adicional en la superficie de la casa,el
precio aumenta en 0,1097 miles de euros(109,7 euros)
ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA
10
5.REGRESIÓN LINEAL SIMPLE
5.4:INFERENCIA EN EL MLS: TEST DE SIGNIFICATIVIDAD INDIVIDUAL
Test t sobre la pendiente del modelo: ¿la variable x es relevante para explicar la Y? Hipótesis nula y alternativa: H0: β1 = 0 (no hay relación lineal entre X y Y) H1: β1 ≠ 0 (existe dicha relación)
βˆ 1 β1 t dt(βˆ )
Donde, 𝑑𝑡 𝛽1 =
var(𝛽1
1
n
var( ˆ1) cov( ˆ1ˆ 2 ) 2 1 ˆ ( MVC( ) ˆ ( X´ X ) cov(ˆ ˆ ) var(ˆ ) 1 2 2
ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA
ˆ
2 i
σˆ 2
i1
n k
SCR n k
11
5.REGRESIÓN LINEAL SIMPLE
COMTINUACIÓN EJEMPLO LIBRO NEWBOLD
H0: β1 = 0 H1: β1 0
βˆ 1 β1 0.10977 0 t 3.32938 sβˆ 0.03297 1
g.l.= 10-2 = 8
Decisión: Rechazo H0
t8,.025 = 2.3060
a/2=.025
Rechazo H0
a/2=.025
No rechazo H0
-tn-2,α/2 -2.3060
0
Rechazo
tn-2,α/2 H0 2.3060 3.329
Conclusión: Hay suficiente evidencia para afirmar que los metros cuadrados de la casa afectan a su precio 2
5.REGRESIÓN LINEAL SIMPLE
5.4:INFERENCIA EN EL MLS: INTERVALO DE CONFIANZA PARA 𝛽𝑗
El intervalo de confianza al (1 – α)% para el parámetro βj viene dado por: Pr ta / 2 t n k ta /2 1 a Pr ta / 2 Pr ˆ t
j
ta /2 1 a dt( ˆ j ) dt ( ˆ ) ˆ t
ˆ j j
a /2
j
j
j
a /2
dt ( ˆ j ) 1 a
IC(1a )% ( ˆ j ) ˆ j ta /2 dt ( ˆ j ); ˆ j ta /2 dt ( ˆ j )
ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA
13
5.REGRESIÓN LINEAL SIMPLE
CONTINUACIÓN EJEMPLO LIBRO NEWBOLD(III)
IC(1 a )% ( ˆ1 ) ˆ1 t a /2 dt ( ˆ1 ); ˆ1 ta /2 dt ( ˆ j ) Al 95% de confianza, el intervalo para la pendiente es (0.0337, 0.1858)
El intervalo al 95% no incluye el 0. Conclusión: Hay una relación estadísticamente significativa entre el precio de las casas y sus metros cuadrados al 5% de significación.
Copyright © 2013 Pearson
ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA
14...