Tutorías EE2. Tema 5.MLS PDF

Title	Tutorías EE2. Tema 5.MLS
Course	Estadística 2
Institution	Universidad Complutense de Madrid
Pages	14
File Size	636 KB
File Type	PDF
Total Downloads	105
Total Views	138

Preview

CLICK TO PREVIEW PDF

Summary

Download Tutorías EE2. Tema 5.MLS PDF

Description

TUTORÍAS ESTADÍSTICA EMPRESARIAL II TEMA 5: REGRESIÓN LINEAL SIMPLE

CURSO 2015/2016

Sofía Tirado Sarti

5.REGRESIÓN LINEAL SIMPLE 5.1.INTRODUCCIÓN

Un modelo de regresión es un modelo que permite describir cómo influye una variable X sobre otra variable Y .  Y: Es la variable que queremos explicar. (Variable dependiente o respuesta o endógena)  X: La variable usada para explicar el comportamiento de la Y. (Variable independiente o explicativa o exógena) Ejemplos:  Estimar el precio de una vivienda en función de su superficie.  Aproximar la calificación obtenida en una materia según el número de horas de estudio semanal.  Predecir la tasa de paro para cada edad

Si consideramos que la relación que liga Y con X es lineal: Modelo Lineal Simple

ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA

2

5.REGRESIÓN LINEAL SIMPLE

5.2.MODELO DE REGRESIÓN LINEAL(I)

El modelo de regresión lineal simple(MLS) supone que:

yt  1   2 xt ,2   t , t  1, 2 , donde: • Yt representa el valor de la variable y para el individuo t, o valor de la variable y en el periodo t (dependiendo del tipo de datos con el que estemos trabajando) • Xt,1 (que no aparece explícitamente en la representación del MLS) es una variable que toma siempre el valor 1, y está asociada al parámetro β1 • Xt,2,variable explicativa del MLS asociada al parámetro β2, representa el valor de la variable explicativa para la observación(o periodo) t. • β1 y β2 son parámetros poblacionales desconocido • εt ,perturbación aleatoria o término de error, es una variable aleatoria Ruido Blanco, que refleja todos los factores distintos de X que influyen sobre la y, pero que ninguno de ellos es relevante individualmente.  t ~ N (0;  2 ), t , y E ( t s )  0, t  s ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA

3

5.REGRESIÓN LINEAL SIMPLE

5.2.MODELO DE REGRESIÓN LINEAL(II)

β1 conocido como la “constante” mide el valor esperado de la variable yt cuando la variable explicativa xt,2 valga 0, es decir:

E ( yt xt , 2  xt ,3    xt ,k  0)  1 β2, conocido como la “pendiente,” mide el efecto parcial de la variable explicativa xt,2, sobre la yt , si la variable x es continua, nos indica cómo varía Y ante un cambio unitario en X:

 yt  2 xt ,2

El objetivo va a ser obtener estimaciones de los parámetros desconocidos, β1 y β2, para poder calcular la recta de regresión que se ajuste lo mejor posible a los datos.

ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA

4

5.REGRESIÓN LINEAL SIMPLE

5.2.MODELO DE REGRESIÓN LINEAL(III)

Si el modelo es lineal, una estimación posible es una recta llamada RECTA DE AJUSTE. La distancia entre cada punto de la nube y la recta de ajuste es el residuo.

ˆ i  βˆ 1  βˆ 2 Xi Y

Y Valor observado(dato)de Y para xi

residuo

ˆi  yi  yˆi

Β2=Pendiente

Valor ajustado o estimado de Y para xi Β1=constante xi ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA

X 5

5.REGRESIÓN LINEAL SIMPLE

5.3.ESTIMACIÓN MLS:MINIMOS CUADRADOS ORDINARIOS

Objetivo: Estimar los parámetros de una regresión simple de forma que se cumpla algún criterio de optimalidad. Si el criterio es minimizar la suma de los cuadrados de los residuos: MÍNIMOS CUADRADOS ORDINARIOS(MCO). El error cometido en la estimación (residuo) es el estimador de la perturbación, y por tanto el objetivo a minimizar.

min SCR  min

n

 ˆ

2 i

i 1

Solución:

 min

 (y yˆ ) i

2

i

 min

[y  (ˆ  ˆ x )]

n   n xt 2    ˆ  1  t 1  βˆ  ( XX) 1 Xy      n n  ˆ     2    xt 2  xt22    βˆ XX

ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA

i

1

1

2

2

i

 n    yt   t 1   n    yt  xt 2    Xy

6

5.REGRESIÓN LINEAL SIMPLE EJEMPLO LIBRO NEWBOLD(I)

Un agente inmobiliario quiere examinar la relación existente entre el precio de venta de una casa y su tamaño(medido en metros cuadrados).Para ello dispone de una muestra aleatoria de 10 casas: Precio casas (miles euros)

Superficie (m2)

245

1400

312

1600

279

1700

308

1875

199

1100

219

1550

405

2350

324

2450

319

1425

255

1700

ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA

7

5.REGRESIÓN LINEAL SIMPLE EJEMPLO LIBRO NEWBOLD(II)

Variable dependiente (Y) = Precio casa (en miles de euros) Variable independiente (X) = metros cuadrados

Precio(miles euros)

REPRESENTACIÓN GRÁFICA DE LA RELACIÓN:DIAGRAMA DE DISPERSIÓN 450 400 350 300 250 200 150 100 50 0 0

500

1000

1500

2000

2500

3000

Superficie(metros cuadrados) ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA

8

5.REGRESIÓN LINEAL SIMPLE EJEMPLO LIBRO NEWBOLD(III)

Formulamos el siguiente modelo econométrico:

Precio t  1  2superficie t   t, t  1 ,2 , Con los datos disponibles, vamos a estimar los parámetros poblacionales (desconocidos) a través del método MCO, Así, se tiene que:

1

n   n sup erficiet    ˆ1    t 1 ˆ  ( XX) 1 Xy       β n  ˆ   n  2    sup erficie t  sup erficie t2    βˆ XX

n   precio t    t 1    n   precio erficie sup t t    Xy

1  ˆ1   10 17150   2865   ˆ1   1.97160356 0.00109131  2865   98.24833            ˆ  17150 30983750   5085975   ˆ   0.00109131 0.00000064   5085975   0. 10977   2  2

MODELO ESTIMADO:

preciot  98,2483  0,1097 superficie t

ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA

9

5.REGRESIÓN LINEAL SIMPLE EJEMPLO LIBRO NEWBOLD(III)

Precio(miles euros)

450

Constante

400 350 300

Pendiente ˆ2  0,1097

250 200 150 100 50 0

ˆ1  98, 2483

0

500

1000

1500

2000

2500

300

Superficie(metros cuadrados)

ˆ1  98, 2483 Indica que el precio esperado con independencia de la superficie de la casa es

de 98,24 miles de euros ˆ2  0,1097 Por casa metro cuadrado adicional en la superficie de la casa,el

precio aumenta en 0,1097 miles de euros(109,7 euros)

ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA

10

5.REGRESIÓN LINEAL SIMPLE

5.4:INFERENCIA EN EL MLS: TEST DE SIGNIFICATIVIDAD INDIVIDUAL

 Test t sobre la pendiente del modelo: ¿la variable x es relevante para explicar la Y?  Hipótesis nula y alternativa: H0: β1 = 0 (no hay relación lineal entre X y Y) H1: β1 ≠ 0 (existe dicha relación)

βˆ 1  β1 t dt(βˆ )

Donde, 𝑑𝑡 𝛽1 =

var(𝛽1

1

n

 var( ˆ1) cov( ˆ1ˆ 2 )  2 1 ˆ  ( MVC(  )  ˆ ( X´ X )    cov(ˆ ˆ ) var(ˆ )  1 2 2  

ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA

 ˆ

2 i

σˆ 2 

i1

n k



SCR n k

11

5.REGRESIÓN LINEAL SIMPLE

COMTINUACIÓN EJEMPLO LIBRO NEWBOLD

H0: β1 = 0 H1: β1  0

βˆ 1 β1 0.10977  0 t   3.32938 sβˆ 0.03297 1

g.l.= 10-2 = 8

Decisión: Rechazo H0

t8,.025 = 2.3060

a/2=.025

Rechazo H0

a/2=.025

No rechazo H0

-tn-2,α/2 -2.3060

0

Rechazo

tn-2,α/2 H0 2.3060 3.329

Conclusión: Hay suficiente evidencia para afirmar que los metros cuadrados de la casa afectan a su precio 2

5.REGRESIÓN LINEAL SIMPLE

5.4:INFERENCIA EN EL MLS: INTERVALO DE CONFIANZA PARA 𝛽𝑗

El intervalo de confianza al (1 – α)% para el parámetro βj viene dado por: Pr  ta / 2  t n k  ta /2   1  a  Pr  ta / 2    Pr ˆ  t



j

  ta /2   1  a  dt( ˆ j )   dt ( ˆ )    ˆ  t

ˆ j   j

a /2

j

j

j

a /2



 dt ( ˆ j )  1  a

IC(1a )% ( ˆ j )   ˆ j  ta /2  dt ( ˆ j ); ˆ j  ta /2  dt ( ˆ j )   

ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA

13

5.REGRESIÓN LINEAL SIMPLE

CONTINUACIÓN EJEMPLO LIBRO NEWBOLD(III)

IC(1 a )% ( ˆ1 )  ˆ1  t a /2  dt ( ˆ1 ); ˆ1  ta /2  dt ( ˆ j )  Al 95% de confianza, el intervalo para la pendiente es (0.0337, 0.1858)

El intervalo al 95% no incluye el 0. Conclusión: Hay una relación estadísticamente significativa entre el precio de las casas y sus metros cuadrados al 5% de significación.

Copyright © 2013 Pearson

ESTADÍSTICA EMPRESARIAL II-INFERENCIA ESTADÍSTICA

14...