Repaso Econometria Clasica PDF

Title Repaso Econometria Clasica
Course Econometría I
Institution Universidad Diego Portales
Pages 22
File Size 899.4 KB
File Type PDF
Total Downloads 92
Total Views 153

Summary

Repaso Econometría Seddighi...


Description

1.1

Modelo Clásico de Regresión Líneal y Estimador de Mínimos Cuadrados Ordinarios

Dentro del set de supuestos que conforman el Modelo Clásico de Regresión Líneal (MCRL), revisaremos aquellos cuya violación lleva a la pérdida de importantes propiedades estadísticas para el Estimador de Mínimos Cuadrados Ordinarios (MICO) y al eventual uso de estimadores alternativos.

Los principales supuestos del MCRL pueden

clasi…carse como

1. La variable dependiente (Yt ) es una función líneal estable de las variables independientes (Xt ) más un error estocástico ("t ).

2. El error poblacional es Independiente e Idénticamente Distribuido, con Esperanza y Varianza constantes ("t

 iid(;  2)).

3. No puede haber ningún tipo de covarianza entre el error poblacional ("t ) y las variables independientes (Xt ).

1.1.1

Violaciones al MCRL y Propiedades Estadísticas de MICO

Las posibles violaciones al supuesto (1) son 1.a) No linealidad en los parámetros.

4

una transformación logarítmica se necesita que la función poblacional tenga una forma multiplicativa y en particular que el error poblacional no entre aditivamente en dicha función. Al estimar un modelo no linealizable mediante un método lineal, obtenemos parámetros sesgados. Un ejemplode función poblacional no linealizable sería la siguiente



Yt =  0 X t 1 + "t 1.b) Función no estable. 1.b.i) Quiebre estructural en los parámetros. Si los coe…cientes de la función poblacional cambian en forma discreta (por una sóla vez) y no se considera esta variación en el intercepto o las pendientes de la función, al estimar el modelo se obtendrían parametros sesgados. Un ejemplo de quiebre estructural en el intercepto de la función poblacional está dado por

Yt =  0 + Dt +  1 Xt + "t

Dt

8 >< 0 sí t < t = >: 1 sí t  t

0

0

9> = >;

donde el intercepto después del quiebre estructural (desde el momento t0 ) sería igual a  0

+ . 5

Sí los coe…cientes de la función poblacional son estocásticos -en lugar de valores …jos- y dependen de variables exógenas no incluidas en el modelo, al estimar sin tomar en cuenta esta situación se obtienen parámetros sesgados además de ine…cientes (debido a la presencia de heterocedasticidad en los errores). Un ejemplo de lo anterior sería

Yt =  0 +  1;t Xt + "t  1;t = 0 + 1 Zt +  t

reemplazando la segunda ecuación en la primera obtenemos

Yt =  0 + 0 Xt + 1 (Zt Xt ) + ( t Xt + "t )

o rede…niendo variables

Yt =  0 + 0 Xt + 1 Wt + "t 1.c) Conjunto de variables independientes incorrecto. 1.c.i) Inclusión de variables irrelevantes. El incluir una variable que no es estadísticamente signi…cativa en el modelo poblacional, en general no produce sesgo en los parámetros estimados.

Sin embargo, los

coe…cientes de aquellas variables correlacionadas con la variable irrelevante serán estimados en forma ine…ciente (su varianza no será mínima). Si la variable incluida por 6

no tiene efecto sobre los coe…cientes de las variables relevantes. 1.c.ii) Exclusión de variables relevantes. El no incluir una variable estadísticamente signi…cativa en el modelo poblacional, produce sesgo sobre los coe…cientes de aquellas variables correlacionadas con la excluida.

Si la variable excluida no está correlacionada con las demás, entonces no

se obtienen parámetros sesgados.

A pesar de que se produce sesgo, la exclusión de

la variable relevante reduce la varianza de los parámetros estimados para aquellas variables correlacionadas con la excluida.

Nota 1:

En términos generales, las violaciones al supuesto (1) tienen

que ver con errores de especí…cación del modelo poblacional, por lo que en lugar de requerir de métodos de estimación alternativos (excepto por el caso de modelos no líneales donde se requiere un método como Máxima Verosimilitud o Mínimos Cuadrados No Lineales), se requiere corregir la forma funcional que se quiere estimar para evitar problemas de sesgo o ine…ciencia del estimador MICO. Las posibles violaciones al supuesto (2) son 2.a) Autocorrelación. En este caso los errores de diferentes momentos del tiempo presentan una covarianza distinta de cero.

Un ejemplo sencillo de errores autocorrelacionados está dado

7

Yt =  0 +  1 Xt + "t "t = "t1 +  t t

 iid(0; 2)

2.b) Heterocedasticidad. Este concepto se re…ere a que la varianza del error poblacional no es constante a través del tiempo.

El ejemplo más común corresponde al caso en que la varianza

del error poblacional crece con el nivel de alguna de las variables independientes del modelo

Yt =  0 +  1 Xt + "t V ("t ) = Xt  2 En ámbas violaciones los parametros estimados mediante MICO siguen siendo insesgados, sin embargo son ine…cientes (no son los de mínima varianza dentro de los estimadores líneales insesgados).

Nota 2:

Ante la presencia de autocorrelación o heterocedasticidad

en los errores poblacionales, existe un método de estimación alternativo a MICO, que es el de mínima varianza (MELI). Mínimos Cuadrados Generalizados (MCG). Finalmente, las posibles violaciones al supuesto (3) son 8

Este método es el de

poblacional. 3.a.i) Covarianza no contemporanea. Esto corresponde al caso en que el error poblacional covaría con valores pasados o futuros de la variable independiente, pero no en el mismo momento del tiempo. Si bien los parámetros estimados por MICO son sesgados para la variable que se relaciona con el error poblacional, en la medida que el tamaño de la muestra tiende a in…nito MICO entrega parámetros consistentes. Un ejemplo de covarianza contemporanea viene dado por un modelo con variable endógena rezagada

Yt =  0 +  1 Yt1 + "t en este caso Xt

= Yt1

y mediante sustitución recursiva podemos observar que

Yt1 no depende de "t , aunque si de sus valores pasados

X t2

Yt1 = const +

 i1 "t1i

i=0

3.a.ii) Covarianza contemporanea. En este caso el error poblacional covaría con la variable independiente en el mismo momento del tiempo. Nuevamente MICO entrega parámetros sesgados, sin embargo aunque el tamaño de la muestra tienda a in…nito no es posible obtener parámetros consistentes. 9

ciones simultaneas (e.g. oferta y demanda) y el de variables independientes medidas con error.

El caso de variables mal medidas resulta interesante de revisar debido a

su común ocurrencia y falta de conciencia de los problemas que produce. Considere el modelo poblacional

Yt =  0 +  1 X t + "t Xt = Xt + ut donde Xt es una variable no observable y en su lugar se utiliza Xt , que se relaciona con la variable de interés a través de un error de medición ut . Al reemplazar Xt en el modelo poblacional, se obtiene

Yt =  0 +  1 Xt + ("t

 1u ) t

o rede…niendo variables

Yt =  0 +  1 Xt + "t donde "t covaría contemporaneamente con Xt (que depende de ut ). Nota 3:

En el caso de covarianza no contemporanea no se conoce

ningún estimador insesgado y dado que MICO es consistente, no se utiliza un estimador alternativo.

Sin embargo, en el caso de covarianza con-

temporanea existe un estimador alternativo a MICO, que a pesar de ser

10

Instrumentales (VI).

1.2

Estimadores Alternativos

1.2.1

Estimador de Máxima Verosimilitud (MV) y Mínimos Cuadrados No Lineales (MCNL)

El estimador MV puede ser utilizado tanto en modelos lineales como no lineales.

Para

su implementación, a diferencia del estimador MICO, requiere el asumir una cierta dis-

tribución para los errores poblacionales (que sea matemáticamente tratable!).

Una

vez escrita la función de probabilidad conjunta para todas las observaciones en la

muestra (función de verosimilitud), esta es maximizada con respecto a los parámet-

ros del modelo.

De esta forma, el estimador MV obtiene el vector de parámetros

que maximiza la probabilidad conjunta de obtener valores estimados de la variable

dependiente lo más cercanos a los valores observados en la muestra.

Para el caso en que el modelo es líneal y se asume que los errores se distribuyen

Normal, este estimador entrega el mismo vector de parámetros estimados que MICO

(el estimador de la varianza sólo di…ere en que la suma de residuos al cuadrado es

dividida por el tamaño total de la muestra en lugar de usar los grados de libertad

como lo hace el estimador MICO).

En el caso no líneal, dada la posibilidad de encontrar máximos locales en la fun-

11

un máximo global (las condiciones de primer orden no son su…cientes para la maximización ya que la función no es estrictamente concava, o dicho de otra forma no se cumplen las condiciones de segundo orden para un máximo).

Nuevamente, bajo

el supuesto de Normalidad de los errores poblacionales el estimador MV entrega el

b

mismo vector de parámetros estimados (  ) que el estimador MCNL. Bajo el supuesto de Normalidad tenemos que la función de densidad, para una observación en la muestra, está dada por

f ("t ) =

1

1 (2 2 ) 2

exp

n

 2"t

2

o

2

y, bajo independencia de los errores, la función de densidad conjunta es

Y

"2

T

f ("1 ; :::; "T ) =

9> 8> X T >< t> = t  exp T >> >> : ;

f ("t ) =

t=1

1

=1

2 2

(2 2 ) 2

El maximizar la función de verosimilitud anterior, con respecto a los parámetros, es equivalente a maximizar el logaritmo natural de dicha función.

Esto se debe a

que el logaritmo natural es una transformación monotónica (creciente), por lo que el argumento que maximiza ámbas funciones es el mismo. Luego, la función a maximizar sería

ln f ("1 ; :::; "T

X ) =  ln (2 )  " T 2

12

T

2

1 2 2

2 t

t=1

ln f ("1 ; :::; "T ) =  ln (2 )  T 2

2

1 2 2

T X t=1

(Yt   0 Xt 1 )2 

Entonces podemos de…nir el estimador MV de los parámetros como

b M V = arg max

"





T X t=1

(Yt 

#   0 X t 1 )2

y dado que el argumento que maximiza el negativo de una función es el mismo

que minimiza dicha función, entonces tenemos que

b M V = arg min 

"

T X

(Yt 

#   0 X t 1 )2

t=1

que a su vez es la de…nición del estimador MCNL.

Finalmente, el estimador de la varianza de los parámetros está dado por el inverso

del negativo del Hessiano del logaritmo de la función de verosimilitud

V (b M V ) =

1.2.2

h

@

2

ln f ("1 ;:::;"T ) 0 @@

i1

Estimador de Mínimos Cuadrados Generalizados (MCG) vs. MICOHAC

Como se mencionó anteriormente, ante la presencia de autocorrelación o heterocedas-

ticidad en los errores el estimador MCG es MELI. El vector de parámetros estimados

y su varianza se obtiene a través de las siguientes formulas

13

 MCG = (X 0 1 X )1 X 0 1 Y

bMCG ) = (X 0 1X )1 V ( donde



representa la matriz de varianza-covarianza de los errores poblacionales.

Sin imponer alguna estructura de autocorrelación o heterocedasticidad en particular,

dicha matriz puede escribirse como

2 6 6 6 6 6 0 E ("" ) =  = 6 6 6 6 6 4

 21  21

 12 ..



 2T

.

. . .

..

T 1 T 2

 1T

. . .

.

T2



3 7 7 7 7 7 7 7 7 7 7 5

La implementación del estimador MCG, por lo tanto, requiere el contar con un

estimador de la matriz

.

En el caso de heterocedasticidad pura, sólo necesitamos estimar los

T

elementos

de la diagonal principal.

b =

2  b12 6 6 6 6 0 6 6 6 . 6 . . 6 6 4 0

0 ..



. . .

. ..



0

0

.

0  bT 2

3 7 7 7 7 7 7 7 7 7 7 5

para esto podemos asumir que la varianza de los errores depende de variables exó-

genas, con lo que las varianzas estimadas pueden obtenerse a través de una regresión

14

de variables consideradas como potenciales responsables de la heterocedasticidad. En el caso de autocorrelación pura, al no imponer restricciones sobre la covarianza de los errores, el numero de parámetros a estimar supera largamente el numero de observaciones disponibles en la muestra.

Considerando la simetría de la matriz de

varianza-covarianza, así como asumiendo homocedasticidad, aún restan por estimarse

T (T

 1)=2 parámetros en la matriz .

estimar

45

Por ejemplo, si

T = 10 entonces

deberíamos

parámetros dentro de dicha matriz.

Debido a lo anterior, la práctica común es asumir una estructura de autocorrelación sencilla que permita estimar



en base a un numero reducido de parámetros.

El

supuesto usual es que los errores siguen un proceso AR(1). De esta forma, la matriz de varianza-covarianza está dada por

b = 1bb 2

2

donde

3 2 T 1 1 b    b 7 6 7 6 7 6 .. 6 T 2 7 . b b 7 6 7 6 7 6 . . .. 7 6 .. .. . 7 6 7 6 5 4 T 1 T 2 b b  1

b proviene de una regresión -por MICO- de los residuos del modelo original

sobre su primer rezago. El estimador MCG factible para heterocedasticidad o autocorrelación, sin embargo, no necesariamente resulta ser e…ciente comparado con el estimador MICO. 15

buena aproximación a la verdadera estructura poblacional.

Si dichos supuestos no

son apropiados, la varianza del estimador MCG implementado será aún mayor que la de MICO. Debido a lo anterior y recordando que MICO sigue siendo un estimador insesgado de los parámetros poblacionales, la alternativa disponible es quedarse con el estimador de los parámetros pero corregir la varianza de los mismos utilizando una representación robusta a la presencia de autocorrelación o heterocedasticidad en los errores poblacionales. Dicha matriz es conocida como HAC (Heteroskedasticity Autocorrelation Consistent). La varianza del estimador MICO, que permite errores no esféricos, esta dada por

V (b  )HAC = (X 0 X )1 (X 0 X )(X 0 X )1 donde la formula estándar

V (b  ) =  2 (X 0 X )1 se obtiene imponiendo el supuesto del MCRL

2 6 6 6 6 6 2 = I =6 6 6 6 6 4

2

0

0 ..

16

..



0 ...

.

.. .

0



0

.

0 2

3 7 7 7 7 7 7 7 7 7 7 5

X y la matriz de varianza-covarianza

.

Esta última no es conocida y ya vimos que su estimación

requiere la imposición de supuestos sobre la estructura de heterocedasticidad o autocorrelación de los errores.

Sin embargo, si consideramos la matriz

(X 0 X )

(que

corresponde a la varianza-covarianza de largo plazo o matriz espectral en frecuencia cero), esta puede ser estimada en forma consistente ya que implica un numero reducido de parámetros a estimar con

T

observaciones en la muestra.

Para el caso de heterocedasticidad, White (1980) propone estimar dicha matriz como

2 e21 6 6 6 6 6 0 06 0b X X = X 6 .. 6 . 6 6 4 0

donde el estimador

b 

0 ..



.. .

. ..



0

.

0

0

e2T

3 7 7 7 7 7 7 X 7 7 7 7 5

basado en los residuos al cuadrado estimados por MICO, a

pesar de ser inconsistente para la matriz de varianza-covarianza de los errores poblacionales, permite estimar consistentemente la matriz

(X 0 X ).

En el caso de autocorrelación el numero de parámetros a estimar es mucho mayor, sin embargo -de acuerdo a la metodología popularizada por Newey y West (1987)- es posible estimar la matriz de largo plazo como la suma ponderada de las matrices de corto plazo 17

(X 0  X )

T

= R(0) +

X

T 1 j =1

W (j ) [R(j ) + R(j )0]

R(j ) = V VT 0

j

2 e1 e1X11    e1Xk1 6 6 6 .. ... ... V = 66 ... . 6 4

eT eT X1T    eT XkT

8 > < 1 W (j ) = > :

0

Vj : m:

Matriz

V

j m+1 sí

3 7 7 7 7 7 7 5

9 > sí j < m = > ;

jm

rezagada en

j períodos

Numero máximo de rezagos

donde el vector de ponderación

W (j ) decrece linealmente asegurando la obtención

de un estimador consistente de la matriz de varianza-covarianza de largo plazo. Esto último se logra ya que la ponderación decreciente reconoce que aquellas covarianzas más alejadas en el tiempo son calculadas con menos información (menos observaciones) y por lo tanto deben tener un menor peso en la matriz de largo plazo.

1.2.3

Estimador de Variables Instrumentales (VI)

Como se mencionó anteriormente, sí el error poblacional covaría contemporaneamente con las variables independientes, el estimador MICO es sesgado e inconsistente. Aunque también sesgado, el estimador VI si es consistente en este caso. 18

bV I = (X 0 PZ X )1X 0 PZ Y  bV I ) =  2(X 0 PZ X )1 V ( PZ = Z (Z 0 Z )1 Z 0 donde PZ es la matriz de proyección perpendicular (de Mínimos Cuadrados Ordinarios) sobre el plano expandido por las columnas de la matriz de variables instrumentales Z . Las variables instrumentales deben cumplir con dos caracteristicas para ser considerados buenos instrumentos

1. No covaríar contemporaneamente con los errores poblacionales ".

2. Tener covarianza alta con las variables originales en la matriz X .

El estimador VI también es conocido como Mínimos Cuadrados en Dos Etapas (MC2E).

Lo anterior debido a que el estimador de los parámetros y su varianza

pueden escribirse como

b0X b )1 X b 0Y b  V I = (X b0X b )1 V (b V I ) = 2( X formulas que se derivan utilizando las propiedades de simetría e idempotencia de

b la matriz de proyección, así como la de…nición de ...


Similar Free PDFs