Title | Econometria Parte 1 Ene22 Rev |
---|---|
Author | Carlos Juarez |
Course | ECONOMETRIA |
Institution | Instituto Tecnológico Autonómo de México |
Pages | 61 |
File Size | 1.3 MB |
File Type | |
Total Downloads | 28 |
Total Views | 287 |
Download Econometria Parte 1 Ene22 Rev PDF
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
CURSO DE ECONOMETRÍA ITAM
Dr. Víctor M. Guerrero Departamento de Estadística - ITAM [email protected] Enero de 2022
1
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
1. INTRODUCCIÓN A LA ECONOMETRÍA ECONOMETRÍA, MODELOS Y DATOS - Definición de Econometría. Rama de la Economía que se ocupa de la estimación empírica (o sea, basada en los datos) de las relaciones económicas. - Ingredientes principales de la Econometría: 1) Teoría y 2) hechos. Teoría
Hechos
Modelo
Datos
Especificación
Teoría Estadística Preparación de datos
Modelo Econométrico
Datos refinados
Técnicas Econométricas
Estimación del modelo econométrico con los datos refinados,
Usos del modelo
Análisis estructural
Pronóstico
Evaluación de planes y políticas 2
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
- Objetivos de la Econometría. Los objetivos de la Econometría se relacionan directamente con los usos que se pueden dar a los modelos que produce. De esta manera, se tiene que los usos y objetivos principales son: 1. Análisis estructural. Es el objetivo de carácter científico, mediante el cual se trata de entender el mundo real con la validación de relaciones económicas. Este objetivo a su vez influye en ocasiones sobre la teoría. 2. Pronóstico. El objetivo aquí es predecir los valores de las variables que se desea, fuera de la muestra de datos observada. Los pronósticos no son un fin en sí mismos, sino que constituyen la base para tomar decisiones. 3. Evaluación de planes y políticas. Este constituye el uso del modelo para decidir entre diversos planes o políticas en consideración. Una manera de realizar esta actividad es mediante la simulación de lo que ocurriría con cada una de las alternativas, según lo que indique el modelo. Los tres principales usos de la Econometría están íntimamente ligados entre sí, de tal forma que la estructura determinada en un análisis estructural se utiliza después para pronosticar, o bien, la evaluación de políticas con el modelo constituye en realidad un pronóstico de tipo condicional. Sin embargo, es importante reconocer que un modelo econométrico útil para pronosticar puede no servir para realizar análisis estructural y esperar que cualquier modelo sea útil para todo, es un abuso de la Econometría.
3
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
- Modelos econométricos. Modelo: Representación simplificada de un fenómeno real (por lo tanto, todo modelo es erróneo, ya que simplifica algún aspecto de la realidad) MODELO MATEMÁTICO
Inicio Mundo Real
Abstracción (Detección de características Realidad relevantes) Axiomática
Contrastación con la realidad
Aplicaciones
Desarrollo (Traducción a Matemáticas)
Concreción (Interpretación de resultados)
Teoría Matemática
Modelo para el Ingreso Nacional (en una economía cerrada) • Identidad: Y C + I + G Y = PNB, C = Consumo, I = Inversión, G = Gasto del gobierno (los flujos de C, I y G se suponen medidos en términos reales).
4
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
• Teoría: 1) C = f1 ((1 − τ )Y, r ) con = tasa impositiva,
(1 − τ)Y = Ingreso disponible libre de impuestos y r = tasa de interés. 2) I = f 2 (ΔY, r ) con ΔY el cambio en PNB. La teoría puede indicar las variables explicativas, las ecuaciones y quizás, los signos de las derivadas parciales. Por ejemplo, en la ecuación 1) se esperaría que
0
f 1 ((1 − τ )Y, r ) 1 (1 − τ)Y
y
f1 ((1 − τ )Y, r ) 0 r
o sea que la propensión marginal del consumo C = f1 ((1 − τ )Y, r ), al ingreso disponible, debería ser una fracción positiva, menor que la unidad, y un incremento en r debería traer consigo un efecto depresivo sobre el consumo (ya que eleva la tasa de rendimiento del ahorro e incrementa el costo del financiamiento de bienes duraderos, entre otras cosas). Por su lado, debido a la ecuación 2), se debería tener que f 2 (ΔY, r ) 0 ΔY
y
f 2 (ΔY, r) 0 r
en donde se supone que la inversión, I = f 2 (ΔY, r ) , está influenciada al alza por las expectativas de ganancias que, de manera un tanto burda, se
5
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
aproximan mediante ΔY ; de nuevo, se esperaría que la tasa de interés afectara negativamente, a la inversión en este caso. En esta situación, la Econometría sirve como complemento para determinar: i) La forma funcional de las relaciones 1) y 2). Por ejemplo, si se omite la variable r, podría tenerse alguna de las siguientes opciones, que no se deducen de la teoría, sino del comportamiento de los datos con que se cuente:
C = β 0 + β1 (1 − τ)Y , lineal C = β0 [ (1 − τ )Y] β1 ,
exponencial
o
C = β0 − β1 (1 − τ )Y , recíproca. −1
ii) El tipo de datos más apropiados y su escala de medición. Por ejemplo: ¿cuál es la variable que mejor representa al ingreso, Y? ¿deben usarse datos ajustados por estacionalidad? ¿qué tasa de interés, r, debería emplearse? iii) El tipo de estructura de retrasos (la dinámica del sistema al paso del tiempo), variables alternativas que no fueron consideradas explícitamente por el modelo propuesto, etc. Además, conviene conocer la distinción entre dos tipos de datos con los que se puede realizar análisis econométrico: 6
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
a) Los de CORTE TRANSVERSAL, o sea, aquellos que se observan en un cierto momento, que se generan especialmente a través de encuestas y que no tienen un orden de observación asignado. b) Los datos de SERIES DE TIEMPO, que se caracterizan por tener explícitamente un orden cronológico de observación, lo cual no permite intercambiar lugares de los datos y que, además, son obtenidos de manera rutinaria y sistemática, particularmente por agencias gubernamentales.
7
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
2. MODELO DE REGRESIÓN LINEAL SIMPLE - Introducción. En esta parte se considerarán modelos formados por una sola ecuación, del tipo Y = f(X) donde Y representa la variable dependiente (por ser explicada o endógena) y X es la variable independiente (explicativa o exógena). La especificación del modelo será lineal en los parámetros. De esta forma se habla del modelo de regresión lineal simple, que explica el comportamiento (o variabilidad) de Y simplemente a través de X, por medio de la relación
Y = β 0 + β1X que es lineal en los parámetros porque estos entran en el modelo como combinación lineal de las variables, o sea Y = (β 0 , β 1 )(1, X)' .
El primer paso en una investigación econométrica de la relación entre Y y X consiste en obtener una muestra de n parejas de datos sobre estas variables. Los datos muestrales se denotan entonces por Yi , X i , para i = 1, 2,..., n, o sea
8
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
i
Yi
Xi
1
Y1
X1
...
...
...
n
Yn
Xn
Además, se debe hacer explícita la incertidumbre de que el modelo de regresión lineal simple explique por completo la variabilidad de Y, para ello se introduce una perturbación estocástica (un error aleatorio) que le brinda mayor flexibilidad al modelo, y así se llega a la representación
Yi = β 0 + β1 X i + u i , para i = 1,..., n donde u i denota el término de error. Por ejemplo, si se investiga la relación entre el gasto en bienes de consumo y el ingreso familiar disponible, en una muestra de corte transversal, Y corresponde al gasto, X es el ingreso y n es el número de familias. Debe ser claro que aun dentro de grupos familiares del mismo tamaño y composición, habrá variación en el gasto, aunque el ingreso disponible sea el mismo. Esto se puede deber a otras variables no incluidas en el modelo (como la edad del jefe de familia, los gustos familiares, la tendencia a crecer o decrecer del ingreso, etc.) estas variables omitidas son tenidas en cuenta por el error u.
9
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
Asimismo, u sirve para incorporar el hecho de que la variable Y puede estar medida con error, de forma tal que Z es la verdadera, pero Y es la observada, o sea Z = β 0 + β 1X + v
error en la ecuación
Y= Z+ w
Y = β 0 + β1X + u
error de medición con u = v + w
incluso podría tenerse v = 0, en cuyo caso u = w. Ya que u es una variable aleatoria, el modelo se complementa con supuestos acerca de su comportamiento probabilístico, para ello se hace referencia a sus primeros dos momentos, es decir, su valor esperado, su varianza y su covarianza. De hecho, se supone que E(ui ) = 0, Var(ui ) = σ2 y Cov(u i, u j) = E(u iu j) = 0
para i, j = 1, ..., n y j i . También conviene considerar que la distribución del error es Normal, en tal caso se tiene que u1, ..., un constituye una muestra aleatoria (m.a.) porque se tiene un conjunto de n variables aleatorias independientes e idénticamente distribuidas (i.i.d.) provenientes de la distribución N(0, 2 ) , lo cual se representa gráficamente con la figura que sigue
10
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
β 0 + β1 X n
f(u)
Y (Gasto)
Yn Y2
β 0 + β 1X 2
β 0 + β1 X1 Y1 0
u2
un
u1
β 0 + β 1X
X1 X2 Xn
X (Ingreso) Un supuesto adicional en el modelo es el de linealidad en las variables, la cual puede ser tan solo aproximada y con eso es suficiente. Y
Y
X Y
X Y
X
X 11
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
- Estimación por Mínimos Cuadrados. Para cada selección de valores de los parámetros, se obtiene un conjunto de valores estimados de las Y ' s , o sea, con los valores βˆ 0 y βˆ1 se obtiene
ˆ i = βˆ 0 + βˆ 1 Xi para i = 1, ..., n. Y
A la diferencia entre lo observado y lo estimado se le llama residuo o sea
(
) (
)
ei = Yi − Yˆ i = Yi − βˆ 0 − βˆ 1 Xi = β0 − βˆ 0 + β1 − βˆ1 X i + u i
de manera que e i u i , excepto si βˆ 0 = β0 y βˆ 1 = β1 . La idea del método de Mínimos Cuadrados Ordinarios (MCO) consiste en seleccionar los parámetros estimados b 0 = βˆ 0 y b1 = βˆ1 que minimicen n
e 2i , que es la suma de residuos al cuadrado, también llamada Suma de
i =1
Cuadrados Residual (SCR), con
e
2 i
(
)
2
= Yi − βˆ 0 − βˆ 1X i .
Para minimizar la SCR, primero se obtienen las derivadas parciales, evaluadas en βˆ 0 = b0 y βˆ 1 = b1 , o sea
12
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
que conducen al siguiente sistema de dos ecuaciones lineales con dos incógnitas
Y
= b0 n + b1 X i
Ecuaciones normales. Xi Yi = b0 X i + b1 X 2i i
De la primera ecuación se sigue que
b 0 = Y − b1 X mientras que, del sistema completo, se obtiene
n b1 =
Y X Y X X i
X
i
i
n
X
i
i
i
=
n X i Yi − X i Yi n X 2i − ( X i )
2
2 i
así que, para calcular b0 y b1, se requieren las siguientes cantidades n, X i , Yi , X i Yi y X2i
Ejemplo. Para ilustrar los cálculos numéricos, considérese el siguiente conjunto de n = 5 datos
13
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
i
Xi
Yi
X i Yi
Xi2
1
2
4
8
4
2
3
7
21
9
3
1
3
3
1
4
5
9
45
25
5
9
17
153
81
Suma
20
40
230
120
Entonces X i = 20 y Yi = 40, de forma que X = 4 y Y = 8 , además
b1 =
5(230)− 20(40) 1150− 800 350 = = 1.75 2 = 5(120)− (20) 600− 400 200
y
b0 = 8-1.75(4) = 1
o sea que la regresión estimada de Y sobre X es
ˆ i = 1 + 1.75Xi para i = 1,…, n. Y A partir de esta ecuación se pueden obtener los valores estimados por el modelo, correspondientes a las observaciones de X, es decir
ˆ = 1+ 1.75 X = 1 + 1.75(2) = 4.5 Y 1 1 ˆ = 1 + 1.75 X =1+1.75(3) = 6.25 Y 2 2
ˆ 3 = ... Y
...
= 2.75
ˆ 4 = ... Y
...
= 9.75
ˆ 5 = ... Y
...
= 16.75
14
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
De esta forma, los residuos vienen a ser e1 = Y1 − ˆY1 = 4 − 4.5= − 0.5, e2 = 7 − 6.25= 0.75, e3 = 0.25, e4 = − 0.75 y e5 = 0.25
Propiedades de la recta de regresión con las estimaciones b0 y b1. 1.- La recta pasa por el punto de medias
(X, Y )
y esto hace que la suma de
residuos sea cero, o sea
ei = 0 . Demostración.
e = (Y − b i
i
0
− b1X i) = Yi − b 0n − b 1 X i = n(Y − b 0 − b 1X ) = 0 porque b 0 = Y − b1 X
2.- Los residuos tienen covarianza muestral cero con los valores muestrales X y con los valores estimados Yˆ , o sea
Cˆov( X, e) =
1 ˆ , e) = 0 . ( Xi − X )(ei − e) = 0 y Cˆov(Y n −1
Demostración. Coˆ v( X, e) =
1 (X i − X)(e i − e ) n−1
=
1 ( X i − X)e i n −1
=
1 1 X ei Xiei − n −1 n− 1
porque e = 0
15
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
=
1 X i ei n −1
=
1 X i (Yi − b 0 − b1X i ) n−1
=
1 ( Xi Yi − b0 Xi − b1 X i2 ) n −1
=0
por la 2ª. ecuación normal
Además,
ˆ , e) = Coˆv(b 0 + b1 X, e) = Cˆov(b0 , e) + Co Cˆov(Y ˆ v(b 1X, e) = 0 + b1Coˆ v(X, e) = 0
3.- El coeficiente de la pendiente en la regresión también puede calcularse a partir de las desviaciones de X y Y respecto a sus medias, o sea, si se define
xi = Xi − X
y y i = Yi − Y
entonces
b1 = xi yi / xi2 Demostración. Como (X i − X ) 2 = (X 2i − 2X i X + X 2 )
= X 2i − 2 X X i + nX 2
= Xi2 − nX 2 = X2i − ( Xi ) 2 / n
16
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
y ( X i − X)( Yi − Y) = ( X i Yi − X i Y − XYi + XY)
= Xi Yi − Y X i − X Yi + nXY
= X i Yi − nXY = Xi Yi −( X i )( Yi ) / n
entonces
b1 =
n X iY i − X i Y i n X − ( X i ) 2 i
2
=
n (X i − X)(Yi − Y) n (X i − X)
2
=
x y x i
i
2 i
4.- La suma de cuadrados asociada con la variación en Y, se puede expresar en términos de la variación “explicada” por la regresión, más la variación “no explicada por el modelo”.
Demostración. En principio, nótese que ˆ − Y = b + b X − Y = Y − b X + b X − Y = b (X − X) = b x yˆ i = Y i 0 1 i 1 1 i 1 i 1 i
entonces, como
yi = Yi − Y = (Yˆ i + e i ) − Y = yˆ i + e i se deduce que 2 2 2 2 2 2 y i = ( yˆ i + e i ) = ˆyi + 2 yˆ ie i + e i = yˆ i + e i
porque Coˆ v( yˆ , e) = 0
17
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
es decir 2 y 2i = yˆ 2i + ei
Esto puede escribirse entonces como SCT
=
Suma de Cuadrados Total de Y, respecto a su media
SCE Suma de Cuadrados de Y Explicada por la Regresión
+
SCR Suma de Cuadrados no Explicada o Residual
Nótese que se tienen las siguientes expresiones de cálculo
SCE = yˆ i2
= (b1x i )
2
= b21 xi2 = ( x i y i ) 2 / x i2
porque b1 =
x y x i
i
2 i
Por otro lado, se debe notar que la varianza del error verdadero es desconocida, pero se sabe que
σ 2 = Var(u i ) = E(u 2i ) − [ E(u i )]2 = E(u2i ) ,
18
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
2 por ello, es razonable estimar a σ como un promedio de los residuos al
cuadrado, de manera que lo que se usa como estimador es
S2 = SCR / g.l. = e i2 /(n − 2) donde los grados de libertad (g.l.) son en este caso n-2, ya que se tuvo que estimar dos parámetros (β0 y β1 ) para poder calcular los residuos. De 2 hecho, más adelante se demostrará que S resulta ser un estimador 2 insesgado de σ .
- Medidas de bondad de ajuste.
Es importante medir la bondad del ajuste logrado con la recta para estimar los datos observados, esto se logra con el coeficiente de correlación y con el coeficiente de determinación. El coeficiente de correlación muestral entre Y y X viene dado por
r=
Co ˆ v(Y, X) xi yi /(n − 1) = SX SY ˆ x ˆ y
donde
S X = σˆ X =
x
2 i
/(n − 1) y S Y = σˆ Y =
y /(n − 1) 2 i
Otra manera de expresar el coeficiente de correlación es como sigue
19
Curso de Econometría-ITAM
Versión 2022
Dr. Víctor M. Guerrero
x iy i
r=
2
xi
2
yi
x y x2 i i i = x2 2 i y i
= b1
SX SY
de donde se sigue que
debe notarse que b1 y r tienen el mismo signo. El coeficiente de determinación, por su lado, se obtiene al elevar al cuadrado el coeficiente de correlación, o sea, como
r2 =
=
2
con
( x iy i ) 2 ( x 2i )( y 2i )
SCE SCT
=1−
de tal manera que r
r 2,
SCR SCT
mide la proporción de SCT explicada por la
regresión. Además, de las últimas dos expresiones para r 2 se deduce que 0 r 2 1 por lo cual − 1 r 1