Notas Microeconometria Aplicada PDF

Title Notas Microeconometria Aplicada
Author Daniel Redel
Course Econometría Aplicada
Institution Pontificia Universidad Católica de Chile
Pages 33
File Size 664.5 KB
File Type PDF
Total Downloads 70
Total Views 142

Summary

Download Notas Microeconometria Aplicada PDF


Description

Microeconometr´ıa Aplicada Profesor: Felipe Gonz´ alez EAE3101 Pontificia Universidad Cat´olica de Chile

´ Indice 1. Introducci´ on 1.1. Especificaci´ on . . . . . . . . . 1.2. Poblaci´on, Muestra Precisi´on 1.3. Test de Hip´otesis . . . . . . . 1.4. Unbiasedness . . . . . . . . . 1.5. Endogeneidad . . . . . . . . . 1.6. Efectos Fijos . . . . . . . . . .

. . . . . .

3 3 4 4 4 5 6

2. Potential Outcomes y Experimentos Aleatorios 2.1. Causalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Potential Outcomes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Tipos de Experimentos Aleatorios . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1. Sobresubscripci´ on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2. Phase-In . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3. Aleatorizaci´on dentro de Grupos . . . . . . . . . . . . . . . . . . . . . 2.3.4. Dise˜ no con Est´ımulos . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Detalles Experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1. C´ alculos de Poder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2. Variables de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.3. Estratificaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.4. Nivel de Aleatorizaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.5. Aleatorizaci´on Imperfecta . . . . . . . . . . . . . . . . . . . . . . . . 2.4.6. Partial Compliance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.7. ITT vs LATE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.8. Externalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.9. Attrition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.10. Validez Externa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8 8 8 10 11 11 11 11 11 11 12 13 13 13 13 14 14 14 15

. . . . . .

. . . . . .

. . . . . .

. . . . . .

1

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

3. Variables Instrumentales 3.1. Marco Conceptual . . . . . . . . . . . . . . . . . 3.2. Estimaci´ on de MCO en Dos Etapas . . . . . . . . 3.3. Aplicaci´ on: Returns to Capital in Microenterprises 3.4. Aplicaci´ on: Do political Protests Matter? . . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

15 15 17 18 20

4. Matching y Controles Sint´ eticos 4.1. Selecci´ on en Observables . . . . . . . 4.2. Matching: Match Exacto . . . . . . . 4.3. Match Aproximado: Propensity Score 4.4. Controles Sint´eticos . . . . . . . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

20 20 20 22 22

5. Diferencias en Diferencias y otras Diferencias 5.1. Diferencia-en-Diferencias . . . . . . . . . . . . . 5.1.1. Aplicaci´on 1: Giorcelli (2018) . . . . . . 5.1.2. Aplicaci´on 2: Hornbeck y Naidu (2014) . 5.2. Estudio de Eventos . . . . . . . . . . . . . . . . 5.2.1. Aplicaci´on: Kleven et. al (2018) . . . . . 5.2.2. Aplicaci´on: Sarson (2017) . . . . . . . . 5.3. Diferencias Largas . . . . . . . . . . . . . . . . 5.3.1. Aplicaci´on: Burke y Emerick (2016) . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

25 25 26 28 29 29 30 30 30

y Bunching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

31 31 32 33

6. Regresi´ on Discontinua, Kinks 6.1. Marco Conceptual . . . . . 6.2. Implementaci´on . . . . . . . 6.3. Validez del Dise˜ no . . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

7. Transparencia, Replicaci´ on y Open Data

33

8. Big Data

33

2

1.

Introducci´ on

Un modelo econom´etrico intenta resumir una relaci´ on emp´ırica entre una variable dependiente (y) y una o muchas variables explicativas/regresores/independientes (X). La pregunta principal de este curso ser´a el encontrar una derivada parcial que relaciona causalmente ambas variables. Por ejemplo, si creemos que el salario de una eprsona se puede explicar con la educaci´ on podr´ıamos postular que: salario = f (educaci´ on)

(1)

Aqu´ı estoy revelando una Intencionalidad de Causalidad, es decir, si declaramos que el salario es´ a a la izquierda, estoy declarando mis intereses o mi agenda (me interesa el salario). Luego, hay probablemente muchos factores que explican el salario que no conocemos o no podemos observar.

1.1.

Especificaci´ on

Una especificaci´on m´as general de un modelo: y = f (X, ǫ)

(2)

donde y es una variable de inter´es, X representa un conjunto de variables observables que creemos afectan a y. Luego, ǫ representan las variables no-observables: (i) sabemos que hay factores que se nos fue incluir, no son considerados y no conocemos y (ii) hay factores que conocemos pero no nos interesa o es dificil de medir. Sabemos que estos inobservables son cambiantes en el tiempo y dependen del tema de inter´es. Hasta el momento hemos hecho pocos supuestos en torno a f(...); no hemos parametrizado la funci´ on, por lo que no he dicho c´ omo es ni c´omo se comporta. A continuaci´ on incluiremos dos grandes supuestos: (i) Supuesto de Separabilidad: Las variables independientes se relacionan con la dependiente de manera aditiva, es decir y = g(X) + ǫ

(3)

(ii) Supuesto de Linealidad: La relaci´on de las variables independientes con la variable dependiente ser´ a lineal. Es decir, decimoes que hay linealidad en g(X): y = α + βX + ǫ

(4)

Problema de Especificaci´on: asumiendo que es una funci´on separable y aditiva (no cuestionaremos en este curso), debemos determinar la forma de la funci´on a estimar (dependientes vs independiente). Existen 2 aproximaciones para especificar un problema:

3

(i) Especificaci´ on Estructural Derivamos una especificaci´on a partir de un Modelo Te´orico. Aqu´ı, el problema de especificaci´on se patea un paso hacia atr´as hacia el modelo te´ orico: los supuestos que habr´ıa que verificar ser´ an los del Modelo, donde la especificaci´on ser´ a correcta si los supuestos del modelo son correctos. Los modelos econ´omicos asument como se comporta el individuo y las firmas. (ii) Especificaci´ on Reducida No se extrae de ning´ un modelo, no asume nada sobre el comportamiento de los agentes o variables, m´as all´a de la separabilidad y aditividad.

1.2.

Poblaci´ on, Muestra Precisi´ on

Para poder estimar una ecuaci´on lineal por MCO necesitamos datos (y,x). Estos datos pueden corresponder a una poblaci´ on o una muestra de esa poblaci´on. La muestra puede o no ser representativa de la poblaci´on. Entender el proceso por el cual se obtiene la muestra es crucial para poder interpretar los coecientes de la ecuaci´ on. A veces podemos no querer representatividad poblacional. Un Intervalo de Confianza me dice qu´e tan cerca est´ a mi muestra de mi poblaci´ on, en ese sentido decimos que nos muestra el nivel de incertidumbre en torno a nuestra estimaci´ on. Pero y si tengo datos poblacionales: ¿c´ omo entendemos el nivel de incertidumbre? Todo depende de mi poblaci´ on objetivo.

1.3.

Test de Hip´ otesis

Ojo con la intepretaci´ on de los p-values: no son tan importantes como creemos. Lo primordial es el valor de los coeficientes (significancia econ´ omica), nos importa que β tenga un buen tama˜ no. El p-value es secundario, cuando queremos saber la precisi´on de ese coeficiente estimado.

1.4.

Unbiasedness

Si se cumplen algunos supuestos en el modelo de regresi´ on lineal, podemos decir que los par´ ametros son consistentes. Loas regresiones lineales son consistentes bajo ceteris paribus del resto de las variables (algo dif´ıcil de que se cumpla). Con consistencia, podemos afirmar que el coeficiente tiene una interpretaci´on causal. Our goal in empirical work is estimate the causal effect of x on y in a population. We never directly observe the population parameters, because they are not data. What we can do, though, is estimate these parameters using data and assumptions. We just have to have credible assumptions to accurately estimate these parameters with data. Two assumptions: 1. E(u) = 0 2. E(u | x) = E(u) for all values x (Mean independence)

4

If equation b) holds, then we say that u is mean independent of x. In our example of ability and education, we say that, because people choose education based partly on that unobserved ability, equation b) is almost certainly violated in this actual example. Combining a) and b), you get the following new assumption: 1. E(u| x) = 0, for all values x (Zero Conditional Mean Assumption). This is a key identifying assumption in regression models. Because the conditional expected value is a linear operator, a) implies: E(yIx) = a + βx + u which shows the population regression function is a linear function of x. This relationship is crucial for the intuition of the parameter β, as a causal parameter. Unbiasedness is the idea that if we could take as many random samples on Y as we want from the population and compute an estimate each time, the average of these estimates would be equal to β1 . There are several assumptions required for OLS to be unbiased: 1. The first assumption is called linear in the parameters. 2. Our second assumption is random sampling. We have a random sample of size n, following the population model. 3. The third assumption is called the sample variation in the explanatory variable. That is, the sample outcomes on xi are not all the same value. 4. The fourth assumption is where our assumptions start to have real teeth. It is called the zero conditional mean assumption and is probably the most critical assumption in causal inference. In the population, the error term is E(u|x) = E(u) = 0 (The error does not change with x ). The key thing is that the error does no change with changes in x. Note that we can compute the OLS estimates whether or not this assumption holds, or even if there is an underlying population model.

1.5.

Endogeneidad

When we refer to causal analysis of nonexperimental data, we are referring to designs that will produce coefficients that capture the magnitude of the true (causal) relationship rather than just an association or a correlation (which could be spurious). True estimates are called consistent. To say that an estimate is consistent suggests that it will converge to the true population parameter as sample size converges to infinity (i.e., asymptotically). The main threat to consistency is endogeneity. If an estimate is inconsistent, it is purely and simply uninterpretable. A coefficient may appear to adequately reflect the hypothesized relationship —for example, it is the right direction and the effect is highly significant— but in presence of endogeneity it will be inconsistent and will not reflect the true population parameter.

5

Una de las cosas m´ a s importantes en este curso ser´ a poder presentar estrategias de identificaci´ on, s´olo as´ı es posible corregir el problema de endogeneidad y, por tanto, dar con una interpretaci´on causal. Cuando la estimaci´on de un par´ametro es consistente, decimos que el par´ ametro est´ a identicado. Esto es cuando se cumple la premisa de Media Condicional Cero. In a multiple linear regression, if at least one of the regressors is correlated with the residual, then the equation E(u|x) = 0 is violated. In that case, we say that the regression suffers from endogeneity problem. Por otra parte, habr´a endogeneidad si: 1. Variable Omitida 2. Causalidad Inversa 3. Bad Control Si una variable no es end´ogena, decimos que es ex´ogena. Intuci´ on: cuando algo se vuelve ex´ ogeno, es porque puedo manipularlo (ejemplo: el estado elige aleatoriamente a tratados para un programa. El estado intervino as´ı en la decisi´on de las personas, fue un cambio ex´ ogeno a la decisi´ on de esas personas). El desaf´ıo es encontrar una Estrategia de Identificaci´ on. Cuando la estimaci´on de un par´ ametro es consistente, decimos que el par´ametro est´a identicado. El conjunto de los datos, la especicaci´ on, y la variaci´on en los datos que se utiliza para estimar el par´ametro de inter´es se conoce como estrategia de identificaci´ on.

1.6.

Efectos Fijos

Conocer la estructura de datos es importante (corte transversal vs datos de panel vs m´ ultiples cortes) porque nos permite determinar con mayor detalle c´ omo comparar unidades y absorber diferencias observables e inobservables. Un efecto fijo es el coeciente asociado a un indicador.Por ejemplo, una regresi´ on puede incluir efectos fijos por industria j = 1, ..., J, donde cada industria contiene 1 indicador en los datos (dummy): Dj = 1si j = 10si j 6= 1

(5)

Ejemplos: Suponga que queremos estimar la relaci´on emp´ırica entre salario e industria (tres industrias): yij = α + ǫij (6) yij = α + β1 Di1 + ǫij

(7)

yij = α + β1 Di1 + β2 Di2 + ǫij

(8)

En la ecuaci´on (6) tenemos que α representa el salario promedio de la muestra. En la ecuaci´ on (7) tenemos que β1 se interpreta como el premio/castigo por trabajar en la industria j = 1 respecto del resto de las industrias, esto es, del par´ametro α que ahora representa el salario promedio de industrias j = 2, 3. Luego, el salario promedio de la persona i que trabaja en la industria j = 1 se obtiene sumando α + β1 . En la ecuaci´ on (8) tenemos que, al ser 3 industrias, el par´ametro α representa el salario promedio de la persona i en la industria 3. Aqu´ı no es posible agregar una dummy para la indutria 3 a menos que eliminemos el 6

par´ ametro alpha, de lo contrario se genera un problema de multicolinealidad. Entonces, vemos que las dummies Dj absorven toda la variaci´ on que existe entre las industrias (proveniente de las industrias). Esto es muy u´til para estimar coeficientes que no contengan la variaci´ on por lugares o por periodos. Por ejemplo, la relaci´on salarios y educaci´ on. Si no me interesa la heterogeneidad entre las industrias, sino que s´ olo quiero la relaci´ on de salarios con educaci´on, puedo hacer lo siguiente: yij = α + βe educij + β1 Di1 + β2 Di2 + ǫij yij = βe educij + β1 Di1 + β2 Di2 + β3 Di3 + ǫij

(9) (10)

Donde en la ecuaci´on (9) asumiremos que existe alguna industria que ser´a omitida (da lo mismo cual, pero en este caso es la 3). Aqu´ı estamos dejando que cada industria tenga su propio salario promedio, determinado por la suma de α + βe + βj . As´ı, el coeficiente βe capta la correlaci´on entre salarios y educaci´on aislando las diferencias por industria o, alternativamente, βe es el efecto de la educaci´ on en los salarios dentro de cada industria (efecto within). Pasamos de comparar (i) el salario promedio con distintos a˜ nos de educaci´on a (ii) el salario promedio con distintos a˜ nos de educaci´on dentro de cada industria o en la misma industria (la correlaci´on entre salario y educaci´on dentro de una misma industria). Los efectos fijos se agrupan y representan de la siguiente manera: yij = α + βe educij + φj + ǫij

(11)

yij = βe educij + φj + ǫij

(12)

En este caso, α en (11) es el salario promedio de la persona i sin a˜ nos de eduaci´ on y que trabaja en la industria omitida (j = 3). Luego, φj ser´ıa el salario diferencial seg´ un industria, con la diferencia de que en ecuaci´on (12) est´an todas las industrias absorvidas en el mismo par´ ametro. La industria j = 2 tiene un efecto fijo de φ2 . ¿C´ omo saber cu´ ando incorporar efectos fijos? Si hay razones justificadas para creer que los j ser´ an distintos, vale la pena imponer efectos fijos. Importante decir que se absorven tanto observables como no-observables. Finalmente, t´ıpicamente uno agrega efectos fijos por territorio y por periodos: yijt = βe educijt + φj + ηt + ǫij t

(13)

Los efectos fijos son particularmente u ´ tiles cuando utilizamos datos de panel porque nos permiten absorber toda la variaci´on entre, por ejemplo, estudiantes. En este caso, los efectos fijos estar´ıan ayud´ andonos a controlar por todas las diferencias observables e inobservables entre estudiantes que no cambian en el tiempo. Es posible comparar a un individuo i consigo mismo en distintos a˜ nos, al estar absorviendo las diferencias temporales tanto en observables como no-observables. Ahora, como es una misma persona, hay menos cosas no-observables por absorver con efectos fijos.

7

2. 2.1.

Potential Outcomes y Experimentos Aleatorios Causalidad

La interpretaci´on de un modelo y sus par´ametros estimados es una de las partes m´ as importantes de la investigaci´on emp´ırica. ¿C´omo saber si un par´ametro β mide una correlaci´ on o una causalidad? Depende de si hay estrategia de identicaci´ on para superar el problema de endogeneidad y su calidad. En esta secci´ on estudiaremos la estructura de investigaciones que tienen por objetivo estimar relaciones causales con experimentos aleatorios.

2.2.

Potential Outcomes

El marco te´ orico est´ andar para formalizar el problema de la evaluaci´ on de impacto se basa en el modelo de potential outcomes. Formalmente, definimos el indicador tratamiento como Di . Las variables resultados u outcomes las definimos como Y (D : i) para cada individuo i. El efecto del tratamiento para undividuo i se puede escribir como: τ = Yi (1) − Yi (0)

(14)

El Problema Fundamental de la evaluaci´ on de impacto es que s´olo se da uno de los dos potential outcomes, nunca ambos. As´ı, el resultado observado se puede escribir como: Yi = Di Yi (1) + (1 − Di )Yi (0)

(15)

En primera instancia, se puede estimar el impacto promedio en tratados (ATE). Sin embargo, en la realidad s´olo podemos ver E[Y (1)i |D = 1] − E[Y (0)i |D = 0]. Si alteramos un poco la ecuaci´ on, tendremos que: E[Y (1)i |D = 1] − E[Y (0)i |D = 0] = E[Y (1)i |D = 1] − E[Y (0)i |D = 1] +E[Y (0)i |D = 1] − E[Y (0)i |D = 0]

(16)

El primer t´ermino de la ecuaci´on 16 se conoce como Efecto Tratamiento en los Tratados (ATT y se lee as´ı: La diferencia entre el outcome del grupo tratamiento (D1 ) si hubiese rec...


Similar Free PDFs