Econometria con Stata PDF

Title Econometria con Stata
Author Osvaldo Nina
Course Econometría I
Institution Universidad Mayor de San Andrés
Pages 31
File Size 994.1 KB
File Type PDF
Total Downloads 7
Total Views 140

Summary

Manual para realizar estimaciones econométricas con STATA....


Description

Introducción a la Econometría con STATA Osvaldo Nina INESAD

Agosto 2013

Contenido

1. 2.

INTRODUCCIÓN ..................................................................................................................... 1 CONCEPTOS BÁSICOS........................................................................................................... 1 2.1. Etapas del análisis económico empírico ...................................................................... 1 2.2. Modelo económico ....................................................................................................... 2 2.3. Modelo econométrico................................................................................................... 2 2.4. Estructura de datos económicos .................................................................................. 4 2.5. Métodos de estimación ................................................................................................ 6 3. ANÁLISIS DE REGRESIÓN CON DATOS DE CORTE TRANSVERSAL .............................................. 7 3.1. Regresión lineal simple ................................................................................................ 8 3.2. Mínimos Cuadros Ordinarios (MCO) ...........................................................................11 3.2.1. Procedimiento ......................................................................................................12 3.2.2. Bondad de ajuste .................................................................................................13 3.2.3. Hipótesis sobre los estimadores ..........................................................................14 4. ANÁLISIS DE REGRESIÓN MÚLTIPLE ......................................................................................17 4.1. Estimadores MCO.......................................................................................................17 4.2. Test de hipótesis.........................................................................................................20 4.2.1. Test de Linealidad ...............................................................................................20 4.2.2. Test de Heteroscedasticidad................................................................................21 4.2.3. Test de Multicolinealidad .....................................................................................23 4.2.4. Test de Especificación del Modelo .......................................................................23 4.2.5. Test de Normalidad..............................................................................................24 4.3. Mejoras al modelo analizado ......................................................................................26

1. INTRODUCCIÓN El manual es una introducción básica a la econometría utilizando el programa STATA. En ese sentido, nos centraremos a desarrollar conceptos básicos para el análisis de regresión con datos de corte transversal. La econometría se basa en el desarrollo de métodos estadísticos destinados a estimar las relaciones económicas, contrastar teorías económicas, y evaluar y poner en práctica políticas públicas y de negocio. Por ejemplo, la econometría puede estudiar:  Educación: el efecto de los gastos de escolarización sobre el rendimiento de los alumnos.  Ciencia Política: los efectos de los gastos de campaña sobre los resultados de las votaciones. La econometría se ha desarrollado como una disciplina distinta de la estadística matemática ya que se centra en los problemas inherentes a la recopilación y al análisis de datos económicos no experimentales. Los datos no experimentales no se recogen mediante experimentos controlados con individuos, empresas o segmentos de la economía. Los datos no experimentales se denominan a veces datos de observación para enfatizar el hecho de que el investigador recopila datos de forma pasiva.

2. CONCEPTOS BÁSICOS 2.1. Etapas del análisis económico empírico El análisis económico empírico consiste en la utilización de datos económicos para contrastar una teoría o estimar una relación que tiene cierta importancia para la toma de decisiones en los negocios o para el análisis de políticas públicas. Las etapas del análisis empírico son: 1. Construcción de un modelo económico formal; 2. Transformación del modelo formal a un modelo econométrico; 3. Formulación de varias hipótesis de interés en términos de los parámetros desconocidos; 4. Selección del modelo de estimación de los parámetros; 5. Análisis de los estimadores: valores y signos de los parámetros determinan la validez de una teoría económica y los efectos de ciertas políticas económicas.

1

2.2. Modelo económico Un modelo económico consiste en ecuaciones matemáticas que describen varias relaciones. Estos modelos describen toda una serie de comportamientos. La modelización económica formal constituye en el primer paso del análisis empírico, pero normalmente el uso que se hace de la teoría económica es menos formal, basándose incluso únicamente en la intuición. En particular, bajo supuestos generales podemos derivar como función de varios factores una ecuación que describe la variable que queremos analizar. Como se detalla en el siguiente recuadro.

Modelo Económico: La literatura sobre geografía y desarrollo en Bolivia

El documento de trabajo de Andersen y Nina (2005) realiza una revisión de la literatura para realizar una modelización económica de la relación entre geografía y desarrollo a nivel municipal para el caso de Bolivia. La revisión da lugar a proponer la siguiente función:

donde:

Como suele suceder en teoría económica, no hemos sido específicos con la función . Esta función depende de otros factores que rara vez se conoce. Sin embargo, podemos emplear la teoría económica, o la introspección, para predecir el efecto que cada variable tendría sobre el desarrollo a nivel municipal. Una establecido el modelo económico, debemos transformarlo en lo que llamamos un modelo econométrico.

2.3. Modelo econométrico El punto de partida para el análisis econométrico es el modelo económico y este se transformará en modelo econométrico cuando se han añadido las especificaciones necesarias para su 2

aplicación empírica. Es decir, cuando se han definido las variables (endógenas, exógenas) que explican y determinan el modelo, los parámetros estructurales que acompañan a las variables, las ecuaciones y su formulación en forma matemática y la perturbación aleatoria que explica la parte no sistemática del modelo. Un ejemplo de modelo econométrico se puede observar en el siguiente recuadro. Modelo Econométrico: Geografía y desarrollo en Bolivia

El documento de trabajo de Andersen y Nina (2005) propone tres modelos econométricos para analizar la entre geografía y desarrollo a nivel municipal para el caso de Bolivia. El modelo extendido a variables geográficas tiene las siguientes características:

Las constantes son los parámetros del modelo econométrico y describen las direccione e intensidades de la relación existente entre el índice de desarrollo humano y los factores que determinan o explican. El término contiene factores no observados, que es denominado término de error o término de perturbación aleatoria. Este término debe darse el tratamiento adecuado porque es quizás el elemento más importante de cualquier análisis econométrico. A partir del modelo econométrico especificado, en una segunda etapa se procede a la estimación, fase estadística que asigna valores numéricos a los parámetros de las ecuaciones del modelo. Para ello se utilizan métodos estadísticos como pueden ser: Mínimos cuadrados ordinarios, Máxima verosimilitud, etc. Al recibir los parámetros el valor numérico definen el concepto de estructura que ha de tener valor estable en el tiempo especificado. En la mayoría de los casos, el análisis econométrico comienza por especificar un modelo econométrico, sin prestar atención a los detalles de construcción del modelo. Éste es el procedimiento que se suele seguir, principalmente porque una derivación cuidadosa del modelo económico llevaría demasiado tiempo y podría, por otra parte, conducirnos a otras áreas especializadas de la teoría económica. Muchas veces, el uso del sentido común y del razonamiento económico puede guiarnos en la elección de variables. Una vez identificado un modelo econométrico, pueden formularse varias hipótesis de interés en términos de los parámetros desconocidos. Por ejemplo, podemos formular la hipótesis de que “la

3

distancia al océano” no tiene efecto sobre el índice de desarrollo humano. En el contexto de un modelo econométrico particular, la hipótesis es equivalente a . En general, un análisis empírico requiere datos. Después de haber recopilado datos sobre las variables relevantes, se emplean métodos econométricos para estimar los parámetros del modelo econométrico y para contrastar formalmente las hipótesis de interés. En algunos casos, el modelo econométrico se emplea para contrastar una teoría o estudiar el impacto de una política económica.

2.4. Estructura de datos económicos Los conjuntos de datos económicos pueden ser de clases muy variadas. Si bien hay métodos econométricos que pueden aplicarse a diferentes conjuntos de datos sin necesitar modificación alguna o, en cualquier caso, con sólo ligereas modificaciones, las características especiales de determinados conjuntos de datos deben tomarse en cuenta o deberían explotarse. Datos de corte transversal Un conjunto de datos de corte transversal es una muestra compuesta por individuos, familias, empresas, ciudades, municipios, estados, países u otro tipo de unidades muy variadas recogida en un momento determinado. Por ejemplo, las encuestas continúas de hogares o las encuestas sobre clima de inversión a las empresas. Una característica importante de los datos de corte transversal es que, a menudo, podemos suponer que se han obtenido mediante un muestreo aleatorio de la población subyacente. Por ejemplo, si obtenemos información sobre los salarios, la educación, la experiencia y otras características escogiendo aleatoriamente a 500 personas de la población empleada, podemos decir que contamos con una muestra aleatoria de toda la población que tiene un empleo. Datos de series temporales Un conjunto de datos de series temporales consiste en observaciones sobre una variable o distintas variables a lo largo del tiempo. Por ejemplo, los precios de las acciones, los índices de precios al consumo, el producto interno bruto. Dado los acontecimientos pasados pueden tener influencia sobre acontecimientos futuros, y los efectos retardados en el comportamiento de los individuos son frecuentes en ciencias sociales, el tiempo es un parámetro importante en los conjuntos de series temporales. Por oposición al orden de los datos de corte transversal, la disposición cronológica de las observaciones de una serie temporal sí transmite información potencialmente importante. Una característica importante de las series temporales que hace que éstas sean más difíciles de analizar que los datos de corte transversal es el hecho de que rara vez, si no nunca, podemos suponer que las observaciones económicas son temporalmente independientes. La mayoría de las series temporales están relacionadas con su historia reciente. Otra característica de los datos de series temporales que puede requerir especial atención es la frecuencia de los datos, es decir, la frecuencia con la que se recogen los datos. En economía, las frecuencias más comunes son las frecuencias diarias, mensuales, trimestrales y anuales. 4

Muchas series temporales muestran una característica estacional marcada que puede ser un factor importante en el análisis de series temporales. Cuando se emplean métodos econométricos para analizar las series de datos temporales, los datos deberían almacenarse por orden cronológico. Datos fusionados de sección cruzada Algunos conjuntos de datos tienen características tanto de datos de corte transversal como de datos de series temporales. Por ejemplo, supongamos que se hacen dos encuestas de corte transversal sobre hogares en Bolivia, una en 2000 y otra en 2005. En 200, se hace una encuesta con una muestra aleatoria para obtener variables como el nivel de ingreso, de ahorro, el tamaño de os hogares, etc. En 2005, se hace un nuevo muestreo aleatorio de los hogares y se emplean las mismas preguntas que en 2000 para hacer la encuesta. Para aumentar el tamaño de la muestra, podemos formar un conjunto de datos fusionados de sección cruzada combinando los datos de dos años. La fusión de datos de corte transversal de distintos años a menudo resulta útil para analizar los efectos de nuevas políticas gubernamentales. La idea consiste en recopilar datos de los años anteriores y posteriores a un cambio político clave. Los datos fusionados de sección cruzada se analizan de forma muy parecida a los datos de corte transversal convencionales, con la salvedad de que a menudo necesitamos tomar en cuenta diferencias de las variables a lo largo del tiempo. De hecho, además de aumentar el tamaño de la muestra, el objetivo de la fusión de datos de sección cruzada es a menudo observar cómo una relación clave ha cambiado con el tiempo. Datos de panel o longitudinales Los conjuntos de datos de panel (o longitudinales) consisten en series temporales para cada unidad de corte transversal del conjunto de datos. Por ejemplo, un registro de datos sobre el salario, la educación y el historial de empleo de un conjunto de individuos seguidos durante un periodo de diez años. Los datos de panel también pueden recopilarse sobre unidades geográficas. Por ejemplo, podemos recopilar datos sobre flujos de inmigración, temperatura, precipitación pluvial, área de cultivos, población, etc., en el mismo conjunto de municipios de Bolivia para los años 2000, 2005 y 2010. La característica clave de los datos de panel que los diferencia de los datos fusionados de sección cruzada es el hecho de que se mantiene un registro de las mismas unidades de sección cruzada (individuos, empresas o municipios) durante un periodo de tiempo determinado. Como puede intuirse, el observar las mismas unidades a lo largo del tiempo ofrece ciertas ventajas que no se dan con datos de corte transversal o datos fusionados de sección cruzada: al tener varias observaciones de las mismas unidades podemos tener un control sobre ciertas características de individuos, empresas, etc. Una segunda ventaja de los datos de panel es que, a menudo, nos permiten estudiar la importancia de retardos en el comportamiento o de retardos en la toma de decisiones.

5

2.5. Métodos de estimación Los métodos de estimación consisten en ajustar una relación matemática (ecuación o línea de regresión) a un conjunto de observaciones de las variables con el propósito de establecer relaciones económicas cuantificables (estimación de los valores de los parámetros) o de realizar comprobaciones de hipótesis. Para ello se utilizan métodos econométricos como pueden ser: mínimos cuadrados ordinarios, mínimos cuadrados generalizados, máxima verosimilitud y el método generalizado de momentos. Método de Mínimos Cuadrados Ordinarios (MCO) El método mínimos cuadrados ordinarios (MCO) es el método para estimar los parámetros desconocidos en un modelo de regresión lineal, que minimiza la suma de cuadrados de las distancias verticales entre las respuestas observadas en el conjunto de datos y las respuestas predichas por la aproximación lineal. El método de Mínimos Cuadrados Ordinarios permite encontrar los mejores estimadores lineales insesgados. En particular, el estimador MCO es consistente cuando los regresores son exógenos y no hay perfecta multicolinealidad , y es óptimo en la clase de estimadores lineales cuando los errores son homoscedásticos y no hay correlación serial. En estas condiciones, el método de MCO proporciona la mínima varianza media-insesgada estimada cuando los errores tienen varianzas finitas. Bajo la suposición adicional de que los errores se distribuyen normalmente, el estimador MCO es el de máxima verosimilitud. Este método presenta muchas ventajas en cuanto a lo fácil de su uso y por lo adecuado del planteamiento estadístico matemático que permite adecuarse a los supuestos para los modelos econométricos. Método de Mínimos Cuadrados Generalizados (MCG) El método de mínimos cuadrados generalizados (MCG) es una técnica para la estimación de los parámetros desconocidos en un modelo de regresión lineal. El GLS se aplica cuando las varianzas de las observaciones son desiguales es decir cuando se presenta heterocedasticidad (o no existe homoscedásticidad), o cuando existe un cierto grado de correlación entre las observaciones (multicolinealidad). En estos casos, los estimadores MCO pueden ser estadísticamente ineficaz, o incluso dar inferencias engañosas. Método de Máxima Verosimilitud (EMV) El método de máxima verosimilitud (EMV) es un procedimiento que permite estimar los parámetros de un modelo probabilístico, o los coeficientes de un modelo matemático, de tal manera que sean los más probables a partir de los datos obtenidos. La idea fundamental de este método es tomar como estimación del parámetro estudiado el valor que haga máxima la probabilidad de obtener la muestra observada.

6

Hay que tener bien claro que en el método además de intervenir la información aportada por los datos, se está postulando un modelo matemático para éstos, como puede ser por ejemplo el modelo logístico o un modelo de supervivencia, y que los parámetros estimados se calculan considerando la información aportada por los datos de acuerdo a ese modelo. Si el modelo propuesto no fuera adecuado el método tampoco lo será. Quiere esto decir que la razón de verosimilitud no nos proporciona información suficiente en cuanto a la bondad de ajuste, que habrá que verificar convenientemente por otros métodos. Método Generalizado de Momentos (MGM) El método generalizado de momentos (MGM) es una técnica de estimación muy general, que permite interpretar la mayor parte de los métodos de estimación conocidos como casos particulares, incluido el de máxima verosimilitud bajo ciertas condiciones. Además, este procedimiento permite desarrollar métodos de estimación nuevos. Una de las características del método es que no requiere la especificación de una forma particular de distribución de las variables aleatorias involucradas en el modelo que se estudia. Sin embargo, esta generalidad también puede significar un uso no eficiente de la información disponible en la muestra.

3. ANÁLISIS DE REGRESIÓN CON DATOS DE CORTE TRANSVERSAL La sección comienza con un modelo de regresión lineal simple, en el que explicamos una variable en términos de otra variable. Esta tipo de regresión se emplea en forma ocasional y sirve de punto de partida natural, dado que las interpretaciones de álgebra son relativamente directas. Seguidamente, se incluyen los conceptos fundamentales de análisis de regresión múltiple, en el que permitimos que más de una variable afecte a la variable que tratamos de explicar. La regresión múltiple sigue siendo el método más usado en la investigación empírica. En ambos casos, el objetivo es inferir si una variable tiene un efecto causal sobre otras variables. El encontrar una relación entre dos o más variables puede ser algo sugerente, pero rara vez pasa de eso, a no ser que se pueda establecer una relación de causalidad. La noción de ceteris paribus, que significa “(siendo) los demás factores (relevantes) igual” y que se parafrasea como «permaneciendo el resto constante», desempeña un papel importante en el análisis causal. En el análisis econométrico, el mantener los demás factores fijos es fundamental para el análisis de políticas públicas. Por ejemplo, al evaluar un programa de formación profesional nos podría interesar el efecto que tendría una semana más de formación profesional sobre los salarios manteniendo constante los demás componentes (la educación y la experiencia). Si logramos mantener fijos todos los demás factores relevantes y encontramos después una relación entre la formación profesional y los salarios, pode...


Similar Free PDFs