Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Apuntes de Econometría Prof. Ricardo Guzmán Ponti�cia Universidad Católica de Chile Instituto de Economía 2do Semestre de 2006 Sección 2: Introducción al análisis de regresión lineal El objeto de estudio de la econometría es una relación del siguiente tipo. y = f (x1; x2; :::; xk; "j�) ; donde y es una variable dependiente, también llama- da explicada o endógena, x0 es un vector �la de K regresores, también llama- dos variables explicativas o variables exógenas. " es un error aleatorio no observable, también cono- cido como residuo, perturbación o innovación. � es un vector columna de parámetros, de dimensión K � 1. Lo que queremos hacer es estimar � para luego chequear una serie de hipótesis sobre su valor y/o signo. Con ese propósito recogemos información muestral, la que con- siste en una lista de N observaciones (yi;x0i) N i=1. Entonces, lo que tenemos en realidad es una lista de N relaciones: yi = f (xi1; xi2; :::; xik; "ij�) ; solamente que no conocemos "i ni �. En general, los datos en economía no pueden ser genera- dos experimentalmente (salvo en economía experimental) de manera que tanto la variable dependiente como los re- gresores deben ser tratados como variables aleatorias. También suponemos que el vector de parámetros, �, re- presenta algún tipo de �ley de la naturaleza�, lo que sig- ni�ca que no es estocástico. Supuestos clásicos del modelo de regresión lineal El modelo de regresión lineal es un conjunto de 4 supuestos que restringen la distribución conjunta de la variable de- pendiente y los regresores. Supuesto 1: Linealidad yi = xi1�1 + xi2�2 + :::+ xiK�K + "i = x0i� + "i; o bien, y N�1 = X � (N�K)(K�1)| {z } N�1 + " N�1 : El supuesto de linealidad establece que la relación entre la variable dependiente y los regresores es lineal en los parámetros. Ejemplo: Teoría keynesiana del consumo. coni = �1 + �2inci + "i; donde coni es el consumo agregado del año i e inci es ingreso nacional disponible de ese mismo año. � Note que un regresor puede in�uir en la variable depen- diente directamente o a través de su efecto en otro re- gresor. Ejemplo: Modelo de Mincer. ln (inci) = �1 + �2 ln (educi) + �3 ln (edadi) + "i; donde inci es el ingreso de la persona i, educi es su nivel de educación y edadi su edad. La edad in�uye en el ingreso de una persona porque una persona de más edad tiene más experiencia laboral, la que es valorada por el mercado; pero la edad también in�uye a través de la educación. ¿Por qué? � El coe�ciente �k re�eja el efecto marginal del regresor xk sobre la variable dependiente, ceteris paribus. En el lenguaje del cálculo, @y=@xk = �k. Una consecuencia de la linealidad es que el efecto marginal de los regresores no depende de su nivel. En ocasiones la relación de interés no es lineal en los parámetros, lo que no importa si es posible manipularla para hacerla lineal. Ejemplo: Función de producción Cobb-Douglas. Y = AK�L1��e"; donde " es una perturbación aleatoria con media cero (un shock de productividad), y donde � y A son los paráme- tros que queremos estimar. Tomando logaritmo a ambos lados de la expresión, obte- nemos ln (Y ) = ln (A) + � ln (K) + (1� �) ln (L) + "; y esa relación es lineal en los parámetros, ln (A) y �. � Hay casos, sin embargo, en que la relación de interés es imposible de linealizar. Por ejemplo, y = �+ 1 � + x + ": ¿Se le ocurre una salida a este problema? Ejemplo: Teoría cuantitativa del dinero. La teoría cuantitativa establece que dinero, precio e in- greso satisfacen la siguiente relación: PY =MV; donde P es el nivel de precios, Y es ingreso, M es la cantidad de dinero en la economía y V es la velocidad de circulación del dinero. Tomando logaritmo a ambos lados obtenemos: lnP + lnY = lnM + lnV: Y, derivando con respecto del tiempo y reordenando: � = E ( _v � _y) + _m+ "; donde � es in�ación, _m es la tasa de crecimiento del dinero y " = _v � _y � E ( _v � _y). Es decir, la teoría establece que existe una relación uno a uno entre crecimiento del dinero e in�ación. En términos del modelo econométrico: � = �1 + �2 _m+ " y nuestra hipótesis es que �2 = 1. El siguiente grá�co muestra la in�ación promedio versus crecimiento promedio del dinero en 92 países. Los prome- dios abarcan el período que va desde 1985 a 2004. 0% 25% 50% 75% 100% 125% 150% 0% 25% 50% 75% 100% 125% 150% CRECIMIENTO DEL DINERO (M1) IN FL A C IÓ N ¿Podemos concluir a partir de los datos que �2 = 1? � Supuesto 2: Exogeneidad estricta El supuesto de exogeneidad establece que E ("jX) = 0N�1: La fórmula dice que X no contiene información sobre la media de ningún "i. En algunos textos el supuesto de exogeneidad se expresa como la �independencia entre el error y los regresores�. El supuesto de independencia es más fuerte que el de exogeneidad estricta. Asumir E ("jX) = 0 no es tan restrictivo como parece si la regresión incluye una constante: yi = �1 + xi2�2 + :::+ xik�k + "i o, lo que es igual, si suponemos que xi1 = 1 para todo i. De ahora en adelante, y a menos que señalemos expresa- mente lo contrario, asumiremos que la primera columna de X es un vector de N unos. Implicancias de la exogeneidad estricta: La media incondicional de los errores es cero: E (") = 0N�1. Los errores son ortogonales a la variables explicati- vas: E � "0X � = 0K�1. La covarianza entre el error y los regresores es cero: cov � "0;X0 � = 0K�1. Pregunta: cov � "0;X0 � = 0 ¿implica que E ("jX) = 0N�1? Ejemplo: El siguiente modelo, llamado auto-regresión de orden 1, viola el supuesto de exogeneidad estricta: yt = �yt�1 + "t Suponga que E (yt�1"t) = E ("t) = 0 y que E("2t ) = �2. Entonces, E (yt"t) 6= 0 (Tarea: demostrarlo). Supuesto 3: No multicolinealidad perfecta Este supuesto establece que el rango de la matriz de re- gresores, X, es K con probabilidad 1. En otras palabras, que las columnas de X siempre son linealmente inde- pendientes. Para que eso sea posible, es necesario que N � K. El supuesto de rango completo es muy débil, pero funda- mental. Si no se cumple, el modelo no se puede identi- �car. Ejemplo: Consideremos el siguiente �modelo�de deman- da de dinero en una economía cerrada. M P = �1 + �2i+ �3Y + �4C + �5I + "i (1) Y = C + I (2) Usando (2) podemos rescribir (1) así: M P = �1 + �2i+ �3 [(1� �)Y + � (C + I)] +�4C + �5I + "i = �1 + �2i+ �3 (1� �)Y + (�4 + ��3)C +(�5 + ��3) I + "i o bien, M P = �1 + �2i+ 1Y + 2C + 3I + "i (3) Mirando los modelos (1) y (3) nos damos cuenta de que ambos representan la misma relación y, sin embar- go, tienen coe�cientes distintos. De hecho, es imposible identi�car los verdaderos parámetros del modelo. � La raíz del problema de rango incompleto o �multicolinea- lidad perfecta�suele estar en el descuido del investigador. En el ejemplo anterior, el problema se resuelve estimando la relación que sugiere la teoría: M P = �1 + �2i+ �3Y + "i Supuesto 4: Perturbaciones esféricas Matricialmente, este supuesto se escribe así: E(""0jX) = �2IN : Podemos desglosarlo de la siguiente manera: E("2i jX) = �2 para todo i. A este supuesto se le llama homocedasticidad. E("i"jjX) = �2 para todo i 6= j. A este supuesto se le llama no autocorrelación. Usando a la exogeneidad estricta (i.e. E ("jX) = 0), es posible expresar el supuesto de perturbaciones esféricas así: var ("jX) = �2IN Tarea: Demostrar que la varianza incondicional de " es igual a su varianza condicional.
Compartir