Vista previa del material en texto
ECONOMETRÍA APUNTES DE CLASE Profesores: Verónica Gil Aroztegui Aldo Lema Navarro Agosto 2004 Pontificia Universidad Católica de Chile Estos apuntes están en permanente revisión por lo cual sugerencias o correcciones serán bienvenidas. E-mails: vgila@afpprovida.cl y alema@security.cl Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 1 INDICE 1. INTRODUCCIÓN............................................................................................................................................ 1 1.1 ORÍGEN Y CONCEPTO ....................................................................................................................................1 Definiciones................................................................................................................................................................ 1 Diferencias entre un econometrista y un estadístico:......................................................................................... 2 1.2 MODELO ECONOMÉTRICO. .........................................................................................................................2 1.3 OBJETIVOS DE LA ECONOMETRÍA ...........................................................................................................3 1.4 METODO DE LA ECONOMETRÍA. ..............................................................................................................3 1.5 DATOS, VARIABLES Y MODELOS. ............................................................................................................5 DATOS. ....................................................................................................................................................................... 5 RELACIONES............................................................................................................................................................ 7 VARIABLES................................................................................................................................................................ 7 FORMAS FUNCIONALES (Introducción) ........................................................................................................... 8 ANEXO 1: RECORDANDO DE INFERENCIA.....................................................................................................................9 Variable Aleatoria..................................................................................................................................................... 9 Notación:..................................................................................................................................................................... 9 Distribución de Probabilidades.............................................................................................................................. 9 ANEXO 2: UN REPASO DE MATRICES .................................................................................................................11 3.1.1 Operaciones matriciales:.............................................................................................................................11 3.1.2 Valores y vectores propios...........................................................................................................................16 3.2 ALGUNOS EJERCICIOS DE MATRICES..................................................................................................................19 3.2.1 Operaciones con matrices............................................................................................................................19 3.2.2 Determinantes...............................................................................................................................................19 3.2.3 Matriz Inversa ...............................................................................................................................................20 3.2.4 Valores y Vectores propios..........................................................................................................................20 2. REGRESIÓN SIMPLE..............................................................................................................................22 2.1 EL MÉTODO DE MÍNIMOS CUADRADOS ORDINARIOS (MICO). .......................................................................22 2.1.1 Definición de análisis de regresión............................................................................................................22 2.1.2 Especificación de la Regresión Simple......................................................................................................23 2.1.3 Ejemplo:..........................................................................................................................................................23 2.1.4 Fuentes de Error µ ........................................................................................................................................25 2.1.5 Función de regresión poblacional y muestral.........................................................................................25 2.1.6. MICO para una regresión simple..............................................................................................................29 2.1.7 Ejemplo de cálculo de ˆ β 1 y ˆ β 2 ..................................................................................................................31 2.1.8 Expresión de las formulas en desvíos. .......................................................................................................32 2.1.9 Corolarios de los estimadores MICO. .......................................................................................................33 2.1.10. Coeficiente de determinacion (R2)..........................................................................................................38 2.1.11 Algunas Regresiones Particulares...........................................................................................................40 2.1.12. ¿Cómo seleccionar entre estimadores? .................................................................................................42 2.2 SUPUESTOS CLÁSICOS DEL MODELO DE REGRESIÓN. .....................................................................................45 1. La variable explicativa X está dada (es no estocástica o no aleatoria)..............................................46 2. E(µi/Xi)=0 ∀ i ...............................................................................................................................................46 3. No autocorrelación ⇒ Cov( µi, uj)=0 i≠j...............................................................................................46 4. Homocedasticidad ⇒ V(µi/Xi)=σ2...........................................................................................................48 5. El modelo está bien especificado...............................................................................................................49 6. Normalidad ⇒ µi ∼N( 0 , σ2) ..................................................................................................................49 Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 2 2.3 PROPIEDADES ESTADÍSTICAS DE LOS ESTIMADORES MICO .............................................................................49 2.3.1 Linealidad.................................................................................................................................................50 2.3.2 Insesgamiento...........................................................................................................................................50 2.3.3 Eficiencia..................................................................................................................................................522.4 INFERENCIA ESTADÍSTICA EN EL MODELO DE REGRESIÓN LINEAL SIMPLE..................................................62 2.4.1 Repaso Breve de algunos teoremas de Inferencia...................................................................................62 2.4.2 ¿Qué Consecuencias tiene suponer µi ~ N(0, σ2)? .................................................................................65 2.4.3 Intervalos de Confianza para β1 y β2. ....................................................................................................67 2.4.4 Prueba de hipótesis......................................................................................................................................68 2.4.5 Recordando de inferencia:...........................................................................................................................70 2.4.6 Ejemplos de Test De Hipótesis....................................................................................................................71 2.5 ANALISIS DE VARIANZA.......................................................................................................................................76 Grados de Libertad.................................................................................................................................................78 2.6 PRUEBA DE NORMALIDAD......................................................................................................................................80 3. MODELO DE REGRESIÓN MULTIPLE ..........................................................................................................81 3.1 DEFINICIONES ...................................................................................................................................................81 • Modelo de regresión poblacional múltiple...............................................................................................81 • Modelo de regresión muestral múltiple....................................................................................................82 3.2 ESTIMADORES MICO ......................................................................................................................................84 3.2.1 Primera forma de derivación.....................................................................................................................84 3.2.2 Otra forma de encontrar β̂ ...................................................................................................................87 3.2.3 Deducción de los estimadores MICO en el modelo simple...................................................................89 3.2.4 Una interpretación de los estimadores MICO. ......................................................................................93 3.2.5 Corolarios de los Estimadores MICO ......................................................................................................95 3.3 SUPUESTOS CLÁSICOS.........................................................................................................................................101 Explicación.............................................................................................................................................................102 3.4 PROPIEDADES ESTADÍSTICAS DE LOS ESTIMADORES MICO..........................................................................105 3.5.1 Linealidad....................................................................................................................................................105 3.5.2 Insesgamiento..............................................................................................................................................105 3.5.3 Eficiencia......................................................................................................................................................105 3.5.4 Consistencia.................................................................................................................................................111 3.6 INFERENCIA EN EL MODELO GENERAL...............................................................................................................112 3.6.1 Distribución de β̂ ......................................................................................................................................112 3.6.2 Distribuciones derivadas de µ...................................................................................................................112 3.6.3 Distribución de 2 ' σ ee .................................................................................................................................113 3.6.4 Prueba de Hipótesis en el Modelo Múltiple............................................................................................115 3.5.5 Test General Para Probar Restricciones Lineales de Parámetros.....................................................117 3.5.6 Estabilidad y Cambio Estructural ............................................................................................................123 3.6 PREDICCION ......................................................................................................................................................131 • ¿Cuál es el valor esperado del error de predicción?...........................................................................132 • ¿Cuál es la varianza de e0?.......................................................................................................................132 • ¿Cómo se distribuye e0? ............................................................................................................................133 • Intervalo de confianza para el error de predicción..............................................................................133 • Intervalo de confianza para Y0.................................................................................................................134 4. VARIABLES FICTICIAS O DUMMY O BINARIAS O DICOTÓMICAS .............................................135 4.1 MODELOS ALTERNATIVOS. .......................................................................................................................135 Ejemplo 1: Unica Variable Explicativa es una variable dummy. .................................................................135 Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 3 Ejemplo 2: Una variable cualitativa y otra cuantitativa................................................................................136 Ejemplo 3: Dos variables cualitativas...............................................................................................................137 Ejemplo 4: Interacción entre una variable cuantitativa y una cualitativa..................................................137 Ejemplo 5: Variables Cualitativas Politómicas...............................................................................................138 4.2 VARIABLES DUMMY PARA DESESTACIONALIZAR.........................................................................140 4.3 VARIABLES DUMMY PARA DETECTAR CAMBIO ESTRUCTURAL............................................143 4.4 VARIABLES DUMMY PARA CORREGIR OUTLIERS. ........................................................................145 5. MULTICOLINEALIDAD ....................................................................................................................................147 5.1 INTUICIÓN ..........................................................................................................................................................147 5.2 TIPOS DE MULTICOLINEALIDAD.............................................................................................................148 Multicolinealidad perfecta...................................................................................................................................148Multicolinealidad imperfecta..............................................................................................................................150 ¿Por qué importa el determinante?....................................................................................................................151 5.3 EFECTO DE LA MULTICOLINEALIDAD A NIVEL EMPÍRICO ........................................................152 En el modelo con dos variables explicativas...................................................................................................152 En el Modelo General...........................................................................................................................................152 Efectos prácticos de la multicolinealidad:........................................................................................................153 5.4 FORMAS DE DETECTAR LA MULTICOLINEALIDAD.........................................................................153 Por sus efectos sobre los test...............................................................................................................................153 5.5 FORMAS DE SOLUCIONAR LA MULTICOLINEALIDAD ...................................................................154 No hacer nada........................................................................................................................................................154 Incorporar información adicional......................................................................................................................154 6. HETEROCEDASTICIDAD ...................................................................................................................................157 6.1 ¿CÓMO SE AFECTAN LAS PROPIEDADES DEL ESTIMADOR MICO CUANDO EXISTE HETEROCEDASTICIDAD? ....................................................................................................................................158 ¿Qué ocurre si se estima por MICO sin tener en cuenta la heterocedasticidad?......................................160 6.2. MÉTODO DE MÍNIMOS CUADRADOS GENERALIZADOS................................................................................160 Derivación de MCG en el caso simple ..............................................................................................................162 Derivación de MCG en el caso múltiple. ..........................................................................................................162 6.3. ¿CÓMO DETECTAR LA HETEROCEDASTICIDAD? ..........................................................................163 • Naturaleza del problema:..........................................................................................................................164 • Método gráfico:...........................................................................................................................................164 • Prueba de Park............................................................................................................................................164 • Prueba de Glesjer .......................................................................................................................................164 • Goldfeld - Quant .........................................................................................................................................165 • Test de White. ..............................................................................................................................................166 6.4 ¿CÓMO SOLUCIONAR HETEROCEDATICIDAD? ..............................................................................166 Ejemplo en caso general ......................................................................................................................................167 7. AUTOCORRELACIÓN.........................................................................................................................................169 7.1 INTRODUCCIÓN................................................................................................................................................169 7.2 CAUSAS MÁS FRECUENTES DE AUTOCORRELACIÓN ....................................................................170 Ciclos o tendencias en las variables, .................................................................................................................170 Autocorrelación espacial,....................................................................................................................................170 Influencia prolongada de shocks:.......................................................................................................................170 Inercia:....................................................................................................................................................................170 Mala especificación..............................................................................................................................................170 Quiebre o cambio estructural..............................................................................................................................171 7.3 ALGUNAS DEFINICIONES .............................................................................................................................172 Autocovarianza ......................................................................................................................................................172 Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 4 Coeficiente de Autocorrelación...........................................................................................................................172 EJEMPLO...............................................................................................................................................................172 7.4 PROPIEDADES DE LA ESTIMACIÓN MICO BAJO AUTOCORRELACIÓN ...................................175 7.5 ¿CÓMO DETECTAR AUTOCORRELACIÓN?...........................................................................................................176 Método gráfico:.....................................................................................................................................................176 Estadístico de Durbin-Watson (1951)................................................................................................................176 Test de Breusch - Godfrey (1978).......................................................................................................................179 Ejemplo de utilización de los test en Eviews. ...................................................................................................179 7.6 FORMAS DE CORREGIR POR AUTOCORRELACION ......................................................................181 7.6.1 Conozco la forma de la autocorrelación y conozco ρ.....................................................................181 7.6.2 . No conocemos ρ...............................................................................................................................184 8. ESPECIFICACION DE MODELOS ...................................................................................................................186 8.1 ATRIBUTOS DE UN BUEN MODELO .........................................................................................................186 8.2 TIPO DE ERRORES DE ESPECIFICACIÓN................................................................................................186 8.3 CONSECUENCIAS DE LOS ERRORES DE ESPECIFICACIÓN. .........................................................186 8.3.1 Variables Omitidas......................................................................................................................................1868.3.2 Inclusión de una Variable Irrelevante (Variables Intrusas)................................................................189 Conclusión para Especificar Modelos...............................................................................................................190 Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 1 11.. IINNTTRROODDUUCCCCIIÓÓNN 1.1 ORÍGEN Y CONCEPTO Algunos economistas ⇒ Europa S. XIX Otros ⇒ S. XX (como movimiento organizado) 1930 ⇒ fundación de la Sociedad Econométrica (Revista, 1933) La Econometría se nutre de: • Economía (“Teoría”) • Matemáticas (“especificaciones” y “tools”) • Estadística (“Técnicas”) Definiciones. • “Es lo que hacen los econometristas” • Etimológicamente: “Economía Medida” Sin embargo, este es un concepto vago, porque medir el PIB, el empleo, la oferta de dinero, etc., no es econometría. El concepto es más amplio que este. • Maddala: “Es la aplicación de métodos estadísticos y matemáticos al análisis de los datos económicos con el propósito de otorgar contenido empírico a las teorías económicas, verificándolas o refutándolas” • Kennedy: “ Los desacuerdos permitirían escribir un paper” La confusión proviene de que los econometristas son al mismo tiempo: i) Economistas: interpretan (o crean teoría) para probar empíricamente. ii) Matemáticos: formulan matemáticamente su teoría iii) Estadísticos aplicados: buscando datos para sus variables y gastando horas frente al computador tratando de estimar relaciones económicas y prediciendo. iv) Estadísticos teóricos: aplicando su habilidad para desarrollar técnicas estadísticas apropiadas a los problemas empíricos. • La econometría no significa lo mismo que estadística económica, tampoco es lo que conocemos como teoría económica, ni es la aplicación de las matemáticas a la economía. Econometría es la unificación de estas tres áreas. Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 2 Diferencias entre un econometrista y un estadístico: La preocupación del econometrista está en los problemas causados por la violación de “supuestos estadísticos clásicos”; la naturaleza de las relaciones económicas y la falta de “experimentos controlados” 1.2 MODELO ECONOMÉTRICO. i) MODELO: representación simplificada de la realidad, recurriendo a un número limitado de conceptos formalizados. Críticas: • Sobre-simplificación. El contra-argumento es que se puede partir con un modelo sencillo y luego complicarlo. • Supuestos poco realistas. Sin embargo, se podría argumentar como lo hace Friedman, que lo importante no es cuán reales sean los supuestos, sino que tan buenos son como aproximación al fenómeno a explicar. • Se basa en un número limitado de “datos” ii) MODELO ECONÓMICO, conjunto de supuestos que aproximadamente describen el comportamiento de una economía (o de un sector) Ej. La función de producción Cobb-Douglas, Y= A KαLβ, establece la relación exacta, deterministica, que existe entre los insumos y el producto, basándose en una serie de supuestos. Pero, si quisiéramos testear cuán bueno es este modelo para explicar la evolución del PIB en Chile, tendríamos algunos problemas. Sin importar lo sofisticado que sea nuestro modelo de producción, no nos servirá para explicar hechos como la caída de la producción por inundación o sequía, los momentos de huelga, etc. Para poder testear este modelo, es necesario incorporarle elementos estocásticos. Esto lo convertirá de un modelo económico en uno econométrico. iii) MODELO ECONOMÉTRICO: es un set de ecuaciones de comportamiento derivadas de un modelo económico que involucra: - variables observables - elementos estocásticos o shocks, que recogen errores de medición en las variables observadas y factores que no pueden ser recogidos por el modelo. Esto hace que la variable objetivo varíe no sólo porque lo hacen las variables explicativas, sino por cierta aleatoriedad del comportamiento humano o del contexto. El modelo determinístico ⇒ Y= A KαLβ se transforma en El modelo econométrico ⇒ Y= A KαLβ eµ Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 3 El término eµ será una variable aleatoria con determinadas propiedades que veremos en el curso, por lo que deberemos especificar la distribución de probabilidad de µ y las consecuencias de estas sobre la estimación. 1.3 OBJETIVOS DE LA ECONOMETRÍA i) Formulación de modelos econométricos (o sea modelos económicos en una forma testeable empíricamente). Objetivo: DESCRIPTIVO⇒ representar la realidad Usualmente hay diversas formas de formular un modelo econométrico a partir de un modelo económico ya que debe elegirse ⇒ forma funcional ⇒ especificación de la estructura estocástica de las variables, etc. ii) Estimar y testear los modelos con datos. Objetivo: INTERPRETAR. iii) Usar los modelos con fines predictivos y de política. De lo anterior se infiere que LA ECONOMETRIA ⇒ ¿Es una ciencia? ⇒ Aplicación de modelos estadísticos para intentar verificar modelos económicos que representan el funcionamiento de la economía 1.4 METODO DE LA ECONOMETRÍA. i) Diagrama que resume la Metodología de la econometría (Cuadro 1) 1. Teoría Económica o Modelo Económico 3.Información apriori 2. Modelo Econométrico 4. Datos 5. Estimación del Modelo 6. Testeo de Hipótesis sugeridas por el Modelo Económico 7.Predicción y Políticas Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 4 Para el ejemplo que veíamos antes: ii) Críticas: - Hay feedback entre 1 y 6 (no es cierto que sólo se “testean teorías”) - Hay feedback entre 2 y 5 con 3 (también hay aportes en datos) - Hay feedback entre 6 y 2 (como resultado de los test econométricos es posible replantear modelos econométricos) Por tanto hay retroalimentación (Cuadro 2) ¿Es el modelo adecuado? si no Prueba de alguna hipótesis Uso del modelo para predicción y políticas Teoría Económica Modelo Econométrico Estimación Pruebas de Especificación y examen de Diagnóstico Datos 1. Y=AKαLβ 2. Y=AKαLβeµ 3. Revisión de resultados obtenidos en otros estudios similares, nacionales e internacionales 4. Conseguir los datos de PIB (Y) y Empleo (L) del Banco Central. Construir una serie de capital (K). 5. Estimación de α y β 6. Verifico hipótesis respecto a los parámetros. Ej: Test α+β=1 7. Predicción: dadas las estimaciones de K y L, cual será el PIB del próximo año Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 5 ⇒ los resultados econométricos influyen en la teoría ⇒ del modelo econométrico hacia los datos ⇒ De los test de especificación hacia la revisión de la especificación del modelo. ¿Qué constituye un test para la teoría económica? - Signos de los coeficientes son correctos. Problema: diferentes estudios econométricos llegan a conclusiones contradictorias. - El test más válido: “que una teoría económica genere mejores predicciones que una alternativa”. - Estabilidad de los coeficientes estimados (Crítica de Lucas). - IMPORTANTE: La econometría no es un elemento para derribar teorías, sino para conocer la realidad, y ver si los datos que tenemos se ajustar a la teoría. - SI LOS DATOS NO SE AJUSTAN LO ÚNICO QUE SE PUEDE DECIR ES QUE ESTOS DATOS NO VERIFICAN LA TEORÍA. - Error muy común: concluir que la equivocada es la realidad, si esta no coincide con el modelo. - Sin embargo pueden haber ciertas fuentes de error en la elaboración del modelo: - El modelo no se ajusta a la realidad. - Mala formulación del modelo - No se dispone de buena cantidad y/o calidad de datos. 1.5 DATOS, VARIABLES Y MODELOS. DATOS. Hay tres tipos: i. Datos de cross-section (seccióncruzada): son observaciones de una variable para varias unidades individuales en un momento de tiempo. Por ejemplo, la tasa de crecimiento del PIB para el año 1991, para distintos países de América Latina. 1991 ARGENTINA 8.9 BOLIVIA 5.1 BRASIL 0.3 CHILE 6.8 COLOMBIA 1.8 ECUADOR 4.9 MEXICO 3.6 PARAGUAY 2.3 PERU 2.6 URUGUAY 3.2 VENEZUELA 9.7 Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 6 ii. Datos de series temporales: son observaciones de una determinada variable a lo largo de cierto período de tiempo. Por ejemplo en PIB del período 1976-1997 PIB de CHILE a precios constantes (escala logarítmica) iii. Pool-Data: es la mezcla de datos de cross-section y series temporales. Ejemplo: tasas de crecimiento de varios países de América Latina en el período 1991-1995. Un tipo especial son los datos de panel (Panel Data), donde a la unidad de corte transversal se la sigue en el tiempo. 1999 2000 2001 2002 2003 Argentina -3.1 -0.5 -4.4 -10.9 8.4 Brasil 1.0 4.5 1.5 1.6 0.0 Colombia -4.5 2.8 1.4 1.5 3.3 Chile -1.0 4.4 2.8 2.1 3.5 México 3.5 6.9 -0.3 0.9 1.1 Perú 3.8 3.6 0.2 5.2 4.0 Venezuela -7.2 3.2 2.7 -8.9 -10.0 Ecuador -7.3 2.3 5.6 3.4 2.3 Guatemala 3.8 3.6 1.8 2.3 2.5 Rep.Dominicana 8.0 7.8 3.0 3.5 -3.0 Uruguay -3.2 -1.1 -3.1 -10.8 2.5 15.6 16.0 16.4 16.8 17.2 17.6 60 65 70 75 80 85 90 95 00 Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 7 RELACIONES. i) Uniecuacionales: Es aquella en que la variable dependiente “está determinada” por variables explicativas. C= f(Y,r,G), donde C (Consumo) es la variable dependiente e Y(Ingreso) , r (tasa de interés) y G (Gustos) las variables independientes. ii) Multiecuacionales Es cuando para explicar un fenómeno se requieren varias ecuaciones. Ej: Consumo Durables =f(Ingreso Permanente, tasa de interés) Consumo No Durables: f(Ingreso Transitorio) El tratamiento de las ecuaciones puede ser en forma separada o conjunta. iii) Ecuaciones simultáneas. Es cuando dos o más variables vienen determinadas “simultáneamente” por un cierto número de variables explicativas. En los casos anteriores, el ingreso (Y) es “dado” para una familia individual, pero en la economía como un todo no se puede considerar que el ingreso esté “dado” Para un consumidor individual el precio de un bien viene “dado”. Para toda la economía, los precios y las cantidades vienen determinadas simultáneamente por las condiciones de oferta y demanda. Qd = f (p,x) Qs= f (p,z) Qd =Qs Donde Qd es la cantidad demandada, Qs es la cantidad ofrecida, X es la variable de escala en la demanda (Ingreso) y Z es la variable de escala en la oferta (tecnología). VARIABLES. En general: Variable dependiente: Y Variables independientes: X1, X2......Xk Sin embargo, reciben también otros nombres: Y X1, X2......Xk a) Predicha Predictores b) Regresandos Regresores c) Explicada Explicativas d) Dependiente Independientes e) Causada Causante f) Endógena Exógena g) Objetivo Control Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 8 La primera denominación surge de la posibilidad de efectuar predicciones. La terminología de las letras b, c y d son las usualmente utilizadas cuando se habla de modelos de regresión. En los estudios de causalidad se utiliza la expresión e). Se habla de variables exógenas y endógenas cuando se quiere distinguir entre aquellas variables que se determinan dentro del sistema (endógenas) y aquellas que se determinar fuera (exógenas). Por ejemplo en modelos de gran escala para explicar la economía de un país las variables exógenas son las determinadas fuera del país, como precios internacionales, tasas de interés, movimientos de capitales, etc. En problemas de control, se utiliza g). Por lo general las objetivo son aquellas que se desea influenciar. FORMAS FUNCIONALES (Introducción) i) Lineal ⇒ C= α + βY ii) Log-Lineal ⇒ ln C= α + β ln Y También se le llama Doble Logarítmica. Elasticidad Constante. iii) Semi-logarítmica ⇒ ln C= α + β Y ⇒Elasticidad Variable iv) Lineal-Recíproco ⇒ C=α + β (1/Y) v) Log-Recíproco ⇒ ln C= α +β (1/Y) vi) Lineal Log ⇒ C=α +β lnY En iv y v, la relación entre C e Y no es lineal. ¿Qué significa linealidad? i) En las variables: la relación entre la variable dependiente y las variables independientes es lineal. Y= α +β X ii) En los parámetros: la relación es lineal en β por ejemplo, si dicho coeficiente aparece con potencia 1 y no está multiplicado ni dividido por otro parámetro. Y= α +β X (lineal en variables y parámetro β) Y= α +β (1/X) (lineal en parámetro, pero no en las variables). Cuando se habla de linealidad en este curso se hace referencia a la LINEALIDAD EN LOS PARÁMETROS. TAREA: de los modelos anteriores determine cuáles son lineales en los parámetros, en las variables o en ambos. Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 9 ANEXO 1: RECORDANDO DE INFERENCIA Variable Aleatoria Una variable aleatoria es una función que asocia un número real a cada elemento de un espacio muestral. En particular X es una V.A si para cada numero real a, existe una probabilidad P(X≤ a) de que X tome un valor menor o igual que a. Notación: • X,Y,Z para variables aleatorias, x,y,z para los valores particulares que toman las variables aleatorias X,Y,Z. • P(X=x) es la probabilidad de que la variable aleatoria X, tome el valor x. • P(x1 ≤ X≤ x2) es la probabilidad de que la variable X tome valores entre x1 y x2. Hay dos tipos de variables aleatorias: i) Variables aleatorias discretas: Si la variable aleatoria toma un conjunto finito de valores o un conjunto “contable” de valores infinitos. Ej: el número de clientes que arriban en una hora a una tienda. ii) Variables aleatorias continuas Si en un cierto rango pueden adoptar infinitos valores. Ej. Ingreso de una familia en Chile. Distribución de Probabilidades. Discreta: Lista de los posibles valores que una variable aleatoria discreta puede tomar conjuntamente con sus probabilidades asociadas. Ej. X es el número que sale en la cara superior al tirar un dado. x P(X=x) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 10 Continua: se le denomina “función densidad”: f(x) Las probabilidades se discuten solo para intervalos, no para valores concretos. La probabilidad de obtener un valor exacto es cero. Las variables aleatorias continuas son una creación muy útil. Dentro de ellas la más utilizada es la normal, que tiene la siguiente función densidad: f(x) µ X Donde µ es la media y σ es el desvío estándar. Tarea: • Revisar INFERENCIA • Leer Apéndice A de Gujarati. ∫=≤≤ b a dx)x(f)bXa(P 2 )x( 2 1 2e 2 1 )x(f µ σ πσ −− = Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 11 ANEXO 2: UN REPASO DE MATRICES1 DEFINICIÓN: una matriz es un arreglo rectangular de elementos aij donde i representa la fila en que se encuentra el elemento y j representa la columna en que se encuentra. El orden de una matriz es la cantidad de filas y columnas que esta tiene. Por ejemplo, la matriz A= − 312 431 , se dirá que es de orden 2×3. El elemento a21=2 3.1.1 Operaciones matriciales: • Igualdad A=B, si aij=bij • Transposición La traspuesta de la matriz Am×n, es una matriz A’n×m, que tiene por filas las columnas de A. Propiedades: ⇒ (A′)′=A ⇒ (A+B)′=A′+B′ ⇒ (AB)′=B′A′ ⇒ (αA)′=αA′, si α es un escalar y A una matriz. ⇒ SiA=A′, entonces se dice que A es simétrica. • Suma y Resta Sea Am×n y Bm×n , entonces Cm×n=A+B es tal que cij=aij+bij Sea Am×n y Bm×n , entonces Dm×n=A-B es tal que dij=aij-bij Propiedades: ⇒ A+B+C=A+(B+C)=(A+B)+C ⇒ A+B=B+A 1 Este anexo repasa solamente algunas propiedades de matrices. Mas detalles en: • Econometría. Alfonso Novales. Segunda Edición. Capítulo 1 • Métodos de Econometría. J. Johnston. Capítulo 4 • Introducción a la Econometría. G.S. Maddala. Segunda edición. Apendice al Capítulo 2. Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 12 • Producto de matriz por escalar Sea Am×n una matriz y α una constante, entonces Bm×n=αA, es tal que bij= α aij • Producto de matriz por matriz Sea Am×n y Bp×q , el producto AB solo se puede calcular si n=p (matrices conformables), Cm×q=AB es tal que cij se obtiene multiplicando elemento a elemento de la fila i-esima de A por la columna j-esima de B y sumando estos productos. Es decir ∑ = = n 1s sj b is a ij c . Propiedades: ⇒ AB ≠ BA ⇒ La única matriz que se puede multiplicar por si misma es la matriz cuadrada. ⇒ Si AA=A se dice que A es idempotente. ⇒ Si An×1, entonces A′A es un escalar igual ∑ n 1 2 ia , mientras que AA′ será una matriz cuadrada y simétrica de orden n×n. ⇒ A(BC)=ABC=(AB)C ⇒ A(B+C)=AB+AC • Traza La traza de una matriz cuadrada es igual a la suma de los elementos de la diagonal principal. Propiedades: ⇒ Tr(A+B)=Tr(A)+Tr(B) ⇒ Tr(ABC)=Tr(CAB)=Tr(BCA) • Matriz identidad. Se denota como In a la matriz cuadrada de orden n, que tiene elementos 1 en la diagonal y cero en el resto. I2= 10 01 Propiedades: Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 13 ⇒ Sea Am×n , luego, ImA=AIn=A • Diferenciación Matricial Si bn×1, entonces [ ] [ ] [ ] [ ] ∂ ∂ ∂ ∂ ∂ ∂ = ∂ ∂ n 2 1 b )b(f . . b )b(f b )b(f b )b(f Ejemplos: ⇒ [ ] a b b'a = ∂ ∂ ⇒ [ ] Ab2 b Ab'b = ∂ ∂ ⇒ [ ] A2 b Ab2 = ∂ ∂ • Determinante de una matriz El determinante es una función que asocia un número real a una matriz cuadrada. Procedimiento de Laplace: 1. Elija cualquier fila o columna de una matriz y para cada uno de los elementos calcule el cofactor. El cofactor de un elemento aij será cij=(-1)i+jMij. 2. Mij (matriz menor) es el determinante de la matriz que surge de eliminar la fila i y la columna j de la matriz original. 3. Multiplique cada elemento aij de esa fila (o columna) por su cofactor cij 4. Determinante de A=|A|= ∑ = ∀ n 1j ijij i ca Ejemplos: Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 14 1. = 2221 1211 aa aa A 12211111 cacaA += c11=(-1)1+1 M11=(-1)2 (a22)=a22 c21=(-1)2+1 M21=(-1)3(a12)= -a12 1221221112212211 aaaa)a(aaaA −=−+= 2. A= − − 112 503 312 312111 c2c3c2A ++= c11=(-1)1+1 M11=(-1)2 11 50 − =5 c21=(-1)2+1 M21=(-1)3 11 31− =(-1)(-1-3)=4 c31=(-1)3+1 M31=(-1)4 50 31 − − =5 32)5(2)4(3)5(2A =++= Propiedades: ⇒ 'AA = ⇒ Intercambiar 2 filas (o columnas) cambia el signo del determinante ⇒ Si una fila de un determinante se multiplica por k, el determinante queda multiplicado por k. ⇒ La adición de un múltiplo de una fila a otra no altera el valor del determinante. ⇒ Si una fila (o columna) es combinación lineal de otra fila (o columna) el determinante de la matriz es cero. Una matriz con determinante cero se denomina singular. • Matriz inversa Dada la matriz cuadrada An, 1nA − es su matriz inversa si n 1 nn IAA = − Procedimiento de calculo: Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 15 A de eeterminantd uesta transpcofactores de matriz A )'A( A c 1 ==− La matriz de cofactores se forma de sustituir cada elemento de la matriz por su correspondiente cofactor cij. Donde cij=(-1)i+j Mij , siendo Mij (menor) el determinante de la submatriz que se forma cuando a la matriz A se le elimina la fila i y la columna j. Ejemplo: = 010 100 001 A 312111 c0c0c1A ++= = 1 c11=(-1)1+1 M11=(-1)2 01 10 =-1 )1(A −= = − − − − = − − − − = = − − −− −− = − − − − − = 010 100 001 1 010 100 001 1 ' 010 100 001 1 ' )0)(1()1)(1()0)(1( )1)(1()0)(1()0)(1( )0)(1()0)(1()1)(1( 1 ' 00 01 )1( 10 01 )1( 10 00 )1( 10 01 )1( 00 01 )1( 01 00 )1( 10 00 )1( 00 10 )1( 01 10 )1( A )'A( c Propiedades: ⇒ ¿Siempre existe 1A − ? No, la matriz A debe ser cuadrada y no singular ⇒ A)A( 11 =−− ⇒ La inversa (si existe) es única. ⇒ 111 AB)AB( −−− = ⇒ )'A()'A( 11 −− = Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 16 • Rango de una matriz Una matriz Am×n puede interpretarse como una colección de m vectores fila de dimensión n, o como una colección de n vectores columna de dimensión m. Entonces, podemos hablarse de filas linealmente independientes (LI) o linealmente dependientes (LD). Se denomina rango de la matriz al máximo número de columnas (o filas) LI. Propiedades: ⇒ El número máximo de filas LI es igual al número máximo de columnas LI ⇒ Rango (Am×n)=min (m,n) ⇒ Rango A=Rango A’ ⇒ Si rango Am×n=m=n, entonces A es no singular y su inversa existe y es única. 3.1.2 Valores y vectores propios Dada una matriz cuadrada An, entonces existe una constante λ y un vector x (no nulo), tal que satisfacen la siguiente ecuación: Ax=λx y que reciben el nombre λ= valor propio de A x= vector propio de A Ax=λx es una ecuación que tiene implícita dos incógnitas, un vector y un escalar. Las soluciones vendrán en parejas, a cada λ le corresponde un vector x Procedimiento de cálculo: Ax=λx Ax-λx=0 (A-λI)x=0 Si A-λI es no singular, entonces la única solución a la ecuación anterior es la trivial (x=0). Entonces, para que la solución sea no nula, el determinante de A-λI debe ser igual a cero. A esta se le conoce como ecuación característica y tiene n soluciones a las que se denomina valores propios. Para cada valor propio existe un vector propio que se obtiene sustituyendo el valor de λ en la ecuación (A-λI)x=0. Ejemplo: = 5.05.0 10 A i) Encontramos los valores propios de la matriz A: Debemos resolver: det( A-λI)=0 Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 17 − − λ λ 1 0 5 0 5. . = (-λ)(0.5-λ)-0.5= -0.5λ+λ2-0.5 =0 0.5± 2 )5.0(45.0 2 −− =(0.5±1.5)/2= 1 0 5− . Los valores propios son 1 y –0.5 ii) Vectores propios: ♦ Para λ=1 (A-λ1I)x1=0 (A-(1)I)x=0 = − − 0 0 b a 5.05.0 11 -a+b=0 ⇒ a=b 0.5a-0.5b=0 ⇒ a=b Dado que las dos ecuaciones son iguales el vector propio es un vector genérico x1= = a a b a Cualquier vector que tenga dos componentes que sean iguales verifica esta ecuación. En particular se puede normalizar el vector haciendo que su longitud sea 1, es decir, haciendo que a2+b2=1 Luego, a=b= 2 1 con lo que = 2 1 2 1 1x ♦ Para λ=-0.5 det(A-λ2I)x2=0 (A- 0.5I)x2=0 = 0 0 d c 15.0 15.0 0.5c+d=0 c= -2d 05c+d=0 c= -2d = − = = dd2 d c 2x Normalizando tenemos dos ecuaciones: c2+d2=1 y c= -2d , con lo que: (-2d)2+d2=1 ⇒ 4d2+d2= 1 ⇒ 5d2 =1 ⇒ 5/1d = Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 18 c= -2d ⇒ 5/2c −= − = = 5 1 5 2 d c 2x Propiedades: ⇒ Los valores propios de una matriz simétrica son reales. ⇒ Los vectores propios correspondientes a distintos valores propios de una matriz simétrica son ortogonales entre si. Es decir que su producto es cero. 0=x2x1' ⇒ Sea B una matriz que tenga por columnas los vectores propios de A y D una matriz que tiene los valores propios en la diagonal y cero en el resto. B= ||| ||| x..xx ||| ||| n21 y D= λ λ λ n 2 1 00 0.00 0.00 00 00 La propiedad anterior asegura que B’B= BB’=In, esto implica que B’ es la inversa de B (B es ortogonal). ⇒ DAB'B = , es decir que la matriz B (de vectores propios) diagonaliza a A. ⇒ Si A es una matriz simétrica, definida positiva, existe una matriz no singular P tal que A=P’P ⇒ La suma de los valores propios de una matriz A es igual a la traza de A ⇒ El producto de los valores propios de una matriz A es igual al determinante de A ⇒ Una matriz es singular si y solo si al menos un valor propio es cero. ⇒ El rango de una matriz es igual al número de valores propios no nulos de ella. ⇒ Los valores propios de la matriz A2 son el cuadrado de los valores propios de A. ⇒ Los valores propios de A-1 son los inversos de los valores propios de A, los vectores propios son los mismos que los de A. ⇒ Los valores propios de una matriz idempotente son cero o uno. ⇒ El rango de una matriz idempotente es igual al número de valores propios iguales a 1 e igual a su traza. Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 19 ⇒ Sea una matriz A de orden m, definida positiva, y P una matriz de m×n, de orden m, el producto P’AP es una matriz definida positiva. ⇒ Los elementos de la diagonal principal de una matriz definida positiva son estrictamente positivos, mientras que los elementos de la diagonal principal de una matriz semidefinida positiva son no negativos. 3.2 ALGUNOS EJERCICIOS DE MATRICES2 3.2.1 Operaciones con matrices a) Dadas los siguientes matrices, A = 3 5 8 4 0 2 B = 3 8 0 2 1 4 3 2 1 C = − − 4 2 1 Calcular: (ABC), (C`A`); (AC)` ; (B`C)` ; (C`B) b) Dadas las matrices: A = 1 3 4 2 0 7 5 6 9 B = 10 2 0 7 1 3 4 5 6 Calcular (A+B); (A-B); (4A+7B) 3.2.2 Determinantes a. Dadas las matrices cuadradas: A = 1 0 3 1 B = 4 1 0 2 = 12 21 C Comprobar: A B A B A B C A B C . . . . . . = = 2 Recomendables para quienes el tema de matrices resulte nuevo o olvidado. Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 20 b. Dada la siguiente matriz cuadrada: A = 1 0 1 2 3 0 0 4 1 Comprobar: A A kA k An = = ' probar con k=2 c. Calcular los siguientes determinantes: t111 z211 y121 x112 B a10 0a1 10a A = = 3.2.3 Matriz Inversa a. Hallar la inversa de las siguientes matrices: A = − − 2 2 3 1 0 3 3 4 0 B = 3 1 1 1 2 2 1 2 4 b. Dadas tres matrices A, B y C cuadradas cualquiera, verificar: (ABC)-1 = C-1B-1A-1 3.2.4 Valores y Vectores propios. a) Encontrar los valores y vectores propios de: − = 221 211 403 A y mostrar que Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 21 i) la suma de las raíces características (valores propios) es igual a la suma de los elementos de la diagonal de A ii) el producto de las raíces características es igual al determinante de A. b) Dada la matriz: A = 1 4 1 1 i) Encontrar los vectores propios de A ii) Calcular A2 y comprobar que λ2 es un valor propio de A2. iii) Calcular A-1 y comprobar que 1/λ es un valor propio de A-1 c) Dada la siguiente matriz: A = 2 1 1 2 i) Encontrar los valores y vectores propios ii) Probar que x1 es ortogonal a x2 ⇒(x1’x2)=0 iii) Formar B y D y probar que el determinante de A es igual al determinante de D (es obvio?), que el rango de A es igual al rango de D y que A y D tienen la misma ecuación característica. iv) Probar que B diagonaliza A⇒ B’AB=D d) Dado que X= 3 1 2 1 1 1 1 1 , calcular A= [ ])'X)X'X(X(I 14 −− . Demostrar que A es idempotente y determinar su rango. Calcular los valores propios de A y obtener la matriz que diagonaliza a A. Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 22 22.. RREEGGRREESSIIÓÓNN SSIIMMPPLLEE 2.1 EL MÉTODO DE MÍNIMOS CUADRADOS ORDINARIOS (MICO). 2.1.1 Definición de análisis de regresión. Se vincula a la descripción y evaluación de la relación entre una determinada variable (dependiente o explicada) y una o más variables denominadas explicativas o independientes. Significado del término de regresión (Francis Galton, 1886): la estatura promedio de los niños que nacían de padres con una determinada estatura tendía a moverse o “regresar” hacia la altura promedio de la población total. Ello aún cuando existía una tendencia a que los padres altos tuvieran hijos altos y padres bajos tuvieran hijos bajos. Galton dijo que existía una “regresión a la mediocridad”. Actualmente se denomina regresión al estudio de la dependencia de una variable (la variable dependiente) de una o más variables (las explicativas) con la perspectiva de estimar y/o predecir el valor poblacional medio de la primera en términos de los valores conocidos de las segundas. Si k=2 ⇒ Regresión Simple Si k>2 ⇒ Regresión Múltiple Donde en general X1 no representa una variable, sino que es una columna de “unos” que permitirá calcular la constante del modelo. Ej. Y = gasto en consumo de una familia X2 = ingreso de la familia X3 = activos financieros de la familia X4 = tamaño de la familia Objetivos del Análisis de Regresión: ⇒ Predecir el valor poblacional medio de Y dado los valores fijos de las X ⇒ Analizar los efectos de políticas que alteren las X ⇒ Saber si las X tienen o no efectos sobre la Y (y si estos efectos son significativos). )X,.....,X,X(fY k21= Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 23 2.1.2 Especificación de la Regresión Simple. Antes habíamos hablado de relación entre variables dependientes e independientes. Y= f (X) Esta puede ser de dos tipos: i) determinística o matemática. De este tipo de relación se preocupa la economía matemática. Ej: Y=1+X Y queda determinada exactamente dado el valor de la variable X. ii) estocástica o estadística De este tipo de relación se preocupa la Econometría. Para valores de X no podemos determinar Y en forma exacta, sino probabilísticamente. Y=1 + X+ µ Donde µ, conocido como RESIDUO, es una variable aleatoria. Representa la ignorancia residual, por lo tanto podemos atribuirle las propiedades más convenientes al problema en cuestión. 2.1.3 Ejemplo: Relación deterministica Y=K0.3 L0.7 Divido entre L, 3.0 3.0 3.03.03.0 7.03.0 L K L 1 KLK L LK L Y ==== − Aplico logaritmo: LN(Y/L) =0.3 LN(K/L) Dados los valores de K/L (relación capital/trabajo), existe un único valor de producto por trabajador (Y/L). LN(K/L) LN(Y/L)Y/L 12 3.6 36.6 14 4.2 66.7 20 6 403.4 5 1.5 4.5 10 3 20.1 0 1 2 3 4 5 6 7 0 5 10 15 20 25 LN (K/L) L N ( Y /L ) Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 24 0 1 2 3 4 5 6 7 8 0 5 10 15 20 25 LN (K/L) L N ( Y /L ) Relación estocástica Y=K0.3 L0.7 eµ Divido entre L, µµµ µ e L K e L 1 KeLK L eLK L Y 3.0 3.0 3.03.03.0 7.03.0 ==== − Aplico logarítmo: LN(Y/L) =0.3 LN(K/L) + µ Ahora el valor final de LN(Y/L) no depende solamente del valor de LN(K/L) sino también del valor de µ. Sabemos que µ es una variable aleatoria, pero aún no conocemos su distribución. Supongamos que µ tiene la siguiente distribución: + = 1/2 de adprobabilidcon 1- 1/2 de adprobabilidcon 1 µ Entonces para cada valor de K/L tendríamos dos valores posibles de Y/L LN(K/L) X LN(Y/L) si µ=1 Y LN(Y/L) si µ=-1 Y 12 4.6 2.6 14 5.2 3.2 20 7 5 5 2.5 0.5 10 4 2 Supongamos ahora que µ es una variable aleatoria continua que tiene una distribución normal estandarizada (con esperanza cero y varianza 1). Entonces por cada valor de K/L tendremos infinitos valores para Y/L, dependiendo del valor de µ. El gráfico que obtendríamos sería algo similar a esto: Valor posible de LN(Y/L) para un valor dado de K/L La relación entre LN(Y/L) y (K/L), ahora es estocástica. Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 25 En términos generales en econometría tendremos relaciones estocásticas entre la variable dependiente (Yi) y la explicativa (Xi). Yi=α+βXi+µ tiene dos componentes ⇒ componente determinístico: α+βXi, donde α y β son los parámetros o coeficientes de la regresión. Sus valores serán estimados a partir de los datos disponibles para X e Y. ⇒ componente estocástico: µ 2.1.4 Fuentes de Error µ i) Elementos impredecibles y aleatorios en las respuestas humanas. Por ejemplo Consumo=f(ingreso), pero las personas no siempre responden de igual forma para iguales valores del ingreso. ii) Variables Omitidas: En el término de error se resume la incapacidad de identificar la influencia de ciertas variables o en otros casos imposibilidad de representarlas en valores (por ser de difícil cuantificación). iii) Errores de medida en la variable dependiente. Cuidado: estos errores de medida tienen ciertos problemas que estudiaremos más adelante. 2.1.5 Función de regresión poblacional y muestral. Dado que el objetivo del análisis de regresión es estimar o predecir el valor medio o promedio (poblacional) de la variable dependiente basándose en los valores fijos o conocidos de las variables explicativas, distinguiremos algunos conceptos. Función de Regresión Poblacional (FRP): es la recta que surge de unir las esperanzas condicionales de la variable dependiente para los valores fijos de la variable explicativa. Dado que para cada Xi, existe una población de valores de Y, se puede calcular la esperanza condicional de los valores de Y, condicional a cada Xi. A la unión de las esperanzas condicionales se le denomina FRP. Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 26 Del gráfico podemos concluir que E(Y/Xi) es una función de Xi, y esa será una función lineal de Xi. Recordar: la linealidad puede ser en las variables y en los parámetros. Lo que nos interesa es que la relación sea lineal en los parámetros. variableslasen ni ,parámetros losen ni lineal es no 2iX2 1 )1X/Y(E variableslasen no ,parámetrosen lineal es 2iX 2 1 )iX/Y(E →β+β= →β+β= Modelos Linealizables: 2 iX1)iX/Y(E β β= ln E(Y/Xi) = ln β1 + β2Xi No Linealizables iX2e )iX/Y(E 21 β β+β= Qué forma tiene esta función? Para saberlo hay que recurrir a la teoría, pero podría ser por ejemplo E(Y/Xi)= β 1+β 2 Xi Existe una relación lineal entre Xi y E(Y/Xi), en el caso del gráfico esta relación es positiva. Pero, ¿cómo es la relación entre cada Yi y el Xi correspondiente? Para cada Xi dado, un Yi en particular se desvía de la E(Y/Xi), por un término de error, µi. Es decir, µi= Yi - E(Y/Xi) o Yi= E(Y/Xi) + µi , Por lo que Yi= β1+β2 Xi+ µi Para el ejemplo que veíamos antes: Ln (Y/L) = β1+β2 Ln (K/L) + ui, lo que indica que para encontrar cada valor particular de producto por trabajador debo sumar dos componentes, el primero representa el promedio de producto obtenido dado el nivel de capital utilizado [β1+β2 Ln (K/L)], el segundo que indica cuánto hay que sumarle o restarle a ese promedio para alcanzar el valor de Y/L particular. Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 27 Función de Regresión muestral (FRM). Hasta ahora nos hemos referido a los valores poblacionales de Y correspondientes a los valores fijos de X. Al hacer econometría nuestro interés es estimar β1 y β2, pero el primer obstáculo que enfrentamos es que no conocemos la población, sino una muestra de ella. Antes (población) Ahora (una muestra) Así como tenemos esta muestra, podríamos tener otra. Dado que no conocemos la población sino muestras, la estimación de la E(Y/Xi) dependerá de la muestra elegida. ¿Cuál es la verdadera? No lo sabemos. Nuestro objetivo es conocer E(Y/Xi) ⇒ lo sabemos si tenemos β1 + β2Xi pero en realidad no conocemos β1 y β2 (parámetros poblacionales o teóricos), por lo que debemos estimarlos: estimada recta la será Xˆ ˆ Ŷ X Y i21i ii21i β+β= µ+β+β= ii21i iii e Xˆ ˆ Y e Ŷ Y +β+β= += donde Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 28 1β̂ estimación para β1 2β̂ estimación para β2 Estimamos ˆ Y i = ˆ β 1 + ˆ β 2 Xi donde los ˆ β i - son los valores resultantes (estimaciones) a partir de estimadores (fórmulas o algoritmos). Modelo teórico 2β Y1 i21i X)X/Y(E β+β= 1β µ1 µ2 Y2 Xi Yi X1 X2 Modelo estimado β1 1β̂ i21i X ˆˆŶ β+β= E(Y/Xi)=β1+β2Xi 2β̂ X1 1Ŷ E(Y/X1) Y1 µ1 e1 β2 Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 29 Diferencias entre µi y ei µi= Yi - E(Y/Xi) Xˆ ˆ Y e Ŷ Ye i21ii iii β−β−= −= µ -es no observable -es una variable aleatoria a la que se le supone cierta distribución de probabilidad e -es observable (se dispone de valores) - satisface ciertas propiedades que veremos más adelante. ¿Cómo calcular β1 y β2? Método de momentos? Máxima Verosimilitud? Método de Mínimos Cuadrados Ordinarios (MICO)? 2.1.6. MICO para una regresión simple Utilizaremos un método llamado Mínimos Cuadrados Ordinarios (MICO). Idea: “Pasar la recta de regresión a través de los puntos del gráfico de forma que esté lo más próxima posible a la urbe de puntos”. Trataremos que las distancias verticales (errores) sean lo más pequeñas posible. iX21 ˆ iYie iŶiYie β−β−= −= Se trata de elegir ˆ β 1 y ˆ β 2 tal que la diferencia sea mínima. Minimizaremos ei 2∑ (para dar peso equivalente a residuos más grandes). O sea, minimizaremos la suma de los cuadrados de las “distancias verticales” desde los puntos de la recta. Q = (Yi∑ − ˆ Y i ) 2 = (Yi∑ − ˆ β 1 − ˆ β 2 Xi ) 2 = f ( ˆ β 1, ˆ β 2 ) Debemos minimizar Q, es decir que debemos encontrar las condiciones de mínimo CNPO CNSO mínimo de scondicione 0 2)2 ˆ( Q2 0 2 ˆ Q 0 2) 1 ˆ( Q2 0 1 ˆ Q > β∂ ∂ = β∂ ∂ • > β∂ ∂ = β∂ ∂ • Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 30 0 )Xˆ ˆ Y( 0 )1( )Xˆ ˆ Y( 2 ˆ Q)1( i21i i21i 1 =β−β− =−β−β−= β∂ ∂ ∑ ∑ 0 X ˆ 1 ˆ Y i21i =β−β− ∑∑∑ 0 X ˆ n n ˆ Y 21 =β−β− ˆ β 1 = Y − ˆ β 2 X (*) Alternativamente podríamos expresar (1) de la forma ∑ ∑ =⇒=− 0e0)1(e2 ii , esta es la primera condición que se debe cumplir para minimizar la suma de cuadrados de los residuos. Y i∑ Xi − ˆ β 1 Xi −∑ ˆ β 2 Xi 2∑ = 0 Sustituyo 1β̂ por (*) ˆ β 2 = YiXi − n X Y ∑ X i2 − n X 2∑ (**) Alternativamente podríamos expresar (2) de la forma ∑ ∑ =⇒=− 0Xe0)1(Xe2 iiii , esta es la segunda condición que se debe cumplir para minimizar la suma de cuadrados de los residuos. A las dos condiciones se le llama generalmente ECUACIONES NORMALES . La fórmula (**) la podemos transformar para interpretarla mejor. 0 )X)(Xˆ ˆ Y( 2 ˆ Q )2( ii21i 2 =β−β−−= β∂ ∂ ∑ 0 Xˆ X )X ˆ Y( X Y 2i2i2ii =β−β−− ∑∑∑ ∑∑∑ β+β−= 2i2i2ii Xˆ X )X ˆ Y( X Y ∑∑ β+β−= 2i222ii Xˆ Xn ˆ Y X n X Y ∑∑ β+β−= 2i22ii Xˆ Xn )X ˆ Y( X Y )Xn X( ˆ Y X n X Y 22i2ii −β+= ∑∑ Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 31 Recordando de Inferencia: Sxy = cov(X,Y) = (Xi − X )(Yi − Y )∑ n = (XiYi − XiY − X Yi + X Y )∑ n = X iYi∑ n − Y Xi∑ n − X Yi∑ n + X Y n n = Este último es el término que tenemos en el numerador de (**). El denominador es parecido a la formula de la varianza muestral, 1n )XX( S 2 i2 x − − = ∑ . Por lo que (**), para muestras grandes, se puede expresar: X de muestral ianzavar Y e X entre muestral arianzacov S S S n nS X n X Y X n XY ˆ 2 x XY 2 x XY 22 i ii 2 ===− − =β ∑ ∑ donde: ˆ β 1 - ordenada en el origen ˆ β 2 - coeficiente angular o pendiente 2.1.7 Ejemplo de cálculo de ˆ β 1 y ˆ β 2 Supongamos que conocemos los datos de producción y horas trabajadas de 10 trabajadores de una fábrica en un momento de tiempo (corte transversal). Definimos Y = producto , X = horas de trabajo X Y X2 Y2 XY 1 10 11 100 121 110 2 7 10 49 100 . 3 10 12 100 . . 4 5 6 25 . 5 8 10 64 6 8 7 64 7 6 9 36 8 7 10 49 9 9 11 81 10 10 10 100 ∑ 80 96 668 952 789 6,9 Y 8 X = = Yi = ˆ β 1 + ˆ β 2Xi + ei ˆ β 1 = Y − ˆ β 2 X = 9,6 − ˆ β 2 • 8 = 9,6 − 0,75(8) = 3,6 n X Y n YX Y X YX X Y n YX iiii ∑∑ −=+−−= Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 32 ˆ β 2 = X Y − n X Y ∑ Xi2 − n X 2∑ = 789 − 10(8) 9,6 668 − 10(8)2 = 0,75 ˆ Y i = ˆ β 1 + ˆ β 2 Xi ˆ Y i = 3,6 + 0,75 Xi Yi = ˆ β 1 + ˆ β 2Xi + ei Por ejemplo: 1Ŷ =3,6+0,75(10)=7,5+3,6=11,1 2Ŷ = 3,6 + 0,75(7)= 8,85 e1= 1,0 1,11 0,11 Ŷ Y 1i −=−=− e2 = 15.185,8 0,10 Ŷ Y 1i =−=− 0 5 10 15 0 2 4 6 8 10 12 Y X Intercepto: 3.6 Pendiente: 0.75 e1=-0.1 e2=1.15 Tarea: Verificar que en el ejemplo se cumplen los corolarios de las ecuaciones normales 0 Xe 0 e ii i = = ∑ ∑ 2.1.8 Expresión de las formulas en desvíos. Veremos una segunda forma de expresar los resultados anteriores: X ˆ Y ˆ 21 β−=β (*) ∑ ∑ ∑ ∑ − −− == − − =β 2 i ii 2 X XY 22 i ii 2 )XX( )YY)(XX( S S X n X Y X n YX ˆ (**) Definamos las variables en desvíos respecto a su media Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 33 Y Y y X X x ii ii −= −= Entonces, (**) la podemos expresar ∑ ∑ =β 2 i ii 2 x yxˆ (***), donde las variables en minúsculas representan desvíos respecto a la media de la variable. TAREA: demostrar CNSO 2.1.9 Corolarios de los estimadores MICO. 1. De las ecuaciones normales se desprende 0)(media compensan se errores los =⇒=⇒=−= β∂ ∂ ∑∑ 0 e 0 e2 ˆ Q ii 1 0 Xe 0 Xe 2 ˆ Q iiii 2 =⇒=−= β∂ ∂ ∑∑ 2. La regresión siempre pasa por el punto Y,X . Yi = ˆ β 1 + ˆ β 2Xi + ei Sumando para todo i, tenemos: Y i∑ = N ˆ β 1 + ˆ β 2 X i∑ + ei∑ Dado que ∑ = 0e i Y = ˆ β 1 + ˆ β 2 X , Con lo que el punto Y,X verifica la recta de regresión. 3. El valor medio de Y estimado es igual al valor medio de Y observado. ii21i eX ˆ ˆ Y +β+β= Sumando para todo i, iii eŶ Y += iii eŶ Y ∑ ∑∑ += 0 n Ŷ Y i += ∑ ŶY = Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 34 4. La regresión se puede expresar en desvíos: Como ∑ei = 0 (1) ii21i e X ˆ ˆ Y +β+β= , sumando para todo i, ∑∑∑ +β+β= ii21i e X ˆ ˆ n Y , recordando que ∑ei = 0 y dividiendo entre n (2) X ˆ ˆ Y 21 β+β= Restando (1) –(2)⇒ X ˆ e X ˆ ˆ ˆ Y Y 2ii211i β−+β+β−β=− ii2i e )X X( ˆ Y Y +−β=− Expresado en desvíos ⇒ ii2i ex ˆy +β= Similarmente se podría verificar que i2i x ˆŷ β= 5. 0 )e ,X( Cov )e ,Ŷ( Cov == Los residuos no están correlacionados con el valor estimado de Yi, ni con los valores explicativos. Para demostrar este resultado debemos recordar la propiedad 1 y su corolario 0e = • Cov(X,e)= )e( )X X( n 1 )e e( )X X( n 1 iiii −=−− ∑∑ [ ] [ ] 0 e X 0 n 1 eX e X n 1 iiii =−=−= ∑∑∑ De este resultado se deriva que ∑ iiex también es igual a cero. −= −=−−= ∑∑∑∑∑ iiiiii e Ŷ eŶ n 1 e Ŷ e Ŷ n 1 )e e()Ŷ Ŷ( n 1 )e ,Ŷ( Cov Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 35 Analizando la última expresión, comprobamos que el segundo término es cero. Y como se observa debajo también lo es el primero. [ ] [ ] ii22ii21i eX ˆ )X ˆ Y(n 1 e)X ˆ ˆ ( n 1 eŶ n 1 ∑∑∑ β+β−=β+β= [ ] 0eXˆeXˆeY n 1 ii2i2i =β+β− ∑∑∑ 6. Descomposición en Suma de Cuadrados Veamos un resultado previo. Sabemos que: Ŷ Y e Ŷ Y iii = += Restando las dos expresiones anteriores, obtenemos iii e Ŷ Ŷ Y Y +−=− , lo que en desvíos respecto a la media, se puede expresar: iii eŷy += y dado que i2i x ˆŷ β= entonces ii2i ex ˆy +β= Con lo que: iiii2i e ŷe xˆ y +=+β= Se eleva al cuadrado: 2 iii 2 i 2 iii2 2 i 2 2 2 i 2 ii 2 ii2 2 i e eŷ2 ŷ e e x ˆ2 x ˆ y )e ŷ( )e xˆ( y ++=+β+β= +=+β= Se aplica ∑: ( ) ∑∑∑∑∑ ++=+β+β= 2iii2i2iii22i222i e eŷ 2 ŷ e exˆ 2 x ˆ y ∑∑∑∑∑∑∑ ++=+β+β= 2iii2i2iii22i222i e eŷ 2 ŷ e exˆ 2 x ˆ y ∑∑∑∑∑ +=+β= 2i2i2i2i222i e ŷ e x ˆ y , (****) dado que los dos términos de Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 36 productos cruzados se hacen cero por algunas de las propiedades anteriores. Definimos: SSR residuales cuadrados de Suma SCR e SSE SCEexplicados cuadrados de Suma x ˆ ŷ SST CTS totalescuadrados de umaS y 2 i 2 i 2 2 2 i 2 i === ===β= === ∑ ∑∑ ∑ Entonces el resultado (****) ⇒ SCT=SCE+SCR Una expresión alternativa para SCE, se deriva a continuación: ∑β= 2i22 x ˆ SCE [ ] [ ] [ ] ∑∑ ∑∑ ∑ ∑∑∑ ∑∑ ∑ ∑ β=== =β= =β ii22 i 2 ii2 i22 i 2 ii2 i 2 2 i ii2 i 2 2 2 i ii 2 yxˆ x yx x x yx x x yx x ˆ SCE x yx ˆ Como Ejemplo. Supongamos que el consumo de los hogares se explica por su nivel de ingreso. En el diagrama de dispersión (Gráfico1) cada punto (Xi,Yi) indica la combinación de ingreso y consumo del hogar. Podríamos partir explicando el consumo de una cierta familia por el consumo medio observado de la muestra. Para cada familia cometeríamos un error dado por YiY − . Si realizamos una regresión y estimamos los parámetros 21 ˆy ˆ ββ por MICO, el error que cometemos al asignar a la familia Xi cuyo verdadero consumo es Yi, lamedia de los consumos, se divide ahora en dos partes (Gráfico 2). Una de ellas nos indica la parte del error que ha sido explicada por el modelo ( YŶi − ). La otra mide el error que aún subsiste (ei) Esto se puede generalizar obteniendo medidas resumen para todas las observaciones (o sea para toda la muestra). Estas medidas son las sumas de cuadrados que vimos antes: la suma de cuadrados totales (SCT) puede descomponerse en una parte explicada por la regresión (SCE) y otra parte que aún no logramos explicar o residual (SCR). Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 37 Gráfico 1: Desvío respecto a la media X Y * * * * * * * YYi − Es el desvío total (DT) respecto a la media. (Xi,Yi) Y DRDE)Y Ŷ ( )Ŷ Y(Y Ŷ Ŷ YDT ,Ŷ restamosy sumamosle )Y Y(DTAl iiiiii ii +=−+−=−+−= −= Gráfico 2: Desvío Total, Desvío Explicado y Desvío Residual DT= YYi −DR= ŶYi − DE= YŶi − iŶ Y iY * * * * * * * (Xi,Yi) i21 X ˆˆ β+β Y X Xi X Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 38 2.1.10. Coeficiente de determinacion (R2) Esta descomposición da lugar a una medida de la bondad de ajuste de modelo de regresión SCT SCR 1 SCT SCR SCT SCT SCE R 2 −= − == Consideraciones: 1. Es una medida de bondad absoluta del modelo ya que mide qué proporción de la varianza total (la varianza de Y) es explicada por el modelo de regresión (por X). Cuanto mayor sea la relación entre X e Y, mayor será este indicador. 2. Es una medida de bondad relativa entre modelos. Por ejemplo, permite comparar si la capacidad explicativa es mayor incluyendo X como variable independiente respecto a incluir Z. 3. 0 ≤ R2 ≤ 1 (Si el modelo no explica nada SCR = SCT ⇒ R2 = 0) (Si el modelo explica todo SCE = SCT ⇒ R2 = 1) * * * * * * * Y Y X X R2=1 R2=0Y X Todas las observaciones coinciden con la línea No existe relación alguna que de regresión⇒ ajuste perfecto (imposible) sea expresable linealmente Otras formas de expresarlo: ( ) 2 y,x2 y 2 x 2 xy 2 i 2 i 2 ii 2 i 2 i 2 2 i ii 2 i 2 i 2 2 2 i 2 i2 r S • S S x y yx y x x yx y x ˆ y ŷ SCT SCE R === = β === ∑ ∑ ∑ ∑ ∑∑ ∑ ∑ ∑ ∑ ∑ Es decir, en el modelo de regresión simple el R2 es igual al cuadrado del coeficiente de Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 39 correlación muestral simple entre X e Y. Recordar que yx y,x 2 i 2 i ii XY SS S yx yx )Y(V)X(V )Y,X(Cov r === ∑∑ ∑ , era una medida de la asociación lineal que existe entre X e Y. Debemos recordar que el concepto de covarianza nos da una primera aproximación del grado de asociación que tienen X e Y. n xy n )YY)(XX( Sxy ∑∑ =−−= Y Y X X ∑ < 0xy ∑ > 0xy ∑ > 0xy ∑ < 0xy Esto se cumple si los puntos muestrales se concentran predominantemente en estos cuadrantes. Puede pasar que exista una relación, pero pequeña, entre las dos variables, en ese caso los puntos estarán dispersos en los cuatro cuadrantes. Desventajas de trabajar con ∑ xy : a. Su valor puede aumentar simplemente agregando más observaciones. La solución es dividir por el tamaño muestral, con esto se obtiene Sxy b. La covarianza depende de las unidades en que se miden X e Y. Por ejemplo si pasamos variables de dólares a centavos, la covarianza aumenta en 10000. Por esta razón, la covarianza se escala dividiendo por la desviación estándar de las variables en cuestión. Por eso trabajamos con 2 y xy2 XY S Sˆ )Y(V)X(V )Y,X(Cov r β == . El signo de rXY dependerá del signo de la covarianza. Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 40 Propiedades de r: a. Está entre –1 y 1 b. Simetría rxy=ryx c. Es independiente del origen y de la escala. d. Si X e Y son estadísticamente independientes, entonces r=0. Pero r=0, no implica independencia. e. Como es una medida de asociación lineal, no tiene sentido utilizarlo para describir relaciones no lineales. f. No dice nada de las relaciones causa-efecto. Para eso se utiliza el test de Granger. 2.1.11 Algunas Regresiones Particulares • Regresión que incluye sólo Constante (o sea no incluye X) 2 1i 2 i i1i 1i i1i )ˆ Y( e Q e ˆ Y ˆ Ŷ u Y β−== +β= β= +β= ∑∑ 0 )1)(ˆ Y( 2 ˆ Q 1i 1 =−β−= β∂ ∂ ∑ Y n Y ˆ ˆ Y i 1 1i ==β β= ∑ ∑∑ Yˆ 1 =β • La regresión que pasa por el origen (incluye X, pero no constante) =β−== β−= +β= ∑∑ )Xˆ Y( e Q )X ˆ Y( e u X Y 2 i2i 2 i i2ii ii2i 0 )X)(X ˆ Y(2 ˆ Q ii2i 2 =−β−= β∂ ∂ ∑ 0 X ˆ X Y 0 X )X ˆ Y( 2i2iiii2i =β−⇒=β− ∑∑∑ ∑ ∑=β 2 i ii 2 X XYˆ Tarea: verificar qué propiedades se cumplen para esta regresión. . Tarea: calcular R2, verificar las restantes propiedades. Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 41 Características: 0 X e 0 e ii i = ≠ ∑ ∑ • Modelo doble logarítmico i21 u Xln Yln +β+β= X en porcentual cambio al respecto ,Y de porcentual cambio ˆ X a respecto Y de delasticida Xln Yln 2YX ↓ β== ∂ ∂ =η • Modelo Semilogarítmico i21 u X Yln +β+β= .Xen unidad unaen cambio elpor Yen cambio de tasa:cidadsemielasti . Xen absoluto cambioun por Yen relativo cambio ln 2 ↓ ⇒= β ∂ ∂ X Y • Ejemplo: el tiempo como variable explicativa Supongamos que tenemos el siguiente modelo para representar la evolución de una cierta economía: PIB=Aer t (Ver Recuadro) Donde A es un término constante, r es la tasa de crecimiento anual (que se supone constante) y t es el tiempo (1,2,3.......). Para estimar esta ecuación debemos linealizarla e incorporarle el componente aleatorio: PIBt=Aerteµ ln PIBt= ln A + rt+µi Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 42 ln PIBt= β0+ β1t+µi (*) Luego de estimar (*) con los datos de un cierto país, obtenemos: ln PIBt = 6,96 + 0,0269 t +ei Esto significa que la tasa de crecimiento del PIB promedio en el período de esta economía es 2.69%. Supongamos que el PIB crece a una tasa de 3% anual. Matemáticamente esto significa que: PIB03.0 dt dPIB = Esta es una ecuación diferencial que se puede reescribir como: dt03.0dPIB PIB 1 = . Si integramos a ambos lados de la ecuación, tenemos: ∫ ∫= dt03.0dPIBPIB 1 y resolviendo ambas integrales: 21 ct03.0cPIBln +=+ Con lo que: ct03.0PIBln += . Encontrando el antilogaritmo de esta ecuación: PIB(t)=e0.03tec 2.1.12. ¿Cómo seleccionar entre estimadores? Hasta ahora hemos derivado los estimadores MICO para 21 ˆy ˆ ββ . También hemos derivado sus propiedades. En este punto nos preguntamos qué criterios podemos aplicar para saber que tan buenos son estos estimadores. Pese a que MICO es el método más popular para estimar los parámetros de un modelo, minimizar la suma de los errores al cuadrado, no dice nada sobre la relación del estimador y el verdadero valor del parámetro. Puede pasar que la minimización sea válida para una muestra en particular. Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004 43 MICO siempre minimiza ei 2∑ , pero esto no garantiza que se cumplan otras propiedades. Mayor R2 ¿Tiene sentido decir que los estimadores tendrán buenas propiedades si hacen que el R2 sea el mayor posible? No, MICO minimiza ei 2∑ para una muestra en particular y esto es equivalente a maximizar