Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE FACULTAD DE CIENCIAS ECONOMICAS Y ADMINISTRATIVAS INSTITUTO DE ECONOMIA TAREA 2 ECONOMETRIA I EAE250A SEC.3 Profesor Juan Urquiza Primer Semestre 2019 Integrantes del grupo: 1. Francisca Dutilh 2. Francisca Gana 3. María Teresa Saieh Problema 1: Compensación por riesgo laboral A) Estime una regresión para el logaritmo del salario ¿Hay evidencia en favor de un premio por riesgo? Justifique su respuesta. Podemos observar que el coeficiente de la tasa de accidentes fatales en el empleo es 6,564486 por lo que, ante un aumento de 1% de esta tasa, el salario aumentará 6,6% aproximadamente, mostrando evidencia a favor de un premio por riesgo. (Definitivamente, un trabajador que acepta un trabajo con mayor riesgo laboral, recibe mayor salario) Podemos ver que haciendo un test, esta variable es relevante ya que rechazamos Ho porque el valor-p es 0 entonces nos indica que la variable significativa. B) Preocupado por posibles problemas de endogeneidad, decide recurrir al tamaño promedio de las empresas del mismo sector económico (tam_otras) como posible instrumento para rfatal. Asumiendo que tam_otras es una variable exógena, verifique que sea un instrumento relevante para rfatal a partir de la estimación de la forma reducida o primera etapa. Considere un nivel de significancia del 1%. Los problemas de endogeneidad son que la variable explicativa correlacione con el error, incluyendo tam_otras como instrumento para rfatal. Para ver si este instrumento es válido, debe cumplir: 1.Relevancia: Exista Correlación (Variable explicativa, Variable instrumental) , en este caso entre rfatal y tam_otras 2.Exclusión: Tam_otras y el error NO correlaciones Como se puede ver, poseen una relación (corr = 0,4323), cumpliendo el primer requisito. Por otro lado, como nos dice el enunciado, tam_otras es un variable exógena, es completamente aleatoria, lo que nos permite considerar que C(tam_otras, e) = 0. Para determinar si es relevante, haremos un test sobre su estimador en una regresión auxiliar: A través del test sobre la regresion auxiliar, podemos ver que como la Prob > F = 0.0000 se rechaza la hipótesis nula, por lo tanto, es relevante la variable tam_otras sobre la tasa de accidentes fatales en el empleo al 1%. C) Ahora estime la regresión original por MC2E usando al instrumento sugerido en la parte anterior, y luego compare con los resultados obtenidos en la parte a). Además, se pide que evalúe formalmente si la diferencia entre las estimaciones por MCO y MC2E es significativa al 1%, y que luego se refiera a las implicancias de dicho contraste. La variable rfatal aumentó más del doble, de 6,564486 a 15.39378 con la regresión por MC2E. Esto significa que se estaba subestimando el impacto de las tasas de accidente fatales en empleo en el salario ya que antes, B1 estimado estaba sesgado porque tenía la variable tam_otras en el error y está correlacionada con la variable explicativa rfatal. Para ver las diferencias entre las estimaciones por MC2E y MCO al 1% realizaremos un contraste de endogeneidad así podremos comprobar si las variables explicativas son o no endógenas. Ocuparemos el Stata para realizar dicho test, los resultados nos muestran que el valor-p es 0, rechazando Ho (Variable es exógena), por lo que concluimos que la variable tasa de accidentes fatales en el empleo es endógena por lo que es necesario utilizar variables instrumentales. D) Verifique que al implementar la estimación por MC2E de manera secuencial se obtienen los mismos coeficientes pero distintos errores estándar. Ayuda: revise los apuntes correspondientes a la clase 11. Para implementar una estimación por MC2E de manera secuencial, estimaremos la variable endógena por medio de la variable explicativa (rfatal) y la variable instrumental en una regresión auxiliar. Así uno obtiene la parte explicada por el instrumento (parte exógena) Luego se regresa por MCO inicial, pero con la variable estimada: En base a los modelos anteriores, podemos ver que posee los mismo coeficientes y distintos errores estándar, donde el segundo modelo es mayor ya que posee los errores del primero. E) Compruebe que la estimación por MC2E no equivale a simplemente reemplazar a la variable endógena por el instrumento. Primero, claramente si reemplazamos la variable tam_otras por rfatal, se produce insesgamiento ya que, sabemos que la variable explicativa rfaltal correlaciona con la variable dependiente. Por lo que teniendo rfatal en el error nos generaría una inferencia incorrecta. También fijándonos en el R-squared este aumenta de 0,2753 a 0,2760 expresando que las variables explicativas explican más sobre la regresión, debido a como un estimador deja de posee significancia individual, la magnitud de los coeficientes de las otras variables cambian. F) Considere ahora la posibilidad de incorporar al cuadrado del tamaño promedio de las empresas del sector (tam_otras2) como un segundo instrumento. Se pide entonces que verifique que ambos instrumentos sean relevantes al 99%, y que luego estime el modelo original por MC2E utilizando ambos instrumentos. ¿Cómo cambian sus resultados respecto de la estimación de la parte c)? Comente. El haber incluido otra variable instrumental, el coeficiente de rfatal aumenta de 15.39378 a 15.5787 lo que nos indica que se subestimó el impacto de la tasa de accidentes fatales en el empleo sobre la variable dependiente (log_salario). Además, realizando un test al 99% (test tam_otras=0 tam_otras2=0) se concluyó que ambos instrumentos son relevantes para cualquier nivel de significancia, ya que el valor-p es igual a 0, por lo tanto, rechazamos la hipótesis nula donde ambas variables no eran relevantes (Ho). G) Finalmente, implemente un contraste de sobre-identificación e interprete su resultado. Verifique además que el estadístico reportado por Stata coincide con el que se puede obtener a partir una regresión auxiliar particular. Para realizar el contraste de sobre-identificacion, ocuparemos el test de Sargan. Comparando el 1,48813 con Chi-cuadrado (q-r), donde q son las variables instrumentales y r son las variables potencialmente endógenas. En este caso será un chi-cuadrado (2-1)= 5.99. Como 5,99 >1,488 no rechazando la hipótesis nula, es decir, ningún instrumento correlaciona con el error, el modelo está bien especificado. De manera alternativa, Se puede estimar MC2E, guardar los residuos y estimar la regresión de los residuos sobre todas las variables explicativas e instrumentos. Y luego comparar nR2 con Chi-cuadrado (q-r). Manualmente: Podemos verificar que el estadístico reportado por Stata coincide con el que se puede obtener a partir una regresión auxiliar, 1.4881274. Problema 2: Inasistencia y desempeño académico A) Estime una regresión para nota sobre inasistencia, control, PPA y PC, y luego evalúe la hipótesis nula de homocedasticidad mediante la prueba F de Breusch–Pagan al 5%. Compruebe que el estadístico de contraste reportado por Stata coincide con el que se puede obtener a partir del R2 de la regresión auxiliar correspondiente Regresión de nota sobre inasistencia, control, promedio acumulado de notas (PPA) y la variable binaria que toma el valor de 1 si un alumno tiene PC y 0 si no: Regresión de los residuos al cuadrado: Test Breusch-Pagan al 5% Obteniendo F a partirde la regresión auxiliar: Se comprueba que el estadístico de contraste reportado por Stata coincide con el que se puede obtener a partir del R2 de la regresión auxiliar correspondiente. Como vemos que el valor-p es más pequeño que la significancia (5%), entonces se rechaza la hipótesis nula de homocedasticidad y la regresión es heterocedástica. B) A la luz de sus resultados, vuelva a estimar la regresión de la parte a) pero considere ahora una estimación por MCGF. Para ello, tenga presente que deberá obtener los ponderadores (h𝑖) a partir de la regresión auxiliar del logaritmo del cuadrado de los residuos sobre todas las variables explicativas. ¿Quedan resueltos problemas de heterocedasticidad? Verifique mediante la prueba LM de Breusch–Pagan. Para poder estimar por MCGF primero hay que estimar por MCO, luego guardar sus residuos y después regresar el logaritmo de los residuos al cuadrado, lo cual se muestra a continuación: Para continuar hay que hay que transformar las variables utilizando como “ponderados” a hi y luego, hay que dividir MCO por la raíz de hi. Hacemos la regresión con las variables transformadas para resolver los problemas de heterocedasticidad: Regresión de los residuos con las variables transformadas: Para comprobar la homocedasticidad del modelo transformado planteamos las siguientes hipótesis nula y alternativa y comparamos la prueba LM con Chi-cuadrado (k): Ho: homocedasticidad H1: heterocedasticidad Para hacer la prueba LM, multiplicamos n*R2 de la regresión de los residuos: Luego comparamos con el estadístico Chi-cuadrado: Se puede notar que no hay suficiente evidencia para rechazar la hipótesis nula de homocedasticidad, ya que LM= 7,6704, lo cual es más pequeño que 7,68. C) Considere ahora un enfoque alternativo. En particular, se pide que estime la regresión de la parte a) pero con errores estándar robustos. ¿Hay evidencia en favor de un efecto negativo de la inasistencia a clases sobre las notas? Justifique. Haciendo la estimación con la regresión de a) pero con errores estándar robustos: Para evaluar si hay evidencia a favor de un efecto negativo de la inasistencias a clases sobre las notas: Ho: b1 >0 H1: b2 <0 Para evaluar la hipótesis calculamos el t-student estimado y lo comparamos con el t-student (0,95,136) Como t-student (0,95, 136)= 1,66 entonces hay evidencia para rechazar Ho y por lo tanto podemos comprobar que la inasistencias a clases provocan un efecto negativo en las notas. D) Finalmente, y a partir de la estimación de la parte c), se pide que entregue una predicción para la nota esperada de un alumno que nunca falta a clases, con PPA=4.4, control=5.0, y que posee un PC. Predicción: Podemos notar que el resultado es 5,0658128. Problema 3: Modelo de Inversión de Grunfeld A) Estime una regresión para la inversión bruta sobre el valor de mercado y el stock de capital, y luego grafique el comportamiento de los residuos a través del tiempo. ¿Qué puede decir al respecto? En el gráfico, se puede ver que los residuos cambian constantemente de pendiente, variando entre valores positivos y negativos, pero solamente con el gráfico, no se puede determinar si existen problemas de correlación serial. B) Implemente la prueba de Durbin-Watson y explique cómo se interpreta el resultado. El estadístico que obtenemos es 1,072099. Ahora debemos buscar los valores en la tabla de Durbin-Watson para indicar si hay autocorrelación. Con k=2(no incluimos el intercepto) y n=20 → dL=1,1 y dU=1,537. Entonces, nuestro estadístico se ubicará entre el 0 y dL, por lo que concluimos que habrá autocorrelación positiva (p>0). Además, podemos estimar p: Se obtiene p=0,4639505. Tal como dijimos antes la correlación es positiva. C) Considere ahora una estimación por MCGF usando el método iterativo de Cochrane–Orcutt. ¿Quedan solucionados los problemas de correlación serial? El estadístico transformado que nos entrega este test es d=1,326794. Luego, calculamos el p: Obtenemos p=0,336603. Por lo tanto, no se soluciona el problema de correlación serial al ser ésta todavía mayor a 0. D) Verifique que los coeficientes reportados en la parte c) coinciden con los que se pueden obtener a partir de la estimación por MCO usando datos cuasidiferenciados. Aquí, obtuvimos la regresión por MCO con los datos transformados al cuasidiferenciar las variables con el rho de la pregunta anterior (0,5005449). Como se ve en la captura, se obtuvieron los mismos coeficientes que acompañan a las variables que en la c). E) Preocupado por sus resultados, decide considerar una prueba de correlación serial de orden superior. En particular, se pide que vuelva a estimar el modelo de la parte a) y que luego implemente la prueba LM de Breusch–Godfrey para correlación serial AR(2). Para ello, utilice el comando estat bgodfrey, y luego verifique que el estadístico reportado coincide con el que se puede obtener a partir de la regresión auxiliar de los residuos sobre sus rezagos y todas las variables explicativas. El estadístico reportado por esta prueba es 10,083. Luego, regresamos los residuos sobre sus rezagos y las variables explicativas: Con la fórmula del test → calculamos el estadistíco: Como vemos, es exactamente igual al obtenido por la prueba Breusch Godfrey.ç F) Finalmente, y a raíz de sus resultados previos, se pide que considere una estrategia de estimación alternativa que combine al método iterativo de Cochrane-Orcutt con errores estándar de Newey-West, y que comente acerca de las diferencias en los errores estándar respecto de los encontrados en la parte c). Considere un máximo de 1 rezago. Este último test Newey West nos entrega errores estandares robustos, lo que soluciona los problemas de heterocedasticidad y autocorrelación que habían en la c).
Compartir