Logo Studenta

Tarea 2 Stata Dutilh_Gana_SaiehMaríaTeresa

¡Este material tiene más páginas!

Vista previa del material en texto

PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE 
FACULTAD DE CIENCIAS ECONOMICAS Y ADMINISTRATIVAS 
INSTITUTO DE ECONOMIA 
 
 
 
 
 
TAREA 2 
 
ECONOMETRIA I 
EAE250A SEC.3 
Profesor Juan Urquiza 
 
 
Primer Semestre 2019 
 
 
 
 
 
 
 
 
 
Integrantes del grupo: 1. Francisca Dutilh 
 2. Francisca Gana 
 3. María Teresa Saieh 
 
 
 
 
 
 
Problema 1: Compensación por riesgo laboral 
 
A) Estime una regresión para el logaritmo del salario ¿Hay evidencia en favor de un 
premio por riesgo? Justifique su respuesta. 
 
 
 
Podemos observar que el coeficiente de la tasa de accidentes fatales en el empleo 
es 6,564486 por lo que, ante un aumento de 1% de esta tasa, el salario aumentará 6,6% 
aproximadamente, mostrando evidencia a favor de un premio por riesgo. (Definitivamente, 
un trabajador que acepta un trabajo con mayor riesgo laboral, recibe mayor salario) 
Podemos ver que haciendo un test, esta variable es relevante ya que rechazamos 
Ho porque el valor-p es 0 entonces nos indica que la variable significativa. 
 
 
 
 
 
B) Preocupado por posibles problemas de endogeneidad, decide recurrir al tamaño 
promedio de las empresas del mismo sector económico (tam_otras) como posible 
instrumento para rfatal. Asumiendo que tam_otras es una variable exógena, 
verifique que sea un instrumento relevante para rfatal a partir de la estimación de la 
forma reducida o primera etapa. Considere un nivel de significancia del 1%. 
 
 
 
 
 
 
 
Los problemas de endogeneidad son que la variable explicativa correlacione con el 
error, incluyendo tam_otras como instrumento para rfatal. Para ver si este instrumento es 
válido, debe cumplir: 
1.Relevancia: Exista Correlación (Variable explicativa, Variable instrumental) , en este caso 
entre rfatal y tam_otras 
2.Exclusión: Tam_otras y el error NO correlaciones 
 
 
 
 
 
 
Como se puede ver, poseen una relación (corr = 0,4323), cumpliendo el primer 
requisito. Por otro lado, como nos dice el enunciado, tam_otras es un variable exógena, es 
completamente aleatoria, lo que nos permite considerar que C(tam_otras, e) = 0. 
Para determinar si es relevante, haremos un test sobre su estimador en una regresión 
auxiliar: 
 
 
 
 
 
 
 
 
 
 
A través del test sobre la regresion auxiliar, podemos ver que como la Prob > F = 
0.0000 se rechaza la hipótesis nula, por lo tanto, es relevante la variable tam_otras sobre 
la tasa de accidentes fatales en el empleo al 1%. 
 
 
 
 
 
C) Ahora estime la regresión original por MC2E usando al instrumento sugerido en la 
parte anterior, y luego compare con los resultados obtenidos en la parte a). 
Además, se pide que evalúe formalmente si la diferencia entre las estimaciones 
por MCO y MC2E es significativa al 1%, y que luego se refiera a las implicancias 
de dicho contraste. 
La variable rfatal aumentó más del doble, de 6,564486 a 15.39378 con la regresión por 
MC2E. Esto significa que se estaba subestimando el impacto de las tasas de accidente 
fatales en empleo en el salario ya que antes, B1 estimado estaba sesgado porque tenía la 
variable tam_otras en el error y está correlacionada con la variable explicativa rfatal. 
 
Para ver las diferencias entre las estimaciones por MC2E y MCO al 1% realizaremos un 
contraste de endogeneidad así podremos comprobar si las variables explicativas son o no 
endógenas. Ocuparemos el Stata para realizar dicho test, los resultados nos muestran que 
el valor-p es 0, rechazando Ho (Variable es exógena), por lo que concluimos que la variable 
tasa de accidentes fatales en el empleo es endógena por lo que es necesario utilizar 
variables instrumentales. 
 
 
 
 
 
 
 
 
 
 
 
D) Verifique que al implementar la estimación por MC2E de manera secuencial se 
obtienen los mismos coeficientes pero distintos errores estándar. Ayuda: revise los 
apuntes correspondientes a la clase 11. 
Para implementar una estimación por MC2E de manera secuencial, estimaremos la 
variable endógena por medio de la variable explicativa (rfatal) y la variable instrumental 
en una regresión auxiliar. Así uno obtiene la parte explicada por el instrumento (parte 
exógena) Luego se regresa por MCO inicial, pero con la variable estimada: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
En base a los modelos anteriores, podemos ver que posee los mismo coeficientes 
y distintos errores estándar, donde el segundo modelo es mayor ya que posee los errores 
del primero. 
 
E) Compruebe que la estimación por MC2E no equivale a simplemente reemplazar a 
la variable endógena por el instrumento. 
 
 
 
 
 
 
 
 
 
Primero, claramente si reemplazamos la variable tam_otras por rfatal, se produce 
insesgamiento ya que, sabemos que la variable explicativa rfaltal correlaciona con la 
variable dependiente. Por lo que teniendo rfatal en el error nos generaría una inferencia 
incorrecta. También fijándonos en el R-squared este aumenta de 0,2753 a 0,2760 
expresando que las variables explicativas explican más sobre la regresión, debido a como 
un estimador deja de posee significancia individual, la magnitud de los coeficientes de las 
otras variables cambian. 
 
F) Considere ahora la posibilidad de incorporar al cuadrado del tamaño promedio de 
las empresas del sector (tam_otras2) como un segundo instrumento. Se pide 
entonces que verifique que ambos instrumentos sean relevantes al 99%, y que luego 
estime el modelo original por MC2E utilizando ambos instrumentos. ¿Cómo cambian 
sus resultados respecto de la estimación de la parte c)? Comente. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
El haber incluido otra variable instrumental, el coeficiente de rfatal aumenta de 
15.39378 a 15.5787 lo que nos indica que se subestimó el impacto de la tasa de accidentes 
fatales en el empleo sobre la variable dependiente (log_salario). 
Además, realizando un test al 99% (test tam_otras=0 tam_otras2=0) se concluyó 
que ambos instrumentos son relevantes para cualquier nivel de significancia, ya que el 
valor-p es igual a 0, por lo tanto, rechazamos la hipótesis nula donde ambas variables no 
eran relevantes (Ho). 
G) Finalmente, implemente un contraste de sobre-identificación e interprete su 
resultado. Verifique además que el estadístico reportado por Stata coincide con el 
que se puede obtener a partir una regresión auxiliar particular. 
Para realizar el contraste de sobre-identificacion, ocuparemos el test de Sargan. 
 
Comparando el 1,48813 con Chi-cuadrado (q-r), donde q son las variables 
instrumentales y r son las variables potencialmente endógenas. En este caso será un 
chi-cuadrado (2-1)= 5.99. Como 5,99 >1,488 no rechazando la hipótesis nula, es decir, 
ningún instrumento correlaciona con el error, el modelo está bien especificado. 
De manera alternativa, Se puede estimar MC2E, guardar los residuos y estimar la 
regresión de los residuos sobre todas las variables explicativas e instrumentos. Y luego 
comparar nR2 con Chi-cuadrado (q-r). 
 
 
 
Manualmente: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Podemos verificar que el estadístico reportado por Stata coincide con el que se 
puede obtener a partir una regresión auxiliar, 1.4881274. 
	
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Problema 2: Inasistencia y desempeño académico 
 
A) Estime una regresión para nota sobre inasistencia, control, PPA y PC, y luego 
evalúe la hipótesis nula de homocedasticidad mediante la prueba F de 
Breusch–Pagan al 5%. Compruebe que el estadístico de contraste reportado 
por Stata coincide con el que se puede obtener a partir del R2 de la regresión 
auxiliar correspondiente	
	
 	
Regresión de nota sobre inasistencia, control, promedio acumulado de notas (PPA) y la 
variable binaria que toma el valor de 1 si un alumno tiene PC y 0 si no: 
 
 
Regresión de los residuos al cuadrado: 
 
 
 
 
 
 
 
Test Breusch-Pagan al 5% 	
	
 
 	
 	
 	
	 	
 
Obteniendo F a partirde la regresión auxiliar:	
	
	
	
Se comprueba que el estadístico de contraste reportado por Stata coincide con 
el que se puede obtener a partir del R2 de la regresión auxiliar correspondiente.	
Como vemos que el valor-p es más pequeño que la significancia (5%), entonces 
se rechaza la hipótesis nula de homocedasticidad y la regresión es heterocedástica.	
	
B) A la luz de sus resultados, vuelva a estimar la regresión de la parte a) pero 
considere ahora una estimación por MCGF. Para ello, tenga presente que 
deberá obtener los ponderadores (h𝑖) a partir de la regresión auxiliar del 
logaritmo del cuadrado de los residuos sobre todas las variables explicativas. 
¿Quedan resueltos problemas de heterocedasticidad? Verifique mediante la 
prueba LM de Breusch–Pagan. 	
 
Para poder estimar por MCGF primero hay que estimar por MCO, luego guardar sus 
residuos y después regresar el logaritmo de los residuos al cuadrado, lo cual se muestra a 
continuación:	
	
	
	
	
	
	
Para continuar hay que hay que transformar las variables utilizando como 
“ponderados” a hi y luego, hay que dividir MCO por la raíz de hi. 	
	
	
Hacemos la regresión con las variables transformadas para resolver los problemas 
de heterocedasticidad:	
	
 
Regresión de los residuos con las variables 
transformadas:
	
	
 
 
 
 
Para comprobar la homocedasticidad del modelo transformado planteamos las siguientes 
hipótesis nula y alternativa y comparamos la prueba LM con Chi-cuadrado (k):	
	
Ho: homocedasticidad	
H1: heterocedasticidad	
	
Para hacer la prueba LM, multiplicamos n*R2 de la regresión de los residuos:	
	
	
	
Luego comparamos con el estadístico Chi-cuadrado:	
	
	
Se puede notar que no hay suficiente evidencia para rechazar la hipótesis nula de 
homocedasticidad, ya que LM= 7,6704, lo cual es más pequeño que 7,68. 	
	
	
C) Considere ahora un enfoque alternativo. En particular, se pide que estime la 
regresión de la parte a) pero con errores estándar robustos. ¿Hay evidencia 
en favor de un efecto negativo de la inasistencia a clases sobre las notas? 
Justifique.	
	
Haciendo la estimación con la regresión de a) pero con errores estándar robustos:	
	
	
	
	
	
	
	
Para evaluar si hay evidencia a favor de un efecto negativo de la inasistencias a 
clases sobre las notas:	
Ho: b1 >0	
H1: b2 <0	
	
Para evaluar la hipótesis calculamos el t-student estimado y lo comparamos con el 
t-student (0,95,136)	
	
	
	
	
	
Como t-student (0,95, 136)= 1,66 entonces hay evidencia para rechazar Ho y por 
lo tanto podemos comprobar que la inasistencias a clases provocan un efecto negativo en 
las notas.	
	
D) Finalmente, y a partir de la estimación de la parte c), se pide que entregue 
una predicción para la nota esperada de un alumno que nunca falta a 
clases, con PPA=4.4, control=5.0, y que posee un PC.	
	
Predicción:	
	
	
Podemos notar que el resultado es 5,0658128. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Problema 3: Modelo de Inversión de Grunfeld 
A) Estime una regresión para la inversión bruta sobre el valor de mercado y el stock 
de capital, y luego grafique el comportamiento de los residuos a través del tiempo. 
¿Qué puede decir al respecto? 	
	
 
 
 
 
 
	
	
	
En el gráfico, se puede ver que los residuos cambian constantemente de pendiente, 
variando entre valores positivos y negativos, pero solamente con el gráfico, no se puede 
determinar si existen problemas de correlación serial.	
 
B) Implemente la prueba de Durbin-Watson y explique cómo se interpreta el resultado.	
	
El estadístico que obtenemos es 1,072099. Ahora debemos buscar los valores en la 
tabla de Durbin-Watson para indicar si hay autocorrelación.	
	
Con k=2(no incluimos el intercepto) y n=20 → dL=1,1 y dU=1,537. 	
Entonces, nuestro estadístico se ubicará entre el 0 y dL, por lo que concluimos que habrá 
autocorrelación positiva (p>0).	
	
Además, podemos estimar p:	
	
Se obtiene p=0,4639505. Tal como dijimos antes la correlación es positiva.	
	
C) Considere ahora una estimación por MCGF usando el método iterativo de 
Cochrane–Orcutt. ¿Quedan solucionados los problemas de correlación serial? 	
	
	
 
 
 El estadístico transformado que nos entrega este test es d=1,326794. Luego, 
calculamos el p:	
 
 
 
 
 
 
 
 
Obtenemos p=0,336603. Por lo tanto, no se soluciona el problema de correlación 
serial al ser ésta todavía mayor a 0.	
	
D) Verifique que los coeficientes reportados en la parte c) coinciden con los que se 
pueden obtener a partir de la estimación por MCO usando datos cuasidiferenciados.	
	
 
Aquí, obtuvimos la regresión por MCO con los datos transformados al cuasidiferenciar 
las variables con el rho de la pregunta anterior (0,5005449). Como se ve en la captura, se 
obtuvieron los mismos coeficientes que acompañan a las variables que en la c).	
	
E) Preocupado por sus resultados, decide considerar una prueba de correlación serial 
de orden superior. En particular, se pide que vuelva a estimar el modelo de la parte 
a) y que luego implemente la prueba LM de Breusch–Godfrey para correlación serial 
AR(2). Para ello, utilice el comando estat bgodfrey, y luego verifique que el 
estadístico reportado coincide con el que se puede obtener a partir de la regresión 
auxiliar de los residuos sobre sus rezagos y todas las variables explicativas. 	
	
	
 
El estadístico reportado por esta prueba es 10,083.	
 
 
 
Luego, regresamos los residuos sobre sus rezagos y las variables explicativas:	
	
Con la fórmula del test → calculamos el estadistíco:	
	
 
 
 
 
 
 
Como vemos, es exactamente igual al obtenido por la prueba Breusch Godfrey.ç 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
	
F) Finalmente, y a raíz de sus resultados previos, se pide que considere una estrategia 
de estimación alternativa que combine al método iterativo de Cochrane-Orcutt con 
errores estándar de Newey-West, y que comente acerca de las diferencias en los 
errores estándar respecto de los encontrados en la parte c). Considere un máximo 
de 1 rezago.	
	
	
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Este último test Newey West nos entrega errores estandares robustos, lo que 
soluciona los problemas de heterocedasticidad y autocorrelación que habían en la c).

Continuar navegando