Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Tarea 3 Econometría Begoña Bilbao Javier Guerraty Dominga Selman C8.6 i) Estimamos el modelo: Ahora guardamos los valores ajustados como arr86_hat y vemos sus estadísticos principales: Se ve que el mínimo es 0,0066 y el máximo 0,55769, efectivamente todos los valores ajustados están entre 0 y 1. ii) ^ arr86 = 0,448 - 0,1678*pcnv + 0,005366*avgsen - 0,00176*tottime - 0,0246*ptime86 - 0,04518*qemp86 iii) Al hacer el test de significancia conjunta obtenemos un p-valor de 0.412858, por lo que no se rechaza la hipótesis nula: ambos coeficientes son iguales a 0, por lo que no son significativos al 5%. C8.9 i) cîgs = -3,639 + 0,8802*lincome - 0,7508*lcigpric - 0,5014*educ + 0,7706*age - 0,009*agesq - 2,825*restaurn R cuadrado = 0,052737 ii) A partir del modelo 1, guardamos los residuales como uhat, y luego creamos una variable l_usq1, que es el logaritmo de los residuales al cuadrado y corrimos la siguiente regresión: Luego, guardamos los valores estimados de esta regresión, creamos una nueva variable hhat= exp( estos valores estimados) y después nombramos “ponderador”= 1/hhat: iii) De la regresión anterior guadamos los residuales y los valores estimados, y los multiplicamos por el ponderador (dividir por 1/(raiz de h)), y los nombramos y_ola y u_ola, luego corrimos la regresión pedida. R cuadrado es 0,02699, el estadístico Fisher es 11,153 y su valor p es 0,000017 (prácticamente 0), por lo tanto se rechaza la hipótesis nula en que no hay heterocedasticidad, por lo que hay evidencia estadística suficiente para decir que sí hay un problema de heterocedasticidad. iv) Los resultados encontrados en el punto anterior nos muestran que que la forma utilizada, no solucionan el problema de heterocedasticidad, o sea, el “h(x)” que usamos no era el correcto . Esto se ve reflejado en el p-valor de 0,000017 con el que podemos determinar que existe heterocedasticidad para prácticamente cualquier nivel de significancia. v) Acá utilizamos MCG igual que antes, pero sacando los estimadores de la varianza robustos Se puede apreciar en la imagen anterior, que los errores estándar aumentaron considerablemente menos “restaurn”, lo que nos ilustra que el modelo de (ii) no resolvió bien el tema de las varianza frente a la heterocedasticidad. Pero vemos que todos los estimadores que se consideran significativos en este modelo, también lo son en (ii), así que la inferencia no cambia tanto. C15.1 i) Efectivamente, el modelo es distinto: antes el intercepto era 5,13 y ahora es 6,86; antes el coeficiente de educación era 0,122 y ahora el que acompaña a sibs es -0,0279. Encontramos que a por tener un hermano más el sueldo en promedio baja un 2,79% y es estadísticamente significativo (p valor prácticamente 0). Esto puede pasar efectivamente por su relación que tiene con educación: a más hermanos, dada una restricción de presupuesto cada uno se educa menos, por lo que tendrían menores sueldos. ii) Probablemente a los hijos que nacieron antes les van a dar más educación porque tienen prioridad, dada una restricción presupuestaria para los menores podría “no alcanzar la plata” entonces se educarían menos. Como se ve en la regresión anterior, efectivamente la educación de los hermanos grandes reduce los años de educación de los hermanos menores: la diferencia de eduación del primer hijo con el segundo es que el segundo tiene 0,28 años menos de educación que el primero. Este coeficiente es significativo, su p-valor es prácticamente 0. iii) El coeficiente de educación para VI con instrumento “sibs” era 0,122 y ahora con VI con instrumento “brthord” es 0,1306, no cambió mucho el coeficiente. Importante notas que se perdieron 83 observaciones,que puede perjudicar la significancia de los estimadores: efectivamente la desviación estándar del coeficiente sube de 0,026 a 0,032 Aún así el coeficiente para educación es significativamente distinto de 0 (p valor casi 0). iv) Regresionamos educación sobre sibs y brthord para ver relevancia: Vemos que ambos son significativas de manera individual (valor p de sibs es 0,0001 y de brthord es 0,0076). Para la relevancia necesito que el coeficiente de brthord sea significativo para que el instrumento sea relevante, y sí lo es. v) Ahora que agregamos sibs como una variable explicativa en el modelo (comparado con (iii)), la desviación estándar del coeficiente de educ pasó de ser 0,032 a 0,074 (más que el doble), pasó de ser significativo en (iii) a nos ser significativo al 5% en este modelo. La varianza del coeficiente de sibs es 0,0173, que en relación a la estimación del coeficiente es muy grande, por lo que hace que no sea significativo a prácticamente nunca (p valor 0,9). Estos errores estándar grandes se deben probablemente a que son variable muy correlacionadas, por lo que el R cuadrado de la regresión de una variable sobre la otra es muy grande, lo que hace que se dispare la varianza, es probable que haya un problema de multicolinealidad. vi) Guardamos los valores estimados de la regresión anterior y vemos la correlación entre ambos: Efectivamente su correlación es de -0,929, que es muy alto, confirmando a cierto nivel la sospecha de multicolinealidad. C15.6 a) Filtramos por exec>0 Observamos que hay 19 estados con ejecuciones entre 1991, 1992 y 1993 Vemos que el estado número 44 tiene la cárcel con más ejecuciones (34) y además es el estado que más ejecuciones tiene: 67. ii) El estimador del coeficiente que acompaña a exec es 0,1277 (no es significativo, su valor p es 0,628), se interpreta como: “por una ejecución de un reo más, aumenta en 0,12 los asesinatos cada 100.000 personas”. iii) Ahora el coeficiente de delta exec (cexec) es significativo al 5% y se ve una relación negativa: por un cambio de 1 en ejecuciones, se ve que la cantidad de asesinatos por cada 100.000 habitantes baja en 0,1038; o bien, cada 10 ejecuciones, baja 1 la cantidad de asesinatos por cada 100.000 habitantes por lo que sí habría un efecto disuasivo. iv) Podemos apreciar que cexec_1 es estadísticamente significativo para prácticamente cualquier nivel de significancia, ya que tiene un p-valor de 5.95 E-8, con lo que se rechaza la hipótesis nula. Eso implica que si en los períodos pasados hubo una ejecución, en el período siguiente van a haber una (-1,08) ejecución menos. v) Se puede observar que la significancia estadística es menor en éste caso para ambas variables, tanto para cexec y cunem, de hecho,ninguna es significativa al 10%. Esto se debe a que con la variable instrumental, se “sacrifica” un poco de significancia estadística (ya que suben los errores estándar), para no tener el problema de endogeneidad. Esto se puede ver reflejado en el valor de Beta de cexec, en donde pasa de ser -0.10384 a -0.1000 (se elimina el sesgo); mientras que la desviación estándar sube de 0.0434 a 0.0643. Para cunem no pasa nada, porque como se asumió para esto, es una variable exógena.
Compartir