Logo Studenta

Ayudantía 9 Enunciado

¡Estudia con miles de materiales!

Vista previa del material en texto

PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE 
INSTITUTO DE ECONOMÍA 
AYUDANTIA N°9 - ECONOMETRÍA 
Tema I: 
Usted quiere estudiar el efecto del tamaño de la familia en la oferta laboral de la mujer. El 
modelo propuesto está dado por: 
𝑊𝑒𝑒𝑘𝑠𝑚𝑖 = 𝛽0 + 𝛽1𝑀𝑜𝑟𝑒𝑘𝑖𝑑𝑠𝑖 + 𝛾1𝑊𝑖1 + ⋯ + 𝛾𝑘𝑊𝑖𝑘 + 𝑢𝑖, 
donde 𝑊𝑖1, … , 𝑊𝑖𝑘 son variables de control exógenas, 𝑀𝑜𝑟𝑒𝑘𝑖𝑑𝑠𝑖 es una dummy igual a 1 si la 
mujer tiene más de 2 hijos y 𝑊𝑒𝑒𝑘𝑠𝑚𝑖 es el número de horas trabajadas. Además, cuenta con 
información sobre el sexo de los 2 primeros hijos; en particular, usted tiene una dummy que es 
1 si el primer hijo es un niño (𝐵𝑜𝑦1𝑠𝑡), una dummy que es 1 si el segundo hijo es un niño 
(𝐵𝑜𝑦2𝑛𝑑), y una dummy que es 1 si los 2 primeros hijos tienen el mismo sexo (𝑆𝑎𝑚𝑒𝑠𝑒𝑥). 
La siguiente tabla muestra los resultados de Stata para este problema. 
 
. reg weeksm1 morekids w1 w2 w3 w4, robust // MODELO 1 
 
Linear regression Number of obs = 254,654 
 F(5, 254648) = 2545.10 
 Prob > F = 0.0000 
 R-squared = 0.0438 
 Root MSE = 21.384 
------------------------------------------------------------------------------ 
 | Robust 
 weeksm1 | Coef. Std. Err. t P>|t| [95% Conf. Interval] 
-------------+---------------------------------------------------------------- 
 morekids | -6.230418 .086239 -72.25 0.000 -6.399445 -6.061392 
 w1 | .8378841 .0121179 69.14 0.000 .8141333 .861635 
 w2 | 11.66424 .1955286 59.65 0.000 11.28101 12.04747 
 w3 | .466093 .1807033 2.58 0.010 .1119194 .8202666 
 w4 | 2.142125 .2082759 10.29 0.000 1.73391 2.55034 
 _cons | -4.834514 .3673477 -13.16 0.000 -5.554506 -4.114523 
---------------------------------------------------------------------- 
 
 
 
. 
 
reg morekids samesex boy1st boy2nd w1 w2 w3 w4, robust // MODELO 2 
 
Linear regression Number of obs = 254,654 
 F(7, 254646) = 939.23 
 Prob > F = 0.0000 
 R-squared = 0.0244 
 Root MSE = .47957 
------------------------------------------------------------------------------ 
 | Robust 
 morekids | Coef. Std. Err. t P>|t| [95% Conf. Interval] 
-------------+---------------------------------------------------------------- 
 samesex | .0685552 .0019018 36.05 0.000 .0648277 .0722826 
 boy1st | -.0106297 .0019019 -5.59 0.000 -.0143573 -.0069021 
 boy2nd | -.0099686 .0019019 -5.24 0.000 -.0136963 -.006241 
 w1 | .0153981 .000276 55.80 0.000 .0148572 .015939 
 w2 | .1003996 .0044428 22.60 0.000 .0916919 .1091074 
 w3 | .1511128 .0041154 36.72 0.000 .1430466 .1591789 
 w4 | .0275804 .0046378 5.95 0.000 .0184903 .0366704 
 _cons | -.1294725 .0085646 -15.12 0.000 -.1462589 -.1126861 
------------------------------------------------------------------------------ 
 
. predict v1_hat, resid 
 
. test samesex boy1st boy2nd 
 
 ( 1) samesex = 0 
 ( 2) boy1st = 0 
 ( 3) boy2nd = 0 
 
 F( 3,254646) = 445.20 
 Prob > F = 0.0000 
 
. ivregress 2sls weeksm1 (morekids=samesex boy1st boy2nd) w1 w2 w3 w4, robust // MODELO 3 
 
Instrumental variables (2SLS) regression Number of obs = 254,654 
 Wald chi2(5) = 6950.65 
 Prob > chi2 = 0.0000 
 R-squared = 0.0435 
 Root MSE = 21.387 
------------------------------------------------------------------------------ 
 | Robust 
 weeksm1 | Coef. Std. Err. z P>|z| [95% Conf. Interval] 
-------------+---------------------------------------------------------------- 
 morekids | -5.441813 1.218616 -4.47 0.000 -7.830257 -3.053369 
 w1 | .8257736 .0222844 37.06 0.000 .7820969 .8694502 
 w2 | 11.58532 .2303902 50.29 0.000 11.13377 12.03688 
 w3 | .3468243 .2578218 1.35 0.179 -.1584971 .8521457 
 w4 | 2.12062 .2109108 10.05 0.000 1.707243 2.533998 
 _cons | -4.752409 .3889045 -12.22 0.000 -5.514648 -3.990171 
------------------------------------------------------------------------------ 
Instrumented: morekids 
Instruments: w1 w2 w3 w4 samesex boy1st boy2nd 
. reg weeksm1 morekids w1 w2 w3 w4 v1_hat, robust // MODELO 4 
 
Linear regression Number of obs = 254,654 
 F(6, 254647) = 2121.04 
 Prob > F = 0.0000 
 R-squared = 0.0438 
 Root MSE = 21.384 
------------------------------------------------------------------------------ 
 | Robust 
 weeksm1 | Coef. Std. Err. t P>|t| [95% Conf. Interval] 
-------------+---------------------------------------------------------------- 
 morekids | -5.441814 1.218468 -4.47 0.000 -7.829978 -3.053649 
 w1 | .8257736 .0222821 37.06 0.000 .7821013 .8694458 
 w2 | 11.58532 .2302738 50.31 0.000 11.13399 12.03665 
 w3 | .3468244 .2577748 1.35 0.178 -.1584074 .8520561 
 w4 | 2.12062 .2108478 10.06 0.000 1.707364 2.533877 
 v1_hat | -.7927526 1.221823 -0.65 0.516 -3.187493 1.601988 
 _cons | -4.75241 .3888685 -12.22 0.000 -5.514581 -3.990238 
------------------------------------------------------------------------------ 
 
. test v1_hat 
 
 ( 1) v1_hat = 0 
 
 F( 1,254647) = 0.42 
 Prob > F = 0.5165 
 
Responda las siguientes preguntas: 
a. Explique por qué el estimador MCO de 𝛽1 podría estar sesgado. 
b. Un economista laboral le sugiere que use el sexo de los 2 primeros hijos como 
instrumento de 𝑀𝑜𝑟𝑒𝑘𝑖𝑑𝑠𝑖. Explique por qué estas variables son instrumentos válidos. 
c. Explique cuál es el instrumento óptimo para 𝑀𝑜𝑟𝑒𝑘𝑖𝑑𝑠𝑖 y, en base a las tablas de STATA, 
comente si éste es un buen instrumento o no. 
d. Considere ahora la estimación por variables instrumentales. Interprete el coeficiente 𝛽1 
y, en base a los resultados, determine si el estimador MCO de 𝛽1 tiene sesgo positivo o 
negativo. 
e. Finalmente, realice un test formal para verificar la posible endogeneidad de 𝑀𝑜𝑟𝑒𝑘𝑖𝑑𝑠𝑖. 
 
Tema II: 
Se quiere estimar los retornos a la educación. Para esto se cuenta con una muestra de 3,613 
hombres estadounidenses y se estima el siguiente modelo de regresión lineal múltiple: 
ln(𝑠𝑎𝑙𝑎𝑟𝑖𝑜𝑖) = 𝛽𝑜 + 𝛽1 × 𝐸𝑑𝑢𝑐𝑖 + 𝛽2 × 𝐸𝑑𝑎𝑑𝑖 + +𝛽3 × 𝑅𝑎𝑧𝑎𝑖 + 𝛽4 × 𝑆𝑢𝑟𝑖 + 𝑢𝑖, 
donde salario es el salario anual en dólares, educ son de años de educación, edad es la edad en 
años, raza una variable dummy que toma valor 1si el individuo es de raza negra y 0 en caso 
contrario, y sur es otra variable dummy que toma valor 1 si el individuo vive en los estados del 
sur de EEUU y es 0 si no. 
a. Se cuenta con una estimación por MCO del modelo anterior. Discuta qué variables son 
endógenas y exógenas, y luego interprete la estimación del parámetro sobre educación. 
Justifique sus respuestas. 
 
b. Además, se dispone de un set de variables que no están incluidas en el modelo de 
salarios: 
- nearc2: variable dummy que toma valor 1 si el individuo creció en un vecindario 
cercano a un college de 2 años. 
- nearc4a: variable dummy que toma valor 1 si el individuo creció en un vecindario 
cercano a un college público de 4 años. 
- nearc4b: variable dummy que toma valor 1 si el individuo creció en un vecindario 
cercano a un college privado de 4 años. 
En base a la evidencia que se le presenta más abajo, evalúe cada una de estas variables 
de cara a ser utilizadas como potencial instrumento de educación. 
 
 
 
c. Finalmente, decide a usar a nearc4a y nearc2 como instrumentos, y estima por VI 
obteniendo los siguientes resultados. Interprete el coeficiente sobre educ en ambos 
casos, y compárelos entre ellos y con la estimación por MCO. 
 
 
 
 
 
 
 
 
 
 
Tema III (PROPUESTO) 
16 and Pregnant es un reality show de MTV sobre embarazo adolescente cuyo primer capítulo 
salió al aire en junio de 2009. El objetivo de este popular programa ha sido mostrar la difícil 
realidad de transformarse en una madre adolescente. Kearney y Levine (2015) estudian si la 
exposición en los medios de estas jóvenes madres ha tenido un impacto en cómo se comportan 
las adolescentes en USA afectando la probabilidad de que ellas se conviertan también en 
madres. 
La siguiente tabla muestra el principal resultado del trabajo: 
 
El artículo usa datos a nivel de condado en USA sobre el embarazo adolescente (ln(birth rate)), 
el rating del programa 16 and Pregnant, la popularidad del canal MTV entre julio 2008 y mayo 
2009 (MTV ratings 2008-2009) y la tasa de desempleo. 
Responda las siguientes preguntas: 
a. La regresión (1) muestra el resultado de Mínimos Cuadrados Ordinarios. Interprete y 
discuta la significancia del coeficiente en el rating de 16 and Pregnant. Note que birth 
rate está en logaritmo, que el rating televisivo es una variable que va de 0 a 100 puntos, 
y que los coeficientes han sido multiplicados por 100 (ver descripción de la tabla). 
b. Interprete y discuta la significancia del coeficiente en la tasa de desempleo. ¿Por qué 
razón podría ser importante incluir esta variable en la regresión? 
c. Discuta cuál es el principal problema que presenta el resultado de la regresión (1). Sea 
claro en sus posibles causas y su efecto en los coeficientes. 
d. Proponga un test formal para verificar si el problema presente en el resultado de la 
regresión (1) es efectivo. Sea detallado en su planteamiento en cuanto a variables 
utilizadas e hipótesis a verificar. 
e. La regresión (2) presenta el resultado de la primera etapa de Mínimos Cuadrados en Dos 
Etapas (2SLS). En este estudio particular, ¿cuáles son las características que debe tener 
una variable para ser un buen instrumento? ¿Cumple el instrumento propuesto estas 
condiciones? ¿Por qué? 
f. La regresión (3) muestra el resultado de la segunda etapa de Mínimos Cuadrados en Dos 
Etapas. Discuta por qué estos resultados difieren sustancialmente de los de la regresión 
(1). ¿Qué puede decir acerca de la pregunta principal de este artículo?

Otros materiales