Logo Studenta

Ayudantía 9 Berni Salinas

¡Este material tiene más páginas!

Vista previa del material en texto

Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) 
 
PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE 
INSTITUTO DE ECONOMÍA 
AYUDANTIA N°9 - ECONOMETRÍA 
Profesor: Juan Urquiza 
Ayudantes: Fernanda Hernández, Carmen Velásquez, Josefina Waugh 
Tema I: 
Usted quiere estudiar el efecto del tamaño de la familia en la oferta laboral de la mujer. El 
modelo propuesto está dado por: 
௜݉ݏܹ݇݁݁ ൌ ଴ߚ ൅ ௜ݏ݀݅݇݁ݎ݋ܯଵߚ ൅ ଵߛ ௜ܹଵ ൅ ൅ڮ ௞ߛ ௜ܹ௞ ൅ ௜ǡݑ
donde ௜ܹଵǡ ǥ ǡ ௜ܹ௞ son variables de control exógenas, ݏ݀݅݇݁ݎ݋ܯ௜ es una dummy igual a 1 si la 
mujer tiene más de 2 hijos y ܹ݁݁݇݉ݏ௜ es el número de horas trabajadas. Además, cuenta con 
información sobre el sexo de los 2 primeros hijos; en particular, usted tiene una dummy que es 
1 si el primer hijo es un niño (ݕ݋ܤͳݐݏ), una dummy que es 1 si el segundo hijo es un niño 
 .(ݔ݁ݏ݁݉ܽܵ) y una dummy que es 1 si los 2 primeros hijos tienen el mismo sexo ,(݀݊ʹݕ݋ܤ)
La siguiente tabla muestra los resultados de Stata para este problema. 
 
. reg weeksm1 morekids w1 w2 w3 w4, robust // MODELO 1 
 
Linear regression Number of obs = 254,654 
 F(5, 254648) = 2545.10 
 Prob > F = 0.0000 
 R-squared = 0.0438 
 Root MSE = 21.384 
------------------------------------------------------------------------------ 
 | Robust 
 weeksm1 | Coef. Std. Err. t P>|t| [95% Conf. Interval] 
-------------+---------------------------------------------------------------- 
 morekids | -6.230418 .086239 -72.25 0.000 -6.399445 -6.061392 
 w1 | .8378841 .0121179 69.14 0.000 .8141333 .861635 
 w2 | 11.66424 .1955286 59.65 0.000 11.28101 12.04747 
 w3 | .466093 .1807033 2.58 0.010 .1119194 .8202666 
 w4 | 2.142125 .2082759 10.29 0.000 1.73391 2.55034 
 _cons | -4.834514 .3673477 -13.16 0.000 -5.554506 -4.114523 
---------------------------------------------------------------------- 
 
 
 
. 
 
Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) 
 
reg morekids samesex boy1st boy2nd w1 w2 w3 w4, robust // MODELO 2 
 
Linear regression Number of obs = 254,654 
 F(7, 254646) = 939.23 
 Prob > F = 0.0000 
 R-squared = 0.0244 
 Root MSE = .47957 
------------------------------------------------------------------------------ 
 | Robust 
 morekids | Coef. Std. Err. t P>|t| [95% Conf. Interval] 
-------------+---------------------------------------------------------------- 
 samesex | .0685552 .0019018 36.05 0.000 .0648277 .0722826 
 boy1st | -.0106297 .0019019 -5.59 0.000 -.0143573 -.0069021 
 boy2nd | -.0099686 .0019019 -5.24 0.000 -.0136963 -.006241 
 w1 | .0153981 .000276 55.80 0.000 .0148572 .015939 
 w2 | .1003996 .0044428 22.60 0.000 .0916919 .1091074 
 w3 | .1511128 .0041154 36.72 0.000 .1430466 .1591789 
 w4 | .0275804 .0046378 5.95 0.000 .0184903 .0366704 
 _cons | -.1294725 .0085646 -15.12 0.000 -.1462589 -.1126861 
------------------------------------------------------------------------------ 
 
. predict v1_hat, resid 
 
. test samesex boy1st boy2nd 
 
 ( 1) samesex = 0 
 ( 2) boy1st = 0 
 ( 3) boy2nd = 0 
 
 F( 3,254646) = 445.20 
 Prob > F = 0.0000 
 
. ivregress 2sls weeksm1 (morekids=samesex boy1st boy2nd) w1 w2 w3 w4, robust // MODELO 3 
 
Instrumental variables (2SLS) regression Number of obs = 254,654 
 Wald chi2(5) = 6950.65 
 Prob > chi2 = 0.0000 
 R-squared = 0.0435 
 Root MSE = 21.387 
------------------------------------------------------------------------------ 
 | Robust 
 weeksm1 | Coef. Std. Err. z P>|z| [95% Conf. Interval] 
-------------+---------------------------------------------------------------- 
 morekids | -5.441813 1.218616 -4.47 0.000 -7.830257 -3.053369 
 w1 | .8257736 .0222844 37.06 0.000 .7820969 .8694502 
 w2 | 11.58532 .2303902 50.29 0.000 11.13377 12.03688 
 w3 | .3468243 .2578218 1.35 0.179 -.1584971 .8521457 
 w4 | 2.12062 .2109108 10.05 0.000 1.707243 2.533998 
 _cons | -4.752409 .3889045 -12.22 0.000 -5.514648 -3.990171 
------------------------------------------------------------------------------ 
Instrumented: morekids 
Instruments: w1 w2 w3 w4 samesex boy1st boy2nd 
Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) 
 
. reg weeksm1 morekids w1 w2 w3 w4 v1_hat, robust // MODELO 4 
 
Linear regression Number of obs = 254,654 
 F(6, 254647) = 2121.04 
 Prob > F = 0.0000 
 R-squared = 0.0438 
 Root MSE = 21.384 
------------------------------------------------------------------------------ 
 | Robust 
 weeksm1 | Coef. Std. Err. t P>|t| [95% Conf. Interval] 
-------------+---------------------------------------------------------------- 
 morekids | -5.441814 1.218468 -4.47 0.000 -7.829978 -3.053649 
 w1 | .8257736 .0222821 37.06 0.000 .7821013 .8694458 
 w2 | 11.58532 .2302738 50.31 0.000 11.13399 12.03665 
 w3 | .3468244 .2577748 1.35 0.178 -.1584074 .8520561 
 w4 | 2.12062 .2108478 10.06 0.000 1.707364 2.533877 
 v1_hat | -.7927526 1.221823 -0.65 0.516 -3.187493 1.601988 
 _cons | -4.75241 .3888685 -12.22 0.000 -5.514581 -3.990238 
------------------------------------------------------------------------------ 
 
. test v1_hat 
 
 ( 1) v1_hat = 0 
 
 F( 1,254647) = 0.42 
 Prob > F = 0.5165 
 
Responda las siguientes preguntas: 
a. Explique por qué el estimador MCO de ߚଵ podría estar sesgado. 
b. Un economista laboral le sugiere que use el sexo de los 2 primeros hijos como 
instrumento de ݏ݀݅݇݁ݎ݋ܯ௜ . Explique por qué estas variables son instrumentos válidos. 
c. Explique cuál es el instrumento óptimo para ݏ݀݅݇݁ݎ݋ܯ௜ y, en base a las tablas de STATA, 
comente si éste es un buen instrumento o no. 
d. Considere ahora la estimación por variables instrumentales. Interprete el coeficiente ߚଵ 
y, en base a los resultados, determine si el estimador MCO de ߚଵ tiene sesgo positivo o 
negativo. 
e. Finalmente, realice un test formal para verificar la posible endogeneidad de ݏ݀݅݇݁ݎ݋ܯ௜ . 
 
Tema II: 
Se quiere estimar los retornos a la educación. Para esto se cuenta con una muestra de 3,613 
hombres estadounidenses y se estima el siguiente modelo de regresión lineal múltiple: 
��ሺ݋݅ݎ݈ܽܽݏ௜ሻൌ ௢ߚ ൅ߚ�ଵ ൈ ଶߚ�௜�൅ܿݑ݀ܧ ൈ ௜݀ܽ݀ܧ ൅ ൅ߚଷ ൈ ௜ܽݖܴܽ ൅ ସߚ ൈ ௜ݎݑܵ ൅ݑ�௜ǡ 
Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) 
 
donde salario es el salario anual en dólares, educ son de años de educación, edad es la edad en 
años, raza una variable dummy que toma valor 1 si el individuo es de raza negra y 0 en caso 
contrario, y sur es otra variable dummy que toma valor 1 si el individuo vive en los estados del 
sur de EEUU y es 0 si no. 
a. Se cuenta con una estimación por MCO del modelo anterior. Discuta qué variables son 
endógenas y exógenas, y luego interprete la estimación del parámetro sobre educación. 
Justifique sus respuestas. 
 
b. Además, se dispone de un set de variables que no están incluidas en el modelo de 
salarios: 
- nearc2: variable dummy que toma valor 1 si el individuo creció en un vecindario 
cercano a un college de 2 años. 
- nearc4a: variable dummy que toma valor 1 si el individuo creció en un vecindario 
cercano a un college público de 4 años. 
- nearc4b: variable dummy que toma valor 1 si el individuo creció en un vecindario 
cercano a un college privado de 4 años. 
En base a la evidencia que se le presenta más abajo, evalúe cada una de estas variables 
de cara a ser utilizadas como potencial instrumento de educación. 
Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) 
 
 
 
 
c. Finalmente, decide a usar a nearc4a y nearc2 como instrumentos, y estima por VI 
obteniendo los siguientes resultados. Interprete el coeficiente sobre educ en ambos 
casos, y compárelos entre ellos y con la estimación por MCO. 
Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) 
 
 
 
 
 
 
 
 
 
 
 
Tema III (PROPUESTO) 
16 and Pregnant es un reality show de MTV sobre embarazo adolescente cuyo primer capítulo 
salió al aire en junio de 2009. El objetivo de este popular programa ha sido mostrar la difícil 
realidad de transformarse en una madre adolescente. Kearney y Levine (2015) estudian si la 
exposición en los medios de estas jóvenes madres ha tenido un impacto en cómo se comportan 
las adolescentes en USA afectando la probabilidad de que ellas se conviertan también en 
madres. 
La siguiente tabla muestra el principal resultado del trabajo: 
Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) 
 
 
El artículo usa datos a nivel de condado en USA sobre el embarazo adolescente (ln(birth rate)), 
el rating del programa 16 and Pregnant, la popularidad del canal MTV entre julio 2008 y mayo 
2009 (MTV ratings 2008-2009) y la tasa de desempleo. 
Responda las siguientes preguntas: 
a. La regresión (1) muestra el resultado de Mínimos Cuadrados Ordinarios. Interprete y 
discuta la significancia del coeficiente en el rating de 16 and Pregnant. Note que birth 
rate está en logaritmo, que el rating televisivo es una variable que va de 0 a 100 puntos, 
y que los coeficientes han sido multiplicados por 100 (ver descripción de la tabla). 
b. Interprete y discuta la significancia del coeficiente en la tasa de desempleo. ¿Por qué 
razón podría ser importante incluir esta variable en la regresión? 
c. Discuta cuál es el principal problema que presenta el resultado de la regresión (1). Sea 
claro en sus posibles causas y su efecto en los coeficientes. 
d. Proponga un test formal para verificar si el problema presente en el resultado de la 
regresión (1) es efectivo. Sea detallado en su planteamiento en cuanto a variables 
utilizadas e hipótesis a verificar. 
e. La regresión (2) presenta el resultado de la primera etapa de Mínimos Cuadrados en Dos 
Etapas (2SLS). En este estudio particular, ¿cuáles son las características que debe tener 
una variable para ser un buen instrumento? ¿Cumple el instrumento propuesto estas 
condiciones? ¿Por qué? 
f. La regresión (3) muestra el resultado de la segunda etapa de Mínimos Cuadrados en Dos 
Etapas. Discuta por qué estos resultados difieren sustancialmente de los de la regresión 
(1). ¿Qué puede decir acerca de la pregunta principal de este artículo? 
Si hay mujeres más “maternales” (característica inobservable y por ende en el error), mujeres con 
esta característica podrían decidir tener más hijos y trabajar menos horas.
Podría existir una causalidad reversa (simultaneidad) entre more kids y weeksm 
Podría serlo porque el género de los hijos es aleatorio
Tener a los dos primeros hijos de cierto género podría inducir a 
las madres a tener más hijos
variables instrumentales
si NO hay variable endEgeria MCO y MCZE son consistentS pero Mao est eticienie
si hay variable endogena solo V1 MCZE es consistent * Test de endogeneidad Test de Hausman
Si morekids es endo-genaentonces.la estimation por Moo estaña sesgada
2 possibles explicaciones
Instruments : Boy 1st , Boy 2nd y Samesex
dva- lidos ?
1 EXO
-
geno
C / instruments , v4 = 0
2 Relevant
C. ( instruments , morekids / =/ 0
Lotesteamos a partir de la lera etapa
si son relevantes 10s instruments seitan VÑIIDOS morekids i = 80 1- 8, samesext 82 boy 1st +83boy 2nd 1- y controles t v
son relevantes
El mejor instrumento es la combinación lineal de Boy1st, Boy2nd y Samesex 
que mejor correlaciona con morekids
Esto es, la combinación lineal ponderada por los resultados de la primera 
etapa
Para ver si los instrumentos son relevantes de forma conjunta:
Los instrumentos son relevantes y son suficientemente fuertes
Dejando todo lo demás constante, las mujeres que tienen más de 
dos hijos trabajan en promedio 5,44 horas MENOS a la semana 
en comparación a las mujeres que tienen menos de dos hijos
En valor absoluto, el estimador por VI es menor, por lo tanto
tiene un sesgo negativo.
Estimación por MCO sobre estima el efecto de tener más hijos 
sobre las horas trabajadas.
Estimar la regresión de la variable posiblemente endógena con los controles y los instrumentos ( samesex; boy1st; 
boy2nd)
Dado que v es inobservable primero se estiman los residuos
Mayor a 10
PIN = -5/44
Bianco = -6,23
Test de Hausman lerpaso :
Ho :c/morekids,u1=O (Exigence)
Hi :C/morekids , ul -1-0 (Endo-genolmorekidsi-sotsrsamesextszboyls.tt Szboyzndty controls TV
predict v1 hat , resid
Zdopaso :
weeksmi-potpnmorekids.it continues 1- ✗ Ñ + E
'
donde Ñ = morekids - ( Sotsisamesextszboylsttszboyzndty wntnles /
Ho :X = 0 morekids exo-ge.no nose rechaza HO
Hn : ✗ =/ 1 Mcoseñavalidoyeticiente
Endógenas 
Educ —> podría correlacionar con el error
(i) variable medida con error: si es una variable auto-repostada con errores
(i) puede existir una correlación positiva entre la habilidad y la educación 
Exógenas
Raza, sur y edad, no hay una teoria que nos haga pensar que son 
endógenas 
El sesgo será distinto según pensemos en la razón de la endogeneidad
lo serán si se eligió el lugar donde se vive sin tomar en cuenta la presencia del college
* interpretation *
By = 0103985
( it Error de Medicion sesgo de atenuacion lsubestimas
Iii / Teoh
-
a habitIdades sesgo de selection positive (sobre estimado)
Cov / X , u / = 0
c. Instrument Valido ?
1 EXO-ge.no
2 Relevant
tracer la regression para Cada variable
Ver la significance
'
a y si es Fuerte IF >101
para saber si conviene Usarla
La estimación de Beta1 por Vi, usando nearc4a, ahora si nos permite hablar de causalidad
la diferencia con el otro podría deberse a un sesgo del estimador debido al uso de instrumentos débiles 
Por lo tanto, la estimación por MCO estaba subestimando el impacto de la educación 
sobre los salarios. Lo que es consistente con la idea de que Educ estaba medida con error.
0
131=0/162 instrument fuerte
significative at 1%
° Usando nearcza
Pr = 01351
significative at 10 pen no al 51 .
F =3 / 68 instrument débil
Companion Moo us . V1
13^1 MCO = 0,0398
pin = 0116
pin = 0,35

Otros materiales