Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE INSTITUTO DE ECONOMÍA AYUDANTIA N°9 - ECONOMETRÍA Profesor: Juan Urquiza Ayudantes: Fernanda Hernández, Carmen Velásquez, Josefina Waugh Tema I: Usted quiere estudiar el efecto del tamaño de la familia en la oferta laboral de la mujer. El modelo propuesto está dado por: ݉ݏܹ݇݁݁ ൌ ߚ ݏ݀݅݇݁ݎܯଵߚ ଵߛ ܹଵ ڮ ߛ ܹ ǡݑ donde ܹଵǡ ǥ ǡ ܹ son variables de control exógenas, ݏ݀݅݇݁ݎܯ es una dummy igual a 1 si la mujer tiene más de 2 hijos y ܹ݁݁݇݉ݏ es el número de horas trabajadas. Además, cuenta con información sobre el sexo de los 2 primeros hijos; en particular, usted tiene una dummy que es 1 si el primer hijo es un niño (ݕܤͳݐݏ), una dummy que es 1 si el segundo hijo es un niño .(ݔ݁ݏ݁݉ܽܵ) y una dummy que es 1 si los 2 primeros hijos tienen el mismo sexo ,(݀݊ʹݕܤ) La siguiente tabla muestra los resultados de Stata para este problema. . reg weeksm1 morekids w1 w2 w3 w4, robust // MODELO 1 Linear regression Number of obs = 254,654 F(5, 254648) = 2545.10 Prob > F = 0.0000 R-squared = 0.0438 Root MSE = 21.384 ------------------------------------------------------------------------------ | Robust weeksm1 | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- morekids | -6.230418 .086239 -72.25 0.000 -6.399445 -6.061392 w1 | .8378841 .0121179 69.14 0.000 .8141333 .861635 w2 | 11.66424 .1955286 59.65 0.000 11.28101 12.04747 w3 | .466093 .1807033 2.58 0.010 .1119194 .8202666 w4 | 2.142125 .2082759 10.29 0.000 1.73391 2.55034 _cons | -4.834514 .3673477 -13.16 0.000 -5.554506 -4.114523 ---------------------------------------------------------------------- . Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) reg morekids samesex boy1st boy2nd w1 w2 w3 w4, robust // MODELO 2 Linear regression Number of obs = 254,654 F(7, 254646) = 939.23 Prob > F = 0.0000 R-squared = 0.0244 Root MSE = .47957 ------------------------------------------------------------------------------ | Robust morekids | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- samesex | .0685552 .0019018 36.05 0.000 .0648277 .0722826 boy1st | -.0106297 .0019019 -5.59 0.000 -.0143573 -.0069021 boy2nd | -.0099686 .0019019 -5.24 0.000 -.0136963 -.006241 w1 | .0153981 .000276 55.80 0.000 .0148572 .015939 w2 | .1003996 .0044428 22.60 0.000 .0916919 .1091074 w3 | .1511128 .0041154 36.72 0.000 .1430466 .1591789 w4 | .0275804 .0046378 5.95 0.000 .0184903 .0366704 _cons | -.1294725 .0085646 -15.12 0.000 -.1462589 -.1126861 ------------------------------------------------------------------------------ . predict v1_hat, resid . test samesex boy1st boy2nd ( 1) samesex = 0 ( 2) boy1st = 0 ( 3) boy2nd = 0 F( 3,254646) = 445.20 Prob > F = 0.0000 . ivregress 2sls weeksm1 (morekids=samesex boy1st boy2nd) w1 w2 w3 w4, robust // MODELO 3 Instrumental variables (2SLS) regression Number of obs = 254,654 Wald chi2(5) = 6950.65 Prob > chi2 = 0.0000 R-squared = 0.0435 Root MSE = 21.387 ------------------------------------------------------------------------------ | Robust weeksm1 | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- morekids | -5.441813 1.218616 -4.47 0.000 -7.830257 -3.053369 w1 | .8257736 .0222844 37.06 0.000 .7820969 .8694502 w2 | 11.58532 .2303902 50.29 0.000 11.13377 12.03688 w3 | .3468243 .2578218 1.35 0.179 -.1584971 .8521457 w4 | 2.12062 .2109108 10.05 0.000 1.707243 2.533998 _cons | -4.752409 .3889045 -12.22 0.000 -5.514648 -3.990171 ------------------------------------------------------------------------------ Instrumented: morekids Instruments: w1 w2 w3 w4 samesex boy1st boy2nd Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) . reg weeksm1 morekids w1 w2 w3 w4 v1_hat, robust // MODELO 4 Linear regression Number of obs = 254,654 F(6, 254647) = 2121.04 Prob > F = 0.0000 R-squared = 0.0438 Root MSE = 21.384 ------------------------------------------------------------------------------ | Robust weeksm1 | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- morekids | -5.441814 1.218468 -4.47 0.000 -7.829978 -3.053649 w1 | .8257736 .0222821 37.06 0.000 .7821013 .8694458 w2 | 11.58532 .2302738 50.31 0.000 11.13399 12.03665 w3 | .3468244 .2577748 1.35 0.178 -.1584074 .8520561 w4 | 2.12062 .2108478 10.06 0.000 1.707364 2.533877 v1_hat | -.7927526 1.221823 -0.65 0.516 -3.187493 1.601988 _cons | -4.75241 .3888685 -12.22 0.000 -5.514581 -3.990238 ------------------------------------------------------------------------------ . test v1_hat ( 1) v1_hat = 0 F( 1,254647) = 0.42 Prob > F = 0.5165 Responda las siguientes preguntas: a. Explique por qué el estimador MCO de ߚଵ podría estar sesgado. b. Un economista laboral le sugiere que use el sexo de los 2 primeros hijos como instrumento de ݏ݀݅݇݁ݎܯ . Explique por qué estas variables son instrumentos válidos. c. Explique cuál es el instrumento óptimo para ݏ݀݅݇݁ݎܯ y, en base a las tablas de STATA, comente si éste es un buen instrumento o no. d. Considere ahora la estimación por variables instrumentales. Interprete el coeficiente ߚଵ y, en base a los resultados, determine si el estimador MCO de ߚଵ tiene sesgo positivo o negativo. e. Finalmente, realice un test formal para verificar la posible endogeneidad de ݏ݀݅݇݁ݎܯ . Tema II: Se quiere estimar los retornos a la educación. Para esto se cuenta con una muestra de 3,613 hombres estadounidenses y se estima el siguiente modelo de regresión lineal múltiple: ��ሺ݅ݎ݈ܽܽݏሻൌ ߚ ߚ�ଵ ൈ ଶߚ��ܿݑ݀ܧ ൈ ݀ܽ݀ܧ ߚଷ ൈ ܽݖܴܽ ସߚ ൈ ݎݑܵ ݑ�ǡ Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) donde salario es el salario anual en dólares, educ son de años de educación, edad es la edad en años, raza una variable dummy que toma valor 1 si el individuo es de raza negra y 0 en caso contrario, y sur es otra variable dummy que toma valor 1 si el individuo vive en los estados del sur de EEUU y es 0 si no. a. Se cuenta con una estimación por MCO del modelo anterior. Discuta qué variables son endógenas y exógenas, y luego interprete la estimación del parámetro sobre educación. Justifique sus respuestas. b. Además, se dispone de un set de variables que no están incluidas en el modelo de salarios: - nearc2: variable dummy que toma valor 1 si el individuo creció en un vecindario cercano a un college de 2 años. - nearc4a: variable dummy que toma valor 1 si el individuo creció en un vecindario cercano a un college público de 4 años. - nearc4b: variable dummy que toma valor 1 si el individuo creció en un vecindario cercano a un college privado de 4 años. En base a la evidencia que se le presenta más abajo, evalúe cada una de estas variables de cara a ser utilizadas como potencial instrumento de educación. Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) c. Finalmente, decide a usar a nearc4a y nearc2 como instrumentos, y estima por VI obteniendo los siguientes resultados. Interprete el coeficiente sobre educ en ambos casos, y compárelos entre ellos y con la estimación por MCO. Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) Tema III (PROPUESTO) 16 and Pregnant es un reality show de MTV sobre embarazo adolescente cuyo primer capítulo salió al aire en junio de 2009. El objetivo de este popular programa ha sido mostrar la difícil realidad de transformarse en una madre adolescente. Kearney y Levine (2015) estudian si la exposición en los medios de estas jóvenes madres ha tenido un impacto en cómo se comportan las adolescentes en USA afectando la probabilidad de que ellas se conviertan también en madres. La siguiente tabla muestra el principal resultado del trabajo: Dudas contactar a Fernanda Hernández (mfhernandez3@uc.cl) El artículo usa datos a nivel de condado en USA sobre el embarazo adolescente (ln(birth rate)), el rating del programa 16 and Pregnant, la popularidad del canal MTV entre julio 2008 y mayo 2009 (MTV ratings 2008-2009) y la tasa de desempleo. Responda las siguientes preguntas: a. La regresión (1) muestra el resultado de Mínimos Cuadrados Ordinarios. Interprete y discuta la significancia del coeficiente en el rating de 16 and Pregnant. Note que birth rate está en logaritmo, que el rating televisivo es una variable que va de 0 a 100 puntos, y que los coeficientes han sido multiplicados por 100 (ver descripción de la tabla). b. Interprete y discuta la significancia del coeficiente en la tasa de desempleo. ¿Por qué razón podría ser importante incluir esta variable en la regresión? c. Discuta cuál es el principal problema que presenta el resultado de la regresión (1). Sea claro en sus posibles causas y su efecto en los coeficientes. d. Proponga un test formal para verificar si el problema presente en el resultado de la regresión (1) es efectivo. Sea detallado en su planteamiento en cuanto a variables utilizadas e hipótesis a verificar. e. La regresión (2) presenta el resultado de la primera etapa de Mínimos Cuadrados en Dos Etapas (2SLS). En este estudio particular, ¿cuáles son las características que debe tener una variable para ser un buen instrumento? ¿Cumple el instrumento propuesto estas condiciones? ¿Por qué? f. La regresión (3) muestra el resultado de la segunda etapa de Mínimos Cuadrados en Dos Etapas. Discuta por qué estos resultados difieren sustancialmente de los de la regresión (1). ¿Qué puede decir acerca de la pregunta principal de este artículo? Si hay mujeres más “maternales” (característica inobservable y por ende en el error), mujeres con esta característica podrían decidir tener más hijos y trabajar menos horas. Podría existir una causalidad reversa (simultaneidad) entre more kids y weeksm Podría serlo porque el género de los hijos es aleatorio Tener a los dos primeros hijos de cierto género podría inducir a las madres a tener más hijos variables instrumentales si NO hay variable endEgeria MCO y MCZE son consistentS pero Mao est eticienie si hay variable endogena solo V1 MCZE es consistent * Test de endogeneidad Test de Hausman Si morekids es endo-genaentonces.la estimation por Moo estaña sesgada 2 possibles explicaciones Instruments : Boy 1st , Boy 2nd y Samesex dva- lidos ? 1 EXO - geno C / instruments , v4 = 0 2 Relevant C. ( instruments , morekids / =/ 0 Lotesteamos a partir de la lera etapa si son relevantes 10s instruments seitan VÑIIDOS morekids i = 80 1- 8, samesext 82 boy 1st +83boy 2nd 1- y controles t v son relevantes El mejor instrumento es la combinación lineal de Boy1st, Boy2nd y Samesex que mejor correlaciona con morekids Esto es, la combinación lineal ponderada por los resultados de la primera etapa Para ver si los instrumentos son relevantes de forma conjunta: Los instrumentos son relevantes y son suficientemente fuertes Dejando todo lo demás constante, las mujeres que tienen más de dos hijos trabajan en promedio 5,44 horas MENOS a la semana en comparación a las mujeres que tienen menos de dos hijos En valor absoluto, el estimador por VI es menor, por lo tanto tiene un sesgo negativo. Estimación por MCO sobre estima el efecto de tener más hijos sobre las horas trabajadas. Estimar la regresión de la variable posiblemente endógena con los controles y los instrumentos ( samesex; boy1st; boy2nd) Dado que v es inobservable primero se estiman los residuos Mayor a 10 PIN = -5/44 Bianco = -6,23 Test de Hausman lerpaso : Ho :c/morekids,u1=O (Exigence) Hi :C/morekids , ul -1-0 (Endo-genolmorekidsi-sotsrsamesextszboyls.tt Szboyzndty controls TV predict v1 hat , resid Zdopaso : weeksmi-potpnmorekids.it continues 1- ✗ Ñ + E ' donde Ñ = morekids - ( Sotsisamesextszboylsttszboyzndty wntnles / Ho :X = 0 morekids exo-ge.no nose rechaza HO Hn : ✗ =/ 1 Mcoseñavalidoyeticiente Endógenas Educ —> podría correlacionar con el error (i) variable medida con error: si es una variable auto-repostada con errores (i) puede existir una correlación positiva entre la habilidad y la educación Exógenas Raza, sur y edad, no hay una teoria que nos haga pensar que son endógenas El sesgo será distinto según pensemos en la razón de la endogeneidad lo serán si se eligió el lugar donde se vive sin tomar en cuenta la presencia del college * interpretation * By = 0103985 ( it Error de Medicion sesgo de atenuacion lsubestimas Iii / Teoh - a habitIdades sesgo de selection positive (sobre estimado) Cov / X , u / = 0 c. Instrument Valido ? 1 EXO-ge.no 2 Relevant tracer la regression para Cada variable Ver la significance ' a y si es Fuerte IF >101 para saber si conviene Usarla La estimación de Beta1 por Vi, usando nearc4a, ahora si nos permite hablar de causalidad la diferencia con el otro podría deberse a un sesgo del estimador debido al uso de instrumentos débiles Por lo tanto, la estimación por MCO estaba subestimando el impacto de la educación sobre los salarios. Lo que es consistente con la idea de que Educ estaba medida con error. 0 131=0/162 instrument fuerte significative at 1% ° Usando nearcza Pr = 01351 significative at 10 pen no al 51 . F =3 / 68 instrument débil Companion Moo us . V1 13^1 MCO = 0,0398 pin = 0116 pin = 0,35
Compartir