Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Ayudant́ıa 7 - Econometŕıa I (EAE-250A) 1er Semestre 2020 1. Usted cuenta con datos del número de locales Starbucks (Si) y el PIB per cápita (Yi) para 30 páıses. El PIB per cápita está medido en dólares. La estimación MCO entrega: bSi = �812 + 0, 07Yi un R2 = 0, 21 y una suma de los residuales al cuadrado de SSR = 435.882, 1. Además, la varianza condicionales del coeficiente que acompaña a Yi es 0,0004. (a) Determine en qué unidades se mide el R2, el SSR, el coeficiente que acompaña a Yi y la varianza condicional de ese coeficiente. (b) Suponga que el tipo de cambio actual es: 1 euro = ↵ dólares. Responda en forma rigurosa cómo cambian las siguientes componentes asociadas a la regresión, si el PIB per cápita se mide en euros en vez de en dólares: • El coeficiente que acompaña a Yi. • El intercepto de la regresión. • La suma de los residuales al cuadrado. • La varianza condicionales del coeficiente que acompaña a Yi. • El R2 de la regresión. (c) Suponga ahora que en vez de usar el PIB per cápita Yi como variable explicativa, se usa la diferencia entre el PIB per cápita del páıs y el PIB per cápita mundial, Yi � YW (todo medido en dólares). Responda cómo cambian las mismas cinco componentes de la pregunta anterior en este nuevo escenario. 2. Suponga que usted quiere medir el efecto del gasto en profesores de inglés en los resultados obtenidos por los alumnos en una prueba estándar de inglés en los colegios de Chile. Hay 408 colegios en la muestra. La variable log gasto mide el logaritmo del gasto promedio por alumno en profesores de inglés y la variable pct pass eng mide el porcentaje de alumnos que aprobaron la prueba de inglés para cada colegio de la muestra. Los resultados del modelo original se presentan a continuación: . reg pct_pass_eng log_gasto Source | SS df MS Number of obs = 408 -------------+------------------------------ F( 1, 406) = 12.41 Model | 1329.4235 1 1329.4235 Prob > F = 0.0005 Residual | 43487.757 406 107.112702 R-squared = 0.0297 -------------+------------------------------ Adj R-squared = 0.0273 Total | 44817.1805 407 110.115923 Root MSE = 10.35 ------------------------------------------------------------------------------ pct_pass_eng | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- log_gasto | 11.16439 3.169011 3.52 0.000 4.934669 17.3941 _cons | -69.34103 26.53013 -2.61 0.009 -121.4946 -17.18746 ------------------------------------------------------------------------------ Usted sospecha que el nivel de pobreza de los alumnos puede afectar el resultado del test de inglés. La pobreza promedio de los alumnos en cada colegio no es observable, pero usted cuenta con la variable pct prg alm que mide el porcentaje de alumnos de cada colegio de la muestra que cuenta con una subvención gubernamental para almorzar. (a) ¿Tiene sentido usar pct prg alm como variable instrumental de log gasto? ¿Por qué? (b) ¿En qué situación tiene sentido usar pct prg alm como proxy del nivel de pobreza de los alumnos en cada colegio? (c) Usted decide usar pct prg alm como proxy del nivel de pobreza y ob- tiene los siguientes resultados: . reg pct_pass_eng log_gasto pct_prg_alm Source | SS df MS Number of obs = 408 -------------+------------------------------ F( 2, 405) = 44.43 Model | 8063.82349 2 4031.91175 Prob > F = 0.0000 Residual | 36753.357 405 90.7490296 R-squared = 0.1799 -------------+------------------------------ Adj R-squared = 0.1759 Total | 44817.1805 407 110.115923 Root MSE = 9.5262 ------------------------------------------------------------------------------ pct_pass_eng | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- log_gasto | 6.229683 2.972634 2.10 0.037 .3859641 12.0734 pct_prg_alm | -.3045853 .0353574 -8.61 0.000 -.3740923 -.2350784 _cons | -20.36069 25.07287 -0.81 0.417 -69.64992 28.92853 ------------------------------------------------------------------------------ ¿Por qué razón el coeficiente de log gasto disminuye casi a la mitad en la nueva regresión? (d) Interprete el coeficiente de pct prg alm en la nueva regresión. 3. Usted sabe que el estimador VI para el modelo simple es: �̂IV 1 = Pn i=1(zi � z)(yi � y)Pn i=1(zi � z)(xi � x) Suponga que usted conoce �2. (a) Demuestre que la varianza de este estimador es: Var[�̂IV 1 |x, z] = �2 SSTxR2x,z donde SSTx = Pn i=1(xi�x)2 y R2x,z es el R2 de la regresión por MCO: xi = �0 + �1zi + ui, es decir: R2x,z = Pn i=1(bxi � x)2 SSTx Dudas a vjrazmilic@uc.cl. Link del video de la ayudant́ıa aqúı Ayudant́ıa 7 - Econometŕıa I (EAE-250A) 1er Semestre 2020 (b) Utilizando el resultado anterior, discuta cuando z es un buen instru- mento para x. 4. Considere el modelo de regresión múltiple: y = �0 + �1x1 + �2x2 + u Describa brevemente qué tipo de información puede obtener de cada una de las siguientes regresiones auxiliares: (a) bu = �0 + �1by + e (b) bu2 = �0 + �1by + e (c) bu = �0 + �1by2 + e (d) bu2 = �0 + �1by2 + e 5. Usted quiere estudiar el efecto del tamaño de la familia en la oferta laboral de la mujer. El modelo propuesto está dado por: Weeksmi = �0 + �1Morekidsi + �1Wi1 + · · ·+ �kWik + ui donde Wi1, . . . ,Wik son variables de control exógenas, Morekidsi es una dummy igual a 1 si la mujer tiene más de 2 hijos y Weeksmi es el número de horas trabajadas. La siguiente página muestra los resultados de Stata para este problema. (a) Explique por qué el estimador MCO de �1 podŕıa estar sesgado. (b) Un economista laboral le sugiere que use el sexo de los 2 primeros hijos como variables instrumentales deMorekidsi. En particular, usted tiene 3 instrumentos potenciales: una dummy que es 1 si el primer hijo es un niño (Boy1st), una dummy que es 1 si el segundo hijo es un niño (Boy2st) y una dummy que es 1 si los 2 primeros hijos tienen el mismo sexo (Samesex). Explique por qué estas variables son instrumentos válidos. (c) En base a los resultados, determine si el estimador MCO de �1 tiene sesgo positivo o negativo. (d) Explique cuál es el instrumento óptimo para Morekidsi y en base a las tablas, comente si éste es un buen instrumento o no. (e) Considere la estimación usando variables instrumentales. Interprete el coeficiente �1. . regress weeksm1 morekids w1 w2 w3 w4, robust Linear regression Number of obs = 254654 F( 5,254648) = 2545.10 Prob > F = 0.0000 R-squared = 0.0438 Root MSE = 21.384 Robust weeksm1 Coef. Std. Err. t P>|t| [95% Conf. Interval] morekids -6.230418 .086239 -72.25 0.000 -6.399445 -6.061392 w1 .8378841 .0121179 69.14 0.000 .8141333 .861635 w2 11.66424 .1955286 59.65 0.000 11.28101 12.04747 w3 .466093 .1807033 2.58 0.010 .1119194 .8202666 w4 2.142125 .2082759 10.29 0.000 1.73391 2.55034 _cons -4.834514 .3673477 -13.16 0.000 -5.554506 -4.114523 . regress morekids samesex boy1st boy2nd w1 w2 w3 w4, robust Linear regression Number of obs = 254654 F( 7,254646) = 939.23 Prob > F = 0.0000 R-squared = 0.0244 Root MSE = .47957 Robust morekids Coef. Std. Err. t P>|t| [95% Conf. Interval] samesex .0685552 .0019018 36.05 0.000 .0648277.0722826 boy1st -.0106297 .0019019 -5.59 0.000 -.0143573 -.0069021 boy2nd -.0099686 .0019019 -5.24 0.000 -.0136963 -.006241 w1 .0153981 .000276 55.80 0.000 .0148572 .015939 w2 .1003996 .0044428 22.60 0.000 .0916919 .1091074 w3 .1511128 .0041154 36.72 0.000 .1430466 .1591789 w4 .0275804 .0046378 5.95 0.000 .0184903 .0366704 _cons -.1294725 .0085646 -15.12 0.000 -.1462589 -.1126861 . test samesex boy1st boy2nd ( 1) samesex = 0 ( 2) boy1st = 0 ( 3) boy2nd = 0 F( 3,254646) = 445.20 Prob > F = 0.0000 Dudas a vjrazmilic@uc.cl. Link del video de la ayudant́ıa aqúı Ayudant́ıa 7 - Econometŕıa I (EAE-250A) 1er Semestre 2020 . ivreg weeksm1 (morekids = samesex boy1st boy2nd) w1 w2 w3 w4, robust Instrumental variables (2SLS) regression Number of obs = 254654 F( 5,254648) = 1390.10 Prob > F = 0.0000 R-squared = 0.0435 Root MSE = 21.387 Robust weeksm1 Coef. Std. Err. t P>|t| [95% Conf. Interval] morekids -5.441813 1.218631 -4.47 0.000 -7.830296 -3.05333 w1 .8257736 .0222847 37.06 0.000 .7820962 .869451 w2 11.58532 .2303929 50.29 0.000 11.13376 12.03689 w3 .3468243 .2578248 1.35 0.179 -.1585055 .852154 w4 2.12062 .2109133 10.05 0.000 1.707236 2.534005 _cons -4.752409 .3889091 -12.22 0.000 -5.514661 -3.990158 Instrumented: morekids Instruments: w1 w2 w3 w4 samesex boy1st boy2nd . predict u, resid . regress u samesex boy1st boy2nd w1 w2 w3 w4 Source SS df MS Number of obs = 254654 F( 7,254646) = 0.55 Model 1771.99537 7 253.142196 Prob > F = 0.7942 Residual 116475387254646 457.401205 R-squared = 0.0000 Adj R-squared = -0.0000 Total 116477159254653 457.395591 Root MSE = 21.387 u Coef. Std. Err. t P>|t| [95% Conf. Interval] samesex -.0208817 .0848284 -0.25 0.806 -.187143 .1453797 boy1st -.0091799 .0848283 -0.11 0.914 -.1754411 .1570812 boy2nd -.164606 .0848289 -1.94 0.052 -.3308683 .0016564 w1 .0000417 .0125502 0.00 0.997 -.0245563 .0246396 w2 -.0014793 .1920016 -0.01 0.994 -.3777973 .3748387 w3 -.0014309 .1788983 -0.01 0.994 -.3520668 .349205 w4 .0005744 .2030561 0.00 0.998 -.3974101 .3985589 _cons .0985317 .3922333 0.25 0.802 -.6702351 .8672985 . test samesex boy1st boy2nd ( 1) samesex = 0 ( 2) boy1st = 0 ( 3) boy2nd = 0 F( 3,254646) = 1.29 Prob > F = 0.2754 Dudas a vjrazmilic@uc.cl. Link del video de la ayudant́ıa aqúı R no tiene medida es una razón unporcentaje Proporción de lavar explicada por el modelo respecto al total SSR Al ser su se mide en locales fin medido en locales USD varipily se mide en MII Y en euros sería 2 L y x 2 x S pot por Y tu 5 po t X pr z t U s por pi z t E pi po pi p C su El SSR no cambia Norbit4 Van lxp.LY I var por 14 pie no cambia 4 Y Yuu PIB CAÍ MUNDIAL 4 514W S pot Por Y t U s pot pr It 4W t n S po Be J t Pr Yu t U s Pot pr Yuu t Pr 4 t U s pit pi 5 t E pu pot por You pispa E u CONSTANTE SSR NO CAMBIA Var Bn NO CAMBIA µ No CAMBIA Dos supuestos e Relevancia el instrumento explica suficientemente la variable endógena Conpct.pro Mm log_gasto O a Restricción de Exclusión el instrumento afecta los resultados exclusivamente a través de la variable endógena es exógena PUMERSUPUESTO Razonable colegios con mayor subvención son los más necesitados por endetienenmenorgasto SEGUNDO SUPUESTO Problema laasignación de lasubvención se hace en NOSECUMPLE función de lasituación delcolegio INCLUYENIVELES DEGASTO NO ESALEATORIA NO ES BUENA VARIABLE TIENE SENTIDO SI Existe UNA CORRELACION ENTRE AMBAS VARIABLES g gusto o t Xp pct.pro Mmt C Donde ato la variable proxy no debe ser endógena que se relacione con los errores del modelo de interés Conjetura los alumnos que tienen sus almuerzos subvencionados son más necesitados promedio la Corr existe sin embargo no es observable c 1 Relación entre gasto y resultados de inglés no era fuerte Relación real situaciónsocioeconómica de loscolegios y los resultados a Por construcción al incluir un proxy seindube error de medición en el modelo sesgaresultados al 0 ALTOS loEf DE GASTO SEA MAYOR ART PASS ENG ART PRO Ave Pa Un aumento de 1 de alumnos con almuerzo subvencionado se ve relacionado con una disminución de 0,30lb puntos porcentuales REPRESENTA LA ELASTICIDAD ENTRE AMBAS VARIABLES pin s Zi 7 l Potpr XtU po pr I Eczi E Hi I pin Etzi E a X I tu E Zi E Xi F pj Pistil calza Eczi t i E in Eczi E Xi ÉN p y Etzi E µ Eczi E Xi SI El V IX 7 D EL ESTIMADOR LV SERIA INSESGADO glzi EI.nl iZVarlpiwdXiz sVN prtsczi zkxi xT Var Elzi E in Eczi E cyi.gg XiZ VoW slzi z ulXiz Eczi E Xi a E Vor Hi I ul Xp Zi E Xi D a El Zi E 2 UN LUIKH Zi E Xi D a 02 El Zi I Sss los Errores SON Zi E Xi a HOMOCEDÁSTICOS 1 NO SE CORRELAGONAN ENTREsí sslx.FI z CNUNCA SST s Xi F a R'µ ELI IT SST sstx.az El Fi F a Ii f t ri zi I jo j E sstx.ro z zlIi xj Eljotjn.zi pj ti.zY ssTx.Rq z fn Elzi IT fr CONOCIDO ja WKND EH F Lz El VW z E a SST Rfp EH F Lz El z a Eczi E a EH F Lz E J v a Elzi E a ll 1 SSIx Raz sstx.RF.rs Buen instrumento Ritz 2 1 2 SIMILAR A las variables son iguales instrumento endógeno 1 No nos dice mucho a Existencia de heterocedersticidad Brush Pagan 3 Permite ver si el error contiene variabilidad proveniente de formas no lineales de las var indep o sea si éstas formas no lineales eran variables omitidas en el modelo original a Test de White heterocedasticidad Relación no linear de la varianza de los errores con la variable independiente Fertilidad Horas detrabajo variables deelección At TRAD A Hlsub At pisos A TMB MoreKids endógena sesgo en el estimadorMardeM Si el sexo de los hijos es aleatorio las variables son exógenas no secorrelacionan con nada El sexo de los hijos puedetener un efectoimportante en la fertilidad se valida por los datos Se rechaza Ho boy 2nd boy 1st sameSex O El estimado Mco tiene sesgo negativo this e site la predicción MorteIidsi sobre todos los instrumentos Y las variables de control Wis En este caso este es un buen instrumento ya que el estadístico E es alto 1415 y prob s E 40000 Aquellas mujeres quetienen más de dos hijos trabajan en promedio 5,44 horas menos al año que aquellas con menor número dehijos
Compartir