Logo Studenta

Ayudantía 7 EAE250A

Vista previa del material en texto

Ayudant́ıa 7 - Econometŕıa I (EAE-250A) 1er Semestre 2020
1. Usted cuenta con datos del número de locales Starbucks (Si) y el PIB per
cápita (Yi) para 30 páıses. El PIB per cápita está medido en dólares. La
estimación MCO entrega:
bSi = �812 + 0, 07Yi
un R2 = 0, 21 y una suma de los residuales al cuadrado de SSR = 435.882, 1.
Además, la varianza condicionales del coeficiente que acompaña a Yi es
0,0004.
(a) Determine en qué unidades se mide el R2, el SSR, el coeficiente que
acompaña a Yi y la varianza condicional de ese coeficiente.
(b) Suponga que el tipo de cambio actual es: 1 euro = ↵ dólares. Responda
en forma rigurosa cómo cambian las siguientes componentes asociadas
a la regresión, si el PIB per cápita se mide en euros en vez de en dólares:
• El coeficiente que acompaña a Yi.
• El intercepto de la regresión.
• La suma de los residuales al cuadrado.
• La varianza condicionales del coeficiente que acompaña a Yi.
• El R2 de la regresión.
(c) Suponga ahora que en vez de usar el PIB per cápita Yi como variable
explicativa, se usa la diferencia entre el PIB per cápita del páıs y el
PIB per cápita mundial, Yi � YW (todo medido en dólares). Responda
cómo cambian las mismas cinco componentes de la pregunta anterior
en este nuevo escenario.
2. Suponga que usted quiere medir el efecto del gasto en profesores de inglés en
los resultados obtenidos por los alumnos en una prueba estándar de inglés en
los colegios de Chile. Hay 408 colegios en la muestra. La variable log gasto
mide el logaritmo del gasto promedio por alumno en profesores de inglés
y la variable pct pass eng mide el porcentaje de alumnos que aprobaron la
prueba de inglés para cada colegio de la muestra.
Los resultados del modelo original se presentan a continuación:
. reg pct_pass_eng log_gasto
Source | SS df MS Number of obs = 408
-------------+------------------------------ F( 1, 406) = 12.41
Model | 1329.4235 1 1329.4235 Prob > F = 0.0005
Residual | 43487.757 406 107.112702 R-squared = 0.0297
-------------+------------------------------ Adj R-squared = 0.0273
Total | 44817.1805 407 110.115923 Root MSE = 10.35
------------------------------------------------------------------------------
pct_pass_eng | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
log_gasto | 11.16439 3.169011 3.52 0.000 4.934669 17.3941
_cons | -69.34103 26.53013 -2.61 0.009 -121.4946 -17.18746
------------------------------------------------------------------------------
Usted sospecha que el nivel de pobreza de los alumnos puede afectar el
resultado del test de inglés. La pobreza promedio de los alumnos en cada
colegio no es observable, pero usted cuenta con la variable pct prg alm que
mide el porcentaje de alumnos de cada colegio de la muestra que cuenta con
una subvención gubernamental para almorzar.
(a) ¿Tiene sentido usar pct prg alm como variable instrumental de log gasto?
¿Por qué?
(b) ¿En qué situación tiene sentido usar pct prg alm como proxy del nivel
de pobreza de los alumnos en cada colegio?
(c) Usted decide usar pct prg alm como proxy del nivel de pobreza y ob-
tiene los siguientes resultados:
. reg pct_pass_eng log_gasto pct_prg_alm
Source | SS df MS Number of obs = 408
-------------+------------------------------ F( 2, 405) = 44.43
Model | 8063.82349 2 4031.91175 Prob > F = 0.0000
Residual | 36753.357 405 90.7490296 R-squared = 0.1799
-------------+------------------------------ Adj R-squared = 0.1759
Total | 44817.1805 407 110.115923 Root MSE = 9.5262
------------------------------------------------------------------------------
pct_pass_eng | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
log_gasto | 6.229683 2.972634 2.10 0.037 .3859641 12.0734
pct_prg_alm | -.3045853 .0353574 -8.61 0.000 -.3740923 -.2350784
_cons | -20.36069 25.07287 -0.81 0.417 -69.64992 28.92853
------------------------------------------------------------------------------
¿Por qué razón el coeficiente de log gasto disminuye casi a la mitad en
la nueva regresión?
(d) Interprete el coeficiente de pct prg alm en la nueva regresión.
3. Usted sabe que el estimador VI para el modelo simple es:
�̂IV 1 =
Pn
i=1(zi � z)(yi � y)Pn
i=1(zi � z)(xi � x)
Suponga que usted conoce �2.
(a) Demuestre que la varianza de este estimador es:
Var[�̂IV 1 |x, z] =
�2
SSTxR2x,z
donde SSTx =
Pn
i=1(xi�x)2 y R2x,z es el R2 de la regresión por MCO:
xi = �0 + �1zi + ui, es decir:
R2x,z =
Pn
i=1(bxi � x)2
SSTx
Dudas a vjrazmilic@uc.cl. Link del video de la ayudant́ıa aqúı
 
Ayudant́ıa 7 - Econometŕıa I (EAE-250A) 1er Semestre 2020
(b) Utilizando el resultado anterior, discuta cuando z es un buen instru-
mento para x.
4. Considere el modelo de regresión múltiple:
y = �0 + �1x1 + �2x2 + u
Describa brevemente qué tipo de información puede obtener de cada una de
las siguientes regresiones auxiliares:
(a) bu = �0 + �1by + e
(b) bu2 = �0 + �1by + e
(c) bu = �0 + �1by2 + e
(d) bu2 = �0 + �1by2 + e
5. Usted quiere estudiar el efecto del tamaño de la familia en la oferta laboral
de la mujer. El modelo propuesto está dado por:
Weeksmi = �0 + �1Morekidsi + �1Wi1 + · · ·+ �kWik + ui
donde Wi1, . . . ,Wik son variables de control exógenas, Morekidsi es una
dummy igual a 1 si la mujer tiene más de 2 hijos y Weeksmi es el número
de horas trabajadas. La siguiente página muestra los resultados de Stata
para este problema.
(a) Explique por qué el estimador MCO de �1 podŕıa estar sesgado.
(b) Un economista laboral le sugiere que use el sexo de los 2 primeros hijos
como variables instrumentales deMorekidsi. En particular, usted tiene
3 instrumentos potenciales: una dummy que es 1 si el primer hijo es
un niño (Boy1st), una dummy que es 1 si el segundo hijo es un niño
(Boy2st) y una dummy que es 1 si los 2 primeros hijos tienen el mismo
sexo (Samesex). Explique por qué estas variables son instrumentos
válidos.
(c) En base a los resultados, determine si el estimador MCO de �1 tiene
sesgo positivo o negativo.
(d) Explique cuál es el instrumento óptimo para Morekidsi y en base a las
tablas, comente si éste es un buen instrumento o no.
(e) Considere la estimación usando variables instrumentales. Interprete el
coeficiente �1.
. regress weeksm1 morekids w1 w2 w3 w4, robust
Linear regression Number of obs = 254654
 F( 5,254648) = 2545.10
 Prob > F = 0.0000
 R-squared = 0.0438
 Root MSE = 21.384
 Robust
 weeksm1 Coef. Std. Err. t P>|t| [95% Conf. Interval]
 morekids -6.230418 .086239 -72.25 0.000 -6.399445 -6.061392
 w1 .8378841 .0121179 69.14 0.000 .8141333 .861635
 w2 11.66424 .1955286 59.65 0.000 11.28101 12.04747
 w3 .466093 .1807033 2.58 0.010 .1119194 .8202666
 w4 2.142125 .2082759 10.29 0.000 1.73391 2.55034
 _cons -4.834514 .3673477 -13.16 0.000 -5.554506 -4.114523
. regress morekids samesex boy1st boy2nd w1 w2 w3 w4, robust
Linear regression Number of obs = 254654
 F( 7,254646) = 939.23
 Prob > F = 0.0000
 R-squared = 0.0244
 Root MSE = .47957
 Robust
 morekids Coef. Std. Err. t P>|t| [95% Conf. Interval]
 samesex .0685552 .0019018 36.05 0.000 .0648277.0722826
 boy1st -.0106297 .0019019 -5.59 0.000 -.0143573 -.0069021
 boy2nd -.0099686 .0019019 -5.24 0.000 -.0136963 -.006241
 w1 .0153981 .000276 55.80 0.000 .0148572 .015939
 w2 .1003996 .0044428 22.60 0.000 .0916919 .1091074
 w3 .1511128 .0041154 36.72 0.000 .1430466 .1591789
 w4 .0275804 .0046378 5.95 0.000 .0184903 .0366704
 _cons -.1294725 .0085646 -15.12 0.000 -.1462589 -.1126861
. test samesex boy1st boy2nd
 ( 1) samesex = 0
 ( 2) boy1st = 0
 ( 3) boy2nd = 0
 F( 3,254646) = 445.20
 Prob > F = 0.0000
Dudas a vjrazmilic@uc.cl. Link del video de la ayudant́ıa aqúı
Ayudant́ıa 7 - Econometŕıa I (EAE-250A) 1er Semestre 2020
. ivreg weeksm1 (morekids = samesex boy1st boy2nd) w1 w2 w3 w4, robust
Instrumental variables (2SLS) regression Number of obs = 254654
 F( 5,254648) = 1390.10
 Prob > F = 0.0000
 R-squared = 0.0435
 Root MSE = 21.387
 Robust
 weeksm1 Coef. Std. Err. t P>|t| [95% Conf. Interval]
 morekids -5.441813 1.218631 -4.47 0.000 -7.830296 -3.05333
 w1 .8257736 .0222847 37.06 0.000 .7820962 .869451
 w2 11.58532 .2303929 50.29 0.000 11.13376 12.03689
 w3 .3468243 .2578248 1.35 0.179 -.1585055 .852154
 w4 2.12062 .2109133 10.05 0.000 1.707236 2.534005
 _cons -4.752409 .3889091 -12.22 0.000 -5.514661 -3.990158
Instrumented: morekids
Instruments: w1 w2 w3 w4 samesex boy1st boy2nd
. predict u, resid
. regress u samesex boy1st boy2nd w1 w2 w3 w4
 Source SS df MS Number of obs = 254654
 F( 7,254646) = 0.55
 Model 1771.99537 7 253.142196 Prob > F = 0.7942
 Residual 116475387254646 457.401205 R-squared = 0.0000
 Adj R-squared = -0.0000
 Total 116477159254653 457.395591 Root MSE = 21.387
 u Coef. Std. Err. t P>|t| [95% Conf. Interval]
 samesex -.0208817 .0848284 -0.25 0.806 -.187143 .1453797
 boy1st -.0091799 .0848283 -0.11 0.914 -.1754411 .1570812
 boy2nd -.164606 .0848289 -1.94 0.052 -.3308683 .0016564
 w1 .0000417 .0125502 0.00 0.997 -.0245563 .0246396
 w2 -.0014793 .1920016 -0.01 0.994 -.3777973 .3748387
 w3 -.0014309 .1788983 -0.01 0.994 -.3520668 .349205
 w4 .0005744 .2030561 0.00 0.998 -.3974101 .3985589
 _cons .0985317 .3922333 0.25 0.802 -.6702351 .8672985
. test samesex boy1st boy2nd
 ( 1) samesex = 0
 ( 2) boy1st = 0
 ( 3) boy2nd = 0
 F( 3,254646) = 1.29
 Prob > F = 0.2754
Dudas a vjrazmilic@uc.cl. Link del video de la ayudant́ıa aqúı
R no tiene medida es una razón unporcentaje
Proporción de lavar explicada por el modelo
respecto al total
SSR Al ser su se mide en locales
fin medido en locales
USD
varipily se mide en MII
Y en euros sería 2 L y x 2
x
S pot por Y tu
5 po t X pr z t U
s por pi z t E
pi po pi p C su
El SSR no cambia
Norbit4 Van lxp.LY
I var por 14
pie no cambia
4 Y Yuu PIB CAÍ MUNDIAL 4 514W
S pot Por Y t U
s pot pr It 4W t n
S po Be J t Pr Yu t U
s Pot pr Yuu t Pr 4 t U
s pit pi 5 t E
pu pot por You pispa E u
CONSTANTE
SSR NO CAMBIA
Var Bn NO CAMBIA
µ No CAMBIA
Dos supuestos
e Relevancia el instrumento explica suficientemente la
variable endógena
Conpct.pro Mm log_gasto O
a Restricción de Exclusión el instrumento afecta
los resultados exclusivamente a través
de la variable endógena es exógena
PUMERSUPUESTO Razonable colegios con mayor subvención son los
más necesitados por endetienenmenorgasto
SEGUNDO SUPUESTO Problema laasignación de lasubvención se hace en
NOSECUMPLE función de lasituación delcolegio
INCLUYENIVELES DEGASTO NO ESALEATORIA
NO ES BUENA VARIABLE
TIENE SENTIDO SI Existe UNA CORRELACION ENTRE AMBAS VARIABLES
g gusto o t Xp pct.pro Mmt C
Donde ato la variable proxy no debe ser
endógena que se relacione con los errores
del modelo de interés
Conjetura los alumnos que tienen sus almuerzos
subvencionados son más necesitados promedio
la Corr existe
sin embargo no es observable
c
1 Relación entre gasto y resultados de inglés no
era fuerte Relación real situaciónsocioeconómica de
loscolegios y los resultados
a Por construcción al incluir un proxy seindube
error de medición en el modelo sesgaresultados al 0
ALTOS loEf DE GASTO SEA MAYOR
ART PASS ENG
ART PRO Ave
Pa
Un aumento de 1 de alumnos con almuerzo subvencionado
se ve relacionado con una disminución de 0,30lb
puntos porcentuales
REPRESENTA LA ELASTICIDAD ENTRE AMBAS VARIABLES
pin s Zi 7 l Potpr XtU po pr I
Eczi E Hi I
pin Etzi E a X I tu
E Zi E Xi F
pj Pistil calza
Eczi
t
i E in
Eczi E Xi
ÉN p y
Etzi E µ
Eczi E Xi
SI El V IX 7 D EL ESTIMADOR LV SERIA
INSESGADO
glzi EI.nl iZVarlpiwdXiz sVN prtsczi zkxi xT
Var
Elzi E in
Eczi E cyi.gg
XiZ
VoW slzi z ulXiz
Eczi E Xi a
E Vor Hi I ul Xp
Zi E Xi D a
El Zi E 2 UN LUIKH
Zi E Xi D a
02 El Zi I Sss los Errores SON
Zi E Xi a
HOMOCEDÁSTICOS
1
NO SE CORRELAGONAN ENTREsí
sslx.FI z
CNUNCA SST s Xi F a R'µ ELI IT
SST
sstx.az El Fi F
a
Ii f t ri zi I jo j E
sstx.ro z zlIi xj Eljotjn.zi pj ti.zY
ssTx.Rq z fn Elzi IT
fr CONOCIDO
ja WKND EH F Lz El
VW z E a
SST Rfp EH F Lz El
z a
Eczi E
a
EH F Lz E J v a
Elzi E a ll
1
SSIx Raz sstx.RF.rs
Buen instrumento Ritz 2 1
2 SIMILAR A las variables son iguales
instrumento endógeno
1 No nos dice mucho
a Existencia de heterocedersticidad Brush Pagan
3 Permite ver si el error contiene variabilidad proveniente
de formas no lineales de las var indep o sea
si éstas formas no lineales eran variables omitidas
en el modelo original
a Test de White heterocedasticidad
Relación no linear de la varianza de los
errores con la variable independiente
Fertilidad Horas detrabajo variables deelección
At TRAD A Hlsub
At pisos A TMB
MoreKids endógena sesgo en el estimadorMardeM
Si el sexo de los hijos es aleatorio las variables
son exógenas no secorrelacionan con nada
El sexo de los hijos puedetener un efectoimportante
en la fertilidad se valida por los datos
Se rechaza Ho boy 2nd boy 1st sameSex O
El estimado Mco tiene sesgo negativo this e site
la predicción MorteIidsi sobre todos los instrumentos
Y las variables de control Wis En este caso este
es un buen instrumento ya que el estadístico E
es alto 1415 y prob s E 40000
Aquellas mujeres quetienen más de dos hijos
trabajan en promedio 5,44 horas menos al año
que aquellas con menor número dehijos

Otros materiales

Materiales relacionados

38 pag.
Guía Econometría 2004-1 3

User badge image

Apuntes Ingeneria Civil

154 pag.
ECONOMETRIA 2

IPN

User badge image

Maria Gomez