Logo Studenta
¡Este material tiene más páginas!

Vista previa del material en texto

Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Clase 17
Teoŕıa Econométrica II
Tomás Rau Binder
8 de Mayo
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Contenidos
Paneles dinámicos
Dif-in-Dif
Ejemplo: Duflo (AER, 2001)
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Paneles dinámicos
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Un Modelo Dinámico de Datos de Panel
En ocasiones estamos interesados en modelos dinámicos que
incorporan variable dependiente rezagada :
yit = α + γyi ,t−1 + Xitβ + uit , i = 1....N, t = 1.....T
Se puede demostrar que la inclusión de variable dependiente
rezagada introduce un sesgo de endogeneidad, independiente de la
estructura del error.
Este sesgo se va a cero asintóticamente pero se necesita T y N
grandes, el problema es que eso casi nunca ocurre
(simultáneamente).
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Un Modelo Dinámico de Datos de Panel
Note que si se asume que el efecto individual µi es fijo, la
potencial endogeneidad viene sólamente por la correlación de
yi ,t−1 y υit . Sin embargo, si se estima por fixed-effects
(demeaning) se incluye una correlación entre demeaned yi ,t−1
y demeaned ui ,t . Dicho sesgo depende de 1/T , luego en
paneles cortos es relevante (Nickel, 1981).
Si se asume que el efecto individual es aleatorio, la
endogeneidad viene por la correlación de los µi que aparece
tanto en yi ,t−1 como en ui ,t , dado su invarianza en el tiempo.
Existen algunos métodos de variables instrumentales para
corregir este problema.
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Un Modelo Dinámico de Datos de Panel
Anderson y Hsiao (1981) proponen un método de variables
instrumentales del modelo en primeras diferencias. Aśı,
∆yit = γ∆yi ,t−1 + ∆Xitβ + ∆υit
y el efecto individual µi se elimina al diferenciar pero de todas
maneras ∆yi ,t−1 está correlacionado con ∆υit
Los autores proponen usar yi ,t−2 como instrumento de ∆yi ,t−1
dado que están correlacionados y no está correlacionado con ∆υit
siempre y cuando no exista correlación serial. Esto se puede hacer
en STATA con el comando xtivreg.
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Un Modelo Dinámico de Datos de Panel
Arellano y Bond (1991) plantean usar todos los instrumentos
disponibles: ∆yi ,t−k para k > 1 y sugieren una estimación por
GMM también bajo la hipótesis de ausencia de correlación serial.
El método de AB muestra ser más eficiente que AH y es preferido
sobre otros estimadores.
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Un Modelo Dinámico de Datos de Panel
La implementación en STATA es directa
El comando xtabond produce el estimador de Arellano y
Bond (1991)
Entre las opciones destacan lags(#) para indicar cuántos
rezagos de la variable dependiente desean incluir
Se puede indicar si tienen otro set de instrumentos para
agregar inst(#)
Se puede indicar el máximo de rezagos de la variable
dependiente para usar como instrumentos maxldep(#)
y muchas otras opciones que se pueden ver en el HELP.
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Differences-in-Differences (DD)
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Panel models
Vimos modelos de datos de panel y discutimos cómo podŕıa
ayudarnos a resolver el problema de la identificación.
Suponga que
yit = α + γdit + uit
donde dit es una dummy que toma el valor 1 si el individuo es
tratado en el momento t y 0 si no.
Una estimación por efecto fijo resolveŕıa parcialmente el
problema de la identificación.
¿Bajo qué supuestos? Que la potencial correlación de dit y uit
sea solamante a través de µi donde uit = µi + υit .
Luego, la única cosa que cambia en el tiempo es el programa.
Hoy veremos el método de diferencias en diferencias que
descansa sobre supuestos similares.
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Differences-in-difference
Es muy dif́ıcil de creer que la única cosa que cambió fue el
programa, muchas cosas pueden haber cambiado
Puede haber crecimiento en algunas variables que afecten el
resultado
Puede haber incluso otros programas ocurriendo al mismo
tiempo
La idea detrás de D-D o modelo de doble-diferencias es que
esos factores pueden ser limpiados comparando los cambios en
los tratados con los cambios en otro grupo de individuos no
afectados al tratamiento
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Card y Krueger (1994)
Uno de los primeros papers en usar D-D fue este para calcular
el impacto de un aumento del salario ḿınimo en un estado
(New Jersey) en abril de 1992 en el empleo de las cadenas de
comida rápida
Claramente otras cosas pueden haber estado ocurriendo en
abril de 1992 en NJ, además del alza del salario ḿınimo:
estacionalidad de la econoḿıa, etc.
¿Solución? Tomar otro estado contiguo (y similar) a NJ como
Pennsylvania y ver qué pasó entre marzo y abril en ambos
estados con el empleo y comparar.
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Card y Krueger (1994)
Resultado: en NJ, aumentó el empleo en las cadenas de
comida rápida mientras que en Penn disminuyó!!!
El estimador D-D simplemente dice tome la diferencia de las
diferencias antes y después entre cada estado. La diferencia
entre el estado sin tratamiento nos da el contrafactual: qué
hubiese ocurrido en ausencia de tratamiento.
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Marco de trabajo DD
Hay una variable de interés Y .
Supongamos que el modelo es lineal separable
Luego, podemos escribir el valor del outcome simplemente
como:
Yit = βdpost + δdtreati + γdpost × dtreati + �it
donde dpost es una dummy igual a 1 si t es posterior al
tratamiento y dtreati una dummy si el indviduo es tratado.
Nos interesa estimar γ. Un estimador de Diferencias
(before-after) nos daŕıa
E (Y |dpos = 1, dtreat = 1) − E (Y |dpos = 0, dtreat = 1)
= β + γ
Luego, hay confounding si β 6= 0, algo que ocurrió distinto al
programa se mezcla con γ
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Marco de trabajo DD
Además, el supuesto de identificación en este caso es:
E (�it |dpost = 1, dtreat = 1) = E (�it |dpost = 0, dtreat = 1)
Que en promedio los no observables de los tratados no hayan
cambiado antes-después.
Differences-in-Difference nos dará el estimador de γ con un
supuesto algo más débil
El estimador DD se construye restando las diferencias
antes-después entre tratados y controles:
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Marco de trabajo DD
Luego, el estimador DD se construye restando estas diferencias
∆1 = E (Y |dpost = 1, treated = 1)− E (Y |dpost = 0, treated = 1)
∆0 = E (Y |dpost = 1, treated = 0)− E (Y |dpost = 0, treated = 0)
Aśı,
γ = ∆1 −∆0
Hay muchas maneras de implementarlo: ols, matching, panel,
double-robust, etc.
El supuesto de identificación es que en promedio, los no
observables de tratados y controles cambien de la misma manera
(parallel trends).
E (�it |dpost = 1, dtreat = 1)− E (�it |dpost = 0, dtreat = 1) =
E (�it |dpost = 1, dtreat = 0)− E (�it |dpost = 0, dtreat = 0)
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Marco de trabajo DD
Suponga que el término de error depende de una tendencia
temporal y es distinto para tratados y controles y por simplicidad
t ∈ {0, 1}:
�it = a0 + a1t + a2dtreat
si el coeficiente a1 es igual antes y después deltratamiento
(parallel trends), se cumplirá el supuesto de identificación.
E (�it |dpost = 1, dtreat = 1) = a0 + a1 + a2
E (�it |dpost = 0, dtreat = 1) = a0 + a2
E (�it |dpost = 1, dtreat = 0) = a0 + a1
E (�it |dpost = 0, dtreat = 0) = a0
El supuesto de identificación no es testeable pero se pueden ver las
trends de la variable de resultado antes del programa
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
El caso perfecto
t
Y
After programBefore program
Control
Treatment
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
El segundo mejor
t
Y
After programBefore program
Control
Treatment
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
El peor caso
t
Y
After programBefore program
Control
Treatment
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Supuesto de identificación
El supuesto esencial de DD es que, sin el programa, los
individuos (unidades) hubiesen tenido la misma tendencia en
el tiempo o “parallel trends”
Este, como todos los supuestos de identificación no es
directamente testeable,
Sin embargo, podemos hacer algunos chequeos de robustez
que harán más confiables nuestras estimaciones:
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Chequeos de robustez
Usar data antes del tratamiento y hacer un DD por ejemplo
entre el peŕıodo 0 y -1. Si encontramos un efecto, puede ser
que nuestra estimación DD entre peŕıodo 1 y 0 es espúria.
Dibujar las tendencias de tratados y controles
Usar grupos de control distintos
Probar con variables de resultado no afectadas por el
tratamiento y mostrar, ojalá, que nada ocurrió.
Ver si los grupos de tratamiento y control tienen regresores
muy distintos. En el caso que estén balanceados es muy
convincente, pero no implica que la estrategia sea inválida
porque podemos controlar por regresores.
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Problemas con DD
Necesitamos asumir que el timing del programa es exógeno:
que no ocurrió en una fecha en particular por razones
relacionadas con la variable de resultado
Hay problemas de poder estad́ıstico. Se recomiendo usar
errores estándar robustos a nivel de cluster (si es posible) para
controlar por autocorrelación serial (lo veremos en otra clase)
Supuesto parámetrico y lineal de la forma funcional puede
afectar los resultados.
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
El Programa INPRES en Indonesia
Gracias al boom del precio del petróleo: Second five year
plan (1974-79)
Un programa masivo de construcción de escuelas: 61,807
escuelas primarias construidas entre 1973/74 a 1978/79
El número de escuelas se multiplicó por 2.1 escuelas por cada
500 niños
Un cambio sustancial en la poĺıtica de infraestructura: antes
de 1973 no construcción
Regla de localización: el número de escuelas construidas en un
distrito deb́ıa ser proporcional al número de niños entre 7 y 12
años no matriculados en el colegio
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Data
SUPAS 95: Una encuesta hecha en 1995: después de que los
niños educados en esas escuelas completaran su escolaridad y
hubieren empezado a trabajar
150,000 hombres nacidos entre 1950-1972
Variables: educación, año y región de nacimiento, salarios.
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
DD como un estimador IV
Duflo usa dos fuentes de variación: región de nacimiento
(treat) y cohorte (post)
El “experimento” analizado en DD genera una variables
instrumentales para educación
Duflo estima con ellas el retorno a la educación
La interacción entre intensidad del programa y el cohorte
están correlacionadas con educación y no con la habilidad de
las personas
Luego, estima por 2SLS el efecto causal de la educación en los
salarios
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Simple Dif-in-Dif
TABLE 3 -- MEANS OF EDUCATION AND LOG(WAGE) BY COHORT AND LEVEL OF PROGRAM CELLS
Years of education
Level of program in Level of program in 
Region of birth Region of birth
High Low Difference High Low Difference
(1) (2) (3) (4) (5) (6)
Panel A: Experiment of Interest
Aged 2 to 6 in 1974 8.49 9.76 -1.27 6.61 6.73 -0.12
(0.043) (0.037) (0.057) (0.0078) (0.0064) (0.010)
Aged 12 to 17 in 1974 8.02 9.40 -1.39 6.87 7.02 -0.15
(0.053) (0.042) (0.067) (0.0085) (0.0069) (0.011)
Difference 0.47 0.36 0.12 -0.26 -0.29 0.026
(0.070) (0.038) (0.089) (0.011) (0.0096) (0.015)
Panel B: Control Experiment
8.00 9.41 -1.41 6.87 7.02 -0.15
Aged 12 to 17 in 1974 (0.054) (0.042) (0.078) (0.0085) (0.0069) (0.011)
7.70 9.12 -1.42 6.92 7.08 -0.16
Aged 18 to 24 in 1974 (0.059) (0.044) (0.072) (0.0097) (0.0076) (0.012)
0.30 0.29 0.013 0.056 0.063 0.0070
Difference (0.080) (0.061) (0.098) (0.013) (0.010) (0.016)
Note: The sample is made of the individuals who earn a wage. Standard errors are in parentheses
Log(wages)
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Regresiones
TABLE 4 -- EFFECT OF THE PROGRAM ON EDUCATION AND WAGES: COEFFICIENTS OF THE INTERACTIONS BETWEEN COHORT DUMMIES 
AND THE NUMBER OF SCHOOLS CONSTRUCTED PER 1000 CHILDREN IN THE REGION OF BIRTH.
Observations (1) (2) (3) (4) (5) (6)
PANEL A: Experiment of Interest: Individuals Aged 2 to 6 or 12 to 17 in 1974
(Youngest Cohort: Individuals Ages 2 to 6 in 1974)
Whole sample 78,470 0.124 0.15 0.188
(0.0250) (0.0260) (0.0289)
Sample of wage earners 31,061 0.196 0.199 0.259 0.0147 0.0172 0.0270
(0.0424) (0.0429) (0.0499) (0.00729) (0.00737) (0.00850)
PANEL B: Control Experiment : Individuals Aged 12 to 24 in 1974 
(Youngest Cohort: Individuals Ages 12 to 17 in 1974)
Whole sample 78,488 0.0093 0.0176 0.0075
(0.0260) (0.0271) (0.0297)
Sample of wage earners 30,225 0.012 0.024 0.079 0.0031 0.00399 0.0144
(0.0474) (0.0481) (0.0555) (0.00798) (0.00809) (0.00915)
Control variables:
Year of birth*enrollment rate in 1971 No Yes Yes No Yes Yes
Year of birth* water and sanitation program No No Yes No No Yes
Notes: All specifications include region of birth, year of birth dummies and interactions between the year of birth dummies and the number of children in the
 region of birth (in 1971). The numbers of observations refer to the specification in columns 1 and 4.
Standard errors are in parentheses.
Log(hourly wage)
Dependent variable
Years of education
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Resultados 2SLS
TABLE 6 -- EFFECT OF EDUCATION ON LABOR MARKET OUTCOMES. OLS AND 2SLS ESTIMATES
Method Instrument (1) (2) (3) (4)
PANEL A: Sample of Individuals Who Work for a Wage
PANEL A1: Dependent variable: log(hourly wage)
OLS 0.0776 0.0777 0.0767
(0.000620) (0.000621) (0.000646)
2SLS Year of birth dummies* program intensity in region of birth 0.0675 0.0809 0.106 0.0908
(0.0280) (0.0272) (0.0222) (0.0541)
[0.96] [0.9] [0.93] [0.9]
2SLS (Aged 2-6 in 1974)*program intensity in region of birth 0.0752 0.0862 0.104
(0.0338) (0.0336) (0.0304)
PANEL A2: Dependent variable: log(monthly earnings) 
OLS 0.0698 0.0698 0.0689
(0.000601) (0.000602) (0.000628)
2SLS Year of birth dummies* program intensity in region of birth 0.0756 0.0925 0.0913 0.134
(0.0280) (0.0278) (0.0219) (0.0631)
[0.73] [0.63] [0.58] [0.7]
PANEL B: Complete Sample
PANEL B1: Dependent variable: participation in the wage sector
OLS 0.0328 0.0327 0.0337
(0.00311) (0.000311) (0.000319)
2SLS Year of birth dummies* program intensity in region of birth 0.101 0.118 0.0892
(0.0210) (0.0197) (0.0162)
[0.66] [0.93] [1.12]
PANEL B2: Dependent variable: log(monthly earnings), imputed for self-employed individuals
OLS 0.05390.0539 0.0539
(0.000354) (0.000354) (0.000355)
2SLS Year of birth dummies* program intensity in region of birth 0.0509 0.0745 0.0346
(0.0157) (0.0136) (0.0138)
[0.68] [0.58] [1.16]
Control variables:
Year of birth*enrollment rate in 1971 No Yes Yes Yes
Year of birth* water and sanitation program No No Yes No
Propensity score, propensity score squared No No No Yes
Notes: Year of birth dummies, region of birth dummies and the interactions betweeen year of birth dummies and the number of children in the region 
of birth in 1971 are included in the regressions. Standard errors are in parenthesis. F-statistics of the test of overidentification restrictions are in 
squared brackets.
Clase 17 Teoŕıa Econométrica II
Paneles dinámicos Dif-in-Dif Ejemplo: Duflo (AER, 2001)
Interpretación de resultados
Esta es una buena ilustración de cómo justificar la validez de
una estrategia Dif-in-Dif
Muestra experimento falso
El efecto en escolaridad es importante, menor en salarios
Los resultados de la estimación de retorno a la educación son
similares a los de OLS
La hipótesis sobre los mayores retornos a la educación en
páıses en desarrollo no se cumple en este caso
Clase 17 Teoŕıa Econométrica II
	Paneles dinámicos
	Dif-in-Dif
	Ejemplo: Duflo (AER, 2001)

Más contenidos de este tema