Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Diferencias en Diferencias Tópicos de Microeconoḿıa Juan Pablo González (jpg512@nyu.edu) Universidad de Buenos Aires 1 / 40 Introducción ▶ Diferencias en diferencias 2x2 ▶ Múltiples momentos en el tiempo ▶ Tendencias paralelas y cómo validar el supuesto de identificación ▶ Aplicaciones en Stata ▶ Galiani et al (2005) 2 / 40 El método de diferencias en diferencias ▶ John Snow y el estudio del cólera en Londres ▶ Diseño de investigación más común en econoḿıa aplicada ▶ Idea básica es combinar comparaciones entre individuos (sesgadas) y en el tiempo (sesgadas) para estimar parámetros causales 3 / 40 El método de diferencias en diferencias Figure 1: Cunningham (2021) 4 / 40 El método de diferencias en diferencias ▶ Tendencias paralelas ▶ Asumir mismo T para todas las unidades ▶ Supuesto de identificación ▶ Cuya credibilidad determina cuán créıbles son nuestros resultados ▶ No se puede demostrar 5 / 40 DD 2x2 ▶ Caso más simple: dos grupos en dos momentos en el tiempo ▶ yit = α+ β Ti + γ Postt + δ (Ti ∗ Postt) + ϵit ▶ δ es el parámetro de interés ▶ Los controles son el contrafáctico de lo que hubiese ocurrido con los tratados en ausencia del tratamiento 6 / 40 DD 2x2 Figure 2: James A. Cannavino Library 7 / 40 Card y Krueger (1994) ▶ Una de los primeras y más famosas aplicaciones de DD en econoḿıa ▶ Efectos del salario ḿınimo ▶ En los modelos clásicos, aumentos del salario ḿınimo generan desempleo ▶ Cuestión emṕırica ▶ ¿Cómo estimar este efecto? ▶ Problemático comparar una provincia con un salario ḿınimo alto contra otra con salario ḿınimo bajo ▶ Problemático comparar una provincia antes y después de decidir aumentar el salario ḿınimo 8 / 40 Card y Krueger (1994) ▶ Pennsylvania vs New Jersey (aumento del salario ḿınimo) ▶ Yits = α+ γ NJs + λ Dt + δ (NJ ∗ D)st + ϵits ▶ donde: ▶ PA pre: α ▶ PA post: α+ λ ▶ NJ pre: α+ γ ▶ NJ post: α+ γ + λ+ δ ▶ i : locales de comida rápida (n), t: años (2), s: estados (2) 9 / 40 Card y Krueger (1994) Figure 3: Cunningham (2021) 10 / 40 Card y Krueger (1994) Figure 4: Cunningham (2021) 11 / 40 DD múltiples peŕıodos ▶ DD se puede extender sin problemas al análisis de muchos peŕıodos ▶ yit = α+ β Ti + γ Postt + δ (Ti ∗ Postt) + ϵit ▶ yit = α+ β Ti + γ Postt + δ (Ti ∗ Postt) + θ Xit + ϵit ▶ Es un panel, aśı que podemos incluir efectos fijos y temporales ▶ yit = δ (Ti ∗ Postt) + θ Xit + αi + βt + ϵit 12 / 40 DD múltiples peŕıodos Figure 5: Gertler et al (2016) 13 / 40 Supuesto de identificación ▶ La validez de DD descansa en el supuesto identificación ▶ Supuesto de identificación de tendencias paralelas: ▶ Tratados y controles hubieran seguido la misma trayectoria de no existir el tratamiento ▶ No hay otro evento contemporáneo que pueda explicar la diferencia entre tratados y controles ▶ No observable, pero podemos presentar evidencia para defenderlo ▶ Tener en cuenta que siempre podemos estimar el coeficiente de DD, que sea causal depende del supuesto de identificación 14 / 40 Tendencias paralelas ▶ Graficar la evolución de los controles y los tratados antes y después del tratamiento ▶ Podemos encontrarnos con distintas situaciones: ▶ DD 2x2 iguales en nivel ▶ DD 2x2 diferencias en nivel ▶ Múltiples peŕıodos e iguales en nivel ▶ Múltiples peŕıodos y diferencias en nivel ▶ Tendencias no paralelas ▶ El diseño de DD es más fuerte si además de tendencias paralelas tenemos mismos niveles previos al tratamiento (aunque no es necesario) 15 / 40 Tendencias no paralelas Figure 6: Gertler et al (2016) 16 / 40 Tendencias paralelas ▶ ¿Qué ocurre cuando las tendencias no son paralelas? ▶ Tendencias paralelas con otras formas funcionales ▶ Si nuestro outcome ajusta mejor, por ejemplo, en forma logaŕıtmica, podemos usar log(y) en lugar de y como dependiente ▶ Los gráficos ayudan y sirven para convencer, pero no son un test estad́ıstico 17 / 40 Tendencias paralelas ▶ Si tenemos igualdad en niveles, podemos estimar si el efecto del tratamiento antes de que se asigne. ▶ Estimación por DD: ▶ yit = δ (Ti ∗Postt)+ θXit +αi + βt + ϵit , incluyendo peŕıodos pre y post tratamiento ▶ Estimación pre tratamiento: ▶ yit = δ Ti + θ Xit + αi + βt + ϵit , incluyendo el peŕıodo pre tratamiento ▶ ¿Por qué no usar (Ti ∗ Postt) en la última ecuación? 18 / 40 Checks de placebo ▶ La idea básica de los checks de placebo es mostrar que algo que no debeŕıa ocurrir si nuestro supuesto identificación fuese cierto, de hecho, no ocurre ▶ Cambiar el momento del tratamiento por otros anteriores ▶ Estimar nuestro DD con Postt−k en lugar de Postt ▶ Tenemos que crear nuevas variables ▶ Usar otros grupos que no debeŕıan ser afectados por el tratamiento ▶ El salario ḿınimo no debeŕıa tener efectos sobre el empleo en sectores de altos salarios ▶ Usar otros outcomes que no debeŕıan ser afectados por el tratamiento 19 / 40 Otros checks ▶ Comparación de observables entre tratados y controles ▶ First stages effects ▶ Usar distintas formas de medir las variables, sub-muestras, etc. ▶ Segunda parte del supuesto: ocurrió algo relevante en el momento que se asignó el tratamiento? 20 / 40 Inferencia ▶ DD es un panel ▶ Valen las mismas conclusiones en términos de inferencia ▶ Cunningham (2021): ▶ Clusters a nivel de asignación del tratamiento ▶ Block bootstraping puede ser útil si tenemos muy pocos clusters (Card y Krueger, 1994) ▶ Agregar datos a dos peŕıodos tiene muchas otras implicancias, no recomendable a menos que sea motivado por la pregunta de investigación 21 / 40 Stata ▶ En Stata necesitamos datos en panel ▶ xtset state year ▶ Una variable que tome el valor de 1 para todas las unidades tratadas (treated), y otra que tome el valor de 1 a partir del momento en que se asigna el tratamiento (treatment) gen did = treated*treatment ▶ Estimamos el modelo con la interacción ▶ xtreg outcome did treated treatment control 1 control 2 i.year, fe ▶ donde did es el estimador de DD 22 / 40 Stata ▶ González (2022): efecto de la industria del fracking sobre la regulación medioambiental ▶ En el año 2005 el fracking se vuelve económicamente viable ▶ Análisis de siete estados en USA que concentran más del 90% de la producción ▶ Unidad de análisis: zipcode/año ▶ Peŕıodo: 1990 - 2014 23 / 40 Stata ▶ Fracked : valor de 1 para todos los zipcodes que registran al menos un pozo de fracking en toda la muestra ▶ Treatment: valor de 1 para todos los años desde 2005 ▶ Did : el producto de ambas variables ▶ Empecemos con un gráfico: ▶ lgraph lnaction year, by(fracked) xline(2005) 24 / 40 Stata Figure 7: González (2022) 25 / 40 Stata ▶ Para la estimación le avisamos a Stata que nuestros datos son paneles con xtset ▶ xtreg lnaction treatment fracked did i.year, fe robust ▶ El estimador de diferencias en diferencias es did ▶ Podemos hacer esto para distintas variables dependientes y meter todo en una misma tabla con outreg2 26 / 40 Stata Figure 8: González (2022) 27 / 40 Stata ▶ xtdidregress para regresiones DD en panel ▶ xtdidregress (y1 x1 x2) (did), group(group) time(time) ▶ Efectos fijos y temporales, errores estándar clustereados en group ▶ Tendencias paralelas: ▶ estat trendplot ▶ estat ptrends 28 / 40 Stata 29 / 40 Stata 30 / 40 Stata 31 / 40 Abdul-Razzak et al (2020) ▶ Consecuencias electorales del dinero en la poĺıtica ▶ Diferencias en diferencias usando el caso de Citizens United ▶ Elecciones estatales ▶ Bipartisan Campaign Finance Reform Act (2002) prohibe outside spending ▶ Citizens United (2010): Corte Suprema deja sin efecto las restricciones 32 / 40 Citizens United Figure 9: Abdul-Razzak et al (2020) 33 / 40 Diferencias en diferencias ▶ Tratados (restricciones previas) vs controles (sin restricciones) ▶ Previos a CU, 23 estamos teńıan restricciones y 27 no ▶ Muestra de 48 estados entre 1990 a 2018 ▶ Compararla trayectoria de ambos grupos antes y después de CU 34 / 40 Diferencias en diferencias ▶ RepVSst = β (BanStatei ∗ CinUnt) + αs + δt + ϵst ▶ s y t, estados y años, respectivamente ▶ RepVSst : % votos a Republicanos (otras medidas como ideoloǵıa o polarización) ▶ BanStatei : igual a 1 para estados eventualmente tratados ▶ CinUnt : igual a 1 para todos los años desde CU ▶ αs y δt : efectos fijos y temporales ▶ Errores estándar clusteareados a nivel estatal 35 / 40 Tendencias paralelas Figure 10: Abdul-Razzak et al (2020) 36 / 40 Tendencias paralelas Figure 11: Abdul-Razzak et al (2020) 37 / 40 Resultados principales Figure 12: Abdul-Razzak et al (2020) 38 / 40 Otros resultados ▶ Otros eventos alrededor de CU ▶ Gran Recesión y presidencia de Obama ▶ Auge del Tea Party: controlar por asistentes a protestas del Tea Party ▶ REDMAP (estrategia estatal de Republicanos): controlar por gasto de REDMAP ▶ Red Wave y contribuciones de campaña: controlar por ĺımites electorales y contribuciones de campaña ▶ Con mismo DD: ▶ Legislaturas estatales más conservadoras ▶ No encuentran efectos sobre polarización en las legislaturas estatales ▶ Mayores efectos en los estados donde las corporaciones están más alineadas con el partido Republicano 39 / 40 Bibliograf́ıa ▶ Cunningham (2021) Cap. 9 ▶ Galiani et al (2005) 40 / 40 Introducción El método de diferencias en diferencias DD 2x2 DD múltiples períodos Supuesto de identificación Inferencia Stata Abdul-Razzak et al (2020) Bibliografía
Compartir