Cap 7 STATA Tópicos de Micro - Clase 6

Sociología

•

SIN SIGLA

0

Marcos A.

21/12/2023

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Sociología

101.862 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

Diferencias en Diferencias
Tópicos de Microeconoḿıa
Juan Pablo González
(jpg512@nyu.edu)
Universidad de Buenos Aires
1 / 40
Introducción
▶ Diferencias en diferencias 2x2
▶ Múltiples momentos en el tiempo
▶ Tendencias paralelas y cómo validar el supuesto de identificación
▶ Aplicaciones en Stata
▶ Galiani et al (2005)
2 / 40
El método de diferencias en diferencias
▶ John Snow y el estudio del cólera en Londres
▶ Diseño de investigación más común en econoḿıa aplicada
▶ Idea básica es combinar comparaciones entre individuos (sesgadas) y en el tiempo
(sesgadas) para estimar parámetros causales
3 / 40
El método de diferencias en diferencias
Figure 1: Cunningham (2021)
4 / 40
El método de diferencias en diferencias
▶ Tendencias paralelas
▶ Asumir mismo T para todas las unidades
▶ Supuesto de identificación
▶ Cuya credibilidad determina cuán créıbles son nuestros resultados
▶ No se puede demostrar
5 / 40
DD 2x2
▶ Caso más simple: dos grupos en dos momentos en el tiempo
▶ yit = α+ β Ti + γ Postt + δ (Ti ∗ Postt) + ϵit
▶ δ es el parámetro de interés
▶ Los controles son el contrafáctico de lo que hubiese ocurrido con los tratados en
ausencia del tratamiento
6 / 40
DD 2x2
Figure 2: James A. Cannavino Library
7 / 40
Card y Krueger (1994)
▶ Una de los primeras y más famosas aplicaciones de DD en econoḿıa
▶ Efectos del salario ḿınimo
▶ En los modelos clásicos, aumentos del salario ḿınimo generan desempleo
▶ Cuestión emṕırica
▶ ¿Cómo estimar este efecto?
▶ Problemático comparar una provincia con un salario ḿınimo alto contra otra con
salario ḿınimo bajo
▶ Problemático comparar una provincia antes y después de decidir aumentar el salario
ḿınimo
8 / 40
Card y Krueger (1994)
▶ Pennsylvania vs New Jersey (aumento del salario ḿınimo)
▶ Yits = α+ γ NJs + λ Dt + δ (NJ ∗ D)st + ϵits
▶ donde:
▶ PA pre: α
▶ PA post: α+ λ
▶ NJ pre: α+ γ
▶ NJ post: α+ γ + λ+ δ
▶ i : locales de comida rápida (n), t: años (2), s: estados (2)
9 / 40
Card y Krueger (1994)
Figure 3: Cunningham (2021)
10 / 40
Card y Krueger (1994)
Figure 4: Cunningham (2021)
11 / 40
DD múltiples peŕıodos
▶ DD se puede extender sin problemas al análisis de muchos peŕıodos
▶ yit = α+ β Ti + γ Postt + δ (Ti ∗ Postt) + ϵit
▶ yit = α+ β Ti + γ Postt + δ (Ti ∗ Postt) + θ Xit + ϵit
▶ Es un panel, aśı que podemos incluir efectos fijos y temporales
▶ yit = δ (Ti ∗ Postt) + θ Xit + αi + βt + ϵit
12 / 40
DD múltiples peŕıodos
Figure 5: Gertler et al (2016)
13 / 40
Supuesto de identificación
▶ La validez de DD descansa en el supuesto identificación
▶ Supuesto de identificación de tendencias paralelas:
▶ Tratados y controles hubieran seguido la misma trayectoria de no existir el
tratamiento
▶ No hay otro evento contemporáneo que pueda explicar la diferencia entre tratados y
controles
▶ No observable, pero podemos presentar evidencia para defenderlo
▶ Tener en cuenta que siempre podemos estimar el coeficiente de DD, que sea
causal depende del supuesto de identificación
14 / 40
Tendencias paralelas
▶ Graficar la evolución de los controles y los tratados antes y después del
tratamiento
▶ Podemos encontrarnos con distintas situaciones:
▶ DD 2x2 iguales en nivel
▶ DD 2x2 diferencias en nivel
▶ Múltiples peŕıodos e iguales en nivel
▶ Múltiples peŕıodos y diferencias en nivel
▶ Tendencias no paralelas
▶ El diseño de DD es más fuerte si además de tendencias paralelas tenemos mismos
niveles previos al tratamiento (aunque no es necesario)
15 / 40
Tendencias no paralelas
Figure 6: Gertler et al (2016)
16 / 40
Tendencias paralelas
▶ ¿Qué ocurre cuando las tendencias no son paralelas?
▶ Tendencias paralelas con otras formas funcionales
▶ Si nuestro outcome ajusta mejor, por ejemplo, en forma logaŕıtmica, podemos usar
log(y) en lugar de y como dependiente
▶ Los gráficos ayudan y sirven para convencer, pero no son un test estad́ıstico
17 / 40
Tendencias paralelas
▶ Si tenemos igualdad en niveles, podemos estimar si el efecto del tratamiento antes
de que se asigne.
▶ Estimación por DD:
▶ yit = δ (Ti ∗Postt)+ θXit +αi + βt + ϵit , incluyendo peŕıodos pre y post tratamiento
▶ Estimación pre tratamiento:
▶ yit = δ Ti + θ Xit + αi + βt + ϵit , incluyendo el peŕıodo pre tratamiento
▶ ¿Por qué no usar (Ti ∗ Postt) en la última ecuación?
18 / 40
Checks de placebo
▶ La idea básica de los checks de placebo es mostrar que algo que no debeŕıa ocurrir
si nuestro supuesto identificación fuese cierto, de hecho, no ocurre
▶ Cambiar el momento del tratamiento por otros anteriores
▶ Estimar nuestro DD con Postt−k en lugar de Postt
▶ Tenemos que crear nuevas variables
▶ Usar otros grupos que no debeŕıan ser afectados por el tratamiento
▶ El salario ḿınimo no debeŕıa tener efectos sobre el empleo en sectores de altos
salarios
▶ Usar otros outcomes que no debeŕıan ser afectados por el tratamiento
19 / 40
Otros checks
▶ Comparación de observables entre tratados y controles
▶ First stages effects
▶ Usar distintas formas de medir las variables, sub-muestras, etc.
▶ Segunda parte del supuesto: ocurrió algo relevante en el momento que se asignó
el tratamiento?
20 / 40
Inferencia
▶ DD es un panel
▶ Valen las mismas conclusiones en términos de inferencia
▶ Cunningham (2021):
▶ Clusters a nivel de asignación del tratamiento
▶ Block bootstraping puede ser útil si tenemos muy pocos clusters (Card y Krueger,
1994)
▶ Agregar datos a dos peŕıodos tiene muchas otras implicancias, no recomendable a
menos que sea motivado por la pregunta de investigación
21 / 40
Stata
▶ En Stata necesitamos datos en panel
▶ xtset state year
▶ Una variable que tome el valor de 1 para todas las unidades tratadas (treated), y
otra que tome el valor de 1 a partir del momento en que se asigna el tratamiento
(treatment)
gen did = treated*treatment
▶ Estimamos el modelo con la interacción
▶ xtreg outcome did treated treatment control 1 control 2 i.year, fe
▶ donde did es el estimador de DD
22 / 40
Stata
▶ González (2022): efecto de la industria del fracking sobre la regulación
medioambiental
▶ En el año 2005 el fracking se vuelve económicamente viable
▶ Análisis de siete estados en USA que concentran más del 90% de la producción
▶ Unidad de análisis: zipcode/año
▶ Peŕıodo: 1990 - 2014
23 / 40
Stata
▶ Fracked : valor de 1 para todos los zipcodes que registran al menos un pozo de
fracking en toda la muestra
▶ Treatment: valor de 1 para todos los años desde 2005
▶ Did : el producto de ambas variables
▶ Empecemos con un gráfico:
▶ lgraph lnaction year, by(fracked) xline(2005)
24 / 40
Stata
Figure 7: González (2022)
25 / 40
Stata
▶ Para la estimación le avisamos a Stata que nuestros datos son paneles con xtset
▶ xtreg lnaction treatment fracked did i.year, fe robust
▶ El estimador de diferencias en diferencias es did
▶ Podemos hacer esto para distintas variables dependientes y meter todo en una
misma tabla con outreg2
26 / 40
Stata
Figure 8: González (2022)
27 / 40
Stata
▶ xtdidregress para regresiones DD en panel
▶ xtdidregress (y1 x1 x2) (did), group(group) time(time)
▶ Efectos fijos y temporales, errores estándar clustereados en group
▶ Tendencias paralelas:
▶ estat trendplot
▶ estat ptrends
28 / 40
Stata
29 / 40
Stata
30 / 40
Stata
31 / 40
Abdul-Razzak et al (2020)
▶ Consecuencias electorales del dinero en la poĺıtica
▶ Diferencias en diferencias usando el caso de Citizens United
▶ Elecciones estatales
▶ Bipartisan Campaign Finance Reform Act (2002) prohibe outside spending
▶ Citizens United (2010): Corte Suprema deja sin efecto las restricciones
32 / 40
Citizens United
Figure 9: Abdul-Razzak et al (2020)
33 / 40
Diferencias en diferencias
▶ Tratados (restricciones previas) vs controles (sin restricciones)
▶ Previos a CU, 23 estamos teńıan restricciones y 27 no
▶ Muestra de 48 estados entre 1990 a 2018
▶ Compararla trayectoria de ambos grupos antes y después de CU
34 / 40
Diferencias en diferencias
▶ RepVSst = β (BanStatei ∗ CinUnt) + αs + δt + ϵst
▶ s y t, estados y años, respectivamente
▶ RepVSst : % votos a Republicanos (otras medidas como ideoloǵıa o polarización)
▶ BanStatei : igual a 1 para estados eventualmente tratados
▶ CinUnt : igual a 1 para todos los años desde CU
▶ αs y δt : efectos fijos y temporales
▶ Errores estándar clusteareados a nivel estatal
35 / 40
Tendencias paralelas
Figure 10: Abdul-Razzak et al (2020)
36 / 40
Tendencias paralelas
Figure 11: Abdul-Razzak et al (2020)
37 / 40
Resultados principales
Figure 12: Abdul-Razzak et al (2020)
38 / 40
Otros resultados
▶ Otros eventos alrededor de CU
▶ Gran Recesión y presidencia de Obama
▶ Auge del Tea Party: controlar por asistentes a protestas del Tea Party
▶ REDMAP (estrategia estatal de Republicanos): controlar por gasto de REDMAP
▶ Red Wave y contribuciones de campaña: controlar por ĺımites electorales y
contribuciones de campaña
▶ Con mismo DD:
▶ Legislaturas estatales más conservadoras
▶ No encuentran efectos sobre polarización en las legislaturas estatales
▶ Mayores efectos en los estados donde las corporaciones están más alineadas con el
partido Republicano
39 / 40
Bibliograf́ıa
▶ Cunningham (2021) Cap. 9
▶ Galiani et al (2005)
40 / 40
	Introducción
	El método de diferencias en diferencias
	DD 2x2
	DD múltiples períodos
	Supuesto de identificación
	Inferencia
	Stata
	Abdul-Razzak et al (2020)
	Bibliografía