RESUMEN GERRING Y CHRISTENSON CAP 8

•

SIN SIGLA

elkun

25/6/2023

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Desarrollo

2348 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

RESUMEN GERRING Y CHRISTENSON CAP 8

Diseños observacionales con N grande
Hay muchos problemas inherentes al diseño experimental. Suele argumentarse que los experimentos tienen
más validez interna que los estudios no experimentales. Esto puede discutirse diciendo que los experimentos
son imposibles o que no tienen validez externa. Esto podría justificar la predominancia de los diseños
observaciones en la ciencia.
En este capítulo, Gerring y Christenson estudian los análisis de muestras grandes sin aleatorización (antes
vimos muestras chicas no aleatorias con estudio de casos). Hay 5 diseños clásicos: cross-section (CS), time-
series (TS), time-series cross-section (TSCS), regresión discontinua (RD) y variable instrumental (IV). Estos
términos están definidos por la variación observada en X, el factor causal de interés o el instrumento por el
cual el tratamiento es asignado (es importante tener en cuenta que la mayoría de estos términos también
tienen una definición más estrecha y técnica). La complejidad de estos métodos comparados con los
experimentales residen en que si no se puede manipular el tratamiento, se necesita tener un poco de
manipulación de datos ex post para poder llegar a resultados que puedan tomarse como evidencia de una
relación causal.
Cross-sectional study (CS) o estudio transversal
La variación en x es analizada a través de las unidades pero no a través del tiempo. En condiciones de
programas de participación voluntaria no puede hacerse una comparación entre el grupo de tratamiento y
grupo de control porque hay distintos motivos que pueden afectar los resultados. Por ejemplo; si para ver los
rendimientos de un programa de desempleo comparamos a la gente desempleada que participó con la gente
desempleada que no asistió midiendo sus ganancias, debemos tener en cuenta que estas pueden estar
afectadas por sus ganas de trabajar, que influyen en la probabilidad de que participen en estos talleres y en
su desempeño laboral. Por esto, los factores de fondo no son los mismos en los dos grupos así como el valor
esperado de Y con una X esperada no es el mismo entre los dos tampoco.
El confounder problemático en este caso es un confounder de causa común, que se llama así porque impacta
en el factor causal (X) y en el outcome (Y).

Hay distintas maneras de encarar este problema, el más simple y común es condicionar sobre Z (el confounder
potencial). O sea, en vez de mirar la relación entre Y en X solos, ahora vemos la relación X—>Y manteniendo
Z constante.
La forma más fácil de explicarlo es tomando una Z binaria (por ejemplo: tienes motivación o no). Ahora, podrías
armar una matriz 2x2 (Figura 8.3 del texto) y comparar los valores de Y con X=0 y X=1 en un escenario de Z=0
constante. Restando Yx=0 con Z=0 y Yx=1 con Z=0 obtenemos el efecto causal para todos los casos con Z=0.
Después, hacemos lo mismo con Z=1.
Nota: Lo descripto arriba es la forma manual de hacerlo, pero se puede reemplazar con estimadores (ej:
regresión o matching) que pueden considerar un amplio número de confounders.
Problemas potenciales;
• Debemos asumir que medimos bien el confounder, PERO hay algunos confounders difíciles de medir (Ej:
motivación en los desempleados, todo el mundo te va a decir que está motivado) porque mienten o
porque no saben medir lo que les están preguntando (que sería estar motivado?)
• Debemos asumir que consideramos todos los confounders PERO podríamos estar omitiendo variables;
pueden existir muchos confounders que no estamos considerando.
• Debemos asumir que todos los factores incluidos como control en el análisis son efectivamente
confounders PERO si no lo son podrían arruinar el análisis que venía bien. Podemos estar agregando
factores que son afectados por el tratamiento (un confounding factor es causalmente previo al
tratamiento) porque Z (el confounder post-tratamiento) bloquea el efecto causal de X en Y. Ej: medir
motivación luego de una charla motivacional.

• Otro problema es el “collider”. Una variable es un colisionador (collider) cuando está influenciada
causalmente por dos o más variables. EJ: la afiliación sindical (z) puede estar condicionada por participar
en un programa de entrenamiento laboral (X) y por las ganancias (Y), esto generaría una relación en la cual
dos acontecimientos no tienen conexión causal.

• Siguiendo el ejemplo anterior, si la entrada al programa es voluntaria, deberíamos esperar que el outcome
(ganancias) modifique la participación. EJ: si el programa es pago, los que ganan mas podrían participar
más. Hay una especie de circularidad entre la causa y el efecto que sesga el análisis.

Aclaro: por si pide en el parcial, el texto da un ejemplo de un estudio usando CS (como también de los otros
métodos que vamos a ver a continuación).
Time- Series Designs (TS)
Habiendo visto las complicaciones de CS con data no experimental, concluimos que es difícil compensar las
virtudes de la aleatorización en un tratamiento no aleatorio. Al final, es muy difícil establecer con seguridad
comparaciones causales entre el grupo de tratamiento y el de control.
Otra opción para enfrentar esto es el Time- Series Design, donde uno prescinde del grupo de control y se
enfoca enteramente en el grupo de tratamiento y lo compara a través del tiempo (antes y después del
tratamiento) para intentar observar relaciones causales. De esta manera, estaríamos pensando en condiciones
de tratamiento y control (más que en grupos); la condición pre-tratamiento es el control y la post-tratamiento
el grupo de tratamiento.
Hay tres tipos de time-series research design:
• El más simple tiene un solo tratamiento con pre y post-tests. Ej: medir las ganancias de un grupo de
desempleados que asisten a un taller de entrenamiento laboral antes y después de haber participado.
• El segundo tipo tiene un único tratamiento acompañado por múltiples pre- y post-tests. Esto se llama
interrupted time-series. Ej: medir las ganancias de un grupo de desempleados en intervalos mensuales
por muchos años anteriores y posteriores de participar en el taller de entrenamiento laboral.
• El tercer tipo involucra iteración (repetición) de un único tratamiento. Esto se conoce como repeated
observations design. Ej: observar un grupo de desempleados que van a uno o más de estos talleres por
muchas décadas, midiendo su ingreso cada año.
Estos tres tipos de diseños son similares pero el segundo y tercer tipo tienen algunas ventajas por sobre el
primero. Desafortunadamente, en TS también existen confounders (factores que se relacionan con el
tratamiento y el outcome).
• Ej: una subida del nivel de motivación a través del tiempo por el nacimiento de un hijo, esto motivaría a
la persona a
o unirse a un taller laboral
o renovar sus esfuerzos en conseguir trabajo.
Como resultado, tendríamos una tendencia en aumento a través del tiempo; el valor de Y con la misma X
no sería igual en T1 (tiempo 1) y T2.
Hay una tendencia en el tiempo muy común: regresión a la media, que consiste volver al estado normal de las
cosas. Ej: un desempleado encuentra empleo porque se puso a buscarlo después de que su cuenta de banco
esté en 0 (no por un programa de empleo). Hay una esperanza de poder ver el problema de las tendencias
preexistentes examinando una trend-line (aunque necesitas mucha información).
Time- Series Cross-Section Designs (TSCS)
Este diseño combina los dos anteriores haciendo combinaciones temporales y espaciales (entre unidades y a
través del tiempo). Típicamente involucra mediciones repetidas en una serie de unidades, observadas a través
del tiempo. Ej: observar individuos todos los años durante 20 años estableciendo un panel de 20 observaciones
a través del tiempo. Nota: si falta información para alguna unidad en algún momento, se genera un
“unbalanced” panel.
A veces las observaciones no son siempre sobre la misma unidad, sino sobreunidades elegidas aleatoriamente
de una población más grande; esto se llama pooled cross-section. Ej: una encuesta a 2000 individuos por 20
años en la que cada año se trabaja con distintos paneles.
El método diferencias-en-diferencias (DD) es una variedad de TSCS porque ve desea estimar el efecto causal
de un cambio en el outcome del grupo de tratamiento contrastado con el outcome en el grupo de control.
Una ventaja de este método es que en CS (cross-sectional) para hacer una inferencia causal necesitás que
todos los factores que puedan impactar en el outcome sean iguales en los grupos de tratamiento y control. En
DD, necesitás que los “changing background factors” sean iguales en promedio, en los dos grupos (algo más
fácil de satisfacer porque suponemos que en un período corto de tiempo los factores cambian de manera
lenta).
El diseño DD es mas robusto que CS o TS, los factores históricos no son problemáticos siempre que afecten de
igual manera a los grupos de control y tratamiento. Los confounders circulares son menos problemáticos
porque es menos probable que afecten a Y en los dos grupos. Aunque los mechanismic confounders podrían
persistir, aunque como el número de confounders es mucho más chico en DD que en otros diseños, es menos
probable confundirse.
Crítica a TSCS: como el tratamiento no es asignado aleatoriamente, uno no podría esperar que el grupo de
tratamiento y el de control sean iguales en las características que son relevantes para el outcome. Si uno
escoge en que grupo estar, no podemos esperar que los miembros de los dos grupos tengan respuestas con
tendencias iguales; los que eligen ser parte del tratamiento deberían reaccionar de manera más positiva. De
esto se desprende que un efecto causal calculado con TSCS es generalmente mejor comprendido como un
efecto promedio para el tratamiento más que un efecto promedio para el tratamiento y el control.
Regresión discontinua (RD)
Un grupo recibe el tratamiento y otro conforma un control y post-test se mide el outcome de interés. Se
establece un criterio de asignación de tratamiento con un punto de corte que separa las unidades tratadas de
las no tratadas y se estudia las unidades cercanas a ese punto; no debería haber diferencias sustantivas entre
ellas. Este es uno de los diseños observaciones que más se acerca a un diseño aleatorio (ej: experimentos).
Debilidades:
1. el punto de corte no es rígidamente observado si la aceptación a participar depende de un jurado
2. si los sujetos conocen el punto de corte, pueden querer pasarse de un lado a otro según les sea
conveniente
3. tiene que haber suficientes unidades sobre y bajo del punto de corte o alternativamente tenés que confiar
mucho en las covariables utilizadas para controlar las diferencias
4. La generalidad del estudio queda limitada porque estudia mucho las unidades cercanas al corte, lo cual
excluye a las de los extremos
Variable instrumental (IV) (según Gervasoni es secundario)
Hemos visto que asignar un tratamiento causal no aleatorio abre la puerta a la aparición de confoundings. Una
solución parcial aparecería si al menos un factor influenciando la asignación al tratamiento no tiene
confoudings. Este instrumento te da la oportunidad de hacer un análisis en dos escenarios, utilizando un
diseño VI. Este diseño se basa entonces en un factor que influencia la asignación al tratamiento pero no
influencia al outcome.
Uno usa un instrumento (Q) para establecer el valor esperado del factor causal de interés (X) que no tiene
confoundings factors (Z). Uno examina entonces la covariación entre X e Y controlando si aparecen nuevos
confounders para medir.

Debilidades:
1. Q puede tener un efecto en el outcome Y más que a través de X
2. El LATE (local average treatment effect) aparece cuando las unidades se ven influenciadas a participar en
el tratamiento por el instrumento; es muy dificil saber cuando sucede esto.