Logo Studenta

Clase 17 - Resultados potenciales

¡Este material tiene más páginas!

Vista previa del material en texto

ˇˇ
Econometrı́a I
EAE2510
Clase 17
Resultados potenciales
Miriam Artiles
Instituto de Economı́a
Pontificia Universidad Católica de Chile
Segundo Semestre 2021
Correlación versus causalidad
• Hasta ahora, hemos interpretado β como diferencias en esperanzas
condicionales
• Esto nos ha permitido describir muchas situaciones empı́ricas
◦ ¿Ganan más los hombres que las mujeres después de controlar por sus diferencias
en educación, experiencia, etc?
◦ ¿Reciben las personas con más educación mayores sueldos?
• Pero, ¿son las relaciones estimadas causales?
1 / 14
Correlación versus causalidad
• En economı́a muchas veces estamos interesados en estudiar el efecto de una
polı́tica o un programa social sobre cierta variable de interés
• El programa o polı́tica es lo que llamamos tratamiento (T )
• La variable de interés es el outcome o resultado (Y )
• Nos interesa calcular el impacto o efecto causal del tratamiento sobre el
resultado
• Ejemplos de tratamientos y resultados:
◦ Recibir un subsidio del gobierno y consumo, participación en programa de
capacitación y empleo, etc
2 / 14
Correlación versus causalidad
• Sabemos que β midel el efecto causal de T sobre Y cuando se cumple el
supuesto de exogeneidad
• Si variables que son relevantes para explicar Y no se incluyen en el modelo de
regresión (están omitidas en el término de error u), entonces no se cumple
E(ui|X) = 0 y, por lo tanto, β no tiene una interpretación causal
• Intuición→ Concepto de contrafactual y resultados potenciales
3 / 14
Modelo de resultados potenciales
Contrafactual
• El concepto de contrafactual es útil para pensar en cuál hubiese sido el
resultado (Y ) de la observación i en una situación diferente
• Definimos la variable explicativa T como una dummy igual a 1 si la observación
i recibió el tratamiento, 0 en otro caso
• Contrafactual: cuál hubiese sido el resultado (Y ) del individuo i en el mismo
momento del tiempo, pero en el caso hipotético de no haber participado en el
programa o no haber recibido el tratamiento
• Problema?
◦ No podemos calcular el impacto de un tratamiento para el mismo individuo i porque
no podemos observar al mismo individuo en los dos estados (con y sin tratamiento)
◦ Los participantes no pueden ser simultáneamente no participantes!
4 / 14
Modelo de resultados potenciales
• Define:
◦ Y T : outcome con tratamiento (situación laboral habiendo recibido capacitación)
◦ Y NT : outcome sin tratamiento (situación laboral sin capacitación)
• Nos gustarı́a conocer el impacto causal de recibir el tratamiento Y Ti − Y NTi
para cada individuo i
• Sin embargo, nunca observamos ambos outcomes a la vez para el mismo
individuo
◦ No es posible observar al mismo individuo en las dos situaciones (con y sin
tratamiento) en el mismo momento del tiempo
• ¿Qué podemos hacer para medir el impacto de haber recibido T?
5 / 14
¿Cómo medir impacto?
• El contrafactual individual es hipotético (nunca podremos observarlo). No es
posible calcular el efecto causal individual porque no podemos observar al
mismo individuo en los dos estados de participación al mismo tiempo
• Entonces, ¿cómo medimos impacto?
◦ Es posible estimar el efecto promedio del tratamiento esperado para un individuo
tomado al azar de la población de participantes y no participantes (Efecto Promedio
del Tratamiento o Average Treatment Effect, ATE)
◦ En términos práctico, necesitamos “construir” un contrafactual
◦ Lo hacemos seleccionando a un grupo de personas que no recibieron T (no
participaron en el programa). Este grupo se llama el grupo de control o el grupo de
comparación
◦ El objetivo es seleccionar un grupo de personas que sean exactamente igual al
grupo de tratados (participantes) en todas las caracterı́sticas que podamos
imaginar, excepto en si reciben o no el tratamiento (programa)
6 / 14
¿Cómo medir impacto?
• Average Treatment Effect (efecto promedio en la muestra):
ATE = E(Y T − Y NT ) = E(Y T )− E(Y NT )
• Nosotros observamos:
E(Y T |T = 1)− E(Y NT |T = 0)
• ¿Corresponde la diferencia de promedios entre grupos (tratados y no tratados)
que observamos al impacto causal del tratamiento T?
7 / 14
¿Cómo medir impacto?
Sesgo de Selección
• Supongamos que queremos calcular el impacto del tratamiento restando los
promedios para cada grupo:
E(Y T |T = 1)− E(Y NT |T = 0)
• Sumando y restando E(Y NT |T = 1)− E(Y NT |T = 1) nos queda:
E(Y T |T = 1)− E(Y NT |T = 0) + E(Y NT |T = 1)− E(Y NT |T = 1)
• Reorganizando:
E(Y T − Y NT |T = 1)︸ ︷︷ ︸
ATT
+E(Y NT |T = 1)− E(Y NT |T = 0)︸ ︷︷ ︸
Sesgo de Selección
• La diferencia observada se descompone en dos términos
8 / 14
¿Cómo medir impacto?
Sesgo de Selección
• El primer término corresponde al Average Treatment on the Treated (efecto
promedio entre los tratados):
ATT = E(Y Ti − Y NTi |Ti = 1)
⇒ Para calcular ATT necesitamos saber lo que hubiese ocurrido si el individuo i
tratado nunca hubiese recibido tratamiento (no se observa)
• El segundo término es lo que llamamos sesgo de selección
E(Y NT |T = 1)− E(Y NT |T = 0)
⇒ Este sesgo es distinto de cero si el resultado promedio esperado de los
tratados en ausencia de tratamiento (no observable) es distinto que el
resultado promedio de los no tratados
⇒ Por ejemplo, si las tasas de desempleo de los tratados en ausencia de
capacitación son más altas
⇒ Si el grupo que recibe el tratamiento no es idéntico en todas las caracterı́sticas
imaginables al grupo que no lo recibe, entonces habrá sesgo de selección
(positivo o negativo)
9 / 14
¿Cómo medir impacto?
Sesgo de Selección
• A priori, podemos pensar que las personas que son elegidas para recibir un
programa o beneficio social tienen caracterı́sticas distintas a las personas que
no fueron elegidas
• ¿Ejemplos?
10 / 14
Aleatorización
• La manera más natural de eliminar el sesgo de selección es a través de la
asignación aleatoria del tratamiento
• Una aleatorización correcta implica que un individuo que recibe tratamiento es,
en promedio, igual (“idéntico”) a alguien que no lo recibe
• En este caso E(Y NT |T = 1) = E(Y NT |T = 0) y no habrá sesgo de
selección, pues se tendrá ATE = ATT y se habrá resuelto el problema de
identificación
• Pareciera ser entonces el contexto ideal para evaluar un tratamiento
• Cada vez hay más evaluación de polı́ticas públicas (y de acción por firmas
privadas) que se hacen usando experimentos aleatorios, pero no son siempre
posibles...
11 / 14
Aleatorización
¿Importa añadir variables de control?
• Si tenemos la suerte de tener una aleatorización que nos garantiza que no
haya sesgo de selección, ¿importa agregar variables explicativas adicionales?
• ¿Cuál será la correlación entre T y esas variables al ser T una variable
aleatorizada?
• Entonces, no tendremos ganancias en la reducción del sesgo incluyendo
variables explicativas adicionales
• No obstante, si incluimos variables que influyen Y (es decir, que son
relevantes, sus βs no son 0), podemos aumentar la precisión del estimador
(menor varianza)
12 / 14
¿Y sin aleatorización?
• ¿Qué pasa si no tenemos aleatorización?
• Podemos hacer supuestos que nos permiten eliminar el sesgo de selección
• Eso será lo que veremos en las futuras clases de esta parte del curso
13 / 14
Un ejemplo
Una alarma para las casas
• Queremos saber si tener una alarma en una casa reduce la incidencia de robo
y sus consecuencias
• El problema es que cada dueño de casa decide si pone o no una alarma
• ¿En qé podrı́an diferir los que instalan una alarma en su casa y los que no lo
hacen?
• ¿Cómo serı́a el sesgo de selección?
• ¿Qué pasarı́a entonces si comparamos la cantidad de robos en casas con y
sin alarmas? ¿Qué nos dirı́a?
14 / 14

Continuar navegando