Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
ˇˇ Econometrı́a I EAE2510 Clase 17 Resultados potenciales Miriam Artiles Instituto de Economı́a Pontificia Universidad Católica de Chile Segundo Semestre 2021 Correlación versus causalidad • Hasta ahora, hemos interpretado β como diferencias en esperanzas condicionales • Esto nos ha permitido describir muchas situaciones empı́ricas ◦ ¿Ganan más los hombres que las mujeres después de controlar por sus diferencias en educación, experiencia, etc? ◦ ¿Reciben las personas con más educación mayores sueldos? • Pero, ¿son las relaciones estimadas causales? 1 / 14 Correlación versus causalidad • En economı́a muchas veces estamos interesados en estudiar el efecto de una polı́tica o un programa social sobre cierta variable de interés • El programa o polı́tica es lo que llamamos tratamiento (T ) • La variable de interés es el outcome o resultado (Y ) • Nos interesa calcular el impacto o efecto causal del tratamiento sobre el resultado • Ejemplos de tratamientos y resultados: ◦ Recibir un subsidio del gobierno y consumo, participación en programa de capacitación y empleo, etc 2 / 14 Correlación versus causalidad • Sabemos que β midel el efecto causal de T sobre Y cuando se cumple el supuesto de exogeneidad • Si variables que son relevantes para explicar Y no se incluyen en el modelo de regresión (están omitidas en el término de error u), entonces no se cumple E(ui|X) = 0 y, por lo tanto, β no tiene una interpretación causal • Intuición→ Concepto de contrafactual y resultados potenciales 3 / 14 Modelo de resultados potenciales Contrafactual • El concepto de contrafactual es útil para pensar en cuál hubiese sido el resultado (Y ) de la observación i en una situación diferente • Definimos la variable explicativa T como una dummy igual a 1 si la observación i recibió el tratamiento, 0 en otro caso • Contrafactual: cuál hubiese sido el resultado (Y ) del individuo i en el mismo momento del tiempo, pero en el caso hipotético de no haber participado en el programa o no haber recibido el tratamiento • Problema? ◦ No podemos calcular el impacto de un tratamiento para el mismo individuo i porque no podemos observar al mismo individuo en los dos estados (con y sin tratamiento) ◦ Los participantes no pueden ser simultáneamente no participantes! 4 / 14 Modelo de resultados potenciales • Define: ◦ Y T : outcome con tratamiento (situación laboral habiendo recibido capacitación) ◦ Y NT : outcome sin tratamiento (situación laboral sin capacitación) • Nos gustarı́a conocer el impacto causal de recibir el tratamiento Y Ti − Y NTi para cada individuo i • Sin embargo, nunca observamos ambos outcomes a la vez para el mismo individuo ◦ No es posible observar al mismo individuo en las dos situaciones (con y sin tratamiento) en el mismo momento del tiempo • ¿Qué podemos hacer para medir el impacto de haber recibido T? 5 / 14 ¿Cómo medir impacto? • El contrafactual individual es hipotético (nunca podremos observarlo). No es posible calcular el efecto causal individual porque no podemos observar al mismo individuo en los dos estados de participación al mismo tiempo • Entonces, ¿cómo medimos impacto? ◦ Es posible estimar el efecto promedio del tratamiento esperado para un individuo tomado al azar de la población de participantes y no participantes (Efecto Promedio del Tratamiento o Average Treatment Effect, ATE) ◦ En términos práctico, necesitamos “construir” un contrafactual ◦ Lo hacemos seleccionando a un grupo de personas que no recibieron T (no participaron en el programa). Este grupo se llama el grupo de control o el grupo de comparación ◦ El objetivo es seleccionar un grupo de personas que sean exactamente igual al grupo de tratados (participantes) en todas las caracterı́sticas que podamos imaginar, excepto en si reciben o no el tratamiento (programa) 6 / 14 ¿Cómo medir impacto? • Average Treatment Effect (efecto promedio en la muestra): ATE = E(Y T − Y NT ) = E(Y T )− E(Y NT ) • Nosotros observamos: E(Y T |T = 1)− E(Y NT |T = 0) • ¿Corresponde la diferencia de promedios entre grupos (tratados y no tratados) que observamos al impacto causal del tratamiento T? 7 / 14 ¿Cómo medir impacto? Sesgo de Selección • Supongamos que queremos calcular el impacto del tratamiento restando los promedios para cada grupo: E(Y T |T = 1)− E(Y NT |T = 0) • Sumando y restando E(Y NT |T = 1)− E(Y NT |T = 1) nos queda: E(Y T |T = 1)− E(Y NT |T = 0) + E(Y NT |T = 1)− E(Y NT |T = 1) • Reorganizando: E(Y T − Y NT |T = 1)︸ ︷︷ ︸ ATT +E(Y NT |T = 1)− E(Y NT |T = 0)︸ ︷︷ ︸ Sesgo de Selección • La diferencia observada se descompone en dos términos 8 / 14 ¿Cómo medir impacto? Sesgo de Selección • El primer término corresponde al Average Treatment on the Treated (efecto promedio entre los tratados): ATT = E(Y Ti − Y NTi |Ti = 1) ⇒ Para calcular ATT necesitamos saber lo que hubiese ocurrido si el individuo i tratado nunca hubiese recibido tratamiento (no se observa) • El segundo término es lo que llamamos sesgo de selección E(Y NT |T = 1)− E(Y NT |T = 0) ⇒ Este sesgo es distinto de cero si el resultado promedio esperado de los tratados en ausencia de tratamiento (no observable) es distinto que el resultado promedio de los no tratados ⇒ Por ejemplo, si las tasas de desempleo de los tratados en ausencia de capacitación son más altas ⇒ Si el grupo que recibe el tratamiento no es idéntico en todas las caracterı́sticas imaginables al grupo que no lo recibe, entonces habrá sesgo de selección (positivo o negativo) 9 / 14 ¿Cómo medir impacto? Sesgo de Selección • A priori, podemos pensar que las personas que son elegidas para recibir un programa o beneficio social tienen caracterı́sticas distintas a las personas que no fueron elegidas • ¿Ejemplos? 10 / 14 Aleatorización • La manera más natural de eliminar el sesgo de selección es a través de la asignación aleatoria del tratamiento • Una aleatorización correcta implica que un individuo que recibe tratamiento es, en promedio, igual (“idéntico”) a alguien que no lo recibe • En este caso E(Y NT |T = 1) = E(Y NT |T = 0) y no habrá sesgo de selección, pues se tendrá ATE = ATT y se habrá resuelto el problema de identificación • Pareciera ser entonces el contexto ideal para evaluar un tratamiento • Cada vez hay más evaluación de polı́ticas públicas (y de acción por firmas privadas) que se hacen usando experimentos aleatorios, pero no son siempre posibles... 11 / 14 Aleatorización ¿Importa añadir variables de control? • Si tenemos la suerte de tener una aleatorización que nos garantiza que no haya sesgo de selección, ¿importa agregar variables explicativas adicionales? • ¿Cuál será la correlación entre T y esas variables al ser T una variable aleatorizada? • Entonces, no tendremos ganancias en la reducción del sesgo incluyendo variables explicativas adicionales • No obstante, si incluimos variables que influyen Y (es decir, que son relevantes, sus βs no son 0), podemos aumentar la precisión del estimador (menor varianza) 12 / 14 ¿Y sin aleatorización? • ¿Qué pasa si no tenemos aleatorización? • Podemos hacer supuestos que nos permiten eliminar el sesgo de selección • Eso será lo que veremos en las futuras clases de esta parte del curso 13 / 14 Un ejemplo Una alarma para las casas • Queremos saber si tener una alarma en una casa reduce la incidencia de robo y sus consecuencias • El problema es que cada dueño de casa decide si pone o no una alarma • ¿En qé podrı́an diferir los que instalan una alarma en su casa y los que no lo hacen? • ¿Cómo serı́a el sesgo de selección? • ¿Qué pasarı́a entonces si comparamos la cantidad de robos en casas con y sin alarmas? ¿Qué nos dirı́a? 14 / 14
Compartir