Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Tópicos de Econoḿıa Aplicada Introducción 1 / 37 Presentación I La econoḿıa aplicada: utilización de teoŕıa y métodos para atacar un tema espećıfico, para brindar una recomendación o realizar un diseño de una poĺıtica. I Ante este objetivo no sirve sólo tener cualitativamente un efecto o un trade-off entre variables relevantes. Se trata de tener una idea cuantitativa de estos efectos (de tener la medida más adecuada posible de los efectos). I En las recomendaciones no sólo hace falta brindar “grandes lineamientos” sino concretar en los detalles de la implementación, sobre la base del análisis económico, los antecedentes, la experiencia y la experimentación. 2 / 37 Presentación “Propongo un nuevo método para la econoḿıa del desarrollo, un método que denomino “econoḿıa cĺınica” para subrayar las similitudes entre la buena econoḿıa del desarrollo y la buena medicina cĺınica. — Jeffrey Sachs, The end of poverty Enfrentando el reto de usar las herramientas económicas para brindar recomendaciones sobre poĺıticas, programas, proyectos sociales, se utilizan la teoŕıa económica, los datos y el análisis necesarios aplicados al caso. La econoḿıa aplicada adapta los métodos para el caso en cuestión. 1. una teoŕıa como gúıa 2. se aplica la teoŕıa a al caso particular 3. se contrasta con los hechos observados y se toman nuevos datos 4. si es necesario se modifican los detalles de la teoŕıa para incluir aspectos relevantes para este caso Si la aplicación es exitosa esta iteración converge 3 / 37 Presentación “El seguimiento y la evaluación son esenciales para el éxito del tratamiento.” — Jeffrey Sachs, The end of poverty La teoŕıa es importante, pero también la medición. Hace falta tener una cuantificación ex-ante de los mecanismos, un monitoreo ex-durante y una evaluación ex-post de los efectos. 1. hace falta ver la relevancia cuantitativa de cada efecto que surge de un modelo teórico 2. recurrimos a los datos, evaluando este efecto a partir de la mejor medición posible que sea implementable 3. es relevante evaluar los efectos de las poĺıticas cuantitativamente para realizar un seguimiento y para luego sacar conclusiones para futuros diseños de poĺıtica Si el proceso es exitoso lleva a una acumulación de conocimiento sobre qué poĺıticas son efectivas 4 / 37 Presentación “Once you hear the details of victory, it is hard to distinguish it from a defeat.” Jean-Paul Sartre Pero una vez que tenemos “la poĺıtica” hace falta concretar el bosquejo en una implementación concreta I los detalles exactos de implementación importan mucho I los modelos ayudan poco en esto; los antecedentes, la experiencia y la experimentación ayudan más Una propuesta de poĺıtica debe basarse en los antecedentes y evaluaciones de poĺıticas realizadas en el pasado As economists increasingly help governments design new policies and regulations, they take on an added responsibility to engage with the details of policy making and, in doing so, to adopt the mindset of a plumber. — Esther Duflo, 2017, The Economist as Plumber, AER 5 / 37 Presentación En la práctica hay fuertes restricciones poĺıticas en el proceso de diseño e implementación de la poĺıtica económica o programas públicos I el diseño de las organizaciones y competencias al interior del Estado influyen fuertemente en la posibilidad de implementar poĺıticas o realizar reformas I los incentivos poĺıticos y las capacidades de presión, lobby, protesta, etc. son parte de la preocupación del que diseña las poĺıticas I fuertes restricciones legales sobre lo que puede hacer el Estado 6 / 37 Presentación Entonces, la econoḿıa aplicada utiliza tanto teoŕıa y como datos. En las aplicaciones 1. se usan (o construyen?) las herramientas anaĺıticas con un objetivo concreto o una recomendación concreta. 2. luego mide resultados espećıficos de esa recomendación (para un seguimiento y para un aprendizaje) 3. luego intenta comprender los detalles que pueden mejorar el objetivo final de la intervención 7 / 37 Presentación En este curso vamos a 1. centrarnos en analizar desde un punto de vista teórico el mercado laboral y la distribución del ingreso 2. (+) utilizar datos que nos ayuden a comprender los problemas y medir los efectos 3. (=) comprender y utilizar métodos estad́ısticos y econométricos para vincular la teoŕıa con los datos, y concluir sobre cuestiones del mercado laboral y sus poĺıticas Para una panorámica del curso, ver Programa en el campus virtual. 8 / 37 Tabla de contenidos Por qué estudiar el mercado laboral? Las preguntas y el análisis emṕırico Descripción de variables y relaciones entre las variables Regresión Relación causal 9 / 37 Por qué estudiar econoḿıa laboral? Qué tiene de diferente el mercado laboral del mercado de trigo? El mercado laboral implica la intervención de una persona. Esto hace que haya muchos aspectos en juego, incluyendo el riesgo (f́ısico), aspectos morales (qué es aceptable). El mercado laboral requiere de los trabajadores capacidades, habilidades y de caracteŕısticas muy diśımiles. Los puestos de trabajo son también muy diferentes (conocimientos requeridos, ocupación, localización, horario, ambiente). Por ello, no es fácil encontrar un trabajador para un puesto 10 / 37 Por qué estudiar econoḿıa laboral? El mercado laboral está muy regulado. (Contrato indefinido, Salario ḿınimo, horas de trabajo, actividades por ocupación, etc.) Además, Most of us will allocate a substantial fraction of our time to the labor market. How we do in the labor market helps determine our wealth, the types of goods we can affort to consume, with whome we associate, where we vacation, which schools our children attend, and even the types of persons who find us attractive. As a result we are all eager to learn how the labor market works. Borjas, Labor Economics, Ch.1. El mercado de trabajo es importante para el problema individual (ocio-consumo), para la macro (desempleo), la productividad (asignación de factores) y el crecimiento (capital humano). 11 / 37 Por qué el mercado laboral? La econoḿıa laboral tiene caracteŕısticas particulares: I Mercados con fricciones I Fuerte vinculación con microdatos 12 / 37 El economista emṕırico El economista emṕırico busca contestar preguntas con los datos Las preguntas económicas pueden ser: I ¿Cuánto aumenta el ingreso el terminar la universidad en comparación con no terminarla? I ¿En qué medida afecta la indemnización por despido a la demanda de empleo? I ¿Cuál es el efecto del seguro de desempleo sobre los salarios? 13 / 37 El economista emṕırico: datos Para enfrentar estas preguntas debe utilizar datos de diferente tipo: I Corte transversal (cross-section), observaciones de individuos (personas, hogares, firmas, páıses) generalmente provenientes de una muestra aleatoria (o incluso de un censo) I Series de tiempo (time-series), observaciones de un individuo (persona, hogar, firma, páıs) a lo largo del tiempo I Longitudinales (panel data), en donde para un mismo individuo i hay disponibles varias observaciones t = 1, 2, ...,T , donde cada individuo puede ser una persona, un hogar, una firma, un páıs, y donde t es t́ıpicamente el tiempo (también pueden ser trabajadores, t, en firmas, i). En general los individuos i son una muestra aleatoria. 14 / 37 El economista emṕırico Ejemplo de encuesta: Encuesta Permanente de Hogares (EPH) Releva viviendas, hogares y personas en aglomerados urbanos de Argentina. Repite cada vivienda 4 trimestres (no consecutivos): corte transversal o micro datos de panel (corto). Si se construyen series de tiempo de variables agregadas (por ejemplo tasa de desempleo) por grupos (por ejemplo por ciudad) se pueden armar datos de panel (largos). La muestra de esta encuesta está diseñada para estimar la tasa de desempleo. Los hogares no tienen igual probabilidad de ser encuestados. Lavariable de ponderación es la cantidad de hogares que cada hogar encuestado representa en el universo (inversa de la probabilidad de ser encuestado). [http://www.indec.gov.ar/bases-de-datos.asp] Diseño de Registro y Estructura para las bases de microdatos Individual y Hogar Versión: Noviembre de 2009 Permanente de Hogares Encuesta [link al diseño de registro] [link] 15 / 37 http://www.indec.gov.ar/bases-de-datos.asp https://dl.dropboxusercontent.com/u/6851291/temp/1_EPH_disenoreg_09.pdf C:/Users/hruffo/Dropbox/DeUTDT/TEA/clases/slides/Otherslides/pdf/statass.pdf El economista emṕırico El economista emṕırico t́ıpitcamente tiene un modelo (teórico o no) del comportamiento de los agentes económicos Este es el modelo de comportamiento del universo Suponemos que los datos son una muestra t́ıpicamente aleatoria de este universo Trabajamos con el universo para comprender como realizar estimaciones y qué implican estas estimaciones Trabajamos con la muestra para implementar estos estimadores 16 / 37 Análisis emṕırico I Pregunta emṕırica: I ¿Aumenta el salario con un t́ıtulo universitario? La pregunta emṕırica es también ¿en cuánto? Una variable relevante de resultado, y , es el salario. Una caracteŕısticaes también el nivel educativo, x1, pero también otra serie de caracteŕısticas del individuo que pueden afectar al salario más allá de la educación, x2, x3, .. que pueden ser observables, y una serie de inobservables que se resumen en una variable, u. I Descripción: Una primera forma de explorar esta pregunta es hacer una descripción de estas variables y de sus relaciones. I (Más adelante veremos un modelo de la decisión de estudiar y de los efectos de la educación.) 17 / 37 Análisis emṕırico - Descripción de los datos Supongamos que x es una variable aleatoria. El valor xj es una realización de x . I La distribución de esta variable está caracterizada por la función de distribución acumulada F (x0) = Pr (x ≤ x0) que mide la probabilidad de que la realización de x sea menor o igual al valor x0. I Si la variable aleatoria es discreta, esta función de distribución se puede describir con la función de probabilidad fx (x0) = Pr (x = x0) . I Si la variable aleatoria es continua entonces Fx (b)− Fx (a) = ∫ b a fx (x) dx y en los puntos derivables, la derivada de la distribución acumulada es la densidad fx (x0) = dF (x) dx 18 / 37 Análisis emṕırico - Descripción de los datos: muestra Apliquemos estos conceptos a una muestra. EPH, ingresos individuales (en logaritmo), nivel educativo. En STATA abrimos la base [link]: . use Individual t414.dta, clear I La variable aleatoria nivel educativo es discreta. Podemos describir la proporción de la población que tiene cada nivel educativo I En STATA es tabular los datos (como es una encuesta con ponderadores los incluimos como fw) . tab nivel ed [fw=pondera] I Un histograma es una representación gráfica de esta distribución . hist nivel ed [fw=pondera], discrete width(1) start(1) I La variable logaritmo del ingreso es continua, se representa graficando percentiles. Genera la variable y calcula percentiles y grafica: . gen ling = log(p47t) . xtile px ling = ling, n(100) . twoway scatter px ling ling 19 / 37 https://dl.dropboxusercontent.com/u/6851291/temp/Individual_t104.dta Análisis emṕırico - Descripción de los datos I La esperanza (o media) de una variable discreta es E (X ) = ∑ j xj fX ( xj ) donde fX es la función de probabilidad y mide la proporción de observaciones en las que ocurre la realización xj . I La esperanza de una variable continua es E (X ) = ∫ ∞ −∞ xfX (x) dx o también puede escribirse E (X ) = ∫ ∞ −∞ xdFX (x) I En la muestra se computa un promedio x̄ = 1 n ∑ j xj I La EPH tiene ponderadores; es necesario ponderar cada observación. . mean p47 [pw=pondera] 20 / 37 Análisis emṕırico - Descripción de los datos I La varianza de una variable discreta es Var (X ) = ∑ j ( xj −E (X ) )2 fX ( xj ) I La varianza de una variable continua es Var (X ) = ∫ ∞ −∞ ( xj −E (X ) )2 fX ( xj ) dx I El desv́ıo es σ (X ) = √ Var (X ) I Skewness (asimetŕıa): S (X ) = 1 σ (X )3 ∑ j ( xj −E (X ) )3 fX ( xj ) I Curtosis (forma): K (X ) = 1 σ (X )4 ∑ j ( xj −E (X ) )4 fX ( xj ) En STATA: . sum p47t [fw=pondera], det 21 / 37 Nota aclaratoria: ponderación en STATA I Para ponderar en STATA (en una muestra con N observaciones, con variable de ponderación pondera con valores enteros) I [pweight=pondera] inversa de la probabilidad de que la observación sea incluida (STATA mantiene a N como numero de observaciones) . mean p47 [pw=pondera] Mean Number of obs = 32362 Mean Std. Err. [95% Conf. Interval] p47t 5234.901 47.01991 5142.741 - 5327.062 I [fweight=exp] cantidad de observaciones duplicadas (STATA considera que la cantidad de osbervaciones es ∑i ponderai ) . mean p47 [fw=pondera] Mean Number of obs = 14171408 Mean Std. Err. [95% Conf. Interval] p47t 5234.901 1.510543 5231.941 - 5237.862 I Regla: usar fw para medias y desv́ıos estándar; usar pw para error estándar; usar pw o no ponderar en regresiones 22 / 37 Análisis emṕırico - Descripción de los datos - Dos variables I Si X e Y son dos variables aleatorias no sólo se puede caracterizar cada una sino también su distribución conjunta. I Un indicador relevante aqúı es la covarianza: Cov (X ,Y ) = E ((X −E (X )) (Y −E (Y ))) = E (XY )−E (X )E (Y ) I En una muestra cxy = 1 n ∑ i (xi − x̄) (yi − ȳ) I La correlación es Corr (X ,Y ) = Cov (X ,Y ) σ (X ) σ (Y ) I En STATA . correlate ling aniosedu [fw=pondera] I Una propiedad importante Var (a+ bX + cY ) = b2Var (X ) + c2Var (Y ) + 2bcCov (X ,Y ) 23 / 37 Análisis emṕırico - Descripción de los datos - Esperanza condicional I Cuando tenemos dos variables también podemos computar una media condicional I Supongamos X es discreta: E (Y |X = x) = ∫ ∞ −∞ yfY |X (y |x) dy donde fY |X (y |x) = fX ,Y (x ,y ) fX (x) es la distribución de y condicionada en X = x . Importante: ∫ ∞ −∞ fY |X (y |x) = 1. I En una muestra es la media pero restringiendo la muestra a todas las observaciones con X = x I Por ejemplo, el log del ingreso promedio de los graduados universitarios . sum ling if nivel ed==6 [fw=pondera] I La distribución condicionada es la distribución del ingreso por educación (para los graduados universitarios) I Cuando la variable X es continua el concepto es idéntico pero en la implementación en una muestra se usan otros métodos (que veremos más adelante) 24 / 37 Análisis emṕırico - Descripción de los datos - Esperanza condicional I La esperanza condicionada puede verse como una función: Conditional Expectation Function (CEF) o función de esperanza condicionada µ(x) = E (Y |X = x) I La esperanza condicional nos ayuda a la comprensión y a la predicción. Veremos varios usos y propiedades. I La ley de esperanzas iteradas es útil E (Y ) = E (E (Y |X )) donde E (E (Y |X )) = ∫ E (Y |X ) fX (x) dx I En una muestra, el promedio total es igual que un promedio (ponderado) de un promedio para cada grupo (ejemplo ingreso por grupo) 25 / 37 Análisis emṕırico - Descripción de los datos - Esperanza condicional I Independencia: Dos variables y , x son independientes en media si E (y) = E (y |x) I Dos variables independientes en media serán incorrelacionadas cov(y , x) = 0. I Llamamos ortogonales a dos variables independientes en media: y ⊥ x I Independencia condicional. Ejemplo: salarios y conciencia ambiental estan correlacionados. Sin embargo, la relación es porque los más educados tienen mayor conciencia ambiental y más salarios. Controlando por educación, estas dos variables no correlacionan (salarios y conciencia ambiental son independientes, condicional en educación): y ⊥ x |z . 26 / 37 Análisis emṕırico - Descripción de los datos - Dos variables I La esperanza condicional puede ser aproximada por una recta. I Supongamos que es el caso y que Y = a+bX + U donde a y b son parámetros y U es una variable aleatoria. Entonces, E (Y |X ) = E (a+ bX + U |X ) = a+ bX + E (U |X ) I Cuando E (U |X ) = 0 entonces el CEF es lineal. 27 / 37 Regresión lineal. Cómo? Regresión y predicción en STATA: . regress p47t aniosedu [pw=pondera] . predict p47hat, xb Incluyendo controles . regress p47t aniosedu edad edad2 sexo 28 / 37 La estimación de relaciones causales Una segunda pregunta, mucho más avanzada y dif́ıcil, es la de la relación causal entre las variables de interés (salarios y educación, por ejemplo). ¿Qué relaciones u objetos son de interés? En general el objeto de interés es ∂E (y |X ) ∂x1 (si x es una variable continua) es decir, cuánto aumenta el resultado cuando cambia un input, sólo uno, dejando constante todas las demás variables, incluso los inobservables (en el ejemplo, cuánto aumenta el salario cuando aumenta la educación). Este efecto puede ser medido según las medias condicionadas o según una regresión. 29 / 37 Problema de variables omitidas Sin embargo, el resultado de una regresión lineal no necesariamente será un efecto causal. Supongamos que calculamos E (yi |xi1), a partir de los datos. Una de las formas de implementar esto es tener la media de los salarios según años de educación o también por nivel educativo (universitario incompleto, universitario completo). Si computamos β̂1 = E (yi |xi1 = UC )−E (yi |xi1 = UI ) podŕıamos tener un estimador del objeto de interés. Sin embargo, si y depende de muchas otras variables, por ejemplo x2 (educación del padre), y x2 cambia con la educación (la educación de un individuo se correlaciona con la educación de la siguiente generación) entonces la estimación del parámetro de interés estará sesgada. Lo importante es que la derivada de interés debe responder a la pregunta de: ¿cuál será el salario si un individuo pasa de no estudiar la universidad a terminar una carrera? Si todo el mayor salario de un individuo universitario viene porque su padre es universitario y esto le genera más contactos y oportunidades laborales entonces en realidad conviene que sólo los individuos con padres universitarios estudien! 30 / 37 Problema de variables omitidas Una analoǵıa matemática... si las variables fueran continuas podŕıamos asociarlo a medir un diferencial total en vez de una derivada parcial: y = g (x1, x2) Entonces, dy dx1 = ∂g (x1, x2) ∂x1 + ∂g (x1, x2) ∂x2 ∂x2 ∂x1 En este caso, el efecto que quisiéramos medir es el primer término ∂g (x1,x2) ∂x1 , dejando fijo el valor de x2, pero si tenemos variables omitidas y sólo observamos x1, vamos a calcular dy dx1 porque no vamos a poder separar el efecto indirecto de x1 a través de x2. 31 / 37 Problema de variables omitidas Supongamos que yi = β1xi1 + β2xi2 + ui , con u ortogonal a las x , pero también xi2 = δxi1 + ε icon ε i es ortogonal a ui . Supongamos que observamos yi , xi1 pero no x2, entonces la media condicionada es ∂E (yi |xi1) ∂xi1 = β1 + β2δ porque condicionamos sólo a lo observable. En el ejemplo anterior, β2 > 0 y δ > 0, por lo que hay un sesgo de estimar el coeficiente observando solamente x1 y este sesgo es a sobre-estimar el efecto de esta variable sobre y . Notar que si observamos tanto x1 como x2, condionamos sobre ambas variables y ∂E (yi |xi1, xi2) ∂xi1 = β1 porque E (xi2|xi1, xi2) = x2. 32 / 37 Supuestos ¿Qué tiene que ocurrir para que el coeficiente de la regresión sea el efecto causal? I Los inobservables deben ser independientes de la variable x1, E (ui |xi ) = 0, o también ui ⊥ xi (u y x son ortogonales). I Los inobservables son independientes e idénticamente distribuidos, ui ∼ iid . 33 / 37 Relación causal y métodos experimentales Puede ocurrir que (seŕıa ideal que) los datos de los individuos surgieran de una muestra especialmente diseñada para encontrar una causalidad. Este es el caso de los experimentos, por ejemplo de las ciencias médicas, pero también en econoḿıa. El ”tratamiento”se asigna aleatoriamente y un grupo es tratado y otro no tratado. Este segundo será el grupo de comparación o de control. Aqúı la relación causal, si se cumple con esta aleatoriedad, la muestra es grande y balanceada (todas las caracteŕısticas son comunes en los dos grupos), el efecto causal puede estimarse como: ∂E (yi |xi ) ∂xi1 = E (yi |xi1 = 1)−E (yi |xi1 = 0) porque todos los otros xi son comunes entre los dos grupos. 34 / 37 Resumen El estudio del mercado de trabajo, la desigualdad de ingresos y la pobreza usa intensivamente micro datos y busca resolver preguntas como “cuál es el efecto de alcanzar un nivel educativo sobre los ingresos laborales?” Primero I Describimos los datos con estad́ısticos como media y varianza I Estimamos la función de esperanzas condicionadas I Podemos considerar a la regresión como una aproximación lineal a esa función Pero como la pregunta es finalmente causal la vinculación entre ingresos y educación no es suficiente I Variables omitidas I Endogeneidad Idealmente estos problemas se resuelven con asignaciones aleatorias. Cuando esto no es posible necesitamos métodos para corregir la endogeneidad 35 / 37 Referencias Leer: Angrist & Pischke, ”Mostly Harmless Econometrics: An empiricit’s Companion”, Cap 1 36 / 37 Por qué estudiar el mercado laboral? Las preguntas y el análisis empírico Descripción de variables y relaciones entre las variables Regresión Relación causal
Compartir