Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
ˇˇ Econometrı́a I EAE2510 Clase 2 Regresión como esperanza condicionada Miriam Artiles Instituto de Economı́a Pontificia Universidad Católica de Chile Segundo Semestre 2021 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen En la última clase • La econometrı́a combina mátemáticas y métodos estadı́sticos con teorı́a económica para testear hipótesis con datos reales • Estudiamos: ◦ Pasos del análisis empı́rico en economı́a ◦ Tipos de datos según su estructura y naturaleza • Noción de ceteris paribus 1 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen En la clase de hoy1 • Nos centramos en datos de sección cruzada o corte transversal ◦ Se observa a distintas entidades en un mismo punto del tiempo ◦ Cada observación (ej., persona) de identifica con el subı́ndice i • Modelo de regresión lineal simple ◦ La función de esperanza condicionada ◦ La importancia del término de error o perturbación ◦ Interpretación de parámetros • Introducción al modelo de regresión lineal múltiple ——– 1 Wooldridge, capı́tulo 2: El modelo de regresión simple 2 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Modelo de regresión lineal simple Introducción al modelo • El modelo de regresión lineal simple (MRL) se puede emplear para estudiar la relación entre dos variables • Considera dos variables x e y que caracterizan una población • Queremos “explicar y en función de x” o “estudiar cómo varı́a y ante variaciones en x” • Ejemplo: y=salario, x=educación • Al tratar de formular un modelo que explique y en términos de x debemos afrontar varias cuestiones: ◦ ¿Cuál es la forma funcional de la relación entre y y x? ◦ ¿Cómo tenemos en cuenta otros factores que afectan a y además de x? ◦ ¿Estamos captando con nuestro modelo una relación ceteris paribus entre y y x? 3 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Modelo de regresión lineal simple Introducción al modelo • El modelo de regresión lineal simple (MRL) se puede emplear para estudiar la relación entre dos variables • Considera dos variables x e y que caracterizan una población • Queremos “explicar y en función de x” o “estudiar cómo varı́a y ante variaciones en x” • Ejemplo: y=salario, x=educación • Al tratar de formular un modelo que explique y en términos de x debemos afrontar varias cuestiones: ◦ ¿Cuál es la forma funcional de la relación entre y y x? ◦ ¿Cómo tenemos en cuenta otros factores que afectan a y además de x? ◦ ¿Estamos captando con nuestro modelo una relación ceteris paribus entre y y x? 3 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Modelo de regresión lineal simple • Con el modelo de regresión lineal simple (MRL) vamos a tratar de “explicar y en función de x” atendiendo a las cuestiones anteriores • Una ecuación lineal que relaciona las variables a nivel poblacional es: y = β0 + β1x+ u (1) • Donde, ◦ y: Variable dependiente, explicada, de respuesta, predicha, regresando ◦ x: Variable independiente, explicativa, de control, predictora, regresor ◦ β0, β1: parámetros poblacionales − β0: intercepto o constante − β1: pendiente ◦ u: término de error o perturbación, representa todos los factores no observables (distintos de x) que influyen en y, componente aleatorio de y no explicado por β0 + β1x 4 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Modelo de regresión lineal simple • Con el modelo de regresión lineal simple (MRL) vamos a tratar de “explicar y en función de x” atendiendo a las cuestiones anteriores • Una ecuación lineal que relaciona las variables a nivel poblacional es: y = β0 + β1x+ u (1) • Donde, ◦ y: Variable dependiente, explicada, de respuesta, predicha, regresando ◦ x: Variable independiente, explicativa, de control, predictora, regresor ◦ β0, β1: parámetros poblacionales − β0: intercepto o constante − β1: pendiente ◦ u: término de error o perturbación, representa todos los factores no observables (distintos de x) que influyen en y, componente aleatorio de y no explicado por β0 + β1x 4 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Modelo de regresión lineal simple Ejemplo • Relación entre salario (y) y educación (x): salario = β0 + β1educación + u • El término de error u puede contener factores inobservables como: ◦ Experiencia laboral ◦ Antiguedad en la empresa ◦ Capacidad o habilidad innata 5 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Modelo de regresión lineal simple La función de esperanza condicional (FEC) • Vamos a definir la función de esperanza condicional (FEC) como la esperanza de una variable y (o su media poblacional) cuando x está fijo. FEC : E(y|x) • Dado que x es una variable aleatoria, la FEC también es aleatoria 6 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Modelo de regresión lineal simple La función de esperanza condicional (FEC) • La función de esperanza condicional es una función lineal de x si E(u|x) = 0: E(y|x) =E(β0 + β1x+ u|x) =β0 + β1E(x|x) + E(u|x) =β0 + β1x+ E(u|x) • Si E(u|x) = 0, entonces E(y|x) = β0 + β1x ◦ En este caso, la FEC es lineal y coincide con la proyección lineal de y dado x ◦ La linealidad implica que por cada aumento de una unidad en x el valor esperado de y se modifica en la cantidad β1: β1 = ∆E(y|x) ∆x 7 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Modelo de regresión lineal simple La función de esperanza condicional (FEC) • La función de esperanza condicional es una función lineal de x si E(u|x) = 0: E(y|x) =E(β0 + β1x+ u|x) =β0 + β1E(x|x) + E(u|x) =β0 + β1x+ E(u|x) • Si E(u|x) = 0, entonces E(y|x) = β0 + β1x ◦ En este caso, la FEC es lineal y coincide con la proyección lineal de y dado x ◦ La linealidad implica que por cada aumento de una unidad en x el valor esperado de y se modifica en la cantidad β1: β1 = ∆E(y|x) ∆x 7 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Modelo de regresión lineal simple Interpretación cetertis paribus • Acabamos de ver que la pendiente β1 mide el cambio promedio en y ante un cambio unitario en x cuando E(u|x) = 0 • Es decir, β1 midel el efecto causal de x sobre y cuando todos los factores en u permanecen constantes (∆u = 0, ceteris paribus) • Notar que cuando E(u|x) 6= 0, β1 no tiene una interpretación causal • Por desgracia, en economı́a aplicada es muy difı́cil suponer que todos los factores en u permanecen constantes, ¿por qué? ◦ A veces ignoramos la totalidad de factores pueden afectar a y, hay millones de posibilidades en el mundo! (todos estos factores quedan ocultos en u) ◦ A veces cononemos algunas de las variables que podrı́an estar en u, pero es difı́cil medirlas con datos para incluirlas en el modelo (ej., habilidad innata) 8 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Modelo de regresión lineal simple Interpretación cetertis paribus • Acabamos de ver que la pendiente β1 mide el cambio promedio en y ante un cambio unitario en x cuando E(u|x) = 0 • Es decir, β1 midel el efecto causal de x sobre y cuando todos los factores en u permanecen constantes (∆u = 0, ceteris paribus) • Notar que cuando E(u|x) 6= 0, β1 no tiene una interpretación causal • Por desgracia, en economı́a aplicada es muy difı́cil suponer que todos los factores en u permanecen constantes, ¿por qué? ◦ A veces ignoramos la totalidad de factores pueden afectar a y, hay millones de posibilidades en el mundo! (todos estos factores quedan ocultos en u) ◦ A veces cononemosalgunas de las variables que podrı́an estar en u, pero es difı́cil medirlas con datos para incluirlas en el modelo (ej., habilidad innata) 8 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen MRL y la función de esperanza condicional (FEC) Interpretación del intercepto • Acabamos de ver que si E(u|x) = 0, entonces E(y|x) = β0 + β1x • Por lo tanto, se tiene que E(y|x = 0) = β0 + β1(x = 0) = β0 • La constante β0 mide el valor promedio de y cuando x = 0 • En la práctica, la constante no tiene interpretación cuando x = 0 no es un valor factible en la población ◦ Ejemplo: y = horas trabajadas, x = edad en una población de personas adultas 9 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Estimadores β̂ • Nuestro objetivo consiste en estimar los parámetros poblacionales (desconocidos) β0 y β1 a partir de un conjunto de datos • Necesitaremos una muestra de la población • Supondremos que nuestros datos (yi, xi), con i = 1, ..., n, son una realización de una muestra aleatoria de tamaño n obtenida de la población • Para cada observación i puede escribirse yi = β0 + β1xi + ui i = 1, ..., n • Donde ui es el término del error de la observación i, contiene todos los demás factores distintos de xi que afectan a yi 10 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen • En la próxima clase vamos a ver cómo podemos obtener estimadores β̂0, β̂1 de los parámetros poblacionales β0, β1 11 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Ejemplo Interpretación β̂0, β̂1 Considera la siguiente estimación ˆsalario = −0.90 + 0.54educ donde el salario por hora se mide en $ y la educación en años • El valor estimado de la pendiente (β1) indica que, en promedio, un año más de educación incrementa el salario por hora en 54 centavos de dólar • En cuanto a la constante, nuestra estimación dirı́a que a una persona sin estudios (educ = 0) le corresponde un salario por hora promedio de -90 centavos de dólar, ¿tiene sentido esto? • La muestra utilizada para estimar β0, β1 no tiene ninguna persona con menos de 8 años de educación, por lo tanto β̂0 no tiene interpretación factible • Para una persona con 8 años de educación el salario predicho o pronosticado es de 3.42 $ por hora 12 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Ejemplo Interpretación β̂0, β̂1 Considera la siguiente estimación ˆsalario = −0.90 + 0.54educ donde el salario por hora se mide en $ y la educación en años • El valor estimado de la pendiente (β1) indica que, en promedio, un año más de educación incrementa el salario por hora en 54 centavos de dólar • En cuanto a la constante, nuestra estimación dirı́a que a una persona sin estudios (educ = 0) le corresponde un salario por hora promedio de -90 centavos de dólar, ¿tiene sentido esto? • La muestra utilizada para estimar β0, β1 no tiene ninguna persona con menos de 8 años de educación, por lo tanto β̂0 no tiene interpretación factible • Para una persona con 8 años de educación el salario predicho o pronosticado es de 3.42 $ por hora 12 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Modelo de regresion lineal múltiple • La mayorı́a de relaciones económicas involucran a más de dos variables • Se pueden incluir múltiples variables en el lado derecho de la ecuación: y = β0 + β1x1 + β2x2 + β3x3 + . . .+ βkxk + u • Notar que el modelo de regresión lineal debe ser lineal en los coeficientes βj , no necesariamente en las variables xj . Por ejemplo: salario = β0 + β1educ+ β2educ 2 + u 13 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Modelo de regresion lineal múltiple • La mayorı́a de relaciones económicas involucran a más de dos variables • Se pueden incluir múltiples variables en el lado derecho de la ecuación: y = β0 + β1x1 + β2x2 + β3x3 + . . .+ βkxk + u • Notar que el modelo de regresión lineal debe ser lineal en los coeficientes βj , no necesariamente en las variables xj . Por ejemplo: salario = β0 + β1educ+ β2educ 2 + u 13 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen Modelo de regresion lineal múltiple • Al igual que para el caso simple, βj representa el cambio promedio en y debido a un cambio en xj cuando el resto de factores permanecen constantes (ceteris paribus) • Considere el modelo de regresión lineal múltiple y = β0 + β1x1 + β2x2 + β3x3 . . .+ βkxk + u • Entonces ∆y = βj∆xj (es decir, βj tiene una interpretación causal) solo si ∆x1 = 0, . . .∆xj−1 = 0,∆xj+1 = 0, . . .∆xk = 0,∆u = 0 14 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen En la clase de hoy • El MRL nos permite medir la esperanza condicional de y como función de x • Asumimos linealidad en la relación entre y y x • La interpretación de los parámetros β depende del supuesto sobre E(u|x) • Si no es posible afirmar que el resto de factores que potencialmente pueden afectar a y se mantienen constantes, no es posible una interpretación causal • Podemos ampliar el MRL para incluir más variables explicativas x1, ..., xk en el lado derecho de la ecuación • A partir de la proxima clase vamos a discutir cómo obtener estimadores de los parámetros poblacionales en el contexto del modelo de regresión → Ayudantı́a lunes 23: repaso de probabilidad, estadı́stica y álgebra lineal para el control del lunes 30 de agosto 15 / 15 Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Compartir