Logo Studenta

Clase 2 - Regresión como esperanza condicionada

¡Este material tiene más páginas!

Vista previa del material en texto

ˇˇ
Econometrı́a I
EAE2510
Clase 2
Regresión como esperanza condicionada
Miriam Artiles
Instituto de Economı́a
Pontificia Universidad Católica de Chile
Segundo Semestre 2021
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
En la última clase
• La econometrı́a combina mátemáticas y métodos estadı́sticos con teorı́a
económica para testear hipótesis con datos reales
• Estudiamos:
◦ Pasos del análisis empı́rico en economı́a
◦ Tipos de datos según su estructura y naturaleza
• Noción de ceteris paribus
1 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
En la clase de hoy1
• Nos centramos en datos de sección cruzada o corte transversal
◦ Se observa a distintas entidades en un mismo punto del tiempo
◦ Cada observación (ej., persona) de identifica con el subı́ndice i
• Modelo de regresión lineal simple
◦ La función de esperanza condicionada
◦ La importancia del término de error o perturbación
◦ Interpretación de parámetros
• Introducción al modelo de regresión lineal múltiple
——–
1 Wooldridge, capı́tulo 2: El modelo de regresión simple
2 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Modelo de regresión lineal simple
Introducción al modelo
• El modelo de regresión lineal simple (MRL) se puede emplear para estudiar la
relación entre dos variables
• Considera dos variables x e y que caracterizan una población
• Queremos “explicar y en función de x” o “estudiar cómo varı́a y ante
variaciones en x”
• Ejemplo: y=salario, x=educación
• Al tratar de formular un modelo que explique y en términos de x debemos
afrontar varias cuestiones:
◦ ¿Cuál es la forma funcional de la relación entre y y x?
◦ ¿Cómo tenemos en cuenta otros factores que afectan a y además de x?
◦ ¿Estamos captando con nuestro modelo una relación ceteris paribus entre y y x?
3 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Modelo de regresión lineal simple
Introducción al modelo
• El modelo de regresión lineal simple (MRL) se puede emplear para estudiar la
relación entre dos variables
• Considera dos variables x e y que caracterizan una población
• Queremos “explicar y en función de x” o “estudiar cómo varı́a y ante
variaciones en x”
• Ejemplo: y=salario, x=educación
• Al tratar de formular un modelo que explique y en términos de x debemos
afrontar varias cuestiones:
◦ ¿Cuál es la forma funcional de la relación entre y y x?
◦ ¿Cómo tenemos en cuenta otros factores que afectan a y además de x?
◦ ¿Estamos captando con nuestro modelo una relación ceteris paribus entre y y x?
3 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Modelo de regresión lineal simple
• Con el modelo de regresión lineal simple (MRL) vamos a tratar de “explicar y
en función de x” atendiendo a las cuestiones anteriores
• Una ecuación lineal que relaciona las variables a nivel poblacional es:
y = β0 + β1x+ u (1)
• Donde,
◦ y: Variable dependiente, explicada, de respuesta, predicha, regresando
◦ x: Variable independiente, explicativa, de control, predictora, regresor
◦ β0, β1: parámetros poblacionales
− β0: intercepto o constante
− β1: pendiente
◦ u: término de error o perturbación, representa todos los factores no observables
(distintos de x) que influyen en y, componente aleatorio de y no explicado por
β0 + β1x
4 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Modelo de regresión lineal simple
• Con el modelo de regresión lineal simple (MRL) vamos a tratar de “explicar y
en función de x” atendiendo a las cuestiones anteriores
• Una ecuación lineal que relaciona las variables a nivel poblacional es:
y = β0 + β1x+ u (1)
• Donde,
◦ y: Variable dependiente, explicada, de respuesta, predicha, regresando
◦ x: Variable independiente, explicativa, de control, predictora, regresor
◦ β0, β1: parámetros poblacionales
− β0: intercepto o constante
− β1: pendiente
◦ u: término de error o perturbación, representa todos los factores no observables
(distintos de x) que influyen en y, componente aleatorio de y no explicado por
β0 + β1x
4 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Modelo de regresión lineal simple
Ejemplo
• Relación entre salario (y) y educación (x):
salario = β0 + β1educación + u
• El término de error u puede contener factores inobservables como:
◦ Experiencia laboral
◦ Antiguedad en la empresa
◦ Capacidad o habilidad innata
5 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Modelo de regresión lineal simple
La función de esperanza condicional (FEC)
• Vamos a definir la función de esperanza condicional (FEC) como la
esperanza de una variable y (o su media poblacional) cuando x está fijo.
FEC : E(y|x)
• Dado que x es una variable aleatoria, la FEC también es aleatoria
6 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Modelo de regresión lineal simple
La función de esperanza condicional (FEC)
• La función de esperanza condicional es una función lineal de x si E(u|x) = 0:
E(y|x) =E(β0 + β1x+ u|x)
=β0 + β1E(x|x) + E(u|x)
=β0 + β1x+ E(u|x)
• Si E(u|x) = 0, entonces E(y|x) = β0 + β1x
◦ En este caso, la FEC es lineal y coincide con la proyección lineal de y dado x
◦ La linealidad implica que por cada aumento de una unidad en x el valor esperado
de y se modifica en la cantidad β1:
β1 =
∆E(y|x)
∆x
7 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Modelo de regresión lineal simple
La función de esperanza condicional (FEC)
• La función de esperanza condicional es una función lineal de x si E(u|x) = 0:
E(y|x) =E(β0 + β1x+ u|x)
=β0 + β1E(x|x) + E(u|x)
=β0 + β1x+ E(u|x)
• Si E(u|x) = 0, entonces E(y|x) = β0 + β1x
◦ En este caso, la FEC es lineal y coincide con la proyección lineal de y dado x
◦ La linealidad implica que por cada aumento de una unidad en x el valor esperado
de y se modifica en la cantidad β1:
β1 =
∆E(y|x)
∆x
7 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Modelo de regresión lineal simple
Interpretación cetertis paribus
• Acabamos de ver que la pendiente β1 mide el cambio promedio en y ante un
cambio unitario en x cuando E(u|x) = 0
• Es decir, β1 midel el efecto causal de x sobre y cuando todos los factores en u
permanecen constantes (∆u = 0, ceteris paribus)
• Notar que cuando E(u|x) 6= 0, β1 no tiene una interpretación causal
• Por desgracia, en economı́a aplicada es muy difı́cil suponer que todos los
factores en u permanecen constantes, ¿por qué?
◦ A veces ignoramos la totalidad de factores pueden afectar a y, hay millones de
posibilidades en el mundo! (todos estos factores quedan ocultos en u)
◦ A veces cononemos algunas de las variables que podrı́an estar en u, pero es difı́cil
medirlas con datos para incluirlas en el modelo (ej., habilidad innata)
8 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Modelo de regresión lineal simple
Interpretación cetertis paribus
• Acabamos de ver que la pendiente β1 mide el cambio promedio en y ante un
cambio unitario en x cuando E(u|x) = 0
• Es decir, β1 midel el efecto causal de x sobre y cuando todos los factores en u
permanecen constantes (∆u = 0, ceteris paribus)
• Notar que cuando E(u|x) 6= 0, β1 no tiene una interpretación causal
• Por desgracia, en economı́a aplicada es muy difı́cil suponer que todos los
factores en u permanecen constantes, ¿por qué?
◦ A veces ignoramos la totalidad de factores pueden afectar a y, hay millones de
posibilidades en el mundo! (todos estos factores quedan ocultos en u)
◦ A veces cononemosalgunas de las variables que podrı́an estar en u, pero es difı́cil
medirlas con datos para incluirlas en el modelo (ej., habilidad innata)
8 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
MRL y la función de esperanza condicional (FEC)
Interpretación del intercepto
• Acabamos de ver que si E(u|x) = 0, entonces E(y|x) = β0 + β1x
• Por lo tanto, se tiene que E(y|x = 0) = β0 + β1(x = 0) = β0
• La constante β0 mide el valor promedio de y cuando x = 0
• En la práctica, la constante no tiene interpretación cuando x = 0 no es un
valor factible en la población
◦ Ejemplo: y = horas trabajadas, x = edad en una población de personas adultas
9 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Estimadores β̂
• Nuestro objetivo consiste en estimar los parámetros poblacionales
(desconocidos) β0 y β1 a partir de un conjunto de datos
• Necesitaremos una muestra de la población
• Supondremos que nuestros datos (yi, xi), con i = 1, ..., n, son una realización
de una muestra aleatoria de tamaño n obtenida de la población
• Para cada observación i puede escribirse
yi = β0 + β1xi + ui i = 1, ..., n
• Donde ui es el término del error de la observación i, contiene todos los demás
factores distintos de xi que afectan a yi
10 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
• En la próxima clase vamos a ver cómo podemos obtener estimadores β̂0, β̂1
de los parámetros poblacionales β0, β1
11 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Ejemplo
Interpretación β̂0, β̂1
Considera la siguiente estimación
ˆsalario = −0.90 + 0.54educ
donde el salario por hora se mide en $ y la educación en años
• El valor estimado de la pendiente (β1) indica que, en promedio, un año más de
educación incrementa el salario por hora en 54 centavos de dólar
• En cuanto a la constante, nuestra estimación dirı́a que a una persona sin
estudios (educ = 0) le corresponde un salario por hora promedio de -90
centavos de dólar, ¿tiene sentido esto?
• La muestra utilizada para estimar β0, β1 no tiene ninguna persona con menos
de 8 años de educación, por lo tanto β̂0 no tiene interpretación factible
• Para una persona con 8 años de educación el salario predicho o pronosticado
es de 3.42 $ por hora
12 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Ejemplo
Interpretación β̂0, β̂1
Considera la siguiente estimación
ˆsalario = −0.90 + 0.54educ
donde el salario por hora se mide en $ y la educación en años
• El valor estimado de la pendiente (β1) indica que, en promedio, un año más de
educación incrementa el salario por hora en 54 centavos de dólar
• En cuanto a la constante, nuestra estimación dirı́a que a una persona sin
estudios (educ = 0) le corresponde un salario por hora promedio de -90
centavos de dólar, ¿tiene sentido esto?
• La muestra utilizada para estimar β0, β1 no tiene ninguna persona con menos
de 8 años de educación, por lo tanto β̂0 no tiene interpretación factible
• Para una persona con 8 años de educación el salario predicho o pronosticado
es de 3.42 $ por hora
12 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Modelo de regresion lineal múltiple
• La mayorı́a de relaciones económicas involucran a más de dos variables
• Se pueden incluir múltiples variables en el lado derecho de la ecuación:
y = β0 + β1x1 + β2x2 + β3x3 + . . .+ βkxk + u
• Notar que el modelo de regresión lineal debe ser lineal en los coeficientes βj ,
no necesariamente en las variables xj . Por ejemplo:
salario = β0 + β1educ+ β2educ
2 + u
13 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Modelo de regresion lineal múltiple
• La mayorı́a de relaciones económicas involucran a más de dos variables
• Se pueden incluir múltiples variables en el lado derecho de la ecuación:
y = β0 + β1x1 + β2x2 + β3x3 + . . .+ βkxk + u
• Notar que el modelo de regresión lineal debe ser lineal en los coeficientes βj ,
no necesariamente en las variables xj . Por ejemplo:
salario = β0 + β1educ+ β2educ
2 + u
13 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
Modelo de regresion lineal múltiple
• Al igual que para el caso simple, βj representa el cambio promedio en y
debido a un cambio en xj cuando el resto de factores permanecen constantes
(ceteris paribus)
• Considere el modelo de regresión lineal múltiple
y = β0 + β1x1 + β2x2 + β3x3 . . .+ βkxk + u
• Entonces ∆y = βj∆xj (es decir, βj tiene una interpretación causal) solo si
∆x1 = 0, . . .∆xj−1 = 0,∆xj+1 = 0, . . .∆xk = 0,∆u = 0
14 / 15
Introducción Modelo de regresion lineal simple Modelo de regresion lineal múltiple Resumen
En la clase de hoy
• El MRL nos permite medir la esperanza condicional de y como función de x
• Asumimos linealidad en la relación entre y y x
• La interpretación de los parámetros β depende del supuesto sobre E(u|x)
• Si no es posible afirmar que el resto de factores que potencialmente pueden
afectar a y se mantienen constantes, no es posible una interpretación causal
• Podemos ampliar el MRL para incluir más variables explicativas x1, ..., xk en el
lado derecho de la ecuación
• A partir de la proxima clase vamos a discutir cómo obtener estimadores de los
parámetros poblacionales en el contexto del modelo de regresión
→ Ayudantı́a lunes 23: repaso de probabilidad, estadı́stica y álgebra lineal para
el control del lunes 30 de agosto
15 / 15
	Introducción
	Modelo de regresion lineal simple
	Modelo de regresion lineal múltiple
	Resumen

Continuar navegando