Logo Studenta

econometria191_clase03_mrl_intro

¡Este material tiene más páginas!

Vista previa del material en texto

Econometŕıa I – EAE-250A
Introducción al Modelo de Regresión Lineal
Jaime Casassus
Instituto de Econoḿıa
Pontificia Universidad Católica de Chile
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Tabla de Contenidos
1 Modelo de regresión lineal simple
2 Modelo de regresión lineal múltiple
3 Estimadores MCO
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Modelo de regresión lineal simple
• Dadas dos variables x e y que caracterizan una población, interesa explicar y
en función de x o bien estudiar cómo vaŕıa y con los cambios de x .
• Una ecuación que relaciona las variables a nivel poblacional es:
y = β0 + β1x + u (1)
• La variable u, denominada término de error o perturbación de la relación,
representa los factores no-observables que influyen en y .
• El coeficiente β0 se denomina intercepto y permite suponer que E (u) = 0.
• β1 captura el efecto de x en y .
• La relación (1) se conoce como modelo de regresión lineal simple.
• Por ejemplo, un modelo que relaciona el salario de una persona con su
educación:
salario = β0 + β1educacion + u
¿Qué factores pueden estar incluidos en u?
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Ceteris paribus
• Un supuesto fundamental en esta teoŕıa, que permite la interpretación
ceteris paribus del coeficiente β1 es
E (u|x) = E (u)
• Esta premisa afirma que para cualquier valor de x , los valores
inobservables promedio son los mismos, y por lo tanto son iguales al
promedio de u en toda la población.
• En el ejemplo, esto implica que la capacidad promedio de los
trabajadores con 8 años de escolaridad (educación básica) debe ser la
misma que la capacidad promedio de los trabajadores con 15 años de
escolaridad (educación superior).
• ¿Es razonable este supuesto?
• Recuerde que: E (u|x) = E (u)⇒ Cov(x , u) = 0.
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Ceteris paribus (cont.)
• El supuesto E (u|x) = E (u) permite escribir:
E (y |x) = β0 + β1x
• Esta ecuación se llama función de regresión poblacional (FRP).
• Para cualquier x , la distribución de y se concentra alrededor de
E (y |x).
• Considere el modelo de regresión lineal simple:
y = β0 + β1x + u
• Si los factores en u se mantienen fijos, es decir ∆u = 0, entonces x
tiene un efecto lineal en y :
∆y = β1∆x
• β1 representa el efecto ceteris paribus de x en y .
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Interpretación gráfica
y
β0
x
y = β0 + β1x + u
E [y |x ] = β0 + β1x
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Tabla de Contenidos
1 Modelo de regresión lineal simple
2 Modelo de regresión lineal múltiple
3 Estimadores MCO
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Modelo de regresión lineal múltiple
• Se puede incluir múltiples variables en el lado derecho de la ecuación:
y = β0 + β1x1 + β2x2 + β3x3 + . . .+ βkxk + u (2)
• Esta relación se conoce como modelo de regresión lineal múltiple.
• En el ejemplo, con k = 2, x1 puede ser educación y x2 años de experiencia.
• Las variables x e y se denominan de distintas formas en la literatura:
y x
Variable dependiente Variable independiente
Variable explicada Variable explicativa
Variable de respuesta Variable de control
Variable predicha Variable predictora
Regresando Regresor
• El modelo de regresión lineal debe ser lineal en los coeficientes βj , no
necesariamente en las variables xj . Por ejemplo:
salario = β0 + β1educacion + β2educacion
2 + u
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Interpretación de βj
• Al igual que para el caso simple, βj representa el cambio en y debido
a un cambio en xj ceteris paribus.
• Considere el modelo de regresión lineal múltiple
y = β0 + β1x1 + β2x2 + β3x3 . . .+ βkxk + u
y ∆x1 = 0, . . .∆xj−1 = 0,∆xj+1 = 0, . . .∆xk = 0,∆u = 0.
• Entonces,
∆y = βj∆xj
• El análisis de regresión no se aplica para determinar causalidad, sino
sólo para ver si dos variables guardan una relación positiva o negativa.
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Ejemplo: gasto en educación
• Suponga que quiere explicar el efecto del gasto por estudiante en la
calificación promedio en el Simce de 4◦ básico (datos de colegios).
• Se sabe que la calificación depende de estos recursos, el ingreso familiar y
otros factores no observables:
simce = β0 + β1gasto + β2ingr + u
• El coeficiente de interés es β1, el efecto ceteris paribus del gasto en
educación en los resultados del Simce.
• Al incluir expĺıcitamente los ingresos familiares en el modelo, se está
controlando por su efecto en el Simce, lo que probablemente es importante
pues los ingresos familiares suelen estar correlacionados con gasto en
educación.
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Ejemplo: gasto en educación (cont.)
• La ventaja del análisis de regresión múltiple es que proporciona una
interpretación ceteris paribus aunque los datos no se hayan
recolectado de esta forma.
• Es decir, en el ejemplo de salario en función de los años de educación
y de experiencia, el coeficiente que acompaña educación representa el
efecto de esta variable sobre salario dejando años de experiencia
constante.
• Esto no significa que se haya recolectado la muestra buscando
individuos con un mismo nivel de experiencia.
• Si aśı fuera, se realizaŕıa una regresión simple de salario en educación,
y se obtendŕıa el impacto de esta variable, para el nivel de experiencia
de nuestros datos recolectados.
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Efecto marginal variable
• Suponga que el consumo familiar es una función cuadrática del
ingreso familiar:
consumo = β0 + β1ingreso + β2ingreso
2 + u
• Este modelo plantea una regresión múltiple (3 coeficientes) en que el
consumo depende de sólo un factor observable.
• Ojo con la interpretación de β1: no tiene sentido medir el efecto
del ingreso en consumo manteniendo fijo el cuadrado del ingreso,
pues si el ingreso cambia, también cambia su cuadrado.
• El efecto marginal del ingreso en el consumo depende tanto de β1
como de β2.
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Forma matricial
• El modelo de regresión lineal para el individuo i es:
yi = x
>
i β + ui
con
xi =

1
xi1
...
xik
 , β =

β0
β1
...
βk

• Para una muestra de n observaciones el modelo es:
y = Xβ + u
con
y =
 y1...
yn
 , X =
 x
>
1
...
x>n
 =
 1 x11 · · · x1k... . . . · · · ...
1 xn1 · · · xnk
 , u =
 u1...
un

donde u e y son vectores de n × 1 y X es una matriz de n × (k + 1).
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Tabla de Contenidos
1 Modelo de regresión lineal simple
2 Modelo de regresión lineal múltiple
3 Estimadores MCO
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Estimadores β̂
• Se denota β̂ al estimador de Mı́nimos Cuadrados Ordinarios (MCO) de β.
• La función de regresión muestral (FRM) o ĺınea de regresión de MCO
corresponde a la ecuación estimada,
ŷ = β̂0 + β̂1x1 + β̂2x2 + . . .+ β̂kxk
• El valor ajustado o pronóstico para la observación i es
ŷi = β̂0 + β̂1xi1 + β̂2xi2 + . . . + β̂kxik
• Normalmente el valor real de yi para cualquier observación no será igual ŷi .
El residuo o valor residual de la observación i se define como:
ûi = yi − ŷi
• Si ûi > 0 entonces ŷi < yi , lo que significa que yi está subpronosticada.
• Si ûi < 0, entonces yi < ŷi e yi está sobrepronosticada.
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Regresión Muestral (MCO) vs. Regresión Poblacional
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Interpretación de β̂j
• Dada la ecuación estimada:
ŷ = β̂0 + β̂1x1 + β̂2x2 + . . .+ β̂kxk (3)
la interpretación de β̂0 es el valor pronosticado de y cuando
x1 = x2 = . . . xk = 0.
• Se puede escribir:
∆ŷ = β̂1∆x1 + β̂2∆x2 + . . . + β̂k∆xk
• El coeficiente de x1 mide el cambio en ŷ (valor predicho) debido a un
aumento de una unidad en x1 con todas las demás variables fijas.
• Esto es,
∆ŷ= β̂1∆x1
si se mantiene fijas x2, x3 . . . , xk .
• Los otros coeficientes tienen una interpretación similar.
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
Interpretación de β̂j (cont.)
• En el ejemplo de educación, se obtiene la siguiente regresión por
MCO:
ˆsalario = −0.90 + 0.54 educacion
• El intercepto -0.90 significa que una persona sin educación recibe un
salario pronosticado de -90 centavos de dólar. ¿Tiene sentido esto?
• La muestra utilizada para ajustar esta ecuación no tiene ningún
individuo con menos de 8 años de educación.
• La pendiente estimada implica que un años más de educación
aumenta el salario estimado en 54 centavos de dólar por hora.
Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19
	Modelo de regresión lineal simple
	Modelo de regresión lineal simple
	Ceteris paribus
	Interpretación gráfica
	Modelo de regresión lineal múltiple
	Modelo de regresión lineal múltiple
	Interpretación de j
	Ejemplo: gasto en educación
	Efecto marginal variable
	Forma matricial
	Estimadores MCO
	Estimadores 
	Regresión Muestral (MCO) vs. Regresión Poblacional
	Interpretación de j

Continuar navegando

Materiales relacionados

80 pag.
36 pag.
2-Modelos lineales

User badge image

wendy sedano ricaldi