Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Econometŕıa I – EAE-250A Introducción al Modelo de Regresión Lineal Jaime Casassus Instituto de Econoḿıa Pontificia Universidad Católica de Chile Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Tabla de Contenidos 1 Modelo de regresión lineal simple 2 Modelo de regresión lineal múltiple 3 Estimadores MCO Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Modelo de regresión lineal simple • Dadas dos variables x e y que caracterizan una población, interesa explicar y en función de x o bien estudiar cómo vaŕıa y con los cambios de x . • Una ecuación que relaciona las variables a nivel poblacional es: y = β0 + β1x + u (1) • La variable u, denominada término de error o perturbación de la relación, representa los factores no-observables que influyen en y . • El coeficiente β0 se denomina intercepto y permite suponer que E (u) = 0. • β1 captura el efecto de x en y . • La relación (1) se conoce como modelo de regresión lineal simple. • Por ejemplo, un modelo que relaciona el salario de una persona con su educación: salario = β0 + β1educacion + u ¿Qué factores pueden estar incluidos en u? Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Ceteris paribus • Un supuesto fundamental en esta teoŕıa, que permite la interpretación ceteris paribus del coeficiente β1 es E (u|x) = E (u) • Esta premisa afirma que para cualquier valor de x , los valores inobservables promedio son los mismos, y por lo tanto son iguales al promedio de u en toda la población. • En el ejemplo, esto implica que la capacidad promedio de los trabajadores con 8 años de escolaridad (educación básica) debe ser la misma que la capacidad promedio de los trabajadores con 15 años de escolaridad (educación superior). • ¿Es razonable este supuesto? • Recuerde que: E (u|x) = E (u)⇒ Cov(x , u) = 0. Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Ceteris paribus (cont.) • El supuesto E (u|x) = E (u) permite escribir: E (y |x) = β0 + β1x • Esta ecuación se llama función de regresión poblacional (FRP). • Para cualquier x , la distribución de y se concentra alrededor de E (y |x). • Considere el modelo de regresión lineal simple: y = β0 + β1x + u • Si los factores en u se mantienen fijos, es decir ∆u = 0, entonces x tiene un efecto lineal en y : ∆y = β1∆x • β1 representa el efecto ceteris paribus de x en y . Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Interpretación gráfica y β0 x y = β0 + β1x + u E [y |x ] = β0 + β1x Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Tabla de Contenidos 1 Modelo de regresión lineal simple 2 Modelo de regresión lineal múltiple 3 Estimadores MCO Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Modelo de regresión lineal múltiple • Se puede incluir múltiples variables en el lado derecho de la ecuación: y = β0 + β1x1 + β2x2 + β3x3 + . . .+ βkxk + u (2) • Esta relación se conoce como modelo de regresión lineal múltiple. • En el ejemplo, con k = 2, x1 puede ser educación y x2 años de experiencia. • Las variables x e y se denominan de distintas formas en la literatura: y x Variable dependiente Variable independiente Variable explicada Variable explicativa Variable de respuesta Variable de control Variable predicha Variable predictora Regresando Regresor • El modelo de regresión lineal debe ser lineal en los coeficientes βj , no necesariamente en las variables xj . Por ejemplo: salario = β0 + β1educacion + β2educacion 2 + u Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Interpretación de βj • Al igual que para el caso simple, βj representa el cambio en y debido a un cambio en xj ceteris paribus. • Considere el modelo de regresión lineal múltiple y = β0 + β1x1 + β2x2 + β3x3 . . .+ βkxk + u y ∆x1 = 0, . . .∆xj−1 = 0,∆xj+1 = 0, . . .∆xk = 0,∆u = 0. • Entonces, ∆y = βj∆xj • El análisis de regresión no se aplica para determinar causalidad, sino sólo para ver si dos variables guardan una relación positiva o negativa. Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Ejemplo: gasto en educación • Suponga que quiere explicar el efecto del gasto por estudiante en la calificación promedio en el Simce de 4◦ básico (datos de colegios). • Se sabe que la calificación depende de estos recursos, el ingreso familiar y otros factores no observables: simce = β0 + β1gasto + β2ingr + u • El coeficiente de interés es β1, el efecto ceteris paribus del gasto en educación en los resultados del Simce. • Al incluir expĺıcitamente los ingresos familiares en el modelo, se está controlando por su efecto en el Simce, lo que probablemente es importante pues los ingresos familiares suelen estar correlacionados con gasto en educación. Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Ejemplo: gasto en educación (cont.) • La ventaja del análisis de regresión múltiple es que proporciona una interpretación ceteris paribus aunque los datos no se hayan recolectado de esta forma. • Es decir, en el ejemplo de salario en función de los años de educación y de experiencia, el coeficiente que acompaña educación representa el efecto de esta variable sobre salario dejando años de experiencia constante. • Esto no significa que se haya recolectado la muestra buscando individuos con un mismo nivel de experiencia. • Si aśı fuera, se realizaŕıa una regresión simple de salario en educación, y se obtendŕıa el impacto de esta variable, para el nivel de experiencia de nuestros datos recolectados. Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Efecto marginal variable • Suponga que el consumo familiar es una función cuadrática del ingreso familiar: consumo = β0 + β1ingreso + β2ingreso 2 + u • Este modelo plantea una regresión múltiple (3 coeficientes) en que el consumo depende de sólo un factor observable. • Ojo con la interpretación de β1: no tiene sentido medir el efecto del ingreso en consumo manteniendo fijo el cuadrado del ingreso, pues si el ingreso cambia, también cambia su cuadrado. • El efecto marginal del ingreso en el consumo depende tanto de β1 como de β2. Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Forma matricial • El modelo de regresión lineal para el individuo i es: yi = x > i β + ui con xi = 1 xi1 ... xik , β = β0 β1 ... βk • Para una muestra de n observaciones el modelo es: y = Xβ + u con y = y1... yn , X = x > 1 ... x>n = 1 x11 · · · x1k... . . . · · · ... 1 xn1 · · · xnk , u = u1... un donde u e y son vectores de n × 1 y X es una matriz de n × (k + 1). Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Tabla de Contenidos 1 Modelo de regresión lineal simple 2 Modelo de regresión lineal múltiple 3 Estimadores MCO Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Estimadores β̂ • Se denota β̂ al estimador de Mı́nimos Cuadrados Ordinarios (MCO) de β. • La función de regresión muestral (FRM) o ĺınea de regresión de MCO corresponde a la ecuación estimada, ŷ = β̂0 + β̂1x1 + β̂2x2 + . . .+ β̂kxk • El valor ajustado o pronóstico para la observación i es ŷi = β̂0 + β̂1xi1 + β̂2xi2 + . . . + β̂kxik • Normalmente el valor real de yi para cualquier observación no será igual ŷi . El residuo o valor residual de la observación i se define como: ûi = yi − ŷi • Si ûi > 0 entonces ŷi < yi , lo que significa que yi está subpronosticada. • Si ûi < 0, entonces yi < ŷi e yi está sobrepronosticada. Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Regresión Muestral (MCO) vs. Regresión Poblacional Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Interpretación de β̂j • Dada la ecuación estimada: ŷ = β̂0 + β̂1x1 + β̂2x2 + . . .+ β̂kxk (3) la interpretación de β̂0 es el valor pronosticado de y cuando x1 = x2 = . . . xk = 0. • Se puede escribir: ∆ŷ = β̂1∆x1 + β̂2∆x2 + . . . + β̂k∆xk • El coeficiente de x1 mide el cambio en ŷ (valor predicho) debido a un aumento de una unidad en x1 con todas las demás variables fijas. • Esto es, ∆ŷ= β̂1∆x1 si se mantiene fijas x2, x3 . . . , xk . • Los otros coeficientes tienen una interpretación similar. Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Interpretación de β̂j (cont.) • En el ejemplo de educación, se obtiene la siguiente regresión por MCO: ˆsalario = −0.90 + 0.54 educacion • El intercepto -0.90 significa que una persona sin educación recibe un salario pronosticado de -90 centavos de dólar. ¿Tiene sentido esto? • La muestra utilizada para ajustar esta ecuación no tiene ningún individuo con menos de 8 años de educación. • La pendiente estimada implica que un años más de educación aumenta el salario estimado en 54 centavos de dólar por hora. Casassus (UC) EAE-250A - Econometŕıa I 13-Mar-19 Modelo de regresión lineal simple Modelo de regresión lineal simple Ceteris paribus Interpretación gráfica Modelo de regresión lineal múltiple Modelo de regresión lineal múltiple Interpretación de j Ejemplo: gasto en educación Efecto marginal variable Forma matricial Estimadores MCO Estimadores Regresión Muestral (MCO) vs. Regresión Poblacional Interpretación de j
Compartir