Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
ˇˇ Econometrı́a I EAE2510 Clases 9-10 Formas Funcionales Miriam Artiles Instituto de Economı́a Pontificia Universidad Católica de Chile Segundo Semestre 2021 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores En la clase de hoy1 ¿Qué ocurre si mi variable cambia de pesos a dólares? ¿Deberı́a usar el ingreso o el log del ingreso como variable y? ¿Deberı́a usar la educación o el log de la educación como variable x? Hoy vamos a ver: 1. Escalamiento de variables 2. No linealidad en regresores ◦ Transformaciones logarı́timicas ◦ Regresores al cuadrado ◦ Interacción entre regresores ——– 1 Wooldridge, capı́tulo 6 1 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores 1. Escalamiento de variables 2 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Repaso: interpretación de β • Considere el siguiente modelo para el peso de bebés al nacer: bwght = β0 + β1cigs+ β2faminc+ u donde bwght es el peso del bebé al nacer (medido en onzas), cigs es el número de cigarros promedio fumados por la madre al dı́a durante el embarazo y faminc es el ingreso familiar anual (en miles de dólares) • Puedes descargar los datos aqui • La base contiene información para n = 1388 bebés 3 / 30 http://fmwww.bc.edu/ec-p/data/wooldridge/bwght.dta Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Repaso: interpretación de β • Se estima el modelo por MCO en Stata: reg bwght cigs faminc 4 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Repaso: interpretación de β • Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que: E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc • Entonces, se puede escribir: ∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc • La interpretación de β1 es: β1 = ∆E(bwght|cigs, faminc) ∆cigs Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás constante (∆faminc = 0,∆u = 0) ◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en promedio 0.4634 onzas • Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus 5 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Repaso: interpretación de β • Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que: E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc • Entonces, se puede escribir: ∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc • La interpretación de β1 es: β1 = ∆E(bwght|cigs, faminc) ∆cigs Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás constante (∆faminc = 0,∆u = 0) ◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en promedio 0.4634 onzas • Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus 5 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Repaso: interpretación de β • Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que: E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc • Entonces, se puede escribir: ∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc • La interpretación de β1 es: β1 = ∆E(bwght|cigs, faminc) ∆cigs Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás constante (∆faminc = 0,∆u = 0) ◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en promedio 0.4634 onzas • Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus 5 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Repaso: interpretación de β • Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que: E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc • Entonces, se puede escribir: ∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc • La interpretación de β1 es: β1 = ∆E(bwght|cigs, faminc) ∆cigs Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás constante (∆faminc = 0,∆u = 0) ◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en promedio 0.4634 onzas • Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus 5 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Repaso: interpretación de β • Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que: E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc • Entonces, se puede escribir: ∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc • La interpretación de β1 es: β1 = ∆E(bwght|cigs, faminc) ∆cigs Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás constante (∆faminc = 0,∆u = 0) ◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en promedio 0.4634 onzas • Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus 5 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Reescalando la variable dependiente • ¿Qué sucede cuando se cambia la unidad de medida de alguna de las variables de la regresión? • Suponga que la unidad de medida de la variable dependiente se mide en libras en lugar de onzas: bwghtlbs = bwght/16 • Al dividir el modelo por 16 se obtiene: bwghtlbs = bwght/16 = β0 16 + β1 16 cigs+ β2 16 faminc+ u 16 = β̃0 + β̃1cigs+ β̃2faminc+ ũ • Los coeficientes MCO estimados serán los coeficiente estimados del modelo original divididos por 16! 6 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Reescalando la variable dependiente • Se estima el modelo por MCO en Stata: reg bwghtlbs cigs faminc • Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al nacer disminuye en promedio 0.4634/16 = 0.0289 libras, manteniendo todo lo demás constante 7 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Reescalando la variable dependiente • ¿Qué ocurre con la significancia estadı́stica y R2? • Los errores estándar son 16 veces menores que en el primer modelo, por lo que el estadı́stico t y la significancia estadı́stica no cambian • Mismo R2 pero distintos SCT, SCE, SCR... ¿por qué? el residual del segundo modelo es ahora û/16... (Wooldridge, pp. 186) 8 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Reescalando la variable dependiente • ¿Qué ocurre con la significancia estadı́stica y R2? • Los errores estándar son 16 veces menores que en el primer modelo, por lo que el estadı́stico t y la significancia estadı́stica no cambian • Mismo R2 pero distintos SCT, SCE, SCR... ¿por qué? el residual del segundo modeloes ahora û/16... (Wooldridge, pp. 186) 8 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Reescalando un regresor • Suponga que se usa el promedio de cajetillas diarias fumadas por la madre (packs = cigs/20) en lugar del número de cigarros: bwght =β0 + (20β1) cigs 20 + β2faminc+ u =β0 + (20β1)packs+ β2faminc+ u • Solo el coeficiente estimado asociado al número de cajetillas diarias cambia • Si β̂1 = −0.4634, entonces β̃1 ≡ 20β̂1 = −9.268 9 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Reescalando un regresor • Se estima el modelo por MCO en Stata: reg bwghtlbs packs faminc • Un cigarro más diario fumado por la madre durante el embarazo disminuye el peso promedio del bebé en 0.4634 onzas, y un aumento de 20 cigarros diarios, lo disminuye en (20)0.4634 = 9.268 onzas, manteniendo todo lo demás constante 10 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Reescalando un regresor • ¿Qué pasa si incluye el número de cigarros y de cajetillas en la regresión? • Tenemos un problema de multicolinealidad perfecta porque packs = cigs/20 • Recuerda que x2 = a(1/x1), donde a es una constante, no incumple el supuesto de ausencia de multicolinealidad perfecta (pregunta 2 del control 1) 11 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Reescalando un regresor • ¿Qué ocurre con la significancia estadı́stica y R2? • El estadı́stico t y la significancia estadı́stica del regresor reescalado no cambian porque también se reescala el error estándar • Tanto R2 como el estimador de σ2 no cambian 12 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Reescalando un regresor • Si se reescala un regresor, tanto R2 como el estimador de σ2 no cambian • Sin embargo, se reescala la varianza del estimador correspondiente: V ar(β̃j) = σ2 ˜SCT j(1−R2j ) = σ2 λ2SCTj(1−R2j ) donde es este caso, λ = 120 • La significancia estadı́stica del regresor no cambia: t = β̃1 s.e.(β̃1) = β̂1/λ s.e.(β̂1) λ = β̂1 s.e.(β̂1) 13 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores 2. No linealidad de los regresores ◦ Transformaciones logarı́timicas 14 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Variables en logaritmo • Considera el modelo semilogarı́tmico y = β0 + β1ln(x) + u • Bajo el supuesto E(u|x) = 0, se tiene E(y|x) = β0 + β1ln(x) • Entonces, se puede escribir ∆E(y|x) = β1∆ln(x) • La interpretación de β1 es por tanto β1 = ∆E(y|x) ∆ln(x) ' ∆E(y|x) ∆x/x (∗) • Multiplicando y dividiendo por 100 para expresar la variación de x en términos porcentuales: β1/100 ' ∆E(y|x) 100×∆x/x = 0.01× ∆E(y|x) ∆x/x → Si x varı́a en un 1%, y varı́a en promedio en β1/100 = 0.01β1 unidades de y, manteniendo todo lo demás constante 15 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Variables en logaritmo (∗) Recuerde que ln(x1)− ln(x0) = ln( x1 x0 ) = ln(1 + ( x1 x0 − 1)) ' x1 x0 − 1 = x1 − x0 x0 = ∆x x0 ∆ln(x) ' ∆x x0 16 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Variables en logaritmo Ejemplo • Considera el siguiento modelo para las regiones de un determinado paı́s: test = β0 + β1ln(ingreso) + u donde test es el resultado promedio de una prueba estandarizada de los colegios y ingreso representa el ingreso promedio de la región • Se estima el modelo por MCO, obteniendo ˆtest = 557.8 + 36.42 ln(ingreso) • Entonces: Un aumento de un 1% en el ingreso de la región se asocia, en promedio, con un incremento de 0.01× 36.42 = 0.36 puntos en el test, manteniendo todo lo demás constante 17 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Variables en logaritmo • Considera el modelo semilogarı́tmico ln(y) = β0 + β1x+ u • Bajo el supuesto E(u|x) = 0, se tiene E(ln(y)|x) = β0 + β1x • Entonces, se puede escribir ∆E(ln(y)|x) = β1∆x • La interpretación de β1 es por tanto β1 = ∆E(ln(y)|x) ∆x ' E((∆y/y)|x) ∆x • Multiplicando por 100 para expresar la variación de y en términos porcentuales: β1 × 100 ' E((100×∆y/y)|x) ∆x → Si x varı́a en un una unidad, y varı́a en promedio en (β1 × 100)%, manteniendo todo lo demás constante 18 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Variables en logaritmo Ejemplo • Considera el siguiento modelo para las regiones de un determinado paı́s: ln(ingresos) = β0 + β1edad+ u donde ingreso representa el ingreso promedio y edad la edad promedio de la región • Se estima el modelo por MCO, obteniendo ˆln(ingresos) = 2.655 + 0.0086 edad • Entonces: Un año adicional de edad se asocia en promedio con un incremento de 100× 0.0086 = 0.86% en los ingresos, manteniendo todo lo demás constante 19 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Variables en logaritmo • Considera el modelo logarı́tmico ln(y) = β0 + β1ln(x) + u • Bajo el supuesto E(u|x) = 0, se tiene E(ln(y)|x) = β0 + β1ln(x) • Entonces, se puede escribir ∆E(ln(y)|x) = β1∆ln(x) • La interpretación de β1 es por tanto β1 = ∆E(ln(y)|x) ∆ln(x) ' E((∆y/y)|x) ∆x/x → Si x varı́a en un 1%, y varı́a en promedio en β1%, manteniendo todo lo demás constante 20 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Variables en logaritmo Ejemplo • Considera el siguiento modelo para las regiones de un determinado paı́s: ln(test) = β0 + β1ln(ingreso) + u donde test es el resultado promedio de una prueba estandarizada de los colegios y ingreso representa el ingreso promedio de la región • Se estima el modelo por MCO, obteniendo ˆln(test) = 6.336 + 0.0554 ln(ingreso) • Entonces: Un aumento de un 1% en el ingreso de la región se asocia, en promedio, con un incremento de 0.0554% en el puntaje del test, manteniendo todo lo demás constante 21 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores 2. No linealidad de los regresores ◦ Regresores al cuadrado 22 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Formas cuadráticas • Considere el modelo y = β0 + β1x+ β2x 2 + u • ¿Cuál es la interpretación de β1 y β2? • En este caso, bajo el supuesto E(u|x) = 0: E(y|x) = β0 + β1x+ β2x2 • Lo que implica ∆E(y|x) ' (β1 + 2β2x)∆x ⇒ ∆E(y|x) ∆x ' β1 + 2β2x • Si x varı́a en 1 unidad, y varı́a en promedio en (β1 + 2β2x) unidades de y, manteniendo todo lo demás constante • Un cambio en x genera un cambio promedio en y que depende del nivel de x: el efecto parcial de x en y es variable • β1 es aproximadamente la pendiente de la relación entre x e y cuando x = 0 23 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Ejemplo: efecto de experiencia en salario • Considere la siguiente estimación MCO ˆsalario = 3.73 + 0.298exper − 0.0061exper2 • La experiencia tiene un efecto inicial positivo pero decreciente sobre el salario ◦ En promedio, el primer año de experiencia vale 0.298$ (manteniendo todo lo demás constante). El segundo año de experiencia valemenos, aproximadamente 0.286$ (0.286 = 0.298− 2× 0.0061× 1), y ası́... ◦ Al pasar de 10 a 11 años de experiencia, el aumento promedio esperado en salario es aproximadamente 0.176$ = 0.298− 2× 0.0061× 10 24 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Ejemplo: efecto de experiencia en salario • Cuando β1 y β2 tienen distinto signo, existe un valor crı́tico x∗ a partir del cual el efecto ceteris paribus de x sobre E(y|x) cambia de dirección: β1 + 2β2x ∗ = 0→ x∗ = − β1 2β2 • En el ejemplo, este valor es x∗ = − β̂1 2β̂2 = − 0.298(2)(−0.0061) = 24.4 años 25 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Ejemplo: efecto de experiencia en salario 26 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores 2. No linealidad de los regresores ◦ Interacción entre regresores 27 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Términos de interacción • En ciertas ocasiones el efecto parcial de un regresor x en la variable dependi- ente y, puede depender del valor de otro regresor z • En este caso, se incluye en la regresión un término de interacción x× z • Por ejemplo, suponga el siguiente modelo para el precio de una vivienda precio = β0 + β1msq + β2dorm+ β3msq × dorm+ β4baños+ u donde msq son los metros cuadrados de la vivienda, dorm el número de dor- mitorios y baños el número de baños • El efecto parcial de dorm, manteniendo todo lo demás constante, es: ∆E(precio|msq, dorm, baños) ∆dorm = β2 + β3msq • Si el número de dormitorios varı́a en 1 unidad, el precio varı́a en promedio en β2 + β3msq, manteniendo todo lo demás constante • Si β2 > 0, β3 > 0 la ecuación implica que un dormitorio adicional se relaciona con un incremento en el precio de la vivienda, y estos incrementos son mayores en viviendas de más metros cuadrados (msq) 28 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Términos de interacción • Para resumir el efecto de dorm en precio, se puede evaluar β2 + β3msq en valores interesantes de msq, como por ejemplo su media (msq): β2 + β3msq • Otra opción para simplificar la interpretación es reparametrizar el modelo: precio = δ0+δ1msq+δ2dorm+β3(msq−msq)×(dorm−dorm)+β4baños+u • En este caso, β2 representa el efecto ceteris paribus de dorm en precio, cuando msq toma su valor promedio msq, se puede ver que δ2 = β2 + β3msq 29 / 30 Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores Conclusiones • Nuestro modelo, aún lineal en parámetros, puede ser muy flexible • Podemos usar variables en logaritmos, como polinomios e incluso agregar interacciones • Lo que cambia es simplemente la interpretación de nuestras estimaciones MCO 30 / 30 Introducción Escalamiento de variables Transformaciones logarítimicas Regresores al cuadrado Interacción entre regresores
Compartir