Clase 9 y 10 - Formas Funcionales

•
Outros

Central de Apuntes
26/5/2022
¡Este material tiene más páginas!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Administración

592.622 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
ˇˇ
Econometrı́a I
EAE2510
Clases 9-10
Formas Funcionales
Miriam Artiles
Instituto de Economı́a
Pontificia Universidad Católica de Chile
Segundo Semestre 2021
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
En la clase de hoy1
¿Qué ocurre si mi variable cambia de pesos a dólares?
¿Deberı́a usar el ingreso o el log del ingreso como variable y?
¿Deberı́a usar la educación o el log de la educación como variable x?
Hoy vamos a ver:
1. Escalamiento de variables
2. No linealidad en regresores
◦ Transformaciones logarı́timicas
◦ Regresores al cuadrado
◦ Interacción entre regresores
——–
1 Wooldridge, capı́tulo 6
1 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
1. Escalamiento de variables
2 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Considere el siguiente modelo para el peso de bebés al nacer:
bwght = β0 + β1cigs+ β2faminc+ u
donde bwght es el peso del bebé al nacer (medido en onzas), cigs es el
número de cigarros promedio fumados por la madre al dı́a durante el embarazo
y faminc es el ingreso familiar anual (en miles de dólares)
• Puedes descargar los datos aqui
• La base contiene información para n = 1388 bebés
3 / 30
http://fmwww.bc.edu/ec-p/data/wooldridge/bwght.dta
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Se estima el modelo por MCO en Stata:
reg bwght cigs faminc
4 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que:
E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc
• Entonces, se puede escribir:
∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc
• La interpretación de β1 es:
β1 =
∆E(bwght|cigs, faminc)
∆cigs
Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al
nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás
constante (∆faminc = 0,∆u = 0)
◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en
promedio 0.4634 onzas
• Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer
disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus
5 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que:
E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc
• Entonces, se puede escribir:
∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc
• La interpretación de β1 es:
β1 =
∆E(bwght|cigs, faminc)
∆cigs
Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al
nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás
constante (∆faminc = 0,∆u = 0)
◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en
promedio 0.4634 onzas
• Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer
disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus
5 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que:
E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc
• Entonces, se puede escribir:
∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc
• La interpretación de β1 es:
β1 =
∆E(bwght|cigs, faminc)
∆cigs
Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al
nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás
constante (∆faminc = 0,∆u = 0)
◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en
promedio 0.4634 onzas
• Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer
disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus
5 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que:
E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc
• Entonces, se puede escribir:
∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc
• La interpretación de β1 es:
β1 =
∆E(bwght|cigs, faminc)
∆cigs
Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al
nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás
constante (∆faminc = 0,∆u = 0)
◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en
promedio 0.4634 onzas
• Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer
disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus
5 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que:
E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc
• Entonces, se puede escribir:
∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc
• La interpretación de β1 es:
β1 =
∆E(bwght|cigs, faminc)
∆cigs
Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al
nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás
constante (∆faminc = 0,∆u = 0)
◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en
promedio 0.4634 onzas
• Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer
disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus
5 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando la variable dependiente
• ¿Qué sucede cuando se cambia la unidad de medida de alguna de las
variables de la regresión?
• Suponga que la unidad de medida de la variable dependiente se mide en libras
en lugar de onzas:
bwghtlbs = bwght/16
• Al dividir el modelo por 16 se obtiene:
bwghtlbs = bwght/16 =
β0
16
+
β1
16
cigs+
β2
16
faminc+
u
16
= β̃0 + β̃1cigs+ β̃2faminc+ ũ
• Los coeficientes MCO estimados serán los coeficiente estimados del modelo
original divididos por 16!
6 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando la variable dependiente
• Se estima el modelo por MCO en Stata:
reg bwghtlbs cigs faminc
• Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al
nacer disminuye en promedio 0.4634/16 = 0.0289 libras, manteniendo todo lo
demás constante
7 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando la variable dependiente
• ¿Qué ocurre con la significancia estadı́stica y R2?
• Los errores estándar son 16 veces menores que en el primer modelo, por lo
que el estadı́stico t y la significancia estadı́stica no cambian
• Mismo R2 pero distintos SCT, SCE, SCR... ¿por qué? el residual del segundo
modelo es ahora û/16... (Wooldridge, pp. 186)
8 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando la variable dependiente
• ¿Qué ocurre con la significancia estadı́stica y R2?
• Los errores estándar son 16 veces menores que en el primer modelo, por lo
que el estadı́stico t y la significancia estadı́stica no cambian
• Mismo R2 pero distintos SCT, SCE, SCR... ¿por qué? el residual del segundo
modeloes ahora û/16... (Wooldridge, pp. 186)
8 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando un regresor
• Suponga que se usa el promedio de cajetillas diarias fumadas por la madre
(packs = cigs/20) en lugar del número de cigarros:
bwght =β0 + (20β1)
cigs
20
+ β2faminc+ u
=β0 + (20β1)packs+ β2faminc+ u
• Solo el coeficiente estimado asociado al número de cajetillas diarias cambia
• Si β̂1 = −0.4634, entonces β̃1 ≡ 20β̂1 = −9.268
9 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando un regresor
• Se estima el modelo por MCO en Stata:
reg bwghtlbs packs faminc
• Un cigarro más diario fumado por la madre durante el embarazo disminuye el
peso promedio del bebé en 0.4634 onzas, y un aumento de 20 cigarros diarios,
lo disminuye en (20)0.4634 = 9.268 onzas, manteniendo todo lo demás
constante
10 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando un regresor
• ¿Qué pasa si incluye el número de cigarros y de cajetillas en la regresión?
• Tenemos un problema de multicolinealidad perfecta porque packs = cigs/20
• Recuerda que x2 = a(1/x1), donde a es una constante, no incumple el
supuesto de ausencia de multicolinealidad perfecta (pregunta 2 del control 1)
11 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando un regresor
• ¿Qué ocurre con la significancia estadı́stica y R2?
• El estadı́stico t y la significancia estadı́stica del regresor reescalado no
cambian porque también se reescala el error estándar
• Tanto R2 como el estimador de σ2 no cambian
12 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando un regresor
• Si se reescala un regresor, tanto R2 como el estimador de σ2 no cambian
• Sin embargo, se reescala la varianza del estimador correspondiente:
V ar(β̃j) =
σ2
˜SCT j(1−R2j )
=
σ2
λ2SCTj(1−R2j )
donde es este caso, λ = 120
• La significancia estadı́stica del regresor no cambia:
t =
β̃1
s.e.(β̃1)
=
β̂1/λ
s.e.(β̂1)
λ
=
β̂1
s.e.(β̂1)
13 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
2. No linealidad de los regresores
◦ Transformaciones logarı́timicas
14 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
• Considera el modelo semilogarı́tmico
y = β0 + β1ln(x) + u
• Bajo el supuesto E(u|x) = 0, se tiene
E(y|x) = β0 + β1ln(x)
• Entonces, se puede escribir
∆E(y|x) = β1∆ln(x)
• La interpretación de β1 es por tanto
β1 =
∆E(y|x)
∆ln(x)
' ∆E(y|x)
∆x/x
(∗)
• Multiplicando y dividiendo por 100 para expresar la variación de x en términos
porcentuales:
β1/100 '
∆E(y|x)
100×∆x/x
= 0.01× ∆E(y|x)
∆x/x
→ Si x varı́a en un 1%, y varı́a en promedio en β1/100 = 0.01β1 unidades de
y, manteniendo todo lo demás constante
15 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
(∗) Recuerde que
ln(x1)− ln(x0) = ln(
x1
x0
) = ln(1 + (
x1
x0
− 1))
'
x1
x0
− 1 =
x1 − x0
x0
=
∆x
x0
∆ln(x) '
∆x
x0
16 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
Ejemplo
• Considera el siguiento modelo para las regiones de un determinado paı́s:
test = β0 + β1ln(ingreso) + u
donde test es el resultado promedio de una prueba estandarizada de los
colegios y ingreso representa el ingreso promedio de la región
• Se estima el modelo por MCO, obteniendo
ˆtest = 557.8 + 36.42 ln(ingreso)
• Entonces:
Un aumento de un 1% en el ingreso de la región se asocia, en promedio, con
un incremento de 0.01× 36.42 = 0.36 puntos en el test, manteniendo todo lo
demás constante
17 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
• Considera el modelo semilogarı́tmico
ln(y) = β0 + β1x+ u
• Bajo el supuesto E(u|x) = 0, se tiene
E(ln(y)|x) = β0 + β1x
• Entonces, se puede escribir
∆E(ln(y)|x) = β1∆x
• La interpretación de β1 es por tanto
β1 =
∆E(ln(y)|x)
∆x
' E((∆y/y)|x)
∆x
• Multiplicando por 100 para expresar la variación de y en términos porcentuales:
β1 × 100 '
E((100×∆y/y)|x)
∆x
→ Si x varı́a en un una unidad, y varı́a en promedio en (β1 × 100)%,
manteniendo todo lo demás constante
18 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
Ejemplo
• Considera el siguiento modelo para las regiones de un determinado paı́s:
ln(ingresos) = β0 + β1edad+ u
donde ingreso representa el ingreso promedio y edad la edad promedio de la
región
• Se estima el modelo por MCO, obteniendo
ˆln(ingresos) = 2.655 + 0.0086 edad
• Entonces:
Un año adicional de edad se asocia en promedio con un incremento de
100× 0.0086 = 0.86% en los ingresos, manteniendo todo lo demás constante
19 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
• Considera el modelo logarı́tmico
ln(y) = β0 + β1ln(x) + u
• Bajo el supuesto E(u|x) = 0, se tiene
E(ln(y)|x) = β0 + β1ln(x)
• Entonces, se puede escribir
∆E(ln(y)|x) = β1∆ln(x)
• La interpretación de β1 es por tanto
β1 =
∆E(ln(y)|x)
∆ln(x)
' E((∆y/y)|x)
∆x/x
→ Si x varı́a en un 1%, y varı́a en promedio en β1%, manteniendo todo lo
demás constante
20 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
Ejemplo
• Considera el siguiento modelo para las regiones de un determinado paı́s:
ln(test) = β0 + β1ln(ingreso) + u
donde test es el resultado promedio de una prueba estandarizada de los
colegios y ingreso representa el ingreso promedio de la región
• Se estima el modelo por MCO, obteniendo
ˆln(test) = 6.336 + 0.0554 ln(ingreso)
• Entonces:
Un aumento de un 1% en el ingreso de la región se asocia, en promedio, con
un incremento de 0.0554% en el puntaje del test, manteniendo todo lo demás
constante
21 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
2. No linealidad de los regresores
◦ Regresores al cuadrado
22 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Formas cuadráticas
• Considere el modelo
y = β0 + β1x+ β2x
2 + u
• ¿Cuál es la interpretación de β1 y β2?
• En este caso, bajo el supuesto E(u|x) = 0:
E(y|x) = β0 + β1x+ β2x2
• Lo que implica
∆E(y|x) ' (β1 + 2β2x)∆x ⇒
∆E(y|x)
∆x
' β1 + 2β2x
• Si x varı́a en 1 unidad, y varı́a en promedio en (β1 + 2β2x) unidades de y,
manteniendo todo lo demás constante
• Un cambio en x genera un cambio promedio en y que depende del nivel de x:
el efecto parcial de x en y es variable
• β1 es aproximadamente la pendiente de la relación entre x e y cuando x = 0
23 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Ejemplo: efecto de experiencia en salario
• Considere la siguiente estimación MCO
ˆsalario = 3.73 + 0.298exper − 0.0061exper2
• La experiencia tiene un efecto inicial positivo pero decreciente sobre el salario
◦ En promedio, el primer año de experiencia vale 0.298$ (manteniendo todo lo demás
constante). El segundo año de experiencia valemenos, aproximadamente 0.286$
(0.286 = 0.298− 2× 0.0061× 1), y ası́...
◦ Al pasar de 10 a 11 años de experiencia, el aumento promedio esperado en
salario es aproximadamente 0.176$ = 0.298− 2× 0.0061× 10
24 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Ejemplo: efecto de experiencia en salario
• Cuando β1 y β2 tienen distinto signo, existe un valor crı́tico x∗ a partir del cual
el efecto ceteris paribus de x sobre E(y|x) cambia de dirección:
β1 + 2β2x
∗ = 0→ x∗ = − β1
2β2
• En el ejemplo, este valor es x∗ = − β̂1
2β̂2
= − 0.298(2)(−0.0061) = 24.4 años
25 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Ejemplo: efecto de experiencia en salario
26 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
2. No linealidad de los regresores
◦ Interacción entre regresores
27 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Términos de interacción
• En ciertas ocasiones el efecto parcial de un regresor x en la variable dependi-
ente y, puede depender del valor de otro regresor z
• En este caso, se incluye en la regresión un término de interacción x× z
• Por ejemplo, suponga el siguiente modelo para el precio de una vivienda
precio = β0 + β1msq + β2dorm+ β3msq × dorm+ β4baños+ u
donde msq son los metros cuadrados de la vivienda, dorm el número de dor-
mitorios y baños el número de baños
• El efecto parcial de dorm, manteniendo todo lo demás constante, es:
∆E(precio|msq, dorm, baños)
∆dorm
= β2 + β3msq
• Si el número de dormitorios varı́a en 1 unidad, el precio varı́a en promedio en
β2 + β3msq, manteniendo todo lo demás constante
• Si β2 > 0, β3 > 0 la ecuación implica que un dormitorio adicional se relaciona
con un incremento en el precio de la vivienda, y estos incrementos son mayores
en viviendas de más metros cuadrados (msq)
28 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Términos de interacción
• Para resumir el efecto de dorm en precio, se puede evaluar β2 + β3msq en
valores interesantes de msq, como por ejemplo su media (msq):
β2 + β3msq
• Otra opción para simplificar la interpretación es reparametrizar el modelo:
precio = δ0+δ1msq+δ2dorm+β3(msq−msq)×(dorm−dorm)+β4baños+u
• En este caso, β2 representa el efecto ceteris paribus de dorm en precio,
cuando msq toma su valor promedio msq, se puede ver que
δ2 = β2 + β3msq
29 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Conclusiones
• Nuestro modelo, aún lineal en parámetros, puede ser muy flexible
• Podemos usar variables en logaritmos, como polinomios e incluso agregar
interacciones
• Lo que cambia es simplemente la interpretación de nuestras estimaciones
MCO
30 / 30
	Introducción
	Escalamiento de variables
	Transformaciones logarítimicas
	Regresores al cuadrado
	Interacción entre regresores