Logo Studenta

Clase 9 y 10 - Formas Funcionales

¡Este material tiene más páginas!

Vista previa del material en texto

ˇˇ
Econometrı́a I
EAE2510
Clases 9-10
Formas Funcionales
Miriam Artiles
Instituto de Economı́a
Pontificia Universidad Católica de Chile
Segundo Semestre 2021
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
En la clase de hoy1
¿Qué ocurre si mi variable cambia de pesos a dólares?
¿Deberı́a usar el ingreso o el log del ingreso como variable y?
¿Deberı́a usar la educación o el log de la educación como variable x?
Hoy vamos a ver:
1. Escalamiento de variables
2. No linealidad en regresores
◦ Transformaciones logarı́timicas
◦ Regresores al cuadrado
◦ Interacción entre regresores
——–
1 Wooldridge, capı́tulo 6
1 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
1. Escalamiento de variables
2 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Considere el siguiente modelo para el peso de bebés al nacer:
bwght = β0 + β1cigs+ β2faminc+ u
donde bwght es el peso del bebé al nacer (medido en onzas), cigs es el
número de cigarros promedio fumados por la madre al dı́a durante el embarazo
y faminc es el ingreso familiar anual (en miles de dólares)
• Puedes descargar los datos aqui
• La base contiene información para n = 1388 bebés
3 / 30
http://fmwww.bc.edu/ec-p/data/wooldridge/bwght.dta
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Se estima el modelo por MCO en Stata:
reg bwght cigs faminc
4 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que:
E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc
• Entonces, se puede escribir:
∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc
• La interpretación de β1 es:
β1 =
∆E(bwght|cigs, faminc)
∆cigs
Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al
nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás
constante (∆faminc = 0,∆u = 0)
◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en
promedio 0.4634 onzas
• Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer
disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus
5 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que:
E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc
• Entonces, se puede escribir:
∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc
• La interpretación de β1 es:
β1 =
∆E(bwght|cigs, faminc)
∆cigs
Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al
nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás
constante (∆faminc = 0,∆u = 0)
◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en
promedio 0.4634 onzas
• Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer
disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus
5 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que:
E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc
• Entonces, se puede escribir:
∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc
• La interpretación de β1 es:
β1 =
∆E(bwght|cigs, faminc)
∆cigs
Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al
nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás
constante (∆faminc = 0,∆u = 0)
◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en
promedio 0.4634 onzas
• Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer
disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus
5 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que:
E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc
• Entonces, se puede escribir:
∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc
• La interpretación de β1 es:
β1 =
∆E(bwght|cigs, faminc)
∆cigs
Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al
nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás
constante (∆faminc = 0,∆u = 0)
◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en
promedio 0.4634 onzas
• Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer
disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus
5 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Repaso: interpretación de β
• Bajo el supuesto de exogeneidad, E(u|cigs, faminc) = 0, se tiene que:
E(bwght|cigs, faminc) = β0 + β1cigs+ β2faminc
• Entonces, se puede escribir:
∆E(bwght|cigs, faminc) = β1∆cigs+ β2∆faminc
• La interpretación de β1 es:
β1 =
∆E(bwght|cigs, faminc)
∆cigs
Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al
nacer varı́a en promedio β1 unidades de bwght, manteniendo todo lo demás
constante (∆faminc = 0,∆u = 0)
◦ Mirando a la estimación MCO, en este caso el peso del bebé al nacer disminuye en
promedio 0.4634 onzas
• Si el número de cigarros aumenta en 5 unidades, el peso del bebé al nacer
disminuye en promedio 0.4634(5) = 2.317 onzas, ceteris paribus
5 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando la variable dependiente
• ¿Qué sucede cuando se cambia la unidad de medida de alguna de las
variables de la regresión?
• Suponga que la unidad de medida de la variable dependiente se mide en libras
en lugar de onzas:
bwghtlbs = bwght/16
• Al dividir el modelo por 16 se obtiene:
bwghtlbs = bwght/16 =
β0
16
+
β1
16
cigs+
β2
16
faminc+
u
16
= β̃0 + β̃1cigs+ β̃2faminc+ ũ
• Los coeficientes MCO estimados serán los coeficiente estimados del modelo
original divididos por 16!
6 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando la variable dependiente
• Se estima el modelo por MCO en Stata:
reg bwghtlbs cigs faminc
• Si el número de cigarros aumenta en 1 unidad, entonces el peso del bebé al
nacer disminuye en promedio 0.4634/16 = 0.0289 libras, manteniendo todo lo
demás constante
7 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando la variable dependiente
• ¿Qué ocurre con la significancia estadı́stica y R2?
• Los errores estándar son 16 veces menores que en el primer modelo, por lo
que el estadı́stico t y la significancia estadı́stica no cambian
• Mismo R2 pero distintos SCT, SCE, SCR... ¿por qué? el residual del segundo
modelo es ahora û/16... (Wooldridge, pp. 186)
8 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando la variable dependiente
• ¿Qué ocurre con la significancia estadı́stica y R2?
• Los errores estándar son 16 veces menores que en el primer modelo, por lo
que el estadı́stico t y la significancia estadı́stica no cambian
• Mismo R2 pero distintos SCT, SCE, SCR... ¿por qué? el residual del segundo
modeloes ahora û/16... (Wooldridge, pp. 186)
8 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando un regresor
• Suponga que se usa el promedio de cajetillas diarias fumadas por la madre
(packs = cigs/20) en lugar del número de cigarros:
bwght =β0 + (20β1)
cigs
20
+ β2faminc+ u
=β0 + (20β1)packs+ β2faminc+ u
• Solo el coeficiente estimado asociado al número de cajetillas diarias cambia
• Si β̂1 = −0.4634, entonces β̃1 ≡ 20β̂1 = −9.268
9 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando un regresor
• Se estima el modelo por MCO en Stata:
reg bwghtlbs packs faminc
• Un cigarro más diario fumado por la madre durante el embarazo disminuye el
peso promedio del bebé en 0.4634 onzas, y un aumento de 20 cigarros diarios,
lo disminuye en (20)0.4634 = 9.268 onzas, manteniendo todo lo demás
constante
10 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando un regresor
• ¿Qué pasa si incluye el número de cigarros y de cajetillas en la regresión?
• Tenemos un problema de multicolinealidad perfecta porque packs = cigs/20
• Recuerda que x2 = a(1/x1), donde a es una constante, no incumple el
supuesto de ausencia de multicolinealidad perfecta (pregunta 2 del control 1)
11 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando un regresor
• ¿Qué ocurre con la significancia estadı́stica y R2?
• El estadı́stico t y la significancia estadı́stica del regresor reescalado no
cambian porque también se reescala el error estándar
• Tanto R2 como el estimador de σ2 no cambian
12 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Reescalando un regresor
• Si se reescala un regresor, tanto R2 como el estimador de σ2 no cambian
• Sin embargo, se reescala la varianza del estimador correspondiente:
V ar(β̃j) =
σ2
˜SCT j(1−R2j )
=
σ2
λ2SCTj(1−R2j )
donde es este caso, λ = 120
• La significancia estadı́stica del regresor no cambia:
t =
β̃1
s.e.(β̃1)
=
β̂1/λ
s.e.(β̂1)
λ
=
β̂1
s.e.(β̂1)
13 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
2. No linealidad de los regresores
◦ Transformaciones logarı́timicas
14 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
• Considera el modelo semilogarı́tmico
y = β0 + β1ln(x) + u
• Bajo el supuesto E(u|x) = 0, se tiene
E(y|x) = β0 + β1ln(x)
• Entonces, se puede escribir
∆E(y|x) = β1∆ln(x)
• La interpretación de β1 es por tanto
β1 =
∆E(y|x)
∆ln(x)
' ∆E(y|x)
∆x/x
(∗)
• Multiplicando y dividiendo por 100 para expresar la variación de x en términos
porcentuales:
β1/100 '
∆E(y|x)
100×∆x/x
= 0.01× ∆E(y|x)
∆x/x
→ Si x varı́a en un 1%, y varı́a en promedio en β1/100 = 0.01β1 unidades de
y, manteniendo todo lo demás constante
15 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
(∗) Recuerde que
ln(x1)− ln(x0) = ln(
x1
x0
) = ln(1 + (
x1
x0
− 1))
'
x1
x0
− 1 =
x1 − x0
x0
=
∆x
x0
∆ln(x) '
∆x
x0
16 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
Ejemplo
• Considera el siguiento modelo para las regiones de un determinado paı́s:
test = β0 + β1ln(ingreso) + u
donde test es el resultado promedio de una prueba estandarizada de los
colegios y ingreso representa el ingreso promedio de la región
• Se estima el modelo por MCO, obteniendo
ˆtest = 557.8 + 36.42 ln(ingreso)
• Entonces:
Un aumento de un 1% en el ingreso de la región se asocia, en promedio, con
un incremento de 0.01× 36.42 = 0.36 puntos en el test, manteniendo todo lo
demás constante
17 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
• Considera el modelo semilogarı́tmico
ln(y) = β0 + β1x+ u
• Bajo el supuesto E(u|x) = 0, se tiene
E(ln(y)|x) = β0 + β1x
• Entonces, se puede escribir
∆E(ln(y)|x) = β1∆x
• La interpretación de β1 es por tanto
β1 =
∆E(ln(y)|x)
∆x
' E((∆y/y)|x)
∆x
• Multiplicando por 100 para expresar la variación de y en términos porcentuales:
β1 × 100 '
E((100×∆y/y)|x)
∆x
→ Si x varı́a en un una unidad, y varı́a en promedio en (β1 × 100)%,
manteniendo todo lo demás constante
18 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
Ejemplo
• Considera el siguiento modelo para las regiones de un determinado paı́s:
ln(ingresos) = β0 + β1edad+ u
donde ingreso representa el ingreso promedio y edad la edad promedio de la
región
• Se estima el modelo por MCO, obteniendo
ˆln(ingresos) = 2.655 + 0.0086 edad
• Entonces:
Un año adicional de edad se asocia en promedio con un incremento de
100× 0.0086 = 0.86% en los ingresos, manteniendo todo lo demás constante
19 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
• Considera el modelo logarı́tmico
ln(y) = β0 + β1ln(x) + u
• Bajo el supuesto E(u|x) = 0, se tiene
E(ln(y)|x) = β0 + β1ln(x)
• Entonces, se puede escribir
∆E(ln(y)|x) = β1∆ln(x)
• La interpretación de β1 es por tanto
β1 =
∆E(ln(y)|x)
∆ln(x)
' E((∆y/y)|x)
∆x/x
→ Si x varı́a en un 1%, y varı́a en promedio en β1%, manteniendo todo lo
demás constante
20 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Variables en logaritmo
Ejemplo
• Considera el siguiento modelo para las regiones de un determinado paı́s:
ln(test) = β0 + β1ln(ingreso) + u
donde test es el resultado promedio de una prueba estandarizada de los
colegios y ingreso representa el ingreso promedio de la región
• Se estima el modelo por MCO, obteniendo
ˆln(test) = 6.336 + 0.0554 ln(ingreso)
• Entonces:
Un aumento de un 1% en el ingreso de la región se asocia, en promedio, con
un incremento de 0.0554% en el puntaje del test, manteniendo todo lo demás
constante
21 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
2. No linealidad de los regresores
◦ Regresores al cuadrado
22 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Formas cuadráticas
• Considere el modelo
y = β0 + β1x+ β2x
2 + u
• ¿Cuál es la interpretación de β1 y β2?
• En este caso, bajo el supuesto E(u|x) = 0:
E(y|x) = β0 + β1x+ β2x2
• Lo que implica
∆E(y|x) ' (β1 + 2β2x)∆x ⇒
∆E(y|x)
∆x
' β1 + 2β2x
• Si x varı́a en 1 unidad, y varı́a en promedio en (β1 + 2β2x) unidades de y,
manteniendo todo lo demás constante
• Un cambio en x genera un cambio promedio en y que depende del nivel de x:
el efecto parcial de x en y es variable
• β1 es aproximadamente la pendiente de la relación entre x e y cuando x = 0
23 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Ejemplo: efecto de experiencia en salario
• Considere la siguiente estimación MCO
ˆsalario = 3.73 + 0.298exper − 0.0061exper2
• La experiencia tiene un efecto inicial positivo pero decreciente sobre el salario
◦ En promedio, el primer año de experiencia vale 0.298$ (manteniendo todo lo demás
constante). El segundo año de experiencia valemenos, aproximadamente 0.286$
(0.286 = 0.298− 2× 0.0061× 1), y ası́...
◦ Al pasar de 10 a 11 años de experiencia, el aumento promedio esperado en
salario es aproximadamente 0.176$ = 0.298− 2× 0.0061× 10
24 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Ejemplo: efecto de experiencia en salario
• Cuando β1 y β2 tienen distinto signo, existe un valor crı́tico x∗ a partir del cual
el efecto ceteris paribus de x sobre E(y|x) cambia de dirección:
β1 + 2β2x
∗ = 0→ x∗ = − β1
2β2
• En el ejemplo, este valor es x∗ = − β̂1
2β̂2
= − 0.298(2)(−0.0061) = 24.4 años
25 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Ejemplo: efecto de experiencia en salario
26 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
2. No linealidad de los regresores
◦ Interacción entre regresores
27 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Términos de interacción
• En ciertas ocasiones el efecto parcial de un regresor x en la variable dependi-
ente y, puede depender del valor de otro regresor z
• En este caso, se incluye en la regresión un término de interacción x× z
• Por ejemplo, suponga el siguiente modelo para el precio de una vivienda
precio = β0 + β1msq + β2dorm+ β3msq × dorm+ β4baños+ u
donde msq son los metros cuadrados de la vivienda, dorm el número de dor-
mitorios y baños el número de baños
• El efecto parcial de dorm, manteniendo todo lo demás constante, es:
∆E(precio|msq, dorm, baños)
∆dorm
= β2 + β3msq
• Si el número de dormitorios varı́a en 1 unidad, el precio varı́a en promedio en
β2 + β3msq, manteniendo todo lo demás constante
• Si β2 > 0, β3 > 0 la ecuación implica que un dormitorio adicional se relaciona
con un incremento en el precio de la vivienda, y estos incrementos son mayores
en viviendas de más metros cuadrados (msq)
28 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Términos de interacción
• Para resumir el efecto de dorm en precio, se puede evaluar β2 + β3msq en
valores interesantes de msq, como por ejemplo su media (msq):
β2 + β3msq
• Otra opción para simplificar la interpretación es reparametrizar el modelo:
precio = δ0+δ1msq+δ2dorm+β3(msq−msq)×(dorm−dorm)+β4baños+u
• En este caso, β2 representa el efecto ceteris paribus de dorm en precio,
cuando msq toma su valor promedio msq, se puede ver que
δ2 = β2 + β3msq
29 / 30
Introducción Escalamiento de variables Transformaciones logarı́timicas Regresores al cuadrado Interacción entre regresores
Conclusiones
• Nuestro modelo, aún lineal en parámetros, puede ser muy flexible
• Podemos usar variables en logaritmos, como polinomios e incluso agregar
interacciones
• Lo que cambia es simplemente la interpretación de nuestras estimaciones
MCO
30 / 30
	Introducción
	Escalamiento de variables
	Transformaciones logarítimicas
	Regresores al cuadrado
	Interacción entre regresores

Otros materiales