Logo Studenta

Variables_Dicotomicas_Exogenas

¡Este material tiene más páginas!

Vista previa del material en texto

Variables Dicótomas Exógenas
Luis Frank
Depto. de Métodos Cuantitativos
Facultad de Agronoḿıa
Universidad de Buenos Aires
Abril, 2021
Introducción
En regresión es frecuente el uso de variables regresoras dicótomas
(o binarias) para
I especificar funciones partidas o “por tramos”,
I incluir efectos de interacción,
I incluir efectos fijos de estacionalidad,
I comparar dos regresiones.
Las variales binarias son útiles también para especificar funciones
que involucren una elección binarias, dando lugar al:
I modelo lineal de probabilidad
I modelo de probabilidad loǵıstico o logit
I modelo de probabilidad normal o probit
Veremos estos últimos al final del curso.
Funciones partidas o por tramos
Consideremos la siguiente función partida, por tramos o por
segmentos,
yi = β0 + β1xi + �i , �i ∼ N(0, σ2) si x ≤ x0
yi = β2 + β3xi + �i , �i ∼ N(0, σ2) si x ≥ x0
Funciones partidas o por tramos (cont.)
I Claramente, en el punto x0, ambas funciones son iguales de
modo que
β2 = β0 + (β1 − β3) x0.
Combinando ambas expresiones en una sola
y = (β0 + β1x) δx≤x0 + [β0 + β1x0 + β3(x − x0)] (1− δx≤x0) + �,
donde δx≤x0 es una variable binaria que vale 1 si x ≤ x0, o 0
en caso contrario.
I Luego de alguna manipulación esta expresión es igual a
y = (β0 + β1x0) + β3 (x − x0) + (β1 − β3) (x − x0)δx≤x0 + �.
(1)
Funciones partidas o por tramos (cont.)
Alternativamente si
y = (β0 + β1x) (1− δx≥x0) + [β0 + β1x0 + β3(x − x0)] δx≥x0 + �,
obtenemos la expresión
y = β0 + β1x + (β3 − β1)(x − x0) δx≥x0 + �. (2)
Si tomamos como referencia (1), podemos probar distintas
hipótesis sobre la forma funcional, e.g.:
I Rβ > 0, con β1 > 0 y β1 − β3 > 0 (concavidad)
I Rβ < 0, con β1 < 0, β1 − β3 < 0 (convexidad)
I Rβ = 0, con β1 − β3 = 0 (salto en nivel)
I R1 = [0, 0, 1], R2 = [1,−x0, 0] y r = [0, β2]′ recta única con
ordenada β̃2
y recurriendo a los estad́ısticos χ2 y F definidos anteriormente.
Funciones partidas o por tramos (cont.)
Ejemplo 1. La depreciación de un veh́ıculo es mayor en los
primeros años de uso y menor en los últimos.
Año Precio X
0 15,0 1 -2 -2
1 10,5 1 -1 -1
2 5,5 1 0 0
3 4,5 1 1 0
4 4,0 1 2 0
5 3,0 1 3 0
Efectos de interacción
Otra aplicación importante de las variables dicótomas es la
inclusión de un término de interacción, por ejemplo
y = β0 + β1δ1 + β2δ2 + β3δ1δ2 + β4x + �, � ∼ N(0, σ2) (3)
I Claramente, el incremento en y cuando δj toma el estado 1 es
∂y
∂δ1
= β1 + β3δ2 y
∂y
∂δ2
= β2 + β3δ1
lo que significa que la respuesta marginal respecto de una
variable cambia cuando la otra está presente. La inclusión de
interacción es frecuente en modelos de fertilización
y = β0 + β1x1 + β2x2 + β3x1x2 + �, � ∼ N(0, σ2) (4)
I Al probar hipótesis sobre (3) o (4) se recomienda probar
interacción (β3) antes que efectos principales.
Efectos de interacción (cont.)
Ejemplo 2. Es sabido que en la producción agŕıcola la adición de
un nutriente potencia (o deprime) el efecto de los demás. En el
siguiente ensayo de rendimiento de trigo fertilizado con N y P se
ajustó un modelo con interacción.
Rend. 17 28 33 22 36 45
N 0 50 100 0 50 100
P 0 0 0 20 20 20
N*P 0 0 0 0 1000 2000
Efectos de interacción (cont.)
En el modelo de efectos principales, tanto el N como el P influyen
positivamente sobre el rendimiento. Sin embargo, al incluir un
término de interacción, el P deja de ser “significativo”.
Es decir, en este experimento, el P no tiene influencia sobre el
rndimiento cuando el N está presente.
Análisis de estacionalidad
Muchas variables económicas presentan un comportamiento
estacional. Para modelarlo es frecuente incluir variables binarias
indicativas del mes o trimestre en cuestión.
y = β0 +
p−1∑
j=1
βjδj + βpx + �, � ∼ N(0, σ2) (5)
donde p es la periodicidad de los datos. Notemos que en (5)
I omitimos un término de estacionalidad para evitar una
“trampa de variables binarias”, es decir, la construcción de
una matriz perfectamente colineal.
I el efecto estacional es fijo y aditivo; si el efecto fuera
proporcional, el modelo correcto debeŕıa considerar ln y , ln x y
un término de error exponencial.
Análisis de estacionalidad (cont.)
I Otra alternativa para eludir la “trampa de las variables
binarias” consiste en “reparametrizar” el modelo, es decir,
asumiendo que
β1 + β2 + β3 + β4 = 0 ⇐⇒ β4 = −β1 − β2 − β3
rescribimos el modelo como
y = β0 + β1δ1 + β2δ2 + β3δ3 + β4δ4 + β5 x + �
= β0 + β1 (δ1 − δ4) + β2 (δ2 − δ4) + β3 (δ3 − δ4) + β5 x + �
I Cabe destacar que al eliminar la última columna de X
asumimos que β4 = 0. En cambio, con la reparametrización
asumimos que los efectos estacionales se compensan.
Análisis de estacionalidad (cont.)
Ejemplo 3. Veamos un esquema de una matriz X
reparametrizada.
X X∗
1 1 0 0 0 x1 1 1 0 0 x1
1 0 1 0 0 x2 1 0 1 0 x2
1 0 0 1 0 x3 1 0 0 1 x3
1 0 0 0 1 x4 1 -1 -1 -1 x4
1 1 0 0 0 x5 1 1 0 0 x5
1 0 1 0 0 x6 1 0 1 0 x6
1 0 0 1 0 x7 1 0 0 1 x7
1 0 0 0 1 x8 1 -1 -1 -1 x8
Comparación de dos regresiones
Otra importante aplicación de las variables binarias es la
comparación de dos regresiones. Supongamos que disponemos de
datos de fuentes distintas, asociados a las funciones
y = β0 + β1x + �, � ∼ N(0, σ2)
y = β2 + β3x + �, � ∼ N(0, σ2)
Si combinamos ambas expresiones en una
y = (β0 + β1x) δ + (β2 + β3x) (1− δ) + �
= β2 + (β0 − β2) δ + (β1 − β3) (xδ) + β3x + ν
es decir,
y = α0 + α1δ + α2z + α3x + ν
es evidente que podemos probar que ambas datos provienen de la
misma población, o H0: Rα = 0, siendo R1 = [0, 1, 0, 0] y
R2 = [0, 0, 1, 0] con el conocido estad́ıstico χ2 o F .

Continuar navegando