Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Variables Dicótomas Exógenas Luis Frank Depto. de Métodos Cuantitativos Facultad de Agronoḿıa Universidad de Buenos Aires Abril, 2021 Introducción En regresión es frecuente el uso de variables regresoras dicótomas (o binarias) para I especificar funciones partidas o “por tramos”, I incluir efectos de interacción, I incluir efectos fijos de estacionalidad, I comparar dos regresiones. Las variales binarias son útiles también para especificar funciones que involucren una elección binarias, dando lugar al: I modelo lineal de probabilidad I modelo de probabilidad loǵıstico o logit I modelo de probabilidad normal o probit Veremos estos últimos al final del curso. Funciones partidas o por tramos Consideremos la siguiente función partida, por tramos o por segmentos, yi = β0 + β1xi + �i , �i ∼ N(0, σ2) si x ≤ x0 yi = β2 + β3xi + �i , �i ∼ N(0, σ2) si x ≥ x0 Funciones partidas o por tramos (cont.) I Claramente, en el punto x0, ambas funciones son iguales de modo que β2 = β0 + (β1 − β3) x0. Combinando ambas expresiones en una sola y = (β0 + β1x) δx≤x0 + [β0 + β1x0 + β3(x − x0)] (1− δx≤x0) + �, donde δx≤x0 es una variable binaria que vale 1 si x ≤ x0, o 0 en caso contrario. I Luego de alguna manipulación esta expresión es igual a y = (β0 + β1x0) + β3 (x − x0) + (β1 − β3) (x − x0)δx≤x0 + �. (1) Funciones partidas o por tramos (cont.) Alternativamente si y = (β0 + β1x) (1− δx≥x0) + [β0 + β1x0 + β3(x − x0)] δx≥x0 + �, obtenemos la expresión y = β0 + β1x + (β3 − β1)(x − x0) δx≥x0 + �. (2) Si tomamos como referencia (1), podemos probar distintas hipótesis sobre la forma funcional, e.g.: I Rβ > 0, con β1 > 0 y β1 − β3 > 0 (concavidad) I Rβ < 0, con β1 < 0, β1 − β3 < 0 (convexidad) I Rβ = 0, con β1 − β3 = 0 (salto en nivel) I R1 = [0, 0, 1], R2 = [1,−x0, 0] y r = [0, β2]′ recta única con ordenada β̃2 y recurriendo a los estad́ısticos χ2 y F definidos anteriormente. Funciones partidas o por tramos (cont.) Ejemplo 1. La depreciación de un veh́ıculo es mayor en los primeros años de uso y menor en los últimos. Año Precio X 0 15,0 1 -2 -2 1 10,5 1 -1 -1 2 5,5 1 0 0 3 4,5 1 1 0 4 4,0 1 2 0 5 3,0 1 3 0 Efectos de interacción Otra aplicación importante de las variables dicótomas es la inclusión de un término de interacción, por ejemplo y = β0 + β1δ1 + β2δ2 + β3δ1δ2 + β4x + �, � ∼ N(0, σ2) (3) I Claramente, el incremento en y cuando δj toma el estado 1 es ∂y ∂δ1 = β1 + β3δ2 y ∂y ∂δ2 = β2 + β3δ1 lo que significa que la respuesta marginal respecto de una variable cambia cuando la otra está presente. La inclusión de interacción es frecuente en modelos de fertilización y = β0 + β1x1 + β2x2 + β3x1x2 + �, � ∼ N(0, σ2) (4) I Al probar hipótesis sobre (3) o (4) se recomienda probar interacción (β3) antes que efectos principales. Efectos de interacción (cont.) Ejemplo 2. Es sabido que en la producción agŕıcola la adición de un nutriente potencia (o deprime) el efecto de los demás. En el siguiente ensayo de rendimiento de trigo fertilizado con N y P se ajustó un modelo con interacción. Rend. 17 28 33 22 36 45 N 0 50 100 0 50 100 P 0 0 0 20 20 20 N*P 0 0 0 0 1000 2000 Efectos de interacción (cont.) En el modelo de efectos principales, tanto el N como el P influyen positivamente sobre el rendimiento. Sin embargo, al incluir un término de interacción, el P deja de ser “significativo”. Es decir, en este experimento, el P no tiene influencia sobre el rndimiento cuando el N está presente. Análisis de estacionalidad Muchas variables económicas presentan un comportamiento estacional. Para modelarlo es frecuente incluir variables binarias indicativas del mes o trimestre en cuestión. y = β0 + p−1∑ j=1 βjδj + βpx + �, � ∼ N(0, σ2) (5) donde p es la periodicidad de los datos. Notemos que en (5) I omitimos un término de estacionalidad para evitar una “trampa de variables binarias”, es decir, la construcción de una matriz perfectamente colineal. I el efecto estacional es fijo y aditivo; si el efecto fuera proporcional, el modelo correcto debeŕıa considerar ln y , ln x y un término de error exponencial. Análisis de estacionalidad (cont.) I Otra alternativa para eludir la “trampa de las variables binarias” consiste en “reparametrizar” el modelo, es decir, asumiendo que β1 + β2 + β3 + β4 = 0 ⇐⇒ β4 = −β1 − β2 − β3 rescribimos el modelo como y = β0 + β1δ1 + β2δ2 + β3δ3 + β4δ4 + β5 x + � = β0 + β1 (δ1 − δ4) + β2 (δ2 − δ4) + β3 (δ3 − δ4) + β5 x + � I Cabe destacar que al eliminar la última columna de X asumimos que β4 = 0. En cambio, con la reparametrización asumimos que los efectos estacionales se compensan. Análisis de estacionalidad (cont.) Ejemplo 3. Veamos un esquema de una matriz X reparametrizada. X X∗ 1 1 0 0 0 x1 1 1 0 0 x1 1 0 1 0 0 x2 1 0 1 0 x2 1 0 0 1 0 x3 1 0 0 1 x3 1 0 0 0 1 x4 1 -1 -1 -1 x4 1 1 0 0 0 x5 1 1 0 0 x5 1 0 1 0 0 x6 1 0 1 0 x6 1 0 0 1 0 x7 1 0 0 1 x7 1 0 0 0 1 x8 1 -1 -1 -1 x8 Comparación de dos regresiones Otra importante aplicación de las variables binarias es la comparación de dos regresiones. Supongamos que disponemos de datos de fuentes distintas, asociados a las funciones y = β0 + β1x + �, � ∼ N(0, σ2) y = β2 + β3x + �, � ∼ N(0, σ2) Si combinamos ambas expresiones en una y = (β0 + β1x) δ + (β2 + β3x) (1− δ) + � = β2 + (β0 − β2) δ + (β1 − β3) (xδ) + β3x + ν es decir, y = α0 + α1δ + α2z + α3x + ν es evidente que podemos probar que ambas datos provienen de la misma población, o H0: Rα = 0, siendo R1 = [0, 1, 0, 0] y R2 = [0, 0, 1, 0] con el conocido estad́ıstico χ2 o F .
Compartir