Logo Studenta

variables ficticias

¡Estudia con miles de materiales!

Vista previa del material en texto

TEMA 7. VARIABLES FICTICIAS 
 
 
 
INDICE 
1. INTRODUCCIÓN 
2. EL USO DE LAS VARIABLES FICITICAS EN EL MLG 
3. VARIABLE CUALITATIVA CON MAS DE DOS 
CATEGORÍAS 
4. EFECTOS INTERACTIVOS ENTRE DOS VARIABLES 
FICTICIAS 
5. CONTRASTES DE CAMBIO ESTRUCTURAL BASADO EN 
VARIABLES DUMMIES.
 
1. INTRODUCCIÓN 
Una variable ficticia (también llamada variable binaria o dummy) es una variable 
artificial construida por el investigador que usualmente toma valores 1 ó 0 y que tiene 
distintas utilidades en un modelo econométrico: 
• Para llevar a cabo algunos contrastes de hipótesis, en particular, los llamados 
contrastes de cambio estructural. 
• Para introducir en el modelo econométrico efectos temporales, como por 
ejemplo el concepto de la estacionalidad. 
• A veces, disponemos de información cualitativa acerca de un conjunto de 
individuos, que sólo puede representarse a través de dummies. Por ejemplo, 
el sexo, la raza o el nivel de estudios de un individuo son características del 
mismo que requieren del uso de este tipo de variables. 
 
Empezamos con la tercera utilidad de estas variables. Como ejemplo, consideramos el 
siguiente MLG: 
iuiExpiSal ++= 21 ββ 1) 
Ahora queremos analizar la discriminación salarial entre hombres y mujeres del 
conjunto de individuos. 
Podemos dividir la muestra en dos sub-muestra una con los hombres y otra con las 
mujeres. En base a esta división de la muestra, el análisis de las diferencias saláriales 
entre hombre y mujeres se puede plantear en dos formas alternativas: 
 1. Suponiendo que la relación entre el salario y el nivel de experiencia no 
cambia según si se trata de hombre o mujer, es decir las pendientes son las mismas. 
En este caso la variable ficticia sólo afecta al termino independiente del modelo: 
aditiva. 
 2. Suponiendo que la relación entre el salario y el nivel de experiencia 
cambia según si se trata de hombre o mujer, es decir las pendientes no son las mismas. 
En este caso la variable ficticia afecta a todos los parámetros del modelo: 
multiplicativa 
 
1. EL USO DE LAS VARIABLES FICTICIAS EN EL MLG 
 
Para analizar el uso de las variables ficticias en el MLG consideramos el ejemplo 
anterior del salario de los trabajadores distinguiendo entre Hombres y Mujeres. 
1.1. ADITIVA 
Inicialmente vamos a suponer que la cualificación de Genero sólo afecta a la 
constante u ordenada en el origen. Es decir, habrá sólo diferencia en el salario medio 
entre hombre y mujeres: 
1 2
1 2
: 
 : 
i i Hi
i i Mi
Hombres Sal Exp u
Mujeres Sal Exp u
β β
γ β
= + +
= + + ( 2
 
Para analizar los efectos del genero sobre el salario en primer lugar definimos las 
variables ficticias (también llamadas variables binarias o “dummies”). Estas variables 
ficticias pueden utilizarse como regresores en el MLG. 
 { 1 si el individuo i es mujer0 si el individuo i es hombreiDM = {1 si el individuo i es hombre0 si el individuo i es mujeriDH = 
 
Una vez definidas las variables ficticias y suponiendo que dicha variable sólo afecta al 
término independiente del modelo, ahora introducimos la Variable ficticia de forma 
aditiva en el modelo Econométrico. Tenemos tres formas equivalentes de introducir la 
variable ficticia: 
1. Una de las dos variables ficticias y el término independiente: 
iuiDMiExpiSal +++= 321 βββ (3) 
2ª La otra ficticia y el término independiente: 
iuiDHiExpiSal +++= 321 βββ (4) 
3ª Las dos ficticias pero sin término independiente. 
iuiExpiDHiDMiSal +++= 231 βββ (5) 
 
Los tres modelos ( 3, 4 y 5) son equivalentes. En la regresión 3 y 4 se introduce una 
de las variables ficticias (DM en 3 y DH en 4) así como el término independiente. Sin 
embargo, en 4 se plantea una regresión donde se introducen las dos variables ficticias 
(Hombres y Mujeres) pero se elimina el término independiente. De lo contrario, se 
produce un problema multicolinealidad perfecta conocida como trampa de variables 
ficticias en el modelo. 
La trampa de variables ficticias: 
Si se introducen las dos variables ficticias y el término independientes en el mismo 
modelo tal que: 
iiiii uDMDHExpSal ++++= 4321 ββββ 
Entonces este modelo no se puede estimar debido a la existencia de multicolinealidad 
exacta entre la constante y las dos variables ficticias, ya que: 1i iDH DM+ = 
Para evitar la multicolinealidad perfecta, si una variable cualitativa tiene “m” 
categorías, introducir solo “m-1” variables dummies. Sin embargo, si se elimina el 
término independiente del modelo se pueden introducir las “m” categorías. 
Cuando se elige la opción 3 o la 4, la ficiticia que no aparece se la llama categoría-
control (o grupo omitido). 
INTERPRETACIÓN 
La interpretación que tienen los coeficientes asociados a las dummies es sencilla. De 
la ecuación anterior, podemos obtener el salario esperado (medio) de un HOMBRE y 
el de una MUJER. Es decir, suponiendo que trabajamos con el modelo (3): 
El salario esperado de una mujer (DM=1) es: 
[ ] iExpDMiiSalE 2311| βββ ++== 
El salario esperado de un Hombre (DM=0) es: 
[ ] iExpDMiiSalE 210| ββ +== 
Por tanto, 3β mide la diferencia esperada en el salario entre un hombre y una 
mujer. 
Finalmente, resultante interesante contrastar la siguiente hipótesis nula: 
0:
0:0
3
3
≠
=
β
β
Ha
H
 studenttt _ˆ
ˆ
3
3
ˆ
3 ≈=
β
β σ
β
 
Si se acepta esta hipótesis se concluye que no hay diferencias salariales 
signifivcativas entre hombres y mujeres. Es decir no hay discriminación salarial. En 
cambio rechazar la hipótesis nula indica que hay diferencias salariales significativas 
entre hombres y mujeres. 
 
1.2. MULTIPLICATIVA: 
Ahora vamos a suponer que la cualificación de Genero sólo afecta a la pendiente del 
modelo. Es decir la experiencia se valora (salario percibido) de forma diferente en un 
hombre que en una mujer : 
 
1 2
1 2 3
1 2
i i Hi
i i i i
i i Mi
Sal Exp u Hombres
Sal Sal Exp DM Exp u
Sal Exp u Mujeres
β β
β β β
β γ
= + + →⎧
= → = + + +⎨ = + + →⎩
INTERPRETACIÓN 
La interpretación que tienen los coeficientes asociados a las dummies es sencilla. De 
la ecuación anterior, podemos obtener el salario esperado (medio) de un HOMBRE y 
el de una MUJER. Es decir: 
El salario esperado de una mujer (DM=1) es: 
[ ]| 1 ( )1 2 3E Sal DMi Expi iβ β β= = + + 
El salario esperado de un Hombre (DM=0) es: 
[ ] iExpDMiiSalE 210| ββ +== 
Por tanto, 3β mide la diferencia en salario entre un hombre y una mujer por cada 
año adicional de experiencia. Su signo esperado es negativo. 
Finalmente, resultante interesante contrastar la siguiente hipótesis nula: 
¿Realmente se remunera menos la experiencia de la mujer respecto a la del hombre?: 
3
3
0 : 0
: 0
H
Ha
β
β
=
<
 studenttt _ˆ
ˆ
3
3
ˆ
3 ≈=
β
β σ
β
 
Si se acepta esta hipótesis se concluye que no hay diferencias salariales significativas 
entre hombres y mujeres. Es decir no hay discriminación salarial. En cambio rechazar 
la hipótesis nula indica que hay diferencias salariales significativas entre hombres y 
mujeres. 
 
2. VARIABLE CUALITATIVA CON MAS DE DOS CATEGORIAS 
 
Como ejemplo, supongamos que queremos explicar las diferencias salariales de un 
conjunto de individuos con diferentes niveles de estudios: primarios, secundarios y 
superiores. En un principio, definimos tantas ficticias como niveles de estudio, es 
decir: 
⎩
⎨
⎧
=
casos los de resto 0
primarios estudios tienesi 1
1D 
⎩
⎨
⎧
=
casos los de resto 0
ssecundario estudios tienesi 1
2D 
⎩
⎨
⎧
=
casos los de resto 0
riosuniversita estudios tienesi 1
3D 
 
Para evitar la trampa de las variables ficticias, la especificación de esta función de 
salarios que depende del nivel de estudios y experiencia laboral es incluir término 
constante y dejar una de las variables ficticias, por ejemplo, la primera como variable 
control: 
A) Aditivamente: Suponemosque la formación solo afecta al término independiente: 
1 2 2 2 3 3i i i i i
Sal Exp D D uα β α α= + + + + 
LA INTERPRETACIÓN DE LOS COEFICIENTES ES LA SIGUIENTE: 
 
Individuo con estudios 
Primarios 
032 == DD 
Secundarios 
( 0 1 32 == DyD ) 
Superiores 
( 1Dy 0 32 ==D ) 
Salario 
Esperado 
1α 1 2α α+ 1 3α α+ . 
 
Por tanto, 
2α es la diferencia esperada en el salario de un individuo con estudios 
secundarios con respecto a uno con estudios primarios y se espera que esta diferencia 
(coeficiente) sea positiva. 
Finalmente, 
3α se interpreta como la diferencia esperada entre el salario de una 
persona con estudios superiores con respecto a tener sólo estudios primarios. 
CONTRASTES RELEVANTES: 
A) 2
2
0 : 0
: 0
H
Ha
α
α
=
≠
 2
2
2
ˆ
ˆ
_
ˆ
t t studentα
α
α
σ=
≈ 
Aceptar la hipótesis nula implica que no hay diferencias entre los salarios medios de 
los trabajadores con estudios secundarios y estudios primarios. 
B) 3
3
0 : 0
: 0
H
Ha
α
α
=
≠
 
3
3
3
ˆ
ˆ
_
ˆ
t t studentα
α
α
σ=
≈ 
Aceptar la hipótesis nula implica que no hay diferencias significativas entre los 
salarios medios de los trabajadores con estudios universitarios y estudios primarios. 
C) 2 3
2 3
0 :
:
H
Ha
α α
α α
=
≠ FoEstadístic 
Aceptar la hipótesis nula implica que no hay diferencias significativas entre los 
salarios medios de los trabajadores con estudios universitarios y estudios 
secundarios. 
B) Multiplicativamente: Suponemos que la formación solo afecta a la forma de 
valorar la experiencia: 
1 2 2 2 3 3i i i i iii
Sal Exp D Exp D Exp uα β α α= + + + + 
3. EFECTOS INTERACTIVOS ENTRE DOS VARIABLES FICTICIAS 
Como ejemplo, supongamos que queremos explicar las diferencias salariales de un 
conjunto de individuos diferenciando por genero (Hombre o mujer) y por nivel de 
educación (estudios universitarios o no) es decir: 
1 Mujer
 
0 resto de los casos
DG
⎧
= ⎨
⎩
 
1 Con estudios Univarsitarios
 
0 resto de los casos
DE
⎧
= ⎨
⎩
 
A) ADITIVAMENTE: El efecto interactivo se define: 
iiiiiii uDGDEDEDGExpSal +++++= )*(54321 βββββ 
INTERPRETACIÓN DE LOS COEFICIENTES ES LA SIGUIENTE: 
Mujer sin Estud. Sup 
( 0DEy 1 ==DG ) 
Mujer con Estud. Sup 
( 1DEy 1 ==DG ) 
Hombre sin Estud 
Sup 
( 0DEy 0 ==DG ) 
hombre Estud Sup 
1DEy 0 ==DG 
31 ββ + 5431 ββββ +++ 1β . 41 ββ + 
Por tanto: 
3β mide el efecto diferenciador de ser mujer; 
4β mide el efecto diferenciador de tener estudios universitarios; 
5β mide el efecto diferenciador de ser mujer con estudios universitarios. 
 
4. CONTRASTES DE CAMBIO ESTRUCTURAL BASADO EN VARIABLES 
DUMMIES 
 
El contraste de cambio estructural es contrastar si la crisis ha alterado la función de 
consumo en todos sus parámetros. Es decir, si la crisis ha cambiado no sólo el 
consumo autónomo sino también la propensión marginal a consumir del país. 
 En este caso, el modelo especificado sería: 
1 2 1 1 2 1 1( ) , t=1,2..., n , ...,t t t t t tC D PIB PIB D nα α β β ε= + + + × + Donde: 
1
1
1
1 si t n
 
0 si nt
D
t
≥⎧
= ⎨ <⎩
 
El contraste de cambio estructural global puede llevarse a cabo usando dos 
alternativa: 
A) MEDIANTE FICITICAS 
Consiste en utilizar el modelo: 
1 2 1 1 2 1 1
( ) , t=1,2..., n , ...,
t t t t t t
C D PIB PIB D nα α β β ε= + + + × + 
La hipótesis nula a contrastar es si existen diferencias significativas en los parámetros 
de posición antes y después de la crisis: 
0 1 1: 0H α β= = → � Permanencia estructural 
HA: No H0. → � Ruptura estructural 
Al haber dos restricciones será necesario usar el estadístico F . 
Si se rechaza la nula, decimos que ha habido un cambio estructural global en la 
función de consumo. 
 B) Test de Chow. 
Para contrastar el cambio estructural en la función de consumo utilizando el test de 
Chow realizamos las siguientes etapas: 
1) Estimar el modelo con todas las observaciones (y obtener su Suma Residual (SR): 
SR T1,..., t21 →=++= ttt PIBC εββ 
2) Estimar el modelo para las dos submuestras definidas (antes y después de la crisis) 
y obtener sus respectivas sumas residuales: 
Función de consumo en los años anteriores a la crisis es: 
1 1 1 1 , t=1,2..., n SRt t tC PIBα β ε= + + → 
La función de consumo después de la crisis: 
2 2 1 2 , t= 1,... SRt t tC PIB n nα β ε= + + + → 
Calcular el valor del estadístico como: 
)2,(2)(
21
21 KTKF
K
KT
SRSR
SRSRSRFCHOW −≈−
+
+−
= ( 3
Resolución del contraste: 
 Si FCHOW ≤ Fε(K,T-2k) → EXISTE PERMANENCIA ESTRUCTURAL 
 Si FCHOW>Fε(K,T-2k) → RUPTURA ESTRUCTURAL 
También podríamos considerar que la ruptura solo afectase al término independiente, 
entonces introducimos sólo la ficticia aditivamente, o que sólo hubiese ruptura en la 
propensión marginal a consumir, en ese caso introducimos la ficticia de forma 
multiplicativa. Cuando se considera que la ruptura afecta tanto al término 
independiente como a todas las pendientes del modelo es cuando podemos aplicar 
CHOW. 
 
Ejercicio propuesto para el estudiante: Una cadena de restaurantes elabora un modelo 
para explicar sus ingresos ( iING ). Los factores explicativos qe considera son los 
siguientes: iNF , es el número de familias residentes en la zona donde está el 
restaurante i -ésimo; 1 2 3, ,i i iS S S son tres variables ficticias que hacen referencia a la 
situación del restaurante i -ésimo. Así, 1iS toma valor 1 si el restaurante i está en 
una autopista y 0 en el resto; 2iS toma valor 1 si el restaurante i está en un centro 
comercial y 0 en el resto y 3iS toma valor 1 si está en una calle y 0 en el resto de los 
casos. Se pide: 
Plantear el modelo que utilizaría para este estudio, incluyendo un término constante.

Continuar navegando