Logo Studenta

econometria191_clase10_mrl_dummies

¡Este material tiene más páginas!

Vista previa del material en texto

Econometŕıa I – EAE-250A
Variables con Información Cualitativa
Jaime Casassus
Instituto de Econoḿıa
Pontificia Universidad Católica de Chile
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Tabla de Contenidos
1 Variables Dummy
2 Términos de interacción con dummies
3 Variable dependiente cualitativa
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Información Cualitativa
• En la mayoŕıa de los ejemplos se han usado variables que contienen
información cuantitativa: años de educación, valor de una vivienda, peso de
un recién nacido, etc.
• Sin embargo, en muchos casos es necesario incluir variables con información
cualitativa:
• región
• género
• raza
• religión
• situación marital
• rama de actividad económica
• participación en sindicatos
• ¿tiene t́ıtulo profesional?
• ¿tiene acceso a un computador en su lugar de trabajo?
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Variables Dummy
• En todos estos casos se puede definir una o más variables que toman dos
valores, 0 ó 1, en que 1 representa la posesión de una cualidad y 0 la
ausencia.
• Estas variables son llamadas variables dummy.
• Suponga el caso de una variable regresora dummy para la variable género,
salario = β0 + δ0mujer + β1educ + β2exper + β3ant + u
• δ0 representa la diferencia en los salarios entre mujeres y hombres,
manteniendo todo lo demás constante.
• El intercepto de la ecuación de salarios para los hombres es β0 y para las
mujeres es β0 + δ0.
• ¿Cómo se compara esto con correr dos regresiones separadas, una para
hombres y otra para mujeres?
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Variables Dummy (cont.)
• ¿Cómo se testea la hipótesis nula de no discriminación salarial contra
las mujeres?
H0 : δ0 = 0
H1 : δ0 < 0
• ¿Cómo se compara el modelo anterior con el siguiente?
salario = α0 + γ0hombre + α1educ + α2exper + α3ant + u
• ¿Por qué no se incluyen simultáneamente dummies de hombres y
mujeres, además del intercepto?
• Es posible incluir ambas variables sin intercepto, pero resulta más
complicado testear la diferencia esperada entre ambas categoŕıas.
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Variables Dummy con más de 2 categoŕıas
• ¿Qué hacer cuando se usa una variable cualitativa como región, que tiene
q > 2 categoŕıas?
• Se crean q − 1 variables binarias, cada una correspondiente a una dummy
que vale 1 para una cierta categoŕıa y 0 en otro caso.
• La categoŕıa cuya variable dummy no fue incluida en la ecuación se
considera la categoŕıa base y la interpretación de los coeficientes de las
categoŕıas restantes se hace en relación a esta categoŕıa base.
• ¿Por qué en lugar de crear q− 1 variables dummy distintas no se incluye una
sola variable que toma q valores distintos?
• Si el número de categoŕıas es muy grande y hay pocos datos, se sugiere
agrupar en un número menor de categoŕıas. Por ejemplo, en lugar de incluir
una dummy por cada una de las 15 regiones del páıs (menos una) podemos
crear menos categoŕıas: norte grande, norte chico, centro, . . .
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Ejemplo: premio por matrimonio
• Considere una variable con cuatro categoŕıas: mujer casada, mujer soltera,
hombre casado y hombre soltero (categoŕıa base).
̂ln(salario) = 0.321+ 0.213hcasad− 0.198mcasad
(0.100) (0.055) (0.058)
−0.11msolt 0.079educ+ 0.027exper
(0.056) (0.007) (0.005)
−0.00054exper 2+ 0.029ant− 0.00053ant2
(0.00011) (0.007) (0.00023)
• Un hombre casado tiene un salario esperado que es 21.3% mayor que el de
un hombre soltero.
• Una mujer casada tiene un salario esperado que es 19.8% menor que el de
un hombre soltero.
• Para estimar la diferencia entre los salarios de mujeres solteras y casadas, se
calcula −0.110− (−0.198) = 0.088. Para ver la significancia de esta
diferencia se realiza un test de combinación lineal de estos coeficientes.
• También se puede estimar la regresión usando como categoŕıa base a las
mujeres casadas.
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Tabla de Contenidos
1 Variables Dummy
2 Términos de interacción con dummies
3 Variable dependiente cualitativa
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Interacción entre variables dummy
• Considere el modelo equivalente al visto en el ejemplo de premio por
matrimonio, pero usando dos dummies que interactúan:
ln(salario) = 0.321− 0.110mujer+ 0.213casad− 0.301mujer × casad + . . .
(0.100) (0.056) (0.055) (0.072)
• El efecto parcial (i.e ceteris paribus) de estar casado en los salarios depende
del género:
∆ln(salario)
∆casad
= 0.213− 0.301mujer
Para hombres, su valor es 21.3% y para mujeres es −0.088 = −8.8%.
• En esta forma, testear la hipótesis nula de que el premio por matrimonio no
depende del género del individuo es directo, y corresponde a testear que el
coeficiente que acompaña al término de interacción es no significativo.
• Para analizar diferencias entre cualquier par de grupos, por ejemplo,
hombres casados versus mujeres solteras, sólo hay que tener cuidado al
chequear qué coeficientes sobreviven. (0.213 + 0.110 = 0.323 = 32.3%).
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Interacción con variables cuantitativas
• Considere el siguiente modelo
ln(salario) = β0 + δ0mujer + β1educ + δ1mujer × educ + u
• Para los hombres, el intercepto es β0 y la pendiente por educación es β1.
• Para las mujeres, el intercepto es β0 + δ0 y la pendiente por educación es
β1 + δ1.
• δ0 mide la diferencia en los interceptos entre mujeres y hombres, y δ1 la
diferencia en los retornos a la educación entre mujeres y hombres.
• La hipótesis nula H0 : δ1 = 0 plantea que los retornos a la educación son los
mismos para hombres y mujeres.
• Para testear que los salarios son iguales para mujeres y hombres de iguales
caracteŕısticas, incluyendo años de educación, se debe plantear la hipótesis
H0 : δ0 = δ1 = 0.
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Test de Chow: diferencias entre grupos
• Suponga el siguiente modelo
y = β0 + β1x1 + β2x2 + β3x3 + u
y que se puede clasificar las n observaciones en G grupos distintos.
• Se quiere testear que el modelo es el mismo para todos los grupos, es decir,
los coeficientes son los mismos.
• En series de tiempo esto equivale a testear un cambio de régimen o cambio
“estructural”.
• Suponga G = 2. Para realizar el test planteamos el modelo sin restringir:
y = β0 + β1x1 + β2x2 + β3x3
+α0D + α1x1D + α2x2D + α3x3D + u
donde D es una variable dummy para observaciones de un mismo grupo.
• La hipótesis nula correspondiente es H0 : α0 = α1 = α2 = α3 = 0.
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Test de Chow: diferencias entre grupos (cont.)
• Otra forma de verificar esta hipótesis es usando el Test de Chow.
• Estimar la ecuación
y = βg0 + βg1x1 + βg2x2 + βg3x3 + u
para cada subpoblación g = 1, . . . ,G .
• Obtener la SSRg correspondiente a la regresión para dicho subgrupo, y
construir SSRur =
∑G
g=1 SSRg .
• Estimar la ecuación restringida
y = β0 + β1x1 + β2x2 + β3x3 + u
usando todas las observaciones y obtener su SSRr .
• Construir el estad́ıstico del Test de Chow
F =
(SSRr − SSRur )/((G − 1)(k + 1))
SSRur/(n − G (k + 1))
∼ F ((G − 1)(k + 1), n − G (k + 1))
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Ejemplo: Test de Chow
• Usted busca determinar si la siguiente ecuación de salarios es igual
para mujeres solteras que para hombres:
lwage = β0 + β1educ + β2exper + β3exper
2 + u
donde lwage es log salario, educ los años de educación y exper los
años de experiencia. Además cuenta con las variables dummies female
y married. Verifique la hipótesis nula usando un nivel de significancia
de α = 5%. {Ayuda: En STATA el caracter “&” significa “y”,
mientras que “|” significa “o”. En Gretl el caracter “&&” significa
“y”, mientras que “||” significa “o”.}
Respuesta: Gretl
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Tabla de Contenidos
1 Variables Dummy
2 Términos deinteracción con dummies
3 Variable dependiente cualitativa
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
El modelo de probabilidad lineal (MPL)
• ¿Qué sucede cuándo la variable dependiente refleja información cualitativa?
• Considere el caso simple cuando y tiene sólo dos categoŕıas, definidas como
0 (fracaso) y 1 (éxito).
y = β0 + β1x1 + β2x2 + . . .+ βkxk + u
E[y |x ] = β0 + β1x1 + β2x2 + . . .+ βkxk
• En este caso se cumple además que
E[y |x ] = 1P[y = 1|x ] + 0P[y = 0|x ] = P[y = 1|x ]
• Luego la regresión es igual a
P[y = 1|x ] = β0 + β1x1 + β2x2 + . . .+ βkxk
• Los modelos con variable dependiente binaria, son llamados modelos de
probabilidad lineal.
• βj mide el cambio en la probabilidad de éxito debido a un cambio en una
unidad de xj .
• β0 mide la probabilidad de éxito cuando x1 = x2 = . . . = xk = 0.
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
El modelo de probabilidad lineal (MPL) (cont.)
• El MPL presenta dos problemas
• Se pueden predecir probabilidades de éxito negativas o mayores que uno.
• No se cumple el supuesto de homocedasticidad.
y = x>β + u ⇒
{
u = −x>β si y = 0
u = 1− x>β si y = 1
Var[y |x ] = Var[u|x ] = E[u2|x ]
= (−x>β)2P[y = 0|x ] + (1− x>β)2P[y = 1|x ]
= (−x>β)2(1− x>β) + (1− x>β)2(x>β)
= x>β(1− x>β)(x>β + (1− x>β)) = x>β(1− x>β)
• Los modelos PROBIT y LOGIT son más apropiados para este tipo de casos.
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
Ejemplo: participación laboral de mujeres casadas
• Considere la siguiente regresión para inlf (in labor force) Gretl
• ¿Para que casos P[y = 1|x ] > 1? ¿y P[y = 1|x ] < 0?
Casassus (UC) EAE-250A - Econometŕıa I 13-May-19
	Variables Dummy
	Información Cualitativa
	Variables Dummy
	Variables Dummy con más de 2 categorías
	Ejemplo: premio por matrimonio
	Términos de interacción con dummies
	Interacción entre variables dummy
	Interacción con variables cuantitativas
	Test de Chow: diferencias entre grupos
	Ejemplo: Test de Chow
	Variable dependiente cualitativa
	El modelo de probabilidad lineal (MPL)
	Ejemplo: participación laboral de mujeres casadas

Continuar navegando

Materiales relacionados

80 pag.
7 pag.
variables ficticias

User badge image

Estudiando Ingenieria

40 pag.
17 pag.
Clase 12 (Dummies)

User badge image

Central de Apuntes