Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Econometŕıa I – EAE-250A Variables con Información Cualitativa Jaime Casassus Instituto de Econoḿıa Pontificia Universidad Católica de Chile Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Tabla de Contenidos 1 Variables Dummy 2 Términos de interacción con dummies 3 Variable dependiente cualitativa Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Información Cualitativa • En la mayoŕıa de los ejemplos se han usado variables que contienen información cuantitativa: años de educación, valor de una vivienda, peso de un recién nacido, etc. • Sin embargo, en muchos casos es necesario incluir variables con información cualitativa: • región • género • raza • religión • situación marital • rama de actividad económica • participación en sindicatos • ¿tiene t́ıtulo profesional? • ¿tiene acceso a un computador en su lugar de trabajo? Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Variables Dummy • En todos estos casos se puede definir una o más variables que toman dos valores, 0 ó 1, en que 1 representa la posesión de una cualidad y 0 la ausencia. • Estas variables son llamadas variables dummy. • Suponga el caso de una variable regresora dummy para la variable género, salario = β0 + δ0mujer + β1educ + β2exper + β3ant + u • δ0 representa la diferencia en los salarios entre mujeres y hombres, manteniendo todo lo demás constante. • El intercepto de la ecuación de salarios para los hombres es β0 y para las mujeres es β0 + δ0. • ¿Cómo se compara esto con correr dos regresiones separadas, una para hombres y otra para mujeres? Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Variables Dummy (cont.) • ¿Cómo se testea la hipótesis nula de no discriminación salarial contra las mujeres? H0 : δ0 = 0 H1 : δ0 < 0 • ¿Cómo se compara el modelo anterior con el siguiente? salario = α0 + γ0hombre + α1educ + α2exper + α3ant + u • ¿Por qué no se incluyen simultáneamente dummies de hombres y mujeres, además del intercepto? • Es posible incluir ambas variables sin intercepto, pero resulta más complicado testear la diferencia esperada entre ambas categoŕıas. Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Variables Dummy con más de 2 categoŕıas • ¿Qué hacer cuando se usa una variable cualitativa como región, que tiene q > 2 categoŕıas? • Se crean q − 1 variables binarias, cada una correspondiente a una dummy que vale 1 para una cierta categoŕıa y 0 en otro caso. • La categoŕıa cuya variable dummy no fue incluida en la ecuación se considera la categoŕıa base y la interpretación de los coeficientes de las categoŕıas restantes se hace en relación a esta categoŕıa base. • ¿Por qué en lugar de crear q− 1 variables dummy distintas no se incluye una sola variable que toma q valores distintos? • Si el número de categoŕıas es muy grande y hay pocos datos, se sugiere agrupar en un número menor de categoŕıas. Por ejemplo, en lugar de incluir una dummy por cada una de las 15 regiones del páıs (menos una) podemos crear menos categoŕıas: norte grande, norte chico, centro, . . . Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Ejemplo: premio por matrimonio • Considere una variable con cuatro categoŕıas: mujer casada, mujer soltera, hombre casado y hombre soltero (categoŕıa base). ̂ln(salario) = 0.321+ 0.213hcasad− 0.198mcasad (0.100) (0.055) (0.058) −0.11msolt 0.079educ+ 0.027exper (0.056) (0.007) (0.005) −0.00054exper 2+ 0.029ant− 0.00053ant2 (0.00011) (0.007) (0.00023) • Un hombre casado tiene un salario esperado que es 21.3% mayor que el de un hombre soltero. • Una mujer casada tiene un salario esperado que es 19.8% menor que el de un hombre soltero. • Para estimar la diferencia entre los salarios de mujeres solteras y casadas, se calcula −0.110− (−0.198) = 0.088. Para ver la significancia de esta diferencia se realiza un test de combinación lineal de estos coeficientes. • También se puede estimar la regresión usando como categoŕıa base a las mujeres casadas. Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Tabla de Contenidos 1 Variables Dummy 2 Términos de interacción con dummies 3 Variable dependiente cualitativa Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Interacción entre variables dummy • Considere el modelo equivalente al visto en el ejemplo de premio por matrimonio, pero usando dos dummies que interactúan: ln(salario) = 0.321− 0.110mujer+ 0.213casad− 0.301mujer × casad + . . . (0.100) (0.056) (0.055) (0.072) • El efecto parcial (i.e ceteris paribus) de estar casado en los salarios depende del género: ∆ln(salario) ∆casad = 0.213− 0.301mujer Para hombres, su valor es 21.3% y para mujeres es −0.088 = −8.8%. • En esta forma, testear la hipótesis nula de que el premio por matrimonio no depende del género del individuo es directo, y corresponde a testear que el coeficiente que acompaña al término de interacción es no significativo. • Para analizar diferencias entre cualquier par de grupos, por ejemplo, hombres casados versus mujeres solteras, sólo hay que tener cuidado al chequear qué coeficientes sobreviven. (0.213 + 0.110 = 0.323 = 32.3%). Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Interacción con variables cuantitativas • Considere el siguiente modelo ln(salario) = β0 + δ0mujer + β1educ + δ1mujer × educ + u • Para los hombres, el intercepto es β0 y la pendiente por educación es β1. • Para las mujeres, el intercepto es β0 + δ0 y la pendiente por educación es β1 + δ1. • δ0 mide la diferencia en los interceptos entre mujeres y hombres, y δ1 la diferencia en los retornos a la educación entre mujeres y hombres. • La hipótesis nula H0 : δ1 = 0 plantea que los retornos a la educación son los mismos para hombres y mujeres. • Para testear que los salarios son iguales para mujeres y hombres de iguales caracteŕısticas, incluyendo años de educación, se debe plantear la hipótesis H0 : δ0 = δ1 = 0. Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Test de Chow: diferencias entre grupos • Suponga el siguiente modelo y = β0 + β1x1 + β2x2 + β3x3 + u y que se puede clasificar las n observaciones en G grupos distintos. • Se quiere testear que el modelo es el mismo para todos los grupos, es decir, los coeficientes son los mismos. • En series de tiempo esto equivale a testear un cambio de régimen o cambio “estructural”. • Suponga G = 2. Para realizar el test planteamos el modelo sin restringir: y = β0 + β1x1 + β2x2 + β3x3 +α0D + α1x1D + α2x2D + α3x3D + u donde D es una variable dummy para observaciones de un mismo grupo. • La hipótesis nula correspondiente es H0 : α0 = α1 = α2 = α3 = 0. Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Test de Chow: diferencias entre grupos (cont.) • Otra forma de verificar esta hipótesis es usando el Test de Chow. • Estimar la ecuación y = βg0 + βg1x1 + βg2x2 + βg3x3 + u para cada subpoblación g = 1, . . . ,G . • Obtener la SSRg correspondiente a la regresión para dicho subgrupo, y construir SSRur = ∑G g=1 SSRg . • Estimar la ecuación restringida y = β0 + β1x1 + β2x2 + β3x3 + u usando todas las observaciones y obtener su SSRr . • Construir el estad́ıstico del Test de Chow F = (SSRr − SSRur )/((G − 1)(k + 1)) SSRur/(n − G (k + 1)) ∼ F ((G − 1)(k + 1), n − G (k + 1)) Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Ejemplo: Test de Chow • Usted busca determinar si la siguiente ecuación de salarios es igual para mujeres solteras que para hombres: lwage = β0 + β1educ + β2exper + β3exper 2 + u donde lwage es log salario, educ los años de educación y exper los años de experiencia. Además cuenta con las variables dummies female y married. Verifique la hipótesis nula usando un nivel de significancia de α = 5%. {Ayuda: En STATA el caracter “&” significa “y”, mientras que “|” significa “o”. En Gretl el caracter “&&” significa “y”, mientras que “||” significa “o”.} Respuesta: Gretl Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Tabla de Contenidos 1 Variables Dummy 2 Términos deinteracción con dummies 3 Variable dependiente cualitativa Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 El modelo de probabilidad lineal (MPL) • ¿Qué sucede cuándo la variable dependiente refleja información cualitativa? • Considere el caso simple cuando y tiene sólo dos categoŕıas, definidas como 0 (fracaso) y 1 (éxito). y = β0 + β1x1 + β2x2 + . . .+ βkxk + u E[y |x ] = β0 + β1x1 + β2x2 + . . .+ βkxk • En este caso se cumple además que E[y |x ] = 1P[y = 1|x ] + 0P[y = 0|x ] = P[y = 1|x ] • Luego la regresión es igual a P[y = 1|x ] = β0 + β1x1 + β2x2 + . . .+ βkxk • Los modelos con variable dependiente binaria, son llamados modelos de probabilidad lineal. • βj mide el cambio en la probabilidad de éxito debido a un cambio en una unidad de xj . • β0 mide la probabilidad de éxito cuando x1 = x2 = . . . = xk = 0. Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 El modelo de probabilidad lineal (MPL) (cont.) • El MPL presenta dos problemas • Se pueden predecir probabilidades de éxito negativas o mayores que uno. • No se cumple el supuesto de homocedasticidad. y = x>β + u ⇒ { u = −x>β si y = 0 u = 1− x>β si y = 1 Var[y |x ] = Var[u|x ] = E[u2|x ] = (−x>β)2P[y = 0|x ] + (1− x>β)2P[y = 1|x ] = (−x>β)2(1− x>β) + (1− x>β)2(x>β) = x>β(1− x>β)(x>β + (1− x>β)) = x>β(1− x>β) • Los modelos PROBIT y LOGIT son más apropiados para este tipo de casos. Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Ejemplo: participación laboral de mujeres casadas • Considere la siguiente regresión para inlf (in labor force) Gretl • ¿Para que casos P[y = 1|x ] > 1? ¿y P[y = 1|x ] < 0? Casassus (UC) EAE-250A - Econometŕıa I 13-May-19 Variables Dummy Información Cualitativa Variables Dummy Variables Dummy con más de 2 categorías Ejemplo: premio por matrimonio Términos de interacción con dummies Interacción entre variables dummy Interacción con variables cuantitativas Test de Chow: diferencias entre grupos Ejemplo: Test de Chow Variable dependiente cualitativa El modelo de probabilidad lineal (MPL) Ejemplo: participación laboral de mujeres casadas
Compartir