Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Ejemplo Interacciones – Sección 7.4 – Wooldridge (2010) Datos y variables[footnoteRef:1]: Los datos en el archivo adjunto (salary.txt) conciernen al salario y otras características de académicos en una institución educativa recolectados a inicios de la década del 80. Esta recolección se presentó como evidencia en procedimientos legales por discriminación sexual en salarios. Todos los académicos registrados en estos datos provienen de archivos personales y las variables registradas son: [1: Weisberg, S. 2005. Applied Linear Regression. Third edition. Wiley Series in Probability and Statistics. (Ejercicio 6.13)] sexo: Género del académico (1: mujer / 0: hombre) rango: Rango del académico (1: profesor asistente / 2: profesor asociado / 3: profesor jornada completa) agnos: número de años en el rango actual grado: máximo grado obtenido por el académico (1: doctorado / 0: magíster). agnos_grado: años transcurridos desde la obtención de su grado máximo. salario: salario anual recibido por el académico (en dólares). . sum grado rango sexo agnos agnos_grado salario Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- grado | 52 .6538462 .4803845 0 1 rango | 52 2.038462 .8623165 1 3 sexo | 52 .2692308 .4478876 0 1 agnos | 52 7.480769 5.507536 0 25 agnos_grado | 52 16.11538 10.22234 1 35 -------------+-------------------------------------------------------- salario | 52 23797.65 5917.289 15000 38045 . correlate grado rango sexo agnos agnos_grado salario (obs=52) | grado rango sexo agnos agnos_~o salario -------------+------------------------------------------------------ grado | 1.0000 rango | -0.0146 1.0000 sexo | 0.0771 -0.2304 1.0000 agnos | -0.1434 0.5080 -0.3794 1.0000 agnos_grado | -0.4828 0.6957 -0.0883 0.6388 1.0000 salario | -0.0697 0.8675 -0.2528 0.7007 0.6749 1.0000 i) ¿Será verdad que el salario anual recibido por académicos es el mismo entre hombres y mujeres? (Si no se controla por otros factores o variables) . reg salario sexo Source | SS df MS Number of obs = 52 -------------+------------------------------ F( 1, 50) = 3.41 Model | 114106220 1 114106220 Prob > F = 0.0706 Residual | 1.6716e+09 50 33432472.8 R-squared = 0.0639 -------------+------------------------------ Adj R-squared = 0.0452 Total | 1.7857e+09 51 35014310.9 Root MSE = 5782.1 ------------------------------------------------------------------------------ salario | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- sexo | -3339.647 1807.716 -1.85 0.071 -6970.55 291.257 _cons | 24696.79 937.9776 26.33 0.000 22812.81 26580.77 ------------------------------------------------------------------------------ . estat ic ----------------------------------------------------------------------------- Model | Obs ll(null) ll(model) df AIC BIC -------------+--------------------------------------------------------------- . | 52 -524.9329 -523.2161 2 1050.432 1054.335 ----------------------------------------------------------------------------- Note: N=Obs used in calculating BIC; see [R] BIC note (Controlando por las restantes variables del modelo. Recuerde: comando ib3.rango define automáticamente dos variables dummy, donde la categoría base es 3 [profesor jornada completa]) . reg salario sexo grado ib3.rango agnos agnos_grado Source | SS df MS Number of obs = 52 -------------+------------------------------ F( 6, 45) = 44.24 Model | 1.5269e+09 6 254478582 Prob > F = 0.0000 Residual | 258858365 45 5752408.11 R-squared = 0.8550 -------------+------------------------------ Adj R-squared = 0.8357 Total | 1.7857e+09 51 35014310.9 Root MSE = 2398.4 ------------------------------------------------------------------------------ salario | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- sexo | 1166.373 925.5689 1.26 0.214 -697.8183 3030.565 grado | -1388.613 1018.747 -1.36 0.180 -3440.475 663.2482 | rango | 1 | -11118.76 1351.772 -8.23 0.000 -13841.37 -8396.155 2 | -5826.403 1012.933 -5.75 0.000 -7866.555 -3786.251 | agnos | 476.309 94.91357 5.02 0.000 285.1433 667.4748 agnos_grado | -124.5743 77.48628 -1.61 0.115 -280.6397 31.49105 _cons | 28253.43 2028.711 13.93 0.000 24167.39 32339.46 ------------------------------------------------------------------------------ . estat ic ----------------------------------------------------------------------------- Model | Obs ll(null) ll(model) df AIC BIC -------------+--------------------------------------------------------------- . | 52 -524.9329 -474.719 7 963.4381 977.0968 ----------------------------------------------------------------------------- Note: N=Obs used in calculating BIC; see [R] BIC note ii) ¿Será verdad que el salario anual recibido por académicos es el mismo entre los 3 rangos? (Si no se controla por otros factores o variables) . reg salario ib3.rango Source | SS df MS Number of obs = 52 -------------+------------------------------ F( 2, 49) = 75.17 Model | 1.3468e+09 2 673391900 Prob > F = 0.0000 Residual | 438946058 49 8958082.81 R-squared = 0.7542 -------------+------------------------------ Adj R-squared = 0.7442 Total | 1.7857e+09 51 35014310.9 Root MSE = 2993 ------------------------------------------------------------------------------ salario | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- rango | 1 | -11890.28 972.407 -12.23 0.000 -13844.41 -9936.158 2 | -6483.021 1042.961 -6.22 0.000 -8578.93 -4387.113 | _cons | 29658.95 669.2564 44.32 0.000 28314.03 31003.87 ------------------------------------------------------------------------------ . estat ic ----------------------------------------------------------------------------- Model | Obs ll(null) ll(model) df AIC BIC -------------+--------------------------------------------------------------- . | 52 -524.9329 -488.4495 3 982.8991 988.7528 ----------------------------------------------------------------------------- Note: N=Obs used in calculating BIC; see [R] BIC note (Controlando por agnos, grado, agnos_grado) . reg salario ib3.rango agnos grado agnos_grado Source | SS df MS Number of obs = 52 -------------+------------------------------ F( 5, 46) = 52.10 Model | 1.5177e+09 5 303547304 Prob > F = 0.0000 Residual | 267993336 46 5825942.09 R-squared = 0.8499 -------------+------------------------------Adj R-squared = 0.8336 Total | 1.7857e+09 51 35014310.9 Root MSE = 2413.7 ------------------------------------------------------------------------------ salario | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- rango | 1 | -10509.62 1270.434 -8.27 0.000 -13066.87 -7952.37 2 | -5795.697 1019.092 -5.69 0.000 -7847.022 -3744.372 | agnos | 416.5638 82.74817 5.03 0.000 250.0004 583.1273 grado | -1062.115 991.5271 -1.07 0.290 -3057.956 933.7253 agnos_grado | -81.21746 69.87129 -1.16 0.251 -221.8611 59.42616 _cons | 27883.07 2020.1 13.80 0.000 23816.82 31949.32 ------------------------------------------------------------------------------ . estat ic ----------------------------------------------------------------------------- Model | Obs ll(null) ll(model) df AIC BIC -------------+--------------------------------------------------------------- . | 52 -524.9329 -475.6208 6 963.2415 974.949 ----------------------------------------------------------------------------- Note: N=Obs used in calculating BIC; see [R] BIC note iii) ¿Será verdad que las diferencias salariales entre ambos sexos son iguales en cada rango? (Si no se controla por otros factores o variables) . reg salario ib3.rango##sexo Source | SS df MS Number of obs = 52 -------------+------------------------------ F( 5, 46) = 29.12 Model | 1.3570e+09 5 271392041 Prob > F = 0.0000 Residual | 428769653 46 9321079.42 R-squared = 0.7599 -------------+------------------------------ Adj R-squared = 0.7338 Total | 1.7857e+09 51 35014310.9 Root MSE = 3053 ------------------------------------------------------------------------------ salario | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- rango | 1 | -11952.84 1230.721 -9.71 0.000 -14430.15 -9475.524 2 | -6428.854 1165.901 -5.51 0.000 -8775.69 -4082.018 | 1.sexo | -1067.438 1706.704 -0.63 0.535 -4502.854 2367.979 | rango#sexo | 1 1 | 727.8375 2238.321 0.33 0.747 -3777.669 5233.344 2 1 | -806.1458 2889.66 -0.28 0.782 -6622.729 5010.438 | _cons | 29872.44 763.2611 39.14 0.000 28336.07 31408.8 ------------------------------------------------------------------------------ . estat ic ----------------------------------------------------------------------------- Model | Obs ll(null) ll(model) df AIC BIC -------------+--------------------------------------------------------------- . | 52 -524.9329 -487.8397 6 987.6793 999.3868 ----------------------------------------------------------------------------- Note: N=Obs used in calculating BIC; see [R] BIC note . reg salario ib3.rango sexo Source | SS df MS Number of obs = 52 -------------+------------------------------ F( 3, 48) = 50.16 Model | 1.3539e+09 3 451286181 Prob > F = 0.0000 Residual | 431871315 48 8997319.05 R-squared = 0.7582 -------------+------------------------------ Adj R-squared = 0.7430 Total | 1.7857e+09 51 35014310.9 Root MSE = 2999.6 ------------------------------------------------------------------------------ salario | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- rango | 1 | -11677.75 1003.575 -11.64 0.000 -13695.57 -9659.927 2 | -6532.705 1046.743 -6.24 0.000 -8637.322 -4428.087 | sexo | -869.4545 980.5011 -0.89 0.380 -2840.884 1101.975 _cons | 29832.84 698.7999 42.69 0.000 28427.81 31237.87 ------------------------------------------------------------------------------ . estat ic ----------------------------------------------------------------------------- Model | Obs ll(null) ll(model) df AIC BIC -------------+--------------------------------------------------------------- . | 52 -524.9329 -488.0271 4 984.0541 991.8591 ----------------------------------------------------------------------------- Note: N=Obs used in calculating BIC; see [R] BIC note ¿Cómo usaría los resultados anteriores para responder a la pregunta iii)? (Controlando otros factores o variables) . reg salario ib3.rango##sexo grado agnos agnos_grado Source | SS df MS Number of obs = 52 -------------+------------------------------ F( 8, 43) = 33.32 Model | 1.5377e+09 8 192207471 Prob > F = 0.0000 Residual | 248070090 43 5769071.86 R-squared = 0.8611 -------------+------------------------------ Adj R-squared = 0.8352 Total | 1.7857e+09 51 35014310.9 Root MSE = 2401.9 ------------------------------------------------------------------------------ salario | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- rango | 1 | -10539.36 1426.21 -7.39 0.000 -13415.58 -7663.13 2 | -5420.359 1107.7 -4.89 0.000 -7654.25 -3186.469 | 1.sexo | 2954.541 1609.276 1.84 0.073 -290.8742 6199.956 | rango#sexo | 1 1 | -2510.245 1925.979 -1.30 0.199 -6394.352 1373.861 2 1 | -2011.956 2355.017 -0.85 0.398 -6761.301 2737.389 | grado | -1501.514 1029.803 -1.46 0.152 -3578.309 575.2816 agnos | 522.1385 105.5256 4.95 0.000 309.3258 734.9511 agnos_grado | -148.6112 86.8349 -1.71 0.094 -323.7305 26.50807 _cons | 28044.03 2103.065 13.33 0.000 23802.79 32285.27 ------------------------------------------------------------------------------ . estat ic ----------------------------------------------------------------------------- Model | Obs ll(null) ll(model) df AIC BIC -------------+--------------------------------------------------------------- . | 52 -524.9329 -473.6122 9 965.2245 982.7857 ----------------------------------------------------------------------------- Note: N=Obs used in calculating BIC; see [R] BIC note . reg salario ib3.rango sexo grado agnos agnos_grado Source | SS df MS Number of obs = 52 -------------+------------------------------ F( 6, 45) = 44.24 Model | 1.5269e+09 6 254478582 Prob > F = 0.0000 Residual | 258858365 45 5752408.11 R-squared = 0.8550 -------------+------------------------------ Adj R-squared = 0.8357 Total | 1.7857e+09 51 35014310.9 Root MSE = 2398.4 ------------------------------------------------------------------------------ salario | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- rango |1 | -11118.76 1351.772 -8.23 0.000 -13841.37 -8396.155 2 | -5826.403 1012.933 -5.75 0.000 -7866.555 -3786.251 | sexo | 1166.373 925.5689 1.26 0.214 -697.8183 3030.565 grado | -1388.613 1018.747 -1.36 0.180 -3440.475 663.2482 agnos | 476.309 94.91357 5.02 0.000 285.1433 667.4748 agnos_grado | -124.5743 77.48628 -1.61 0.115 -280.6397 31.49105 _cons | 28253.43 2028.711 13.93 0.000 24167.39 32339.46 ------------------------------------------------------------------------------ . estat ic ----------------------------------------------------------------------------- Model | Obs ll(null) ll(model) df AIC BIC -------------+--------------------------------------------------------------- . | 52 -524.9329 -474.719 7 963.4381 977.0968 ----------------------------------------------------------------------------- Note: N=Obs used in calculating BIC; see [R] BIC note ¿Cómo usaría los resultados anteriores para responder a la pregunta iii)? Estimados(as) alumnos(as): i) Les adjunto un ejemplo desarrollado en Stata que involucra interacciones en un modelo de regresión con variables binarias, y también la base de datos usada (salary.txt) para que repliquen los resultados obtenidos (y así adquieran más práctica con Stata). Hay algunas preguntas que sería útil que respondieran (aparecen con rojo). Si tienen alguna duda, pueden coordinar reunión conmigo. Por favor, llevar impreso este archivo para la clase de mañana jueves 13/09 (en sección 1) y para la clase de este viernes 14/09 (en sección 3). Por lo pronto, les explico cómo estimar modelos con interacciones en Stata, usando las variables del ejemplo adjunto (ver definición de variables). Al escribir el siguiente comando en Stata: reg salario sexo##ib3.rango usted está estimando el modelo de regresión: salario = Beta0 + Beta1 x sexo + Beta2 x rango1 + Beta3 x rango2 + Beta4 x sexo x rango1 + Beta5 x sexo x rango2 + u donde: rango1: variable binaria (1: rango == 1 [profesor asistente] / 0: en otro caso) rango2: variable binaria (1: rango == 2 [profesor asociado] / 0: en otro caso) sexo: variable binaria (1: mujer / 0: hombre) Por tanto, en cuanto a los rangos de académicos, la categoría base (o grupo base) es: rango == 3 [profesor jornada completa] ii) En cuanto a la especificación alternativa de modelos de regresión con variables dummy, pero sin intercepto y con las g categorías de una variable cualitativa, aclararé lo que sucede usando las variables salario y sexo (del archivo adjunto salary.txt). De acuerdo con Wooldridge (2010), usted puede estimar el modelo: Modelo 1: salario = Beta0 + Beta1 x sexo + u (usando el comando: reg salario sexo) o bien, usted puede crear las variables binarias hombre (1: hombre / 0: mujer) y mujer (1: mujer / 0: hombre), y estimar el modelo sin intercepto: Modelo 2: salario = Delta1 x hombre + Delta2 x mujer + u con el comando en Stata: reg salario hombre mujer, noconstant Sin embargo, las 2 desventajas prácticas que posee la especificación del modelo 2, son: ii.1) Cálculo del R2. Stata provee el R2-descentrado (definido en el libro). En nuestro ejemplo, este valor es: 0,9465. Según Wooldridge (2010), R2-descentrado siempre está entre 0 y 1. Además, R2-descentrado es mucho más grande que el R2 usual (centrado). Como ocurre en modelos sin intercepto y con muy mal ajuste, el R2 usual podría ser negativo. Este fenómeno podría explicar el hecho que softwares como Stata provean R2-descentrado como medida de bondad de ajuste. Si usted estima el modelo 1, el R2 usual (centrado) es: 0,0639. ii.2) Testeo de diferencias significativas. Estimar el modelo 2 hace más complicado testear diferencias significativas con la categoría base. Para que vea esto, le pido que escriba el modelo 2 para los hombres y luego para las mujeres, y posteriormente obtenga la diferencia en salarios esperados entre hombres y mujeres. Finalmente, piense qué haría para testear si esta diferencia es significativa.
Compartir