Logo Studenta

ejemplo econometria 1 copia - Gustavo Perales Vivar

¡Estudia con miles de materiales!

Vista previa del material en texto

Ejemplo Interacciones – Sección 7.4 – Wooldridge (2010)
Datos y variables[footnoteRef:1]: Los datos en el archivo adjunto (salary.txt) conciernen al salario y otras características de académicos en una institución educativa recolectados a inicios de la década del 80. Esta recolección se presentó como evidencia en procedimientos legales por discriminación sexual en salarios. Todos los académicos registrados en estos datos provienen de archivos personales y las variables registradas son: [1: Weisberg, S. 2005. Applied Linear Regression. Third edition. Wiley Series in Probability and Statistics. (Ejercicio 6.13)] 
sexo: Género del académico (1: mujer / 0: hombre)
rango: Rango del académico (1: profesor asistente / 2: profesor asociado / 3: profesor jornada completa)
agnos: número de años en el rango actual
grado: máximo grado obtenido por el académico (1: doctorado / 0: magíster).
agnos_grado: años transcurridos desde la obtención de su grado máximo.
salario: salario anual recibido por el académico (en dólares).
. sum grado rango sexo agnos agnos_grado salario
 Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
 grado | 52 .6538462 .4803845 0 1
 rango | 52 2.038462 .8623165 1 3
 sexo | 52 .2692308 .4478876 0 1
 agnos | 52 7.480769 5.507536 0 25
 agnos_grado | 52 16.11538 10.22234 1 35
-------------+--------------------------------------------------------
 salario | 52 23797.65 5917.289 15000 38045
. correlate grado rango sexo agnos agnos_grado salario
(obs=52)
 | grado rango sexo agnos agnos_~o salario
-------------+------------------------------------------------------
 grado | 1.0000
 rango | -0.0146 1.0000
 sexo | 0.0771 -0.2304 1.0000
 agnos | -0.1434 0.5080 -0.3794 1.0000
 agnos_grado | -0.4828 0.6957 -0.0883 0.6388 1.0000
 salario | -0.0697 0.8675 -0.2528 0.7007 0.6749 1.0000
i) ¿Será verdad que el salario anual recibido por académicos es el mismo entre hombres y mujeres?
(Si no se controla por otros factores o variables)
. reg salario sexo
 Source | SS df MS Number of obs = 52
-------------+------------------------------ F( 1, 50) = 3.41
 Model | 114106220 1 114106220 Prob > F = 0.0706
 Residual | 1.6716e+09 50 33432472.8 R-squared = 0.0639
-------------+------------------------------ Adj R-squared = 0.0452
 Total | 1.7857e+09 51 35014310.9 Root MSE = 5782.1
------------------------------------------------------------------------------
 salario | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
 sexo | -3339.647 1807.716 -1.85 0.071 -6970.55 291.257
 _cons | 24696.79 937.9776 26.33 0.000 22812.81 26580.77
------------------------------------------------------------------------------
. estat ic
-----------------------------------------------------------------------------
 Model | Obs ll(null) ll(model) df AIC BIC
-------------+---------------------------------------------------------------
 . | 52 -524.9329 -523.2161 2 1050.432 1054.335
-----------------------------------------------------------------------------
 Note: N=Obs used in calculating BIC; see [R] BIC note
(Controlando por las restantes variables del modelo. Recuerde: comando ib3.rango define automáticamente dos variables dummy, donde la categoría base es 3 [profesor jornada completa])
. reg salario sexo grado ib3.rango agnos agnos_grado
 Source | SS df MS Number of obs = 52
-------------+------------------------------ F( 6, 45) = 44.24
 Model | 1.5269e+09 6 254478582 Prob > F = 0.0000
 Residual | 258858365 45 5752408.11 R-squared = 0.8550
-------------+------------------------------ Adj R-squared = 0.8357
 Total | 1.7857e+09 51 35014310.9 Root MSE = 2398.4
------------------------------------------------------------------------------
 salario | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
 sexo | 1166.373 925.5689 1.26 0.214 -697.8183 3030.565
 grado | -1388.613 1018.747 -1.36 0.180 -3440.475 663.2482
 |
 rango |
 1 | -11118.76 1351.772 -8.23 0.000 -13841.37 -8396.155
 2 | -5826.403 1012.933 -5.75 0.000 -7866.555 -3786.251
 |
 agnos | 476.309 94.91357 5.02 0.000 285.1433 667.4748
 agnos_grado | -124.5743 77.48628 -1.61 0.115 -280.6397 31.49105
 _cons | 28253.43 2028.711 13.93 0.000 24167.39 32339.46
------------------------------------------------------------------------------
. estat ic
-----------------------------------------------------------------------------
 Model | Obs ll(null) ll(model) df AIC BIC
-------------+---------------------------------------------------------------
 . | 52 -524.9329 -474.719 7 963.4381 977.0968
-----------------------------------------------------------------------------
 Note: N=Obs used in calculating BIC; see [R] BIC note
ii) ¿Será verdad que el salario anual recibido por académicos es el mismo entre los 3 rangos?
(Si no se controla por otros factores o variables)
. reg salario ib3.rango
 Source | SS df MS Number of obs = 52
-------------+------------------------------ F( 2, 49) = 75.17
 Model | 1.3468e+09 2 673391900 Prob > F = 0.0000
 Residual | 438946058 49 8958082.81 R-squared = 0.7542
-------------+------------------------------ Adj R-squared = 0.7442
 Total | 1.7857e+09 51 35014310.9 Root MSE = 2993
------------------------------------------------------------------------------
 salario | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
 rango |
 1 | -11890.28 972.407 -12.23 0.000 -13844.41 -9936.158
 2 | -6483.021 1042.961 -6.22 0.000 -8578.93 -4387.113
 |
 _cons | 29658.95 669.2564 44.32 0.000 28314.03 31003.87
------------------------------------------------------------------------------
. estat ic
-----------------------------------------------------------------------------
 Model | Obs ll(null) ll(model) df AIC BIC
-------------+---------------------------------------------------------------
 . | 52 -524.9329 -488.4495 3 982.8991 988.7528
-----------------------------------------------------------------------------
 Note: N=Obs used in calculating BIC; see [R] BIC note
(Controlando por agnos, grado, agnos_grado)
. reg salario ib3.rango agnos grado agnos_grado
 Source | SS df MS Number of obs = 52
-------------+------------------------------ F( 5, 46) = 52.10
 Model | 1.5177e+09 5 303547304 Prob > F = 0.0000
 Residual | 267993336 46 5825942.09 R-squared = 0.8499
-------------+------------------------------Adj R-squared = 0.8336
 Total | 1.7857e+09 51 35014310.9 Root MSE = 2413.7
------------------------------------------------------------------------------
 salario | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
 rango |
 1 | -10509.62 1270.434 -8.27 0.000 -13066.87 -7952.37
 2 | -5795.697 1019.092 -5.69 0.000 -7847.022 -3744.372
 |
 agnos | 416.5638 82.74817 5.03 0.000 250.0004 583.1273
 grado | -1062.115 991.5271 -1.07 0.290 -3057.956 933.7253
 agnos_grado | -81.21746 69.87129 -1.16 0.251 -221.8611 59.42616
 _cons | 27883.07 2020.1 13.80 0.000 23816.82 31949.32
------------------------------------------------------------------------------
. estat ic
-----------------------------------------------------------------------------
 Model | Obs ll(null) ll(model) df AIC BIC
-------------+---------------------------------------------------------------
 . | 52 -524.9329 -475.6208 6 963.2415 974.949
-----------------------------------------------------------------------------
 Note: N=Obs used in calculating BIC; see [R] BIC note
iii) ¿Será verdad que las diferencias salariales entre ambos sexos son iguales en cada rango?
(Si no se controla por otros factores o variables)
. reg salario ib3.rango##sexo
 Source | SS df MS Number of obs = 52
-------------+------------------------------ F( 5, 46) = 29.12
 Model | 1.3570e+09 5 271392041 Prob > F = 0.0000
 Residual | 428769653 46 9321079.42 R-squared = 0.7599
-------------+------------------------------ Adj R-squared = 0.7338
 Total | 1.7857e+09 51 35014310.9 Root MSE = 3053
------------------------------------------------------------------------------
 salario | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
 rango |
 1 | -11952.84 1230.721 -9.71 0.000 -14430.15 -9475.524
 2 | -6428.854 1165.901 -5.51 0.000 -8775.69 -4082.018
 |
 1.sexo | -1067.438 1706.704 -0.63 0.535 -4502.854 2367.979
 |
 rango#sexo |
 1 1 | 727.8375 2238.321 0.33 0.747 -3777.669 5233.344
 2 1 | -806.1458 2889.66 -0.28 0.782 -6622.729 5010.438
 |
 _cons | 29872.44 763.2611 39.14 0.000 28336.07 31408.8
------------------------------------------------------------------------------
. estat ic
-----------------------------------------------------------------------------
 Model | Obs ll(null) ll(model) df AIC BIC
-------------+---------------------------------------------------------------
 . | 52 -524.9329 -487.8397 6 987.6793 999.3868
-----------------------------------------------------------------------------
 Note: N=Obs used in calculating BIC; see [R] BIC note
. reg salario ib3.rango sexo
 Source | SS df MS Number of obs = 52
-------------+------------------------------ F( 3, 48) = 50.16
 Model | 1.3539e+09 3 451286181 Prob > F = 0.0000
 Residual | 431871315 48 8997319.05 R-squared = 0.7582
-------------+------------------------------ Adj R-squared = 0.7430
 Total | 1.7857e+09 51 35014310.9 Root MSE = 2999.6
------------------------------------------------------------------------------
 salario | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
 rango |
 1 | -11677.75 1003.575 -11.64 0.000 -13695.57 -9659.927
 2 | -6532.705 1046.743 -6.24 0.000 -8637.322 -4428.087
 |
 sexo | -869.4545 980.5011 -0.89 0.380 -2840.884 1101.975
 _cons | 29832.84 698.7999 42.69 0.000 28427.81 31237.87
------------------------------------------------------------------------------
. estat ic
-----------------------------------------------------------------------------
 Model | Obs ll(null) ll(model) df AIC BIC
-------------+---------------------------------------------------------------
 . | 52 -524.9329 -488.0271 4 984.0541 991.8591
-----------------------------------------------------------------------------
 Note: N=Obs used in calculating BIC; see [R] BIC note
¿Cómo usaría los resultados anteriores para responder a la pregunta iii)?
(Controlando otros factores o variables)
. reg salario ib3.rango##sexo grado agnos agnos_grado
 Source | SS df MS Number of obs = 52
-------------+------------------------------ F( 8, 43) = 33.32
 Model | 1.5377e+09 8 192207471 Prob > F = 0.0000
 Residual | 248070090 43 5769071.86 R-squared = 0.8611
-------------+------------------------------ Adj R-squared = 0.8352
 Total | 1.7857e+09 51 35014310.9 Root MSE = 2401.9
------------------------------------------------------------------------------
 salario | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
 rango |
 1 | -10539.36 1426.21 -7.39 0.000 -13415.58 -7663.13
 2 | -5420.359 1107.7 -4.89 0.000 -7654.25 -3186.469
 |
 1.sexo | 2954.541 1609.276 1.84 0.073 -290.8742 6199.956
 |
 rango#sexo |
 1 1 | -2510.245 1925.979 -1.30 0.199 -6394.352 1373.861
 2 1 | -2011.956 2355.017 -0.85 0.398 -6761.301 2737.389
 |
 grado | -1501.514 1029.803 -1.46 0.152 -3578.309 575.2816
 agnos | 522.1385 105.5256 4.95 0.000 309.3258 734.9511
 agnos_grado | -148.6112 86.8349 -1.71 0.094 -323.7305 26.50807
 _cons | 28044.03 2103.065 13.33 0.000 23802.79 32285.27
------------------------------------------------------------------------------
. estat ic
-----------------------------------------------------------------------------
 Model | Obs ll(null) ll(model) df AIC BIC
-------------+---------------------------------------------------------------
 . | 52 -524.9329 -473.6122 9 965.2245 982.7857
-----------------------------------------------------------------------------
 Note: N=Obs used in calculating BIC; see [R] BIC note
. reg salario ib3.rango sexo grado agnos agnos_grado
 Source | SS df MS Number of obs = 52
-------------+------------------------------ F( 6, 45) = 44.24
 Model | 1.5269e+09 6 254478582 Prob > F = 0.0000
 Residual | 258858365 45 5752408.11 R-squared = 0.8550
-------------+------------------------------ Adj R-squared = 0.8357
 Total | 1.7857e+09 51 35014310.9 Root MSE = 2398.4
------------------------------------------------------------------------------
 salario | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
 rango |1 | -11118.76 1351.772 -8.23 0.000 -13841.37 -8396.155
 2 | -5826.403 1012.933 -5.75 0.000 -7866.555 -3786.251
 |
 sexo | 1166.373 925.5689 1.26 0.214 -697.8183 3030.565
 grado | -1388.613 1018.747 -1.36 0.180 -3440.475 663.2482
 agnos | 476.309 94.91357 5.02 0.000 285.1433 667.4748
 agnos_grado | -124.5743 77.48628 -1.61 0.115 -280.6397 31.49105
 _cons | 28253.43 2028.711 13.93 0.000 24167.39 32339.46
------------------------------------------------------------------------------
. estat ic
-----------------------------------------------------------------------------
 Model | Obs ll(null) ll(model) df AIC BIC
-------------+---------------------------------------------------------------
 . | 52 -524.9329 -474.719 7 963.4381 977.0968
-----------------------------------------------------------------------------
 Note: N=Obs used in calculating BIC; see [R] BIC note
¿Cómo usaría los resultados anteriores para responder a la pregunta iii)?
Estimados(as) alumnos(as):
i) Les adjunto un ejemplo desarrollado en Stata que involucra interacciones en un modelo de regresión con variables binarias, y también la base de datos usada (salary.txt)
para que repliquen los resultados obtenidos (y así adquieran más práctica con Stata). Hay algunas preguntas que sería útil que respondieran (aparecen con rojo). Si tienen 
alguna duda, pueden coordinar reunión conmigo. Por favor, llevar impreso este archivo para la clase de mañana jueves 13/09 (en sección 1) y para la clase de este viernes 
14/09 (en sección 3). Por lo pronto, les explico cómo estimar modelos con interacciones en Stata, usando las variables del ejemplo adjunto (ver definición de variables). Al
escribir el siguiente comando en Stata:
reg salario sexo##ib3.rango
usted está estimando el modelo de regresión:
salario = Beta0 + Beta1 x sexo + Beta2 x rango1 + Beta3 x rango2 + Beta4 x sexo x rango1 + Beta5 x sexo x rango2 + u
donde:
rango1: variable binaria (1: rango == 1 [profesor asistente] / 0: en otro caso)
rango2: variable binaria (1: rango == 2 [profesor asociado] / 0: en otro caso)
sexo: variable binaria (1: mujer / 0: hombre)
Por tanto, en cuanto a los rangos de académicos, la categoría base (o grupo base) es: rango == 3 [profesor jornada completa]
ii) En cuanto a la especificación alternativa de modelos de regresión con variables dummy, pero sin intercepto y con las g categorías de una variable cualitativa, aclararé lo
que sucede usando las variables salario y sexo (del archivo adjunto salary.txt). De acuerdo con Wooldridge (2010), usted puede estimar el modelo:
Modelo 1: salario = Beta0 + Beta1 x sexo + u (usando el comando: reg salario sexo)
o bien, usted puede crear las variables binarias hombre (1: hombre / 0: mujer) y mujer (1: mujer / 0: hombre), y estimar el modelo sin intercepto:
Modelo 2: salario = Delta1 x hombre + Delta2 x mujer + u
con el comando en Stata: 
reg salario hombre mujer, noconstant
Sin embargo, las 2 desventajas prácticas que posee la especificación del modelo 2, son:
ii.1) Cálculo del R2. Stata provee el R2-descentrado (definido en el libro). En nuestro ejemplo, este valor es: 0,9465. Según Wooldridge (2010), R2-descentrado siempre 
está entre 0 y 1. Además, R2-descentrado es mucho más grande que el R2 usual (centrado). Como ocurre en modelos sin intercepto y con muy mal ajuste, el R2 usual 
podría ser negativo. Este fenómeno podría explicar el hecho que softwares como Stata provean R2-descentrado como medida de bondad de ajuste. Si usted estima el modelo 
1, el R2 usual (centrado) es: 0,0639.
ii.2) Testeo de diferencias significativas. Estimar el modelo 2 hace más complicado testear diferencias significativas con la categoría base. Para que vea esto, le pido que escriba el modelo 2 para los hombres y luego para las mujeres, y posteriormente obtenga la diferencia en salarios esperados entre hombres y mujeres. Finalmente, piense 
qué haría para testear si esta diferencia es significativa.

Continuar navegando