Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE FACULTAD DE CIENCIAS ECONOMICAS Y ADMINISTRATIVAS INSTITUTO DE ECONOMIA TAREA 1 ECONOMETRIA I EAE250A SEC.2 Profesor Juan Urquiza Primer Semestre 2017 Integrantes del grupo: 1. Trinidad Kaplan 2. Rodrigo Parsons 3. Carlos Valdes 1 Graph 05-05-17 18:20 0 .0 2 .0 4 .0 6 .0 8 D en si ty 0 20 40 60 80 salario . salario 526 19.06648 11.94249 1.713884 80.77891 Variable Obs Mean Std. Dev. Min Max Tarea Econometría Preguntas: A) !Análisis descriptivo Salario : Se observan 526 observación, con un salario promedio de 19.06648 y una desviación estándar de 11.94249. El valor mínimo que toma el salario es de 1.713884 y el máximo 80.77891. !Histograma Salario: !Salario promedio entre los hombres : 22.95793 !Salario promedio entre las mujeres : 14.83531 . salario 274 22.95793 13.45515 4.850615 80.77891 Variable Obs Mean Std. Dev. Min Max salario 252 14.83531 8.179311 1.713884 69.94587 Variable Obs Mean Std. Dev. Min Max 2 . _cons -9.289687 2.357283 -3.94 0.000 -13.92062 -4.658759 tenure .5473714 .0699931 7.82 0.000 .4098686 .6848742 exper .0722403 .0389888 1.85 0.064 -.0043539 .1488344 educ 1.936899 .1658378 11.68 0.000 1.611108 2.262691 salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 74877.1428 525 142.623129 Root MSE = 9.9744 Adj R-squared = 0.3024 Residual 51933.1062 522 99.4887093 R-squared = 0.3064 Model 22944.0365 3 7648.01218 Prob > F = 0.0000 F(3, 522) = 76.87 Source SS df MS Number of obs = 526 . reg salario educ exper tenure !Proporción de los trabajadores que está casado : 𝟑𝟐𝟎 𝟓𝟐𝟔 !Promedio de educ : 12.56274 !Individuos que tienen al menos 15 años de educación: sum educ if educ≥15 120 B)Estime una regresión para el salario sobre educ, exper y tenure. ¿Cómo se interpretan los coeficientes? !Regresión para el salario sobre educ, exper y tenure. !Interpretación de los coeficientes: 𝛽! = -9.289687!Corresponde al intercepto de la regresión del salario. Es el salario mínimo cuando todas las variables explicativas son cero. 𝛽! = 1.936899!Es cuanto aumenta el salario ante un cambio unitario en la educación manteniendo ceteribus paribus las otras variables explicativas. 𝛽! = 0.0722403!Es cuanto aumenta el salario ante un cambio unitario en la experiencia manteniendo ceteribus paribus las otras variables explicativas. 𝛽! = 0.5473714! Es cuanto aumenta el salario ante un cambio unitario en los años de antigüedad en el empleo manteniendo ceteribus paribus las otras variables explicativas. . educ 526 12.56274 2.769022 0 18 Variable Obs Mean Std. Dev. Min Max 3 tenure 0.0000 -0.0562 0.4993 1.0000 exper 0.0000 -0.2995 1.0000 educ -0.0000 1.0000 resid 1.0000 resid educ exper tenure tenure 5.104563 .3150015 4.485744 5.723381 Mean Std. Err. [95% Conf. Interval] Mean estimation Number of obs = 526 . mean tenure exper 17.01711 .5917743 15.85457 18.17965 Mean Std. Err. [95% Conf. Interval] Mean estimation Number of obs = 526 . mean exper educ 12.56274 .1207351 12.32555 12.79992 Mean Std. Err. [95% Conf. Interval] Mean estimation Number of obs = 526 . mean educ salario 19.06648 .5207174 18.04354 20.08943 Mean Std. Err. [95% Conf. Interval] Mean estimation Number of obs = 526 . mean salario C) Verifique que se cumplan las tres propiedades algebraicas revisadas en clase. Además, compruebe que el coeficiente de determinación es igual al cuadrado del coeficiente de correlación entre 𝑦𝑖 e 𝑦 ̂𝑖 . 1º! Suma de Residuos ! Σ𝜀 = 4.768e-06 = 0 Media Condicional Cero:𝐸(𝜀/X) = 0 Se cumple la propiedad. 2º!Ortogonalidad: Los residuos no están correlacionados con las variables explicativas!𝐶𝑜𝑣 = 0. Se cumple la propiedad. 3º!Pertenencia de las variables estimadas a la regresión: 4 Adj R-squared = 0.3024 Residual 51933.1062 522 99.4887093 R-squared = 0.3064 Para comprobar esta propiedad, reemplazamos los coeficientes obtenidos junto a las variables promedio, lo que nos debe dar como resultado en la regresión igual al salario medio, quedando comprobada la propiedad. 𝑚𝑒𝑎𝑛 𝑠𝑎𝑙𝑎𝑟𝑖𝑜 = 𝛽! + 𝛽! ∗𝑚𝑒𝑎𝑛 𝑒𝑑𝑢𝑐 + 𝛽!𝑚 ∗𝑚𝑒𝑎𝑛 𝑒𝑥𝑝𝑒𝑟 + 𝛽! ∗𝑚𝑒𝑎𝑛(𝑡𝑒𝑛𝑢𝑟𝑒) 19.06648 = −9.289687 + 1.936899 ∗ 12.56274 + 0.0722403 ∗ 17.01711 + 0.5473714 ∗ 5.104563 !𝑅! : Por tabla entregado por Stata 𝑅! = 0.3064. Luego, al ver la correlación entre salario y salariohat, vemos que el coeficiente de correlación es 0.5536, el cual si lo elevamos al cuadrado da 0.3064, cumpliéndose la igualdad postulada en la pregunta. D) Ahora compruebe que las propiedades anteriores no se cumplen si la regresión estimada en la parte (b) no incluye intercepto. ! Regresión para el salario sobre educ, exper, tenure sin constante. salariohat 0.5536 1.0000 salario 1.0000 salario salari~t tenure .5724254 .0706654 8.10 0.000 .4336025 .7112483 exper -.0018288 .0346306 -0.05 0.958 -.0698611 .0662034 educ 1.312757 .0498586 26.33 0.000 1.21481 1.410705salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 266094.332 526 505.88276 Root MSE = 10.112 Adj R-squared = 0.7979 Residual 53478.1912 523 102.252756 R-squared = 0.7990 Model 212616.14 3 70872.0468 Prob > F = 0.0000 F(3, 523) = 693.11 Source SS df MS Number of obs = 526 . reg salario educ exper tenure, noconstant 5 1º! Suma de Residuos: Σ𝜀 = 0 ! -166.32261 ≠ 0 Media Condicional Cero:𝐸(𝜀/X) ≠ 0 No se cumple la propiedad 2º!Ortogonalidad: La propiedad indica que los residuos no están correlacionados con las variables explicativas!𝐶𝑜𝑣 = 0. En este caso los residuos y las variables explicativas si se correlacionan, por ende la propiedad de ortogonalidad no se cumple. 3º! Pertenencia de las variables estimadas a la regresión: tenure 0.0222 -0.0562 0.4993 1.0000 exper 0.0394 -0.2995 1.0000 educ 0.1425 1.0000 resid 1.0000 resid educ exper tenure . end of do-file . tenure 5.104563 .3150015 4.485744 5.723381 Mean Std. Err. [95% Conf. Interval] Mean estimation Number of obs = 526 . mean tenure exper 17.01711 .5917743 15.85457 18.17965 Mean Std. Err. [95% Conf. Interval] Mean estimation Number of obs = 526 . mean exper educ 12.56274 .1207351 12.32555 12.79992 Mean Std. Err. [95% Conf. Interval] 6 𝑚𝑒𝑎𝑛 𝑠𝑎𝑙𝑎𝑟𝑖𝑜 = 𝛽! + 𝛽! ∗𝑚𝑒𝑎𝑛 𝑒𝑑𝑢𝑐 + 𝛽!𝑚 ∗𝑚𝑒𝑎𝑛 𝑒𝑥𝑝𝑒𝑟 + 𝛽! ∗𝑚𝑒𝑎𝑛(𝑡𝑒𝑛𝑢𝑟𝑒) 19.06648 ≠ 1.312757 ∗ 12.56274 − 0.0018288 ∗ 17.01711 + 0.5724254 ∗ 5.104563 Para comprobar esta propiedad, reemplazamos los coeficientes obtenidos junto a las variables promedio, lo que nos debe dar como resultado en la regresión igual al salario medio. En este caso no se cumple la propiedad debido a la no existencia de la constante. E) Vuelva a considerar la regresión estimada en la parte (b), pero ahora compruebe que los estimadores de MCO admiten una interpretación de efecto parcial. Para ello deberá estimar una regresión auxiliar, guardar sus residuos, y luego utilizarlos como variable explicativa en una segunda regresión. !Regresión Inicial del salario sobre educ, exper y tenure. !Educ 1)Regresión auxiliar para Educ: _cons -9.289687 2.357283 -3.94 0.000 -13.92062 -4.658759 tenure .5473714 .0699931 7.82 0.000 .4098686 .6848742 exper .0722403 .0389888 1.85 0.064 -.0043539 .1488344 educ 1.936899 .1658378 11.68 0.000 1.611108 2.262691 salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 74877.1428 525 142.623129 Root MSE = 9.9744 Adj R-squared = 0.3024 Residual 51933.1062 522 99.4887093 R-squared = 0.3064 Model 22944.0365 3 7648.01218 Prob > F = 0.0000 F(3, 522) = 76.87 Source SS df MS Number of obs = 526 . reg salario educ exper tenure _cons 13.57496 .1843245 73.65 0.000 13.21286 13.93707 tenure .0476795 .0183371 2.60 0.010 .011656 .0837031 exper -.0737851 .0097609 -7.56 0.000 -.0929604 -.0546098 educ Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 4025.42966 525 7.66748506 Root MSE = 2.63 Adj R-squared = 0.0979 Residual 3617.48335 523 6.91679416 R-squared = 0.1013 Model 407.946311 2 203.973156 Prob > F = 0.0000 F(2, 523) = 29.49 Source SS df MS Number of obs = 526 . reg educ exper tenure 7 . _cons 17.00365 .6990649 24.32 0.000 15.63033 18.37698 tenure .6397219 .069545 9.20 0.000 .5030993 .7763444 exper -.0706741 .0370188 -1.91 0.057 -.1433983 .0020501 educresid 1.936899 .1658378 11.68 0.000 1.611108 2.262691 salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 74877.1428 525 142.623129 Root MSE = 9.9744 Adj R-squared = 0.3024 Residual 51933.1065 522 99.4887097 R-squared = 0.3064 Model 22944.0363 3 7648.01209 Prob > F = 0.0000 F(3, 522) = 76.87 Source SS df MS Number of obs = 526 . reg salario educresid exper tenure . _cons -7.184163 2.065296 -3.48 0.001 -11.24147 -3.126851 tenure .6130557 .0603515 10.16 0.000 .494494 .7316173 experresid .0722403 .0389888 1.85 0.064 -.0043539 .1488344 educ 1.840464 .1574588 11.69 0.000 1.531133 2.149795 salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 74877.1428 525 142.623129 Root MSE = 9.9744 Adj R-squared = 0.3024 Residual 51933.1063 522 99.4887093 R-squared = 0.3064 Model 22944.0365 3 7648.01217 Prob > F = 0.0000 F(3, 522) = 76.87 Source SS df MS Number of obs = 526 . reg salario educ experresid tenure . predict experhat_cons 29.14613 2.316285 12.58 0.000 24.59577 33.6965 tenure .9092475 .0676858 13.43 0.000 .776278 1.042217 educ -1.334927 .1765944 -7.56 0.000 -1.681848 -.9880053 exper Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 96706.846 525 184.203516 Root MSE = 11.187 Adj R-squared = 0.3206 Residual 65447.8092 523 125.139214 R-squared = 0.3232 Model 31259.0368 2 15629.5184 Prob > F = 0.0000 F(2, 523) = 124.90 Source SS df MS Number of obs = 526 . reg exper educ tenure Efecto Parcializado: Predecimos los años de educación y luego obtenemos los residuos a través de la diferencia entre los verdaderos años de educación y los predichos anteriormente. Posteriormente, parcializamos la regresión, para ver el efecto que tiene 𝑋! sobre el salario cuando no se correlaciona con las otras variables explicativas. Entregándonos como resultado el mismo 𝛽! de la regresión inicial para la regresión del efecto parcializado. Que sean iguales quiere decir 𝛽! esta representando el efecto neto de las otras variables explicativas. !Exper: 2)Regresión Auxiliar para Exper: Efecto Parcializado 8 Siguiendo el mismo procedimiento anterior sobre los residuos, vemos el efecto que tiene 𝑋! sobre el salario cuando no se correlaciona con las otras variables explicativas. Entregándonos como resultado el mismo 𝛽! de la regresión inicial para la regresión del efecto parcializado. Que sean iguales quiere decir 𝛽! esta representando el efecto neto de las otras variables explicativas. 3) Regresión Auxiliar Tenure: Efecto Parcializado: Siguiendo el mismo procedimiento anterior, vemos el efecto que tiene 𝑋! sobre el salario cuando no se correlaciona con las otras variables explicativas. Entregándonos como resultado el mismo 𝛽! de la regresión inicial para la regresión del efecto parcializado. Que sean iguales quiere decir 𝛽! esta representando el efecto neto de las otras variables explicativas. _cons -3.05907 1.466583 -2.09 0.037 -5.940188 -.1779519 exper .2821307 .0210023 13.43 0.000 .2408715 .3233898 educ .2676633 .102941 2.60 0.010 .0654347 .469892 tenure Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 27401.249 525 52.1928553 Root MSE = 6.2313 Adj R-squared = 0.2560 Residual 20307.8183 523 38.8294805 R-squared = 0.2589 Model 7093.43077 2 3546.71538 Prob > F = 0.0000 F(2, 523) = 91.34 Source SS df MS Number of obs = 526 . reg tenure educ exper . _cons -10.96413 2.347539 -4.67 0.000 -15.57592 -6.352349 tenureresid .5473714 .0699931 7.82 0.000 .4098686 .6848742 exper .2266705 .033618 6.74 0.000 .1606273 .2927137 educ 2.083411 .1647762 12.64 0.000 1.759705 2.407117 salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 74877.1428 525 142.623129 Root MSE = 9.9744 Adj R-squared = 0.3024 Residual 51933.1062 522 99.4887093 R-squared = 0.3064 Model 22944.0365 3 7648.01218 Prob > F = 0.0000 F(3, 522) = 76.87 Source SS df MS Number of obs = 526 . reg salario educ exper tenureresid 9 F) Antes de avanzar, revise el histograma de los residuos de la regresión estimada en la parte (b) y compárelo con el histograma de los residuos de la misma regresión pero utilizando al logaritmo del salario (log_salario) como variable dependiente. Los residuos del logaritmo del salario se ajustan mejor a la distribución normal que los residuos del salario. Ambos están centradas en cero. Podemos decir que los residuos se acercan a una distribución normal al hacer una regresión log-nivel que nivel-nivel. G) Ahora interprete los coeficientes de la regresión log-nivel estimada en la parte anterior. !Regresión del log_salario sobre educ, exper y tenure: Al estar analizando el logaritmo del salario, cada 𝛽! distinto de 𝛽!, ante un cambio unitario de 𝑋! afecta a Y de la forma 𝛽! ∗ 100. Es decir, un cambio marginal en 𝑋! genera un cambio porcentual en Y. . _cons 1.458 .1041904 13.99 0.000 1.253316 1.662684 tenure .0220672 .0030936 7.13 0.000 .0159897 .0281447 exper .0041211 .0017233 2.39 0.017 .0007357 .0075065 educ .092029 .0073299 12.56 0.000 .0776292 .1064288 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 148.329743 525 .282532843 Root MSE = .44086 Adj R-squared = 0.3121 Residual 101.455569 522 .194359327 R-squared = 0.3160 Model 46.8741739 3 15.6247246 Prob > F = 0.0000 F(3, 522) = 80.39 Source SS df MS Number of obs = 526 . reg log_salario educ exper tenure 10 _cons 1.375212 .1014697 13.55 0.000 1.175871 1.574553 tenuresq -.0006156 .0002495 -2.47 0.014 -.0011056 -.0001255 expersq -.0005918 .0001141 -5.19 0.000 -.0008159 -.0003677 tenure .0371222 .0072432 5.13 0.000 .0228927 .0513517 exper .029301 .0052885 5.54 0.000 .0189115 .0396905 educ .0845258 .0071614 11.80 0.000 .070457 .0985946 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 148.329743 525 .282532843 Root MSE = .42497 Adj R-squared = 0.3608 Residual 93.9112814 520 .180598618 R-squared = 0.3669 Model 54.4184612 5 10.8836922 Prob > F = 0.0000 F(5, 520) = 60.26 Source SSdf MS Number of obs = 526 . reg log_salario educ exper tenure expersq tenuresq !Análisis de los coeficientes: 𝛽! = 1.458 !Es el intercepto del log_salario, y representa el valor mínimo que toma log_salario cuando las variables explicativas son cero. 𝛽! = 0.092029!El aporte de la educación al salario es de 0.092029*100!9,2029%. 𝛽! = 0.004121! El aporte de la experiencia al salario es de 0.0041211*100!0,412119%. 𝛽! =0.0220672!El aporte de años en el empleo al salario es de 0.0220672*100!2,20672%. H) Incorpore las variables expersq y a la regresión log-nivel analizada en la parte anterior y verifique si son significativas individualmente y de forma conjunta. Además, compruebe que el estadístico F reportado para la prueba conjunta se puede computar a partir de la diferencia en la suma de cuadrados residuales del modelo completo versus el restringido. !Regresión del log_salario sobre educ, exper, tenure, expersq y tenuresq: Analizando individualmente cada parámetro, vemos que todas las variables son significativas. Podemos verlo con test de hipótesis al 5%, donde comparamos con los p-value, los cuales al ser muy pequeños y cercanos a cero, rechazamos la Hipótesis nula correspondiente a cada 𝛽!, por lo que se concluye que cada variable es significativa. Similarmente podemos analizar los intervalos de confianza, donde encontramos que los intervalos no incluyen al cero, por lo que se comprueba que las variables son significativas. 11 . Prob > F = 0.0000 F( 5, 520) = 60.26 ( 5) tenuresq = 0 ( 4) expersq = 0 ( 3) tenure = 0 ( 2) exper = 0 ( 1) educ = 0 . test educ exper tenure expersq tenuresq _cons 1.371985 .1019556 13.46 0.000 1.17169 1.57228 expersq -.0006606 .0001111 -5.94 0.000 -.0008789 -.0004423 tenure .0208413 .0030037 6.94 0.000 .0149404 .0267422 exper .0328542 .0051135 6.42 0.000 .0228085 .0428999 educ .0853489 .0071885 11.87 0.000 .071227 .0994709 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 148.329743 525 .282532843 Root MSE = .42704 Adj R-squared = 0.3545 Residual 95.0110415 521 .182362844 R-squared = 0.3595 Model 53.3187012 4 13.3296753 Prob > F = 0.0000 F(4, 521) = 73.09 Source SS df MS Number of obs = 526 . reg log_salario educ exper tenure expersq Para analizarlo conjuntamente, realizamos el siguiente test: Con los resultados obtenidos vemos que todas las variables conjuntamente son significativas. !Comprobación / Test de Chow: 1)Regresión Inicial: 2)Regresion con variable exper cuadrática: Restringida 1 12 . _cons 1.44932 .1029287 14.08 0.000 1.247113 1.651526 tenuresq -.0009321 .0002478 -3.76 0.000 -.0014189 -.0004452 tenure .0465254 .0071852 6.48 0.000 .0324098 .0606409 exper .0032729 .0017169 1.91 0.057 -.0000999 .0066458 educ .0897291 .0072651 12.35 0.000 .0754566 .1040016 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 148.329743 525 .282532843 Root MSE = .43541 Adj R-squared = 0.3290 Residual 98.7739425 521 .189585302 R-squared = 0.3341 Model 49.5558001 4 12.38895 Prob > F = 0.0000 F(4, 521) = 65.35 Source SS df MS Number of obs = 526 . reg log_salario educ exper tenure tenuresq 3)Regresión con variable tenure cuadrática: Restringida 2 Obtenemos el valor por medio de la diferencia de las sumas de cuadrados residuales del modelo libre y los restringidos. 𝐹 = (𝑆𝐶𝑅! − (𝑆𝐶𝑅! + 𝑆𝐶𝑅!)) (𝑆𝐶𝑅! + 𝑆𝐶𝑅!) ∗ (𝑁 − 2 𝐾! + 1 ) (𝐾! + 1) 𝐹 = (101.455569 − (95.0110415 + 98.7739425)) (95.0110415 + 98.7739425) ∗ (526 − 2(3 + 1) (3 + 1) F≈ 60.26 Se que el estadístico F reportado para la prueba conjunta se puede computar a partir de la diferencia en la suma de cuadrados residuales del modelo completo versus el restringido. 13 I) En base a la regresión estimada en la parte (h), encuentre el valor de exper a partir del cual un año de experiencia adicional impacta negativamente sobre el logaritmo del salario. ¿Cuántos trabajadores tienen una experiencia mayor que ese nivel? !Regresión del log_salario sobre educ, exper, tenure, expersq y tenuresq. En primer lugar, vemos el aporte que tienen los años de experiencia sobre el logaritmo del salario. Buscamos el valor para cuando una unidad mas de experiencia comienza a impactar negativamente sobre el logaritmo del salario, por ende: 𝛽!+𝛽! ∗ 𝑒𝑥𝑝𝑒𝑟 ! 𝛽!+𝛽! ∗ 𝑒𝑥𝑝𝑒𝑟 < 0 Reemplazando: !.!"#$!% !.!!!"#$% < exper ! 49,511 < exper Por lo tanto, para todo valor mayor a 49,511, un año de experiencia adicional impactara negativamente sobre el logaritmo del salario. De la base de datos, hay tan solo 2 personas que tienen mas de 49,511 años de experiencia. _cons 1.375212 .1014697 13.55 0.000 1.175871 1.574553 tenuresq -.0006156 .0002495 -2.47 0.014 -.0011056 -.0001255 expersq -.0005918 .0001141 -5.19 0.000 -.0008159 -.0003677 tenure .0371222 .0072432 5.13 0.000 .0228927 .0513517 exper .029301 .0052885 5.54 0.000 .0189115 .0396905 educ .0845258 .0071614 11.80 0.000 .070457 .0985946 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 148.329743 525 .282532843 Root MSE = .42497 Adj R-squared = 0.3608 Residual 93.9112814 520 .180598618 R-squared = 0.3669 Model 54.4184612 5 10.8836922 Prob > F = 0.0000 F(5, 520) = 60.26 Source SS df MS Number of obs = 526 . reg log_salario educ exper tenure expersq tenuresq 14 J) Ahora incorpore la variable binaria mujer al modelo estimado en la parte (h), y explique cómo se interpreta el coeficiente que la acompaña. Además, evalúe su significancia estadística, y luego verifique relación que existe entre el estadístico F reportado y el estadístico t que Stata reporta automáticamente. !Regresión del log_salario sobre educ, exper, tenure, expersq, tenuresq y mujer: !Interpretación: El aporte porcentual de mujer sobre el logaritmo del salarioes de -29,296511%. !Vemos que dado los valores de la tabla Stata si hay significancia individual, ya que la variable mujer tiene un p-value igual a cero por lo que se rechaza Ho, y su intervalo de confianza al 95% no incluye el 0. En términos de significancia Global también es significativa, porque la probabilidad que Ho sea 0, es 0%. !La relación que existe entre el valor t automático de Stata y la prueba F, radica en que el resultado automático es un test de hipótesis cuando decimos que el parámetro de la variable explicativa mujer es cero (en este caso), mientras que con la prueba F vemos la probabilidad de que Ho se cumpla. En este caso, la probabilidad de que Ho=0 es del 0%, por lo tanto Ho se rechaza, cosa que también obtenemos con el t y p-value respectivo. Es decir, por t tenemos -8.28 con p-value=0.00 y por test F, tenemos F=68.58 y p-value=0.00. Con lo que se concluye que ambos test son significativos. _cons 1.590331 .0989279 16.08 0.000 1.395983 1.78468 mujer -.296511 .0358054 -8.28 0.000 -.3668524 -.2261696 tenuresq -.0005852 .0002347 -2.49 0.013 -.0010463 -.0001241 expersq -.0005827 .0001073 -5.43 0.000 -.0007935 -.0003719 tenure .0317139 .0068452 4.63 0.000 .0182663 .0451616 exper .0294324 .0049752 5.92 0.000 .0196585 .0392063 educ .0801966 .0067573 11.87 0.000 .0669217 .0934716 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 148.329743 525 .282532843 Root MSE = .39978 Adj R-squared = 0.4343 Residual 82.9506454 519 .159827833 R-squared = 0.4408 Model 65.3790973 6 10.8965162 Prob > F = 0.0000 F(6, 519) = 68.18 Source SS df MS Number of obs = 526 . reg log_salario educ exper tenure expersq tenuresq mujer Prob > F = 0.0000 F( 1, 519) = 68.58 ( 1) mujer = 0 . test mujer 15 _cons 1.562446 .1186871 13.16 0.000 1.329279 1.795614 mujerXeduc -.0055645 .0130618 -0.43 0.670 -.0312252 .0200962 mujer -.2267886 .1675394 -1.35 0.176 -.5559289 .1023517 tenuresq -.00059 .0002352 -2.51 0.012 -.001052 -.000128 expersq -.0005804 .0001075 -5.40 0.000 -.0007916 -.0003691 tenure .0318967 .006864 4.65 0.000 .018412 .0453814 exper .0293366 .0049842 5.89 0.000 .019545 .0391283 educ .0823692 .0084699 9.72 0.000 .0657296 .0990088 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 148.329743 525 .282532843 Root MSE = .4001 Adj R-squared = 0.4334 Residual 82.9215928 518 .160080295 R-squared = 0.4410 Model 65.4081498 7 9.3440214 Prob > F = 0.0000 F(7, 518) = 58.37 Source SS df MS Number of obs = 526 . reg log_salario educ exper tenure expersq tenuresq mujer mujerXeduc K) Suponga que desea evaluar si el retorno a la educación es el mismo para hombres y mujeres. Incluya entonces la interacción entre mujer y educ (llámela mujerXeduc), y luego refiérase a su significancia estadística. Además, explique cómo se interpreta el coeficiente que acompaña a mujer en este contexto, y luego compare su significancia estadística respecto de lo encontrado en la parte anterior. Finalmente, evalúe la hipótesis nula que no hay diferencias de salario entre hombres y mujeres. !Regresión del log_salario sobre educ, exper, tenure, expersq, tenuresq, mujer y mujerXeduc: !Interpretación: Se desprende de la tabla que sea mujer aporta un -0,2267886*100 = -22,67886% al log_salario. Por otro lado, mujer y mujerXeduc no son significativas individualmente en este caso, lo cual se obtiene viendo los p-value de la tabla o los intervalos de confianza. Analizando respecto al caso anterior, donde no existe la interacción entre mujer y educación, la variable mujer por si sola si es significativa. Por ende, cuando agregamos la interacción al modelo, deja de serlo. !Queremos ver el aporte al log_salario por parte de las mujeres, para esto postulamos: 𝐻𝑜:𝛽! = 0 𝑦 𝛽! = 0 Para que no haya diferencias de salario entre hombres y mujeres, se debe cumplir que los parámetros que se relacionan con las variables explicativas mujer sean cero. Ambos son significativos, por lo tanto si hay efecto de ser mujer sobre el log_salario. Por ende, existe una diferencia de salario entre mujeres y hombres. Prob > F = 0.0000 F( 2, 518) = 34.33 ( 2) mujerXeduc = 0 ( 1) mujer = 0 . test mujer mujerXeduc . 16 . test mujer _cons 1.562446 .1186871 13.16 0.000 1.329279 1.795614 mujerXeduc -.0055645 .0130618 -0.43 0.670 -.0312252 .0200962 mujer -.2267886 .1675394 -1.35 0.176 -.5559289 .1023517 tenuresq -.00059 .0002352 -2.51 0.012 -.001052 -.000128 expersq -.0005804 .0001075 -5.40 0.000 -.0007916 -.0003691 tenure .0318967 .006864 4.65 0.000 .018412 .0453814 exper .0293366 .0049842 5.89 0.000 .019545 .0391283 educ .0823692 .0084699 9.72 0.000 .0657296 .0990088 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 148.329743 525 .282532843 Root MSE = .4001 Adj R-squared = 0.4334 Residual 82.9215928 518 .160080295 R-squared = 0.4410 Model 65.4081498 7 9.3440214 Prob > F = 0.0000 F(7, 518) = 58.37 Source SS df MS Number of obs = 526 . reg log_salario educ exper tenure expersq tenuresq mujer mujerXeduc (1) -.2267886 .1675394 -1.35 0.176 -.5559289 .1023517 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval] ( 1) mujer = 0 . lincom mujer +0*mujerXeduc (1) -.296345 .0358358 -8.27 0.000 -.3667465 -.2259436 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]( 1) mujer + 12.5*mujerXeduc = 0 . lincom mujer+mujerXeduc*12.5 L) En base a la regresión anterior, estime la diferencia de salario entre un hombre y una mujer cuando educ=0, y luego cuando educ=12,5. ¿Son estas diferencias estadísticamente distintas de 0? ¿Cuántos trabajadores tienen 0 años de educación? ¿Qué cree que podría estar sucediendo? !Regresión del log_salario sobre educ, exper, tenure, expersq, tenuresq, mujer y mujerXeduc: !Valores para educ. 17 Si educ=0, no es significativo la diferencia entre ser hombre y mujer para analizar los salarios, no se puede rechazar Ho. Si educ=12.5, es significativa la diferencia de salario entre hombres y mujeres, dado que p- value=0.000, se rechaza Ho. En el caso que la educación sea 12.5, es significativa la diferencia del log del salario entre hombre y mujer. Mientras si es que no tenemos educación, el p-value es lo suficientemente alto como para no rechazar Ho. Podemos concluir que se generan diferencias de salarios entre hombres y mujeres al existir presencia de educación. El trabajo no calificado no exige diferencia de sexo, pero el calificado al generar beneficios sí. En la muestra hay 2 personas con cero años de educación. M) Vuelva a considerar la diferencia de salarios entre un hombre y una mujer con educ=12,5 pero ahora evalúe su significancia estadística a partir de una especificación alternativa. En particular, se pide que reemplace la interacción entre mujer y educ y por la interacción entre mujer y (educ - 12,5). ¿Hay alguna diferencia respecto de lo encontrado en la parte anterior? Comente. Ayuda: piense en cómo se interpreta el coeficiente de mujer en este contexto. !Regresión del log_salario sobre educ, tenure, expersq, tenuresq, mujer y mujereduc: Vemos que en términos de significancia individual en este caso la variable explicativa mujer si es significativa y mujereduc no, comparado con el caso anterior mujer y mujerXeduc no eran significativos. Para esto vemos los p-value o analizamos si los intervalos de confianza contienen al cero. _cons 1.562446 .1186871 13.16 0.000 1.329279 1.795614 mujereduc -.0055645 .0130618 -0.43 0.670 -.0312252 .0200962 mujer -.296345 .0358358 -8.27 0.000 -.3667465 -.2259436 tenuresq -.00059 .0002352 -2.51 0.012 -.001052 -.000128 expersq -.0005804 .0001075 -5.40 0.000 -.0007916 -.0003691 tenure .0318967 .006864 4.65 0.000 .018412 .0453814 exper .0293366 .0049842 5.89 0.000 .019545 .0391283 educ .0823692 .0084699 9.72 0.000 .0657296 .0990088 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 148.329743 525 .282532843 Root MSE = .4001 Adj R-squared = 0.4334 Residual 82.9215928 518 .160080295 R-squared = 0.4410 Model 65.4081498 7 9.3440214 Prob > F = 0.0000 F(7, 518) = 58.37 Source SS df MS Number of obs = 526 . reg log_salario educ exper tenure expersq tenuresq mujer mujereduc 18 . Prob > F = 0.6703 F( 1, 518) = 0.18 ( 1) mujereduc = 0 . test mujereduc Prob > F = 0.0000 F( 1, 518) = 68.38 ( 1) mujer = 0 . test mujer En términos globales mujer es significativo por ende se rechaza que Beta(mujer)=0. Por otro lado si vemos mujereduc, no se rechaza que Beta(mujereduc)=0, es decir, no es significativo en este caso. Podemos concluir que mujer en el caso anterior aportaba -22,67886% siendo no significativa. Y en este caso la variable mujer aporta -29,6345% de forma significativa. N) A raíz de los resultados anteriores decide eliminar la interacción entre mujer y educ pero ahora pretender explorar la existencia de un “premio a los casados”. Para ello, vuelva a considerar la regresión estimada en la parte (j) pero incorporando a la variable binaria casado. ¿Cómo se interpreta su coeficiente? ¿Hay evidencia en favor de un “premio a los casados”? !Regresión del log_salario sobre educ, exper, tenure, expersq, tenuresq, mujer y casado: _cons 1.591424 .0988662 16.10 0.000 1.397196 1.785652 casado .0529219 .0407561 1.30 0.195 -.0271456 .1329894 mujer -.2901838 .0361121 -8.04 0.000 -.3611279 -.2192396 tenuresq -.0005744 .0002347 -2.45 0.015 -.0010355 -.0001134 expersq -.0005399 .0001122 -4.81 0.000 -.0007603 -.0003196 tenure .0312962 .0068482 4.57 0.000 .0178426 .0447499 exper .0269535 .0053258 5.06 0.000 .0164907 .0374163 educ .0791547 .0068003 11.64 0.000 .0657951 .0925143 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 148.329743 525 .282532843 Root MSE = .39952 Adj R-squared = 0.4351 Residual 82.6815138 518 .159616822 R-squared = 0.4426 Model 65.6482288 7 9.37831841 Prob > F = 0.0000 F(7, 518) = 58.76 Source SS df MS Number of obs = 526 . reg log_salario educ exper tenure expersq tenuresq mujer casado 19 _cons 1.495019 .100009 14.95 0.000 1.298545 1.691492 mujerXsoltero -.1103502 .0557421 -1.98 0.048 -.219859 -.0008414 mujerXcasado -.1982676 .0578355 -3.43 0.001 -.311889 -.0846462 hombreXcasado .2126757 .0553572 3.84 0.000 .103923 .3214283 tenuresq -.0005331 .0002312 -2.31 0.022 -.0009874 -.0000789 tenure .0290875 .006762 4.30 0.000 .0158031 .0423719 expersq -.0005352 .0001104 -4.85 0.000 -.0007522 -.0003183 exper .0268006 .0052428 5.11 0.000 .0165007 .0371005 educ .0789103 .0066945 11.79 0.000 .0657585 .092062 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 148.329743 525 .282532843 Root MSE = .39329 Adj R-squared = 0.4525 Residual 79.9679841 517 .154676952 R-squared = 0.4609 Model 68.3617586 8 8.54521982 Prob > F = 0.0000 F(8, 517) = 55.25 Source SS df MS Number of obs = 526 > o . reg log_salario educ exper expersq tenure tenuresq hombreXcasado mujerXcasado mujerXsolter !Interpretación: El coeficiente de la variable explicativa casado, aporta un 52.9219% al logaritmo del salario. Analizándoloindividualmente, no es significativo (p-value e intervalo de confianza), por lo tanto no hay evidencia a favor de un premio a los casados. O) Para permitir que el “premio a los casados” varíe según el género, estime una regresión para el logaritmo de los salarios sobre educ, exper, expersq, tenure y tenuresq, incorporando las siguientes interacciones: hombreXcasado, mujerXcasado, y mujerXsoltero. Indique cuál es grupo de base o de referencia, y luego estime la diferencia de salarios entre (1) un hombre casado y un hombre soltero, y (2) entre una mujer casada y una mujer soltera. ¿Son estadísticamente significativas estas diferencias? ! Regresión del log_salario sobre educ, exper, expersq, tenure, tenuresq, hombreXcasado, mujerXcasado y mujerXsoltero: . Prob > F = 0.1947 F( 1, 518) = 1.69 ( 1) casado = 0 . test casado 20 end of do-file . Prob > F = 0.0937 F( 1, 517) = 2.82 ( 1) mujerXcasado - mujerXsoltero = 0 . test mujerXcasado=mujerXsoltero Prob > F = 0.0001 F( 1, 517) = 14.76 ( 1) hombreXcasado = 0 . test hombreXcasado El grupo de referencia para ver el “premio” de estar casado, corresponde a el grupo de los solteros con los cuales se está comparando. La diferencia entre un hombre casado y hombre soltero corresponde al coeficiente de hombreXcasado, ya que al mantener todo lo demás constante, si analizamos un hombre soltero, desaparecen todas las variables explicativas de interacciones, mientras si es un hombre casado, existe el termino 𝛽! = 0.2126757, por lo que un hombre con todas las otras variables explicativas iguales si es que está casado aumenta el log_salario en 21.26757 %. Ademas, podemos observar que el 𝛽! es significativa por lo tanto si existe diferencia. La diferencia entre mujeres casadas y mujeres solteras, corresponde a la diferencia de sus coeficientes. Al ser mujer, la variable interacción hombreXcasado se pierde. Si mantenemos todas las otras variables explicativas constantes, la única diferencia en el log_salario seria el coeficiente de mujerXcasado y el de mujerXsoltera. Por lo que la diferencia entre ambas opciones es la diferencia entre sus coeficientes, es decir, 𝛽! − 𝛽! = −0.1982676 + 0.1103502 = −0.0879174. Lo que significa que una mujer casada gana -8.79174% menos que una mujer soltera. Podemos concluir que la diferencia entre los sueldos de los hombres casados con los hombres solteros son significativas mientras que la diferencia entre los suelos de las mujeres casadas y las mujeres solteras no son significativas al 5% pero si al 10%. 21 P) Verifique manualmente los cálculos de la prueba F que Stata reporta para el caso de la diferencia de salarios entre una mujer casada y una mujer soltera. Para que el log_salario entre mujeres casadas y mujeres solteras sean el mismo se requiere que se cumpla Ho: 𝛽! − 𝛽!= 0. Luego realizamos nuestro test: 𝑡 = ( !!! !!)!! !(!!)! !(!!)!!!"#(!!,!!) Reemplazando: 𝑡 = !!.!"#$%&% ! !!.!!"#$"% ! ! !.!!""##$#! !.!!"#!$#%!!∗ !.!!"#$$#% ) ≅ 5,8 Sabiendo que el t anterior debe dar 2,82 pero obtenemos 5,8 no influye en la conclusión final porque rechazamos Ho de igual manera. Q) Finalmente, considere una especificación alternativa donde se reemplaza a la interacción entre mujer y casado por la interacción entre hombre y soltero. Compruebe que se verifican las relaciones entre los coeficientes de ésta y aquellos de la especificación anterior, y luego vuelva a evaluar si la diferencia de salarios entre mujeres casadas y solteras es estadísticamente significativa. Prob > F = 0.0937 F( 1, 517) = 2.82 ( 1) mujerXcasado - mujerXsoltero = 0 . test mujerXcasado=mujerXsoltero 22 Prob > F = 0.0937 F( 1, 517) = 2.82 ( 1) mujerXsoltero = 0 . test mujerXsoltero=0 El coeficiente de mujerXcasado del caso anterior y el de hombreXsoltero en este caso, son inversos, ósea que tienen la misma magnitud pero afectan en sentidos opuestos. Lo cual es lógico, ya que si vemos manteniendo todo constante, una mujer casada afectaba al log_salario en -19.82676%, lo que significa que al compararlo con la opción opuesta (hombre soltero), esta gana un 19.82676% menos. Por lo tanto cabría esperar que al cambiar la regresión, si vemos el hombre soltero, este gane un 19.82676% más que su opuesto (mujer casada) Tomando en cuenta la regresion, cuando sacamos la diferencia de el log_salario de mujeres casadas con mujeres solteras, queda (−𝛽!). En este caso Ho: 𝛽! = 0 Podemos apreciar que al 5%, el t calculado (1,68) versus el tabulado (1,96) no nos da un coeficiente significativo individualmente. Pero por medio del test F realizado anteriormente podemos observar que no lo es al 5% , pero si lo es globalmente al 10%
Compartir