Logo Studenta

tarea1_kaplan_parsons_valdes

¡Este material tiene más páginas!

Vista previa del material en texto

PONTIFICIA  UNIVERSIDAD  CATOLICA  DE  CHILE  
FACULTAD  DE  CIENCIAS  ECONOMICAS  Y  ADMINISTRATIVAS  
INSTITUTO  DE  ECONOMIA  
  
  
  
  
  
TAREA 1 
	
  
ECONOMETRIA I 
EAE250A SEC.2 
Profesor Juan Urquiza 
 
 
Primer Semestre 2017 
  
  
  
  
  
  
  
  
  
Integrantes del grupo: 1. Trinidad Kaplan 
 2. Rodrigo Parsons 
 3. Carlos Valdes 
 
  
  
  
  
	
   1	
  
Graph 05-05-17 18:20
0
.0
2
.0
4
.0
6
.0
8
D
en
si
ty
0 20 40 60 80
salario
. 
 salario 526 19.06648 11.94249 1.713884 80.77891
 
 Variable Obs Mean Std. Dev. Min Max
  
Tarea Econometría 
 
 
Preguntas: 
A) 
!Análisis descriptivo Salario : Se observan 526 observación, con un salario promedio de 
19.06648 y una desviación estándar de 11.94249. El valor mínimo que toma el salario es de 
1.713884 y el máximo 80.77891. 
 
 
!Histograma Salario: 
 
 
 
 
 
 
 
 
!Salario promedio entre los hombres : 22.95793 
!Salario promedio entre las mujeres : 14.83531 
 
 
 
. 
 salario 274 22.95793 13.45515 4.850615 80.77891
 
 Variable Obs Mean Std. Dev. Min Max
 salario 252 14.83531 8.179311 1.713884 69.94587
 
 Variable Obs Mean Std. Dev. Min Max
	
   2	
  
. 
 
 _cons -9.289687 2.357283 -3.94 0.000 -13.92062 -4.658759
 tenure .5473714 .0699931 7.82 0.000 .4098686 .6848742
 exper .0722403 .0389888 1.85 0.064 -.0043539 .1488344
 educ 1.936899 .1658378 11.68 0.000 1.611108 2.262691
 
 salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 74877.1428 525 142.623129 Root MSE = 9.9744
 Adj R-squared = 0.3024
 Residual 51933.1062 522 99.4887093 R-squared = 0.3064
 Model 22944.0365 3 7648.01218 Prob > F = 0.0000
 F(3, 522) = 76.87
 Source SS df MS Number of obs = 526
. reg salario educ exper tenure
 
 
!Proporción de los trabajadores que está casado : 𝟑𝟐𝟎
𝟓𝟐𝟔
 
!Promedio de educ : 12.56274 
!Individuos que tienen al menos 15 años de educación: sum educ if educ≥15 
120 
B)Estime una regresión para el salario sobre educ, exper y tenure. ¿Cómo se interpretan los 
coeficientes? 
!Regresión para el salario sobre educ, exper y tenure. 
 
 
 
 
 
 
 
 
 
!Interpretación de los coeficientes: 
 
𝛽!  = -9.289687!Corresponde al intercepto de la regresión del salario. Es el salario mínimo 
cuando todas las variables explicativas son cero. 
𝛽!  = 1.936899!Es cuanto aumenta el salario ante un cambio unitario en la educación manteniendo 
ceteribus paribus las otras variables explicativas. 
𝛽!  = 0.0722403!Es cuanto aumenta el salario ante un cambio unitario en la experiencia 
manteniendo ceteribus paribus las otras variables explicativas. 
𝛽!  = 0.5473714! Es cuanto aumenta el salario ante un cambio unitario en los años de antigüedad 
en el empleo manteniendo ceteribus paribus las otras variables explicativas. 
 
 
. 
 educ 526 12.56274 2.769022 0 18
 
 Variable Obs Mean Std. Dev. Min Max
	
   3	
  
 tenure 0.0000 -0.0562 0.4993 1.0000
 exper 0.0000 -0.2995 1.0000
 educ -0.0000 1.0000
 resid 1.0000
 
 resid educ exper tenure
 
 tenure 5.104563 .3150015 4.485744 5.723381
 
 Mean Std. Err. [95% Conf. Interval]
 
Mean estimation Number of obs = 526
. mean tenure
 
 exper 17.01711 .5917743 15.85457 18.17965
 
 Mean Std. Err. [95% Conf. Interval]
 
Mean estimation Number of obs = 526
. mean exper
 
 educ 12.56274 .1207351 12.32555 12.79992
 
 Mean Std. Err. [95% Conf. Interval]
 
Mean estimation Number of obs = 526
. mean educ
 
 salario 19.06648 .5207174 18.04354 20.08943
 
 Mean Std. Err. [95% Conf. Interval]
 
Mean estimation Number of obs = 526
. mean salario
 
 
C) Verifique que se cumplan las tres propiedades algebraicas revisadas en clase. Además, 
compruebe que el coeficiente de determinación es igual al cuadrado del coeficiente de correlación 
entre 𝑦𝑖 e 𝑦 ̂𝑖 . 
1º! Suma de Residuos ! Σ𝜀 =  4.768e-06 = 0 
Media Condicional Cero:𝐸(𝜀/X) = 0 
Se cumple la propiedad. 
2º!Ortogonalidad: Los residuos no están correlacionados con las variables explicativas!𝐶𝑜𝑣 =
0. Se cumple la propiedad. 
 
 
 
 
3º!Pertenencia de las variables estimadas a la regresión: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
	
   4	
  
 Adj R-squared = 0.3024
 Residual 51933.1062 522 99.4887093 R-squared = 0.3064
 
 
Para comprobar esta propiedad, reemplazamos los coeficientes obtenidos junto a las variables 
promedio, lo que nos debe dar como resultado en la regresión igual al salario medio, quedando 
comprobada la propiedad. 
 
𝑚𝑒𝑎𝑛 𝑠𝑎𝑙𝑎𝑟𝑖𝑜 = 𝛽! + 𝛽! ∗𝑚𝑒𝑎𝑛 𝑒𝑑𝑢𝑐 + 𝛽!𝑚 ∗𝑚𝑒𝑎𝑛 𝑒𝑥𝑝𝑒𝑟 + 𝛽! ∗𝑚𝑒𝑎𝑛(𝑡𝑒𝑛𝑢𝑟𝑒) 
19.06648 =  −9.289687 +  1.936899   ∗ 12.56274 +  0.0722403   ∗  17.01711   + 0.5473714  
∗  5.104563 
 
!𝑅! : Por tabla entregado por Stata 𝑅! = 0.3064.   Luego, al ver la correlación entre salario y 
salariohat, vemos que el coeficiente de correlación es 0.5536, el cual si lo elevamos al cuadrado da 
0.3064, cumpliéndose la igualdad postulada en la pregunta. 
 
 
 
D) Ahora compruebe que las propiedades anteriores no se cumplen si la regresión estimada 
en la parte (b) no incluye intercepto. 
! Regresión para el salario sobre educ, exper, tenure sin constante. 
 
 
 
 
 
 
 salariohat 0.5536 1.0000
 salario 1.0000
 
 salario salari~t
 
 tenure .5724254 .0706654 8.10 0.000 .4336025 .7112483
 exper -.0018288 .0346306 -0.05 0.958 -.0698611 .0662034
 educ 1.312757 .0498586 26.33 0.000 1.21481 1.410705salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 266094.332 526 505.88276 Root MSE = 10.112
 Adj R-squared = 0.7979
 Residual 53478.1912 523 102.252756 R-squared = 0.7990
 Model 212616.14 3 70872.0468 Prob > F = 0.0000
 F(3, 523) = 693.11
 Source SS df MS Number of obs = 526
. reg salario educ exper tenure, noconstant
	
   5	
  
 
 
1º! Suma de Residuos: Σ𝜀 = 0 ! -166.32261 ≠ 0 
Media Condicional Cero:𝐸(𝜀/X) ≠ 0 
No se cumple la propiedad 
 
2º!Ortogonalidad: La propiedad indica que los residuos no están correlacionados con las 
variables explicativas!𝐶𝑜𝑣 = 0. 
En este caso los residuos y las variables explicativas si se correlacionan, por ende la propiedad de 
ortogonalidad no se cumple. 
 
 
 
3º! Pertenencia de las variables estimadas a la regresión: 
 
 
 
 
 tenure 0.0222 -0.0562 0.4993 1.0000
 exper 0.0394 -0.2995 1.0000
 educ 0.1425 1.0000
 resid 1.0000
 
 resid educ exper tenure
. 
end of do-file
. 
 
 tenure 5.104563 .3150015 4.485744 5.723381
 
 Mean Std. Err. [95% Conf. Interval]
 
Mean estimation Number of obs = 526
. mean tenure
 
 exper 17.01711 .5917743 15.85457 18.17965
 
 Mean Std. Err. [95% Conf. Interval]
 
Mean estimation Number of obs = 526
. mean exper
 
 educ 12.56274 .1207351 12.32555 12.79992
 
 Mean Std. Err. [95% Conf. Interval]
 
	
   6	
  
 
 
 
𝑚𝑒𝑎𝑛 𝑠𝑎𝑙𝑎𝑟𝑖𝑜 = 𝛽! + 𝛽! ∗𝑚𝑒𝑎𝑛 𝑒𝑑𝑢𝑐 + 𝛽!𝑚 ∗𝑚𝑒𝑎𝑛 𝑒𝑥𝑝𝑒𝑟 + 𝛽! ∗𝑚𝑒𝑎𝑛(𝑡𝑒𝑛𝑢𝑟𝑒) 
19.06648   ≠  1.312757 ∗ 12.56274   − 0.0018288   ∗  17.01711 +  0.5724254       ∗  5.104563 
Para comprobar esta propiedad, reemplazamos los coeficientes obtenidos junto a las variables 
promedio, lo que nos debe dar como resultado en la regresión igual al salario medio. En este caso 
no se cumple la propiedad debido a la no existencia de la constante. 
E) Vuelva a considerar la regresión estimada en la parte (b), pero ahora compruebe que los 
estimadores de MCO admiten una interpretación de efecto parcial. Para ello deberá estimar una 
regresión auxiliar, guardar sus residuos, y luego utilizarlos como variable explicativa en una 
segunda regresión. 
!Regresión Inicial del salario sobre educ, exper y tenure. 
 
!Educ 
1)Regresión auxiliar para Educ: 
 
 
 
 
 
 _cons -9.289687 2.357283 -3.94 0.000 -13.92062 -4.658759
 tenure .5473714 .0699931 7.82 0.000 .4098686 .6848742
 exper .0722403 .0389888 1.85 0.064 -.0043539 .1488344
 educ 1.936899 .1658378 11.68 0.000 1.611108 2.262691
 
 salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 74877.1428 525 142.623129 Root MSE = 9.9744
 Adj R-squared = 0.3024
 Residual 51933.1062 522 99.4887093 R-squared = 0.3064
 Model 22944.0365 3 7648.01218 Prob > F = 0.0000
 F(3, 522) = 76.87
 Source SS df MS Number of obs = 526
. reg salario educ exper tenure
 
 _cons 13.57496 .1843245 73.65 0.000 13.21286 13.93707
 tenure .0476795 .0183371 2.60 0.010 .011656 .0837031
 exper -.0737851 .0097609 -7.56 0.000 -.0929604 -.0546098
 
 educ Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 4025.42966 525 7.66748506 Root MSE = 2.63
 Adj R-squared = 0.0979
 Residual 3617.48335 523 6.91679416 R-squared = 0.1013
 Model 407.946311 2 203.973156 Prob > F = 0.0000
 F(2, 523) = 29.49
 Source SS df MS Number of obs = 526
. reg educ exper tenure
	
   7	
  
. 
 
 _cons 17.00365 .6990649 24.32 0.000 15.63033 18.37698
 tenure .6397219 .069545 9.20 0.000 .5030993 .7763444
 exper -.0706741 .0370188 -1.91 0.057 -.1433983 .0020501
 educresid 1.936899 .1658378 11.68 0.000 1.611108 2.262691
 
 salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 74877.1428 525 142.623129 Root MSE = 9.9744
 Adj R-squared = 0.3024
 Residual 51933.1065 522 99.4887097 R-squared = 0.3064
 Model 22944.0363 3 7648.01209 Prob > F = 0.0000
 F(3, 522) = 76.87
 Source SS df MS Number of obs = 526
. reg salario educresid exper tenure
. 
 
 _cons -7.184163 2.065296 -3.48 0.001 -11.24147 -3.126851
 tenure .6130557 .0603515 10.16 0.000 .494494 .7316173
 experresid .0722403 .0389888 1.85 0.064 -.0043539 .1488344
 educ 1.840464 .1574588 11.69 0.000 1.531133 2.149795
 
 salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 74877.1428 525 142.623129 Root MSE = 9.9744
 Adj R-squared = 0.3024
 Residual 51933.1063 522 99.4887093 R-squared = 0.3064
 Model 22944.0365 3 7648.01217 Prob > F = 0.0000
 F(3, 522) = 76.87
 Source SS df MS Number of obs = 526
. reg salario educ experresid tenure
. predict experhat_cons 29.14613 2.316285 12.58 0.000 24.59577 33.6965
 tenure .9092475 .0676858 13.43 0.000 .776278 1.042217
 educ -1.334927 .1765944 -7.56 0.000 -1.681848 -.9880053
 
 exper Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 96706.846 525 184.203516 Root MSE = 11.187
 Adj R-squared = 0.3206
 Residual 65447.8092 523 125.139214 R-squared = 0.3232
 Model 31259.0368 2 15629.5184 Prob > F = 0.0000
 F(2, 523) = 124.90
 Source SS df MS Number of obs = 526
. reg exper educ tenure
 
 
Efecto Parcializado: 
 
 
 
 
 
 
Predecimos los años de educación y luego obtenemos los residuos a través de la diferencia entre los 
verdaderos años de educación y los predichos anteriormente. Posteriormente, parcializamos la 
regresión, para ver el efecto que tiene 𝑋! sobre el salario cuando no se correlaciona con las otras 
variables explicativas. Entregándonos como resultado el mismo 𝛽! de la regresión inicial para la 
regresión del efecto parcializado. Que sean iguales quiere decir 𝛽! esta representando el efecto neto 
de las otras variables explicativas. 
!Exper: 
2)Regresión Auxiliar para Exper: 
 
 
 
 
 
 
Efecto Parcializado 
 
 
 
 
 
 
 
	
   8	
  
 
 
Siguiendo el mismo procedimiento anterior sobre los residuos, vemos el efecto que tiene 𝑋! sobre el 
salario cuando no se correlaciona con las otras variables explicativas. Entregándonos como 
resultado el mismo 𝛽! de la regresión inicial para la regresión del efecto parcializado. Que sean 
iguales quiere decir 𝛽! esta representando el efecto neto de las otras variables explicativas. 
3) Regresión Auxiliar Tenure: 
 
 
 
Efecto Parcializado: 
 
Siguiendo el mismo procedimiento anterior, vemos el efecto que tiene 𝑋! sobre el salario cuando no 
se correlaciona con las otras variables explicativas. Entregándonos como resultado el mismo 𝛽! de 
la regresión inicial para la regresión del efecto parcializado. Que sean iguales quiere decir 𝛽! esta 
representando el efecto neto de las otras variables explicativas. 
 
 
 
 
 _cons -3.05907 1.466583 -2.09 0.037 -5.940188 -.1779519
 exper .2821307 .0210023 13.43 0.000 .2408715 .3233898
 educ .2676633 .102941 2.60 0.010 .0654347 .469892
 
 tenure Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 27401.249 525 52.1928553 Root MSE = 6.2313
 Adj R-squared = 0.2560
 Residual 20307.8183 523 38.8294805 R-squared = 0.2589
 Model 7093.43077 2 3546.71538 Prob > F = 0.0000
 F(2, 523) = 91.34
 Source SS df MS Number of obs = 526
. reg tenure educ exper
. 
 
 _cons -10.96413 2.347539 -4.67 0.000 -15.57592 -6.352349
 tenureresid .5473714 .0699931 7.82 0.000 .4098686 .6848742
 exper .2266705 .033618 6.74 0.000 .1606273 .2927137
 educ 2.083411 .1647762 12.64 0.000 1.759705 2.407117
 
 salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 74877.1428 525 142.623129 Root MSE = 9.9744
 Adj R-squared = 0.3024
 Residual 51933.1062 522 99.4887093 R-squared = 0.3064
 Model 22944.0365 3 7648.01218 Prob > F = 0.0000
 F(3, 522) = 76.87
 Source SS df MS Number of obs = 526
. reg salario educ exper tenureresid 
	
   9	
  
 
 
F) Antes de avanzar, revise el histograma de los residuos de la regresión estimada en la parte (b) y 
compárelo con el histograma de los residuos de la misma regresión pero utilizando al logaritmo del 
salario (log_salario) como variable dependiente. 
 
 
 
 
 
 
 
 
 
 
Los residuos del logaritmo del salario se ajustan mejor a la distribución normal que los residuos del 
salario. Ambos están centradas en cero. Podemos decir que los residuos se acercan a una 
distribución normal al hacer una regresión log-nivel que nivel-nivel. 
 
G) Ahora interprete los coeficientes de la regresión log-nivel estimada en la parte anterior. 
 !Regresión del log_salario sobre educ, exper y tenure: 
 
Al estar analizando el logaritmo del salario, cada 𝛽! distinto de 𝛽!, ante un cambio unitario de 𝑋! 
afecta a Y de la forma 𝛽! ∗ 100. Es decir, un cambio marginal en 𝑋! genera un cambio porcentual 
en Y. 
 
. 
 
 _cons 1.458 .1041904 13.99 0.000 1.253316 1.662684
 tenure .0220672 .0030936 7.13 0.000 .0159897 .0281447
 exper .0041211 .0017233 2.39 0.017 .0007357 .0075065
 educ .092029 .0073299 12.56 0.000 .0776292 .1064288
 
 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 148.329743 525 .282532843 Root MSE = .44086
 Adj R-squared = 0.3121
 Residual 101.455569 522 .194359327 R-squared = 0.3160
 Model 46.8741739 3 15.6247246 Prob > F = 0.0000
 F(3, 522) = 80.39
 Source SS df MS Number of obs = 526
. reg log_salario educ exper tenure
	
   10	
  
 
 _cons 1.375212 .1014697 13.55 0.000 1.175871 1.574553
 tenuresq -.0006156 .0002495 -2.47 0.014 -.0011056 -.0001255
 expersq -.0005918 .0001141 -5.19 0.000 -.0008159 -.0003677
 tenure .0371222 .0072432 5.13 0.000 .0228927 .0513517
 exper .029301 .0052885 5.54 0.000 .0189115 .0396905
 educ .0845258 .0071614 11.80 0.000 .070457 .0985946
 
 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 148.329743 525 .282532843 Root MSE = .42497
 Adj R-squared = 0.3608
 Residual 93.9112814 520 .180598618 R-squared = 0.3669
 Model 54.4184612 5 10.8836922 Prob > F = 0.0000
 F(5, 520) = 60.26
 Source SSdf MS Number of obs = 526
. reg log_salario educ exper tenure expersq tenuresq
 
 
!Análisis de los coeficientes: 
𝛽! =  1.458 !Es el intercepto del log_salario, y representa el valor mínimo que toma log_salario 
cuando las variables explicativas son cero. 
𝛽! = 0.092029!El aporte de la educación al salario es de 0.092029*100!9,2029%. 
𝛽! = 0.004121! El aporte de la experiencia al salario es de 0.0041211*100!0,412119%. 
𝛽! =0.0220672!El aporte de años en el empleo al salario es de 0.0220672*100!2,20672%. 
 
H) Incorpore las variables expersq y a la regresión log-nivel analizada en la parte anterior y 
verifique si son significativas individualmente y de forma conjunta. Además, compruebe que el 
estadístico F reportado para la prueba conjunta se puede computar a partir de la diferencia en la 
suma de cuadrados residuales del modelo completo versus el restringido. 
!Regresión del log_salario sobre educ, exper, tenure, expersq y tenuresq: 
 
 
 
 
 
 
 
 
 
Analizando individualmente cada parámetro, vemos que todas las variables son significativas. 
Podemos verlo con test de hipótesis al 5%, donde comparamos con los p-value, los cuales al ser 
muy pequeños y cercanos a cero, rechazamos la Hipótesis nula correspondiente a cada 𝛽!, por lo 
que se concluye que cada variable es significativa. Similarmente podemos analizar los intervalos de 
confianza, donde encontramos que los intervalos no incluyen al cero, por lo que se comprueba que 
las variables son significativas. 
 
 
 
 
 
	
   11	
  
. 
 Prob > F = 0.0000
 F( 5, 520) = 60.26
 ( 5) tenuresq = 0
 ( 4) expersq = 0
 ( 3) tenure = 0
 ( 2) exper = 0
 ( 1) educ = 0
. test educ exper tenure expersq tenuresq
 
 _cons 1.371985 .1019556 13.46 0.000 1.17169 1.57228
 expersq -.0006606 .0001111 -5.94 0.000 -.0008789 -.0004423
 tenure .0208413 .0030037 6.94 0.000 .0149404 .0267422
 exper .0328542 .0051135 6.42 0.000 .0228085 .0428999
 educ .0853489 .0071885 11.87 0.000 .071227 .0994709
 
 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 148.329743 525 .282532843 Root MSE = .42704
 Adj R-squared = 0.3545
 Residual 95.0110415 521 .182362844 R-squared = 0.3595
 Model 53.3187012 4 13.3296753 Prob > F = 0.0000
 F(4, 521) = 73.09
 Source SS df MS Number of obs = 526
. reg log_salario educ exper tenure expersq
 
Para analizarlo conjuntamente, realizamos el siguiente test: 
 
 
 
 
 
 
Con los resultados obtenidos vemos que todas las variables conjuntamente son significativas. 
 
!Comprobación / Test de Chow: 
1)Regresión Inicial: 
 
 
2)Regresion con variable exper cuadrática: Restringida 1 
 
 
 
 
 
 
 
 
 
 
	
   12	
  
. 
 
 _cons 1.44932 .1029287 14.08 0.000 1.247113 1.651526
 tenuresq -.0009321 .0002478 -3.76 0.000 -.0014189 -.0004452
 tenure .0465254 .0071852 6.48 0.000 .0324098 .0606409
 exper .0032729 .0017169 1.91 0.057 -.0000999 .0066458
 educ .0897291 .0072651 12.35 0.000 .0754566 .1040016
 
 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 148.329743 525 .282532843 Root MSE = .43541
 Adj R-squared = 0.3290
 Residual 98.7739425 521 .189585302 R-squared = 0.3341
 Model 49.5558001 4 12.38895 Prob > F = 0.0000
 F(4, 521) = 65.35
 Source SS df MS Number of obs = 526
. reg log_salario educ exper tenure tenuresq
 
 
 
3)Regresión con variable tenure cuadrática: Restringida 2 
 
 
 
 
 
 
 
 
 
 
Obtenemos el valor por medio de la diferencia de las sumas de cuadrados residuales del modelo 
libre y los restringidos. 
 
𝐹 =
(𝑆𝐶𝑅! − (𝑆𝐶𝑅! + 𝑆𝐶𝑅!))
(𝑆𝐶𝑅! + 𝑆𝐶𝑅!)
∗
(𝑁 − 2 𝐾! + 1 )
(𝐾! + 1)
 
 
 
𝐹 =
(101.455569     − (95.0110415 + 98.7739425))
(95.0110415 + 98.7739425)
∗
(526 − 2(3 + 1)
(3 + 1)
 
 
 
F≈ 60.26 
 
Se que el estadístico F reportado para la prueba conjunta se puede computar a partir de la diferencia 
en la suma de cuadrados residuales del modelo completo versus el restringido. 
 
 
 
 
	
   13	
  
 
I) En base a la regresión estimada en la parte (h), encuentre el valor de exper a partir del cual un año 
de experiencia adicional impacta negativamente sobre el logaritmo del salario. ¿Cuántos 
trabajadores tienen una experiencia mayor que ese nivel? 
!Regresión del log_salario sobre educ, exper, tenure, expersq y tenuresq. 
 
En primer lugar, vemos el aporte que tienen los años de experiencia sobre el logaritmo del salario. 
Buscamos el valor para cuando una unidad mas de experiencia comienza a impactar negativamente 
sobre el logaritmo del salario, por ende: 
𝛽!+𝛽! ∗ 𝑒𝑥𝑝𝑒𝑟 ! 𝛽!+𝛽! ∗ 𝑒𝑥𝑝𝑒𝑟 < 0 
 Reemplazando: !.!"#$!%
!.!!!"#$%  
< exper ! 49,511 < exper 
Por lo tanto, para todo valor mayor a 49,511, un año de experiencia adicional impactara 
negativamente sobre el logaritmo del salario. De la base de datos, hay tan solo 2 personas que 
tienen mas de 49,511 años de experiencia. 
 
 
 
 
 
 
 
 
 
 
 
 
 _cons 1.375212 .1014697 13.55 0.000 1.175871 1.574553
 tenuresq -.0006156 .0002495 -2.47 0.014 -.0011056 -.0001255
 expersq -.0005918 .0001141 -5.19 0.000 -.0008159 -.0003677
 tenure .0371222 .0072432 5.13 0.000 .0228927 .0513517
 exper .029301 .0052885 5.54 0.000 .0189115 .0396905
 educ .0845258 .0071614 11.80 0.000 .070457 .0985946
 
 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 148.329743 525 .282532843 Root MSE = .42497
 Adj R-squared = 0.3608
 Residual 93.9112814 520 .180598618 R-squared = 0.3669
 Model 54.4184612 5 10.8836922 Prob > F = 0.0000
 F(5, 520) = 60.26
 Source SS df MS Number of obs = 526
. reg log_salario educ exper tenure expersq tenuresq
	
   14	
  
 
 
J) Ahora incorpore la variable binaria mujer al modelo estimado en la parte (h), y explique cómo 
se interpreta el coeficiente que la acompaña. Además, evalúe su significancia estadística, y luego 
verifique relación que existe entre el estadístico F reportado y el estadístico t que Stata reporta 
automáticamente. 
!Regresión del log_salario sobre educ, exper, tenure, expersq, tenuresq y mujer: 
 
 
!Interpretación: El aporte porcentual de mujer sobre el logaritmo del salarioes 
 de -29,296511%. 
!Vemos que dado los valores de la tabla Stata si hay significancia individual, ya que la variable 
mujer tiene un p-value igual a cero por lo que se rechaza Ho, y su intervalo de confianza al 95% no 
incluye el 0. En términos de significancia Global también es significativa, porque la probabilidad 
que Ho sea 0, es 0%. 
 
 
!La relación que existe entre el valor t automático de Stata y la prueba F, radica en que el 
resultado automático es un test de hipótesis cuando decimos que el parámetro de la variable 
explicativa mujer es cero (en este caso), mientras que con la prueba F vemos la probabilidad de que 
Ho se cumpla. En este caso, la probabilidad de que Ho=0 es del 0%, por lo tanto Ho se rechaza, 
cosa que también obtenemos con el t y p-value respectivo. 
Es decir, por t tenemos -8.28 con p-value=0.00 y por test F, tenemos F=68.58 y p-value=0.00. Con 
lo que se concluye que ambos test son significativos. 
 
 
 _cons 1.590331 .0989279 16.08 0.000 1.395983 1.78468
 mujer -.296511 .0358054 -8.28 0.000 -.3668524 -.2261696
 tenuresq -.0005852 .0002347 -2.49 0.013 -.0010463 -.0001241
 expersq -.0005827 .0001073 -5.43 0.000 -.0007935 -.0003719
 tenure .0317139 .0068452 4.63 0.000 .0182663 .0451616
 exper .0294324 .0049752 5.92 0.000 .0196585 .0392063
 educ .0801966 .0067573 11.87 0.000 .0669217 .0934716
 
 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 148.329743 525 .282532843 Root MSE = .39978
 Adj R-squared = 0.4343
 Residual 82.9506454 519 .159827833 R-squared = 0.4408
 Model 65.3790973 6 10.8965162 Prob > F = 0.0000
 F(6, 519) = 68.18
 Source SS df MS Number of obs = 526
. reg log_salario educ exper tenure expersq tenuresq mujer
 Prob > F = 0.0000
 F( 1, 519) = 68.58
 ( 1) mujer = 0
. test mujer
	
   15	
  
 
 _cons 1.562446 .1186871 13.16 0.000 1.329279 1.795614
 mujerXeduc -.0055645 .0130618 -0.43 0.670 -.0312252 .0200962
 mujer -.2267886 .1675394 -1.35 0.176 -.5559289 .1023517
 tenuresq -.00059 .0002352 -2.51 0.012 -.001052 -.000128
 expersq -.0005804 .0001075 -5.40 0.000 -.0007916 -.0003691
 tenure .0318967 .006864 4.65 0.000 .018412 .0453814
 exper .0293366 .0049842 5.89 0.000 .019545 .0391283
 educ .0823692 .0084699 9.72 0.000 .0657296 .0990088
 
 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 148.329743 525 .282532843 Root MSE = .4001
 Adj R-squared = 0.4334
 Residual 82.9215928 518 .160080295 R-squared = 0.4410
 Model 65.4081498 7 9.3440214 Prob > F = 0.0000
 F(7, 518) = 58.37
 Source SS df MS Number of obs = 526
. reg log_salario educ exper tenure expersq tenuresq mujer mujerXeduc
 
 
K) Suponga que desea evaluar si el retorno a la educación es el mismo para hombres y mujeres. 
Incluya entonces la interacción entre mujer y educ (llámela mujerXeduc), y luego refiérase a su 
significancia estadística. Además, explique cómo se interpreta el coeficiente que acompaña a mujer 
en este contexto, y luego compare su significancia estadística respecto de lo encontrado en la parte 
anterior.	
  Finalmente, evalúe la hipótesis nula que no hay diferencias de salario entre hombres y 
mujeres. 
!Regresión del log_salario sobre educ, exper, tenure, expersq, tenuresq, mujer y mujerXeduc: 
 
 
 
 
 
 
 
 
 
 
 
!Interpretación: 
Se desprende de la tabla que sea mujer aporta un -0,2267886*100 = -22,67886% al log_salario. Por 
otro lado, mujer y mujerXeduc no son significativas individualmente en este caso, lo cual se obtiene 
viendo los p-value de la tabla o los intervalos de confianza. Analizando respecto al caso anterior, 
donde no existe la interacción entre mujer y educación, la variable mujer por si sola si es 
significativa. Por ende, cuando agregamos la interacción al modelo, deja de serlo. 
!Queremos ver el aporte al log_salario por parte de las mujeres, para esto postulamos: 
𝐻𝑜:𝛽! = 0  𝑦  𝛽! = 0 
Para que no haya diferencias de salario entre hombres y mujeres, se debe cumplir que los 
parámetros que se relacionan con las variables explicativas mujer sean cero.   
 
Ambos son significativos, por lo tanto si hay efecto de ser mujer sobre el log_salario. Por ende, 
existe una diferencia de salario entre mujeres y hombres. 
 Prob > F = 0.0000
 F( 2, 518) = 34.33
 ( 2) mujerXeduc = 0
 ( 1) mujer = 0
. test mujer mujerXeduc
. 
	
   16	
  
. test mujer
 
 _cons 1.562446 .1186871 13.16 0.000 1.329279 1.795614
 mujerXeduc -.0055645 .0130618 -0.43 0.670 -.0312252 .0200962
 mujer -.2267886 .1675394 -1.35 0.176 -.5559289 .1023517
 tenuresq -.00059 .0002352 -2.51 0.012 -.001052 -.000128
 expersq -.0005804 .0001075 -5.40 0.000 -.0007916 -.0003691
 tenure .0318967 .006864 4.65 0.000 .018412 .0453814
 exper .0293366 .0049842 5.89 0.000 .019545 .0391283
 educ .0823692 .0084699 9.72 0.000 .0657296 .0990088
 
 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 148.329743 525 .282532843 Root MSE = .4001
 Adj R-squared = 0.4334
 Residual 82.9215928 518 .160080295 R-squared = 0.4410
 Model 65.4081498 7 9.3440214 Prob > F = 0.0000
 F(7, 518) = 58.37
 Source SS df MS Number of obs = 526
. reg log_salario educ exper tenure expersq tenuresq mujer mujerXeduc
 
 (1) -.2267886 .1675394 -1.35 0.176 -.5559289 .1023517
 
 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 ( 1) mujer = 0
. lincom mujer +0*mujerXeduc
 
 (1) -.296345 .0358358 -8.27 0.000 -.3667465 -.2259436
 
 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]( 1) mujer + 12.5*mujerXeduc = 0
. lincom mujer+mujerXeduc*12.5
 
 
L) En base a la regresión anterior, estime la diferencia de salario entre un hombre y una mujer 
cuando educ=0, y luego cuando educ=12,5. ¿Son estas diferencias estadísticamente distintas de 0? 
¿Cuántos trabajadores tienen 0 años de educación? ¿Qué cree que podría estar sucediendo? 
!Regresión del log_salario sobre educ, exper, tenure, expersq, tenuresq, mujer y mujerXeduc: 
 
 
 
 
 
 
 
 
 
 
 
 
!Valores para educ. 
 
 
 
 
 
 
 
 
 
 
 
 
 
	
   17	
  
 
 
Si educ=0, no es significativo la diferencia entre ser hombre y mujer para analizar los salarios, no se 
puede rechazar Ho. 
Si educ=12.5, es significativa la diferencia de salario entre hombres y mujeres, dado que p-
value=0.000, se rechaza Ho. 
En el caso que la educación sea 12.5, es significativa la diferencia del log del salario entre hombre y 
mujer. Mientras si es que no tenemos educación, el p-value es lo suficientemente alto como para no 
rechazar Ho. Podemos concluir que se generan diferencias de salarios entre hombres y mujeres al 
existir presencia de educación. El trabajo no calificado no exige diferencia de sexo, pero el 
calificado al generar beneficios sí. En la muestra hay 2 personas con cero años de educación. 
 
M) Vuelva a considerar la diferencia de salarios entre un hombre y una mujer con educ=12,5 pero 
ahora evalúe su significancia estadística a partir de una especificación alternativa. En particular, se 
pide que reemplace la interacción entre mujer y educ y por la interacción entre mujer y (educ - 
12,5). ¿Hay alguna diferencia respecto de lo encontrado en la parte anterior? Comente. Ayuda: 
piense en cómo se interpreta el coeficiente de mujer en este contexto. 
!Regresión del log_salario sobre educ, tenure, expersq, tenuresq, mujer y mujereduc: 
 
 
Vemos que en términos de significancia individual en este caso la variable explicativa mujer si es 
significativa y mujereduc no, comparado con el caso anterior mujer y mujerXeduc no eran 
significativos. Para esto vemos los p-value o analizamos si los intervalos de confianza contienen al 
cero. 
 
 
 
 
 _cons 1.562446 .1186871 13.16 0.000 1.329279 1.795614
 mujereduc -.0055645 .0130618 -0.43 0.670 -.0312252 .0200962
 mujer -.296345 .0358358 -8.27 0.000 -.3667465 -.2259436
 tenuresq -.00059 .0002352 -2.51 0.012 -.001052 -.000128
 expersq -.0005804 .0001075 -5.40 0.000 -.0007916 -.0003691
 tenure .0318967 .006864 4.65 0.000 .018412 .0453814
 exper .0293366 .0049842 5.89 0.000 .019545 .0391283
 educ .0823692 .0084699 9.72 0.000 .0657296 .0990088
 
 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 148.329743 525 .282532843 Root MSE = .4001
 Adj R-squared = 0.4334
 Residual 82.9215928 518 .160080295 R-squared = 0.4410
 Model 65.4081498 7 9.3440214 Prob > F = 0.0000
 F(7, 518) = 58.37
 Source SS df MS Number of obs = 526
. reg log_salario educ exper tenure expersq tenuresq mujer mujereduc
	
   18	
  
. 
 Prob > F = 0.6703
 F( 1, 518) = 0.18
 ( 1) mujereduc = 0
. test mujereduc
 Prob > F = 0.0000
 F( 1, 518) = 68.38
 ( 1) mujer = 0
. test mujer
 
 
 
 
 
 
 
 
 
 
 
En términos globales mujer es significativo por ende se rechaza que Beta(mujer)=0. Por otro lado si 
vemos mujereduc, no se rechaza que Beta(mujereduc)=0, es decir, no es significativo en este caso. 
Podemos concluir que mujer en el caso anterior aportaba -22,67886% siendo no significativa. Y en 
este caso la variable mujer aporta -29,6345% de forma significativa. 
 
N) A raíz de los resultados anteriores decide eliminar la interacción entre mujer y educ pero ahora 
pretender explorar la existencia de un “premio a los casados”. Para ello, vuelva a considerar la 
regresión estimada en la parte (j) pero incorporando a la variable binaria casado. ¿Cómo se 
interpreta su coeficiente? ¿Hay evidencia en favor de un “premio a los casados”? 
!Regresión del log_salario sobre educ, exper, tenure, expersq, tenuresq, mujer y casado: 
 
 
 
 
 _cons 1.591424 .0988662 16.10 0.000 1.397196 1.785652
 casado .0529219 .0407561 1.30 0.195 -.0271456 .1329894
 mujer -.2901838 .0361121 -8.04 0.000 -.3611279 -.2192396
 tenuresq -.0005744 .0002347 -2.45 0.015 -.0010355 -.0001134
 expersq -.0005399 .0001122 -4.81 0.000 -.0007603 -.0003196
 tenure .0312962 .0068482 4.57 0.000 .0178426 .0447499
 exper .0269535 .0053258 5.06 0.000 .0164907 .0374163
 educ .0791547 .0068003 11.64 0.000 .0657951 .0925143
 
 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 148.329743 525 .282532843 Root MSE = .39952
 Adj R-squared = 0.4351
 Residual 82.6815138 518 .159616822 R-squared = 0.4426
 Model 65.6482288 7 9.37831841 Prob > F = 0.0000
 F(7, 518) = 58.76
 Source SS df MS Number of obs = 526
. reg log_salario educ exper tenure expersq tenuresq mujer casado
	
   19	
  
 
 _cons 1.495019 .100009 14.95 0.000 1.298545 1.691492
mujerXsoltero -.1103502 .0557421 -1.98 0.048 -.219859 -.0008414
 mujerXcasado -.1982676 .0578355 -3.43 0.001 -.311889 -.0846462
hombreXcasado .2126757 .0553572 3.84 0.000 .103923 .3214283
 tenuresq -.0005331 .0002312 -2.31 0.022 -.0009874 -.0000789
 tenure .0290875 .006762 4.30 0.000 .0158031 .0423719
 expersq -.0005352 .0001104 -4.85 0.000 -.0007522 -.0003183
 exper .0268006 .0052428 5.11 0.000 .0165007 .0371005
 educ .0789103 .0066945 11.79 0.000 .0657585 .092062
 
 log_salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 148.329743 525 .282532843 Root MSE = .39329
 Adj R-squared = 0.4525
 Residual 79.9679841 517 .154676952 R-squared = 0.4609
 Model 68.3617586 8 8.54521982 Prob > F = 0.0000
 F(8, 517) = 55.25
 Source SS df MS Number of obs = 526
> o
. reg log_salario educ exper expersq tenure tenuresq hombreXcasado mujerXcasado mujerXsolter
 
 
!Interpretación: 
El coeficiente de la variable explicativa casado, aporta un 52.9219% al logaritmo del salario. 
 
 
Analizándoloindividualmente, no es significativo (p-value e intervalo de confianza), por lo tanto no 
hay evidencia a favor de un premio a los casados. 
 
O) Para permitir que el “premio a los casados” varíe según el género, estime una regresión para el 
logaritmo de los salarios sobre educ, exper, expersq, tenure y tenuresq, incorporando las siguientes 
interacciones: hombreXcasado, mujerXcasado, y mujerXsoltero. Indique cuál es grupo de base o de 
referencia, y luego estime la diferencia de salarios entre (1) un hombre casado y un hombre soltero, 
y (2) entre una mujer casada y una mujer soltera. ¿Son estadísticamente significativas estas 
diferencias? 
 
! Regresión del log_salario sobre educ, exper, expersq, tenure, tenuresq, hombreXcasado, 
mujerXcasado y mujerXsoltero: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
. 
 Prob > F = 0.1947
 F( 1, 518) = 1.69
 ( 1) casado = 0
. test casado
	
   20	
  
end of do-file
. 
 Prob > F = 0.0937
 F( 1, 517) = 2.82
 ( 1) mujerXcasado - mujerXsoltero = 0
. test mujerXcasado=mujerXsoltero
 Prob > F = 0.0001
 F( 1, 517) = 14.76
 ( 1) hombreXcasado = 0
. test hombreXcasado
 
 
El grupo de referencia para ver el “premio” de estar casado, corresponde a el grupo de los solteros 
con los cuales se está comparando. 
La diferencia entre un hombre casado y hombre soltero corresponde al coeficiente de 
hombreXcasado, ya que al mantener todo lo demás constante, si analizamos un hombre soltero, 
desaparecen todas las variables explicativas de interacciones, mientras si es un hombre casado, 
existe el termino 𝛽! = 0.2126757, por lo que un hombre con todas las otras variables explicativas 
iguales si es que está casado aumenta el log_salario en 21.26757 %. Ademas, podemos observar 
que el 𝛽! es significativa por lo tanto si existe diferencia. 
La diferencia entre mujeres casadas y mujeres solteras, corresponde a la diferencia de sus 
coeficientes. Al ser mujer, la variable interacción hombreXcasado se pierde. Si mantenemos todas 
las otras variables explicativas constantes, la única diferencia en el log_salario seria el coeficiente 
de mujerXcasado y el de mujerXsoltera. Por lo que la diferencia entre ambas opciones es la 
diferencia entre sus coeficientes, es decir, 
𝛽! −  𝛽! =  −0.1982676     +  0.1103502 =  −0.0879174. Lo que significa que una mujer casada 
gana -8.79174% menos que una mujer soltera. 
 
 
 
 
 
 
 
Podemos concluir que la diferencia entre los sueldos de los hombres casados con los hombres 
solteros son significativas mientras que la diferencia entre los suelos de las mujeres casadas y las 
mujeres solteras no son significativas al 5% pero si al 10%. 
 
 
 
 
 
 
 
 
	
   21	
  
 
 
P) Verifique manualmente los cálculos de la prueba F que Stata reporta para el caso de la diferencia 
de salarios entre una mujer casada y una mujer soltera. 
Para que el log_salario entre mujeres casadas y mujeres solteras sean el mismo se requiere que se 
cumpla Ho: 𝛽! −  𝛽!= 0. 
Luego realizamos nuestro test: 𝑡 = (  !!!  !!)!!
!(!!)!  !(!!)!!!"#(!!,!!)
   
Reemplazando: 𝑡 =   !!.!"#$%&%  !    !!.!!"#$"%  !  !
!.!!""##$#!  !.!!"#!$#%!!∗  !.!!"#$$#%  )
≅ 5,8 
Sabiendo que el t anterior debe dar 2,82 pero obtenemos 5,8 no influye en la conclusión 
final porque rechazamos Ho de igual manera. 
 
 
Q) Finalmente, considere una especificación alternativa donde se reemplaza a la interacción entre 
mujer y casado por la interacción entre hombre y soltero. Compruebe que se verifican las relaciones 
entre los coeficientes de ésta y aquellos de la especificación anterior, y luego vuelva a evaluar si la 
diferencia de salarios entre mujeres casadas y solteras es estadísticamente significativa. 
 
 Prob > F = 0.0937
 F( 1, 517) = 2.82
 ( 1) mujerXcasado - mujerXsoltero = 0
. test mujerXcasado=mujerXsoltero
	
   22	
  
 Prob > F = 0.0937
 F( 1, 517) = 2.82
 ( 1) mujerXsoltero = 0
. test mujerXsoltero=0
 
 
El coeficiente de mujerXcasado del caso anterior y el de hombreXsoltero en este caso, son inversos, 
ósea que tienen la misma magnitud pero afectan en sentidos opuestos. 
Lo cual es lógico, ya que si vemos manteniendo todo constante, una mujer casada afectaba al 
log_salario en -19.82676%, lo que significa que al compararlo con la opción opuesta (hombre 
soltero), esta gana un 19.82676% menos. 
Por lo tanto cabría esperar que al cambiar la regresión, si vemos el hombre soltero, este gane un 
19.82676% más que su opuesto (mujer casada) 
Tomando en cuenta la regresion, cuando sacamos la diferencia de el log_salario de mujeres casadas 
con mujeres solteras, queda (−𝛽!). 
En este caso Ho: 𝛽! = 0 
 
 
 
 
 
 
Podemos apreciar que al 5%, el t calculado (1,68) versus el tabulado (1,96) no nos da un coeficiente 
significativo individualmente. Pero por medio del test F realizado anteriormente podemos observar 
que no lo es al 5% , pero si lo es globalmente al 10%

Continuar navegando