Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Ayudant́ıa 6 - Econometŕıa I (EAE-250A) 1er Semestre 2020 1. Considere la siguiente regresión para los puntajes de la prueba de admisión: csat = 1028, 1 (6, 29) + 19, 30 (3, 83) hsize� 2, 19 (0, 53) hsize2 � 45, 09 (4, 29) female� 169, 81 (12, 71) black + 62, 31 (18, 15) black · female con n = 4137, R2 = 0, 08 donde hsize es la cantidad de alumnos por curso y female y black son dum- mies de género y raza, respectivamente. Determine las diferencias promedio entre: (i) black females y non-black females, (ii) non-black females y non- black males, (iii) non-black males y black males, y (iv) black females y black males. Cuando sea posible, determine si la diferencia es significativa al 5%. 2. Usted busca estudiar los determinantes del salario para distintos grupos de personas extendiendo el siguiente modelo estándar: lwage = �0 + �1educ+ �2exper + �3exper 2 + u donde lwage es log salario, educ los años de educación y exper los años de experiencia. Además cuenta con las variables dummies female y married. Su estudio busca determinar si la ecuación de salarios es la misma para mujeres solteras que para hombres. (a) Utilizando como categoŕıa base a los hombres, construya un modelo usando las variables dummies pertinentes y plantee la hipótesis nula correspondiente. (b) Considerando la regresión para toda la muestra cuyos resultados están en la primera tabla abajo, interprete el coeficiente �1 = .0903658. De- termine cómo cambia este coeficiente si el salario se mide en USD al año en vez de miles de USD al año. (c) Utilizando las regresiones que aparecen abajo, verifique la hipótesis nula correspondiente con un nivel de significancia de ↵ = 5%. Deter- mine la distribución exacta del estad́ıstico que utilizará para verificar la hipótesis nula. {Ayuda: En STATA el caracter “&” significa “y”, mientras que “|” significa “o”.} (d) Discuta si con la información disponible es posible comparar el coefi- ciente que acompaña a educ para ambos grupos de interés. Plantee la hipótesis nula correspondiente, y de ser posible, realice el test con un nivel de significancia de ↵ = 5%. . regress lwage educ exper expersq Source | SS df MS Number of obs = 526 -------------+------------------------------ F( 3, 522) = 74.67 Model | 44.5393702 3 14.8464567 Prob > F = 0.0000 Residual | 103.790392 522 .198832168 R-squared = 0.3003 -------------+------------------------------ Adj R-squared = 0.2963 Total | 148.329762 525 .28253288 Root MSE = .44591 ______________________________________________________________________________ lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- educ | .0903658 .007468 12.10 0.000 .0756948 .1050368 exper | .0410089 .0051965 7.89 0.000 .0308002 .0512175 expersq | -.0007136 .0001158 -6.16 0.000 -.000941 -.0004861 _cons | .1279975 .1059323 1.21 0.227 -.0801085 .3361034 ------------------------------------------------------------------------------ . regress lwage educ exper expersq if female == 0 Source | SS df MS Number of obs = 274 -------------+------------------------------ F( 3, 270) = 58.41 Model | 30.7328403 3 10.2442801 Prob > F = 0.0000 Residual | 47.35131 270 .175375222 R-squared = 0.3936 -------------+------------------------------ Adj R-squared = 0.3868 Total | 78.0841503 273 .286022529 Root MSE = .41878 ______________________________________________________________________________ lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- educ | .090354 .0092666 9.75 0.000 .07211 .108598 exper | .0540175 .0067426 8.01 0.000 .0407427 .0672923 expersq | -.0009138 .0001503 -6.08 0.000 -.0012098 -.0006179 _cons | .157291 .1364033 1.15 0.250 -.1112584 .4258403 ------------------------------------------------------------------------------ . regress lwage educ exper expersq if female == 1 Source | SS df MS Number of obs = 252 -------------+------------------------------ F( 3, 248) = 24.01 Model | 11.1496801 3 3.71656003 Prob > F = 0.0000 Residual | 38.3839317 248 .154773918 R-squared = 0.2251 -------------+------------------------------ Adj R-squared = 0.2157 Total | 49.5336118 251 .197345067 Root MSE = .39341 ______________________________________________________________________________ lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- educ | .0791949 .0103688 7.64 0.000 .0587728 .0996169 exper | .0223715 .0066642 3.36 0.001 .0092459 .0354971 expersq | -.0004231 .0001483 -2.85 0.005 -.0007151 -.0001311 _cons | .2660838 .1415351 1.88 0.061 -.0126803 .5448478 ------------------------------------------------------------------------------ . regress lwage educ exper expersq if female == 1 & married ==0 Source | SS df MS Number of obs = 120 -------------+------------------------------ F( 3, 116) = 17.27 Model | 9.37057617 3 3.12352539 Prob > F = 0.0000 Residual | 20.9774994 116 .180840512 R-squared = 0.3088 -------------+------------------------------ Adj R-squared = 0.2909 Total | 30.3480756 119 .255025845 Root MSE = .42525 ______________________________________________________________________________ lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- educ | .0963164 .0153466 6.28 0.000 .0659205 .1267124 exper | .034916 .0102048 3.42 0.001 .0147042 .0551278 expersq | -.0006439 .0002352 -2.74 0.007 -.0011097 -.0001781 _cons | -.0001836 .2029483 -0.00 0.999 -.4021484 .4017812 ------------------------------------------------------------------------------ Ayudant́ıa 6 - Econometŕıa I (EAE-250A) 1er Semestre 2020 . regress lwage educ exper expersq if female == 1 & married ==1 Source | SS df MS Number of obs = 132 -------------+------------------------------ F( 3, 128) = 7.34 Model | 2.78969241 3 .929897469 Prob > F = 0.0001 Residual | 16.2265467 128 .126769896 R-squared = 0.1467 -------------+------------------------------ Adj R-squared = 0.1267 Total | 19.0162391 131 .145162131 Root MSE = .35605 ______________________________________________________________________________ lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- educ | .0603231 .013913 4.34 0.000 .0327939 .0878523 exper | .0075495 .0104801 0.72 0.473 -.0131871 .0282861 expersq | -.0001666 .0002146 -0.78 0.439 -.0005913 .000258 _cons | .6324105 .2112402 2.99 0.003 .2144356 1.050385 ------------------------------------------------------------------------------ . regress lwage educ exper expersq if ( female == 1 & married ==0) | ( female == 0) Source | SS df MS Number of obs = 394 -------------+------------------------------ F( 3, 390) = 86.11 Model | 49.1939514 3 16.3979838 Prob > F = 0.0000 Residual | 74.2693585 390 .190434253 R-squared = 0.3984 -------------+------------------------------ Adj R-squared = 0.3938 Total | 123.46331 393 .314156005 Root MSE = .43639 ______________________________________________________________________________ lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- educ | .0963834 .0081194 11.87 0.000 .0804202 .1123466 exper | .0533155 .0056959 9.36 0.000 .0421169 .064514 expersq | -.0009117 .0001295 -7.04 0.000 -.0011663 -.0006571 _cons | .0211855 .1139129 0.19 0.853 -.2027748 .2451458 ------------------------------------------------------------------------------ 3. Usted está interesado en entender el efecto de la edad en el salario y cuenta con los siguientes datos: Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- ahe | 7986 16.77115 8.758696 2.097902 61.05769 bachelor | 7986 .4557976 .4980735 0 1 female | 7986 .414851 .4927272 0 1 age | 7986 29.754452.891125 25 34 donde ahe es el sueldo promedio por hora medido en dólares, bachelor = 1 si el individuo tienen algún grado universitario ó 0 en caso contrario, female = 1 si es mujer ó 0 si es hombre y age es la edad de la persona medida en años. Usted genera las siguientes variables en Stata: generate agesq = age*age generate bachage=bachelor*age generate bachfem=bachelor*female generate bachfemage = bachelor*female*age y corre los modelos que se muestran en las Tablas 1 a 4. (a) Interprete en el contexto del estudio, el coeficiente que acompaña a la variable bachage en la Tabla 3. De la misma forma, interprete el coeficiente que acompaña a bachage en la Tabla 4. (b) Interprete el coeficiente que acompaña a bachfemage en la Tabla 4. (c) De acuerdo a la estimación de la Tabla 4, ¿cuánto aumenta el salario con la edad para las mujeres con bachelor? ¿y para los hombres con bachelor? Use como caso base el grupo de hombres sin bachelor. (d) Responda usando la estimación de la Tabla 4: i. Plantee un test de hipótesis que permita verificar si el salario de una mujer de 30 con bachelor es similar al de un hombre de 25 sin bachelor. ii. ¿Cuál es la edad que maximiza el salario esperado para las mujeres con bachelor? (e) Verifique si la regresión . regress ahe female age es la misma para el grupo con bachelor que para aquel sin bachelor. Use ↵ = 5%. (f) Suponga que se rechaza la hipótesis nula anterior. Verifique si esta significancia estad́ıstica viene dada sólo por la variable bachelor y no por la interacción de esta con las otras variables. Use ↵ = 5%. Tabla 1: . regress ahe female age Source | SS df MS Number of obs = 7986 -------------+------------------------------ F( 2, 7983) = 164.89 Model | 24300.9748 2 12150.4874 Prob > F = 0.0000 Residual | 588266.294 7983 73.6898777 R-squared = 0.0397 -------------+------------------------------ Adj R-squared = 0.0394 Total | 612567.269 7985 76.7147487 Root MSE = 8.5843 ------------------------------------------------------------------------------ ahe | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- female | -2.346755 .1950323 -12.03 0.000 -2.729069 -1.964441 age | .4415421 .0332389 13.28 0.000 .3763852 .5066989 _cons | 4.606864 .9990293 4.61 0.000 2.648505 6.565222 ------------------------------------------------------------------------------ Tabla 2: . regress ahe female age bachelor Source | SS df MS Number of obs = 7986 -------------+------------------------------ F( 3, 7982) = 624.10 Model | 116386.54 3 38795.5133 Prob > F = 0.0000 Residual | 496180.729 7982 62.1624566 R-squared = 0.1900 -------------+------------------------------ Adj R-squared = 0.1897 Total | 612567.269 7985 76.7147487 Root MSE = 7.8843 ------------------------------------------------------------------------------ ahe | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- female | -3.157864 .1803647 -17.51 0.000 -3.511426 -2.804302 age | .4392042 .0305286 14.39 0.000 .3793601 .4990482 bachelor | 6.86515 .1783686 38.49 0.000 6.515501 7.214799 _cons | 1.883798 .9202918 2.05 0.041 .0797852 3.68781 ------------------------------------------------------------------------------ Ayudant́ıa 6 - Econometŕıa I (EAE-250A) 1er Semestre 2020 Tabla 3: . regress ahe female age bachelor bachfem bachage Source | SS df MS Number of obs = 7986 -------------+------------------------------ F( 5, 7980) = 384.09 Model | 118824.515 5 23764.903 Prob > F = 0.0000 Residual | 493742.754 7980 61.8725255 R-squared = 0.1940 -------------+------------------------------ Adj R-squared = 0.1935 Total | 612567.269 7985 76.7147487 Root MSE = 7.8659 ------------------------------------------------------------------------------ ahe | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- female | -2.99546 .2483005 -12.06 0.000 -3.482194 -2.508726 age | .2654295 .0412178 6.44 0.000 .1846319 .3462272 bachelor | -4.387114 1.843788 -2.38 0.017 -8.001419 -.7728083 bachfem | -.2252154 .3608364 -0.62 0.533 -.932549 .4821182 bachage | .3811631 .0612607 6.22 0.000 .2610761 .5012501 _cons | 6.996035 1.233851 5.67 0.000 4.577364 9.414705 ------------------------------------------------------------------------------ Tabla 4: . regress ahe female age bachelor bachfem bachage bachfemage agesq Source | SS df MS Number of obs = 7986 -------------+------------------------------ F( 7, 7978) = 279.05 Model | 120483.19 7 17211.8842 Prob > F = 0.0000 Residual | 492084.079 7978 61.6801302 R-squared = 0.1967 -------------+------------------------------ Adj R-squared = 0.1960 Total | 612567.269 7985 76.7147487 Root MSE = 7.8537 ------------------------------------------------------------------------------ ahe | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- female | -2.981631 .2479745 -12.02 0.000 -3.467726 -2.495536 age | 2.070624 .7151026 2.90 0.004 .6688355 3.472412 bachelor | -10.54115 2.267109 -4.65 0.000 -14.98528 -6.097029 bachfem | 12.30599 2.719338 4.53 0.000 6.975372 17.6366 bachage | .586535 .075437 7.78 0.000 .4386588 .7344112 bachfemage | -.4217016 .0906514 -4.65 0.000 -.599402 -.2440012 agesq | -.0304873 .0120571 -2.53 0.011 -.0541223 -.0068522 _cons | -19.47472 10.54088 -1.85 0.065 -40.1376 1.188161 ------------------------------------------------------------------------------ 4. Una empresa pequeña desea verificar la presencia de un cambio en la evolución de sus ventas entre dos subpeŕıodos de tiempo consecutivos. La regresión de largo plazo vincula las ventas reales con el PIB, el precio relevante del bien en estudio y una constante. La muestra completa considera 276 obser- vaciones mensuales y se dispone de la siguiente información sobre la suma de cuadrados de los residuos (SSR) de las regresiones: Peŕıodo completo 1er Subpeŕıodo 2do Subpeŕıodo SSR 3.92 0.39 0.25 Tamaño de la muestra 276 192 84 Responda las siguientes preguntas: (a) Realice el test de Chow para la hipótesis de que el vector de coeficientes es el mismo en los dos subpeŕıodos. ¿Qué está suponiendo al realizar este test? ¿Cómo explica que la suma de cuadrados del peŕıodo total sea tan distinta del promedio de las individuales? (b) Usted cree que el cambio en los coeficientes detectado está ocultando un problema en la forma funcional: al agregar el segundo peŕıodo de datos a la muestra los datos sugieren que existe no linealidad en las ventas respecto al precio. Esto puede verse en los siguientes gráficos que ilustran la relación entre las ventas de la empresa y el precio para el primer peŕıodo (Gráfico 1) y para la muestra completa (Gráfico 2). Indique una estrategia de estimación de la regresión que considere esta situación de no linealidad. 3 PREGUNTA II (40 puntos) Una empresa desea verificar la presencia de cambio estructural en la evolución de sus ventas. La regresión de largo plazo vincula el logaritmo de las ventas reales con el logaritmo del PIB, el precio relevante del bien en estudio y una constante. Se han incluido 276 periodos y se dispone de la siguiente información sobre la suma de cuadrados de los residuos (SCR) Período Período completo Primer período Segundo Período SCR 3.92 0.39 0.25 Tamaño de la muestra 276 192 84 a) (7 puntos) Realice el test de Chow para la hipótesis de que el vector de coeficientes es el mismo en los dos subperíodos. ¿Qué está suponiendo al realizar este test? ¿Cómo explica que la suma de cuadrados del período total sea tan distinta del promedio de las individuales? b) (7 puntos) El analista a cargo no puede descartar la presencia de heterocedasticidad en su muestra, ¿afectará esto sus resultados anteriores? Proponga un test que le permita chequear la presencia de cambio estructuralen estas circunstancias. c) (6 puntos) Un colega cree que los problemas estadísticos de su regresión total se soluciona agregando una variable dummy que recoja el efecto del comienzo de las campañas publicitarias de la empresa. ¿Qué efecto recogerá el coeficiente de esta variable dummy? Indique qué problemas puede tener la solución del colega en términos de especificación del modelo. Sugiera soluciones alternativas. d) (5 puntos) Otro colega cree que el resultado obtenido en el punto a) es consecuencia de datos anómalos (outliers) y le sugiere eliminar el efecto de cuatro observaciones raras en la muestra, si es que el R2 de la regresión sin estos datos es mayor que el R2 de la regresión completa. Comente sobre la solución del colega, indicando las críticas a dicho procedimiento. e) (7 puntos) Usted cree que el cambio estructural detectado está ocultando un problema en la forma funcional: al agregar el segundo período de datos a la muestra los datos sugieren que existe no linealidad en las ventas respecto al precio. Esto puede verse en los gráficos que se anexan, que ilustran la relación entre las ventas de la empresa y el precio para el primer período (Gráfico 1) y para la muestra completa (Gráfico 2). Indique una estrategia de estimación de la regresión que considere esta situación de no linealidad. 0 1 2 3 4 5 0 10 20 30 40 50 60 70 80 Ventas Ta sa d e In te ré s P r e c i o Gráfico 2 0 1 2 3 4 5 5 10 15 20 25 30 35 40 Ventas Ta sa d e In te ré s P r e c i o Gráfico 1 3 PREGUNTA II (40 puntos) Una empresa desea verificar la presencia de cambio estructural en la evolución de sus ventas. La regresión de largo plazo vincula el logaritmo de las ventas reales con el logaritmo del PIB, el precio relevante del bien en estudio y una constante. Se han incluido 276 periodos y se dispone de la siguiente información sobre la suma de cuadrados de los residuos (SCR) Período Período completo Primer período Segundo Período SCR 3.92 0.39 0.25 Tamaño de la muestra 276 192 84 a) (7 puntos) Realice el test de Chow para la hipótesis de que el vector de coeficientes es el mismo en los dos subperíodos. ¿Qué está suponiendo al realizar este test? ¿Cómo explica que la suma de cuadrados del período total sea tan distinta del promedio de las individuales? b) (7 puntos) El analista a cargo no puede descartar la presencia de heterocedasticidad en su muestra, ¿afectará esto sus resultados anteriores? Proponga un test que le permita chequear la presencia de cambio estructural en estas circunstancias. c) (6 puntos) Un colega cree que los problemas estadísticos de su regresión total se soluciona agregando una variable dummy que recoja el efecto del comienzo de las campañas publicitarias de la empresa. ¿Qué efecto recogerá el coeficiente de esta variable dummy? Indique qué problemas puede tener la solución del colega en términos de especificación del modelo. Sugiera soluciones alternativas. d) (5 puntos) Otro colega cree que el resultado obtenido en el punto a) es consecuencia de datos anómalos (outliers) y le sugiere eliminar el efecto de cuatro observaciones raras en la muestra, si es que el R2 de la regresión sin estos datos es mayor que el R2 de la regresión completa. Comente sobre la solución del colega, indicando las críticas a dicho procedimiento. e) (7 puntos) Usted cree que el cambio estructural detectado está ocultando un problema en la forma funcional: al agregar el segundo período de datos a la muestra los datos sugieren que existe no linealidad en las ventas respecto al precio. Esto puede verse en los gráficos que se anexan, que ilustran la relación entre las ventas de la empresa y el precio para el primer período (Gráfico 1) y para la muestra completa (Gráfico 2). Indique una estrategia de estimación de la regresión que considere esta situación de no linealidad. 0 1 2 3 4 5 0 10 20 30 40 50 60 70 80 Ventas Ta sa d e In te ré s P r e c i o Gráfico 2 0 1 2 3 4 5 5 10 15 20 25 30 35 40 Ventas Ta sa d e In te ré s P r e c i o Gráfico 1 (c) Dada la evidencia anterior: ¿cuál de las siguientes especificaciones es- cogeŕıa? i. Eliminar una parte de la muestra. ii. Escoger una forma funcional que capture la no linealidad. iii. Utilizar variables dummies que recojan los cambios. Justifique, realizando un análisis de costo-beneficio de cada solución. PREGUNTA 1 1 ASÍ femen y black D fem y black ASÍ f 45,09 169,81 62,31 45,09 Loti5 No podemos hacer testde significancia 2 Ask femsa black so tenso black 0 ASÍ f 45,09 las 45,09 Ho Bien O f 15109 O 6,51Hr Bren 0 4,29 f 1 4137 g t 997J 1,96 1131 Se rechaza Ai PREGUNTA 3 a
Compartir