Logo Studenta

Guía de Ejercicios Prueba Enunciado

¡Estudia con miles de materiales!

Vista previa del material en texto

1) Imagine que desea estimar el efecto del uso de un nuevo fertilizante sobre el rendimiento 
de algún cultivo. Para ello decide realizar el siguiente experimento: elige varias parcelas 
de un terreno, en cada parcela aplica una cantidad diferente de fertilizante, y luego mide el 
rendimiento. Suponga que estos son los resultados del experimento: 
Parcela 𝑌 𝑋 
1 47 10 
2 56 20 
3 47 30 
4 52 40 
5 77 50 
6 60 60 
7 81 70 
Promedio 𝑌# =	60 𝑋# = 40 
 
donde Y es el rendimiento y X es la cantidad de fertilizante. 
a. Estime la regresión simple de Y sobre X por MCO, y luego calcule el R2. Muestre todos 
sus pasos. 
b. Compute los residuos y verifique que se cumplan las propiedades algebraicas. 
Consciente de que el fertilizante es sólo uno de varios factores que influyen sobre el 
rendimiento, decide controlar por las precipitaciones y por un índice de calidad de la tierra. 
Utilice las salidas de STATA que se presentan a continuación para responder las siguientes 
preguntas: 
 
 
 
 
 
 
 
 
c. Evalúe formalmente la hipótesis nula que 𝛽! = 0 frente a la alternativa que 𝛽! > 0. 
Considere un nivel de significancia del 5%. 
d. Reporte la estimación de MCO para 𝛽" y su error estándar. 
e. Reporte el R2 y el R2 ajustado. 
f. Finalmente, entregue una predicción para el rendimiento esperado en dos parcelas con 
las siguientes características: (1) fertilizante=50, precipitaciones=2, calidad=1; (2) 
fertilizante=5, precipitaciones=2, calidad=2. Construya además un intervalo de 
confianza bilateral al 95% para la diferencia de rendimientos esperada, y utilícelo para 
evaluar la hipótesis nula que dicha diferencia es igual a cero. Ayuda: no se pide un 
intervalo de predicción. 
 
2) Considere siguiente el modelo de regresión lineal simple: 
𝑦 = 𝛽# + 𝛽!𝑥 + 𝑢, 
con n observaciones, y donde se cumplen todos los supuestos de Gauss–Markov. 
Sea 𝛽!. un estimador del parámetro poblacional 𝛽! tal que: 
𝛽!. =
(𝑦$ − 𝑦!)
(𝑥$ − 𝑥!)
 
a. Determine si 𝛽!. es un estimador insesgado de 𝛽!, y luego resuelva para su varianza 
condicional. 
3) Imagine que desea estimar la relación empírica entre las privatizaciones de los años 80 en 
Chile (es decir, la venta de empresas estatales a privados) y el rendimiento de las empresas 
en los años 90. Para ello recoleta datos de 100 empresas que eran estatales en los años 70, 
de las cuales la mitad fueron privatizadas en los años 80 y estima la siguiente regresión: 
(1)							𝑌% = 𝛼 + 𝛽 × 𝑃% + 𝑢% , 
 
donde 𝑌% es el rendimiento promedio de la empresa i en los años 90 (medido como retorno 
sobre los activos), 𝑃% es una variable binaria que toma el valor de 1 para aquellas empresas 
que fueron privatizadas, y 𝑢% es un error con media igual a cero. 
a. ¿Cuál es el retorno promedio de las empresas privatizadas en términos de los 
parámetros del modelo (1), y qué condición debiera cumplirse para que dicho retorno 
sea superior al de las empresas no privatizadas? 
b. Usted aprende que en 1982 hubo una crisis económica y cree que a las empresas 
privatizadas después de la crisis les fue mejor que a las privatizadas antes de la crisis. 
Considere entonces el siguiente modelo: 
(2)							𝑌% = 𝜙 + 𝛾! × 𝑃%&'( + 𝛾" × 𝑃%&)*+ + 𝑢% , 
donde 𝑃%&'( y 𝑃%&)*+ son variables binarias para privatizaciones antes y después de la 
crisis, respectivamente. Se pide entonces que exprese su hipótesis en términos de los 
parámetros de este modelo, y que luego explique cómo se relaciona 𝜙 en el modelo (2) 
con 𝛼 en el modelo (1). 
c. Una colega le propone considerar una especificación alternativa: 
(3)							𝑌% = 𝜏 + 𝛿! × 𝑃% + 𝛿" × (𝑃% × 𝑇%) + 𝑢% , 
donde 𝑃% está definida como antes y 𝑇% es una variable binaria que toma el valor de 1 
para aquellas empresas que fueron privatizadas después de la crisis. En base a los 
parámetros del modelo (3), explique qué condición debiera cumplirse si a las empresas 
privatizadas después de la crisis les fue mejor que a las privatizadas antes de la crisis. 
Además, explique cómo se relaciona 𝛿! en el modelo (3) con 𝛾! en el modelo (2). 
 
 
4) Considere las siguientes estimaciones obtenidas a partir de una muestra de 82 firmas: 
 Modelo 
 (1) (2) (3) (4) (5) (6) 
V. dependiente log_Y log_Y log_Y log_Y log_Y log_Y 
log_L 0.48 0.31 0.48 0.70 0.44 0.50 
(log_L*log_L) -0.09 -0.13 
log_K 0.47 0.43 0.35 0.58 0.41 0.47 
(log_K*log_K) -0.10 -0.08 
(log_L*log_K) 0.20 
intercepto 3.29 3.16 3.29 3.38 3.62 3.71 
N 82 26 24 32 82 82 
R2 0.577 0.560 0.564 0.668 0.641 0.731 
SCR 41.166 8.818 12.301 15.560 34.933 26.204 
 
 
 
 
donde Y es el producto, L es el número de trabajadores y K es el stock de capital. 
a. El modelo (5) incorpora a los cuadrados de las variables explicativas. Evalúe la 
significancia conjunta de estas variables al 5% e interprete el resultado de dicho 
contraste. 
b. El modelo (6) incorpora la interacción entre log_L y log_K. Evalúe la hipótesis nula 
que el coeficiente que acompaña a dicha interacción es igual a 0 frente a la alternativa 
que es mayor a 0, y luego interprete el resultado de dicho contraste. Considere un nivel 
de significancia del 1%. Ayuda: piense en la relación que existe entre los estadísticos t 
y F. 
 
5) Usted cuenta con los siguientes datos para 124 países, 30 días después de haber superado 
los 100 casos de contagio por COVID-19: 
- muertes: número de fallecidos totales por país. 
- casos: número de contagios totales por país. 
- camas: número de camas disponibles en hospitales cada mil habitantes. 
- mayores_65: fracción de la población del país mayor de 65 años, medida en puntos 
porcentuales (por ejemplo, en Chile es igual a 11.1). 
- mayores_70: fracción de la población del país mayor de 70 años, medida en puntos 
porcentuales (por ejemplo, en Chile es igual a 9.7). 
En base a las salidas de Stata que se presentan a continuación, se pide que responda a las 
siguientes preguntas: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
a. En base al modelo (1), interprete los coeficientes que acompañan a las variables 
explicativas, y luego evalúe su significancia conjunta al 95%. 
b. Un colega le comenta que el modelo (2) es una versión restringida del modelo (1). En 
caso de serlo, identifique la restricción y luego evalúela al 5%. En caso contrario, 
explique por qué su colega estaría equivocado. 
c. Finalmente, el modelo (3) incorpora la variable mayores_65. ¿Diría usted, en base a 
estos resultados, que la fracción de adultos mayores no es un determinante significativo 
de la cantidad de fallecidos en cada país? Explique qué problema visualiza en esta 
estimación, y luego discuta cómo podría verificar su conjetura. 
 
6) Usted está interesado en estudiar cómo ha cambiado la relación entre la tasa de defunción 
y la pobreza en Chile con la llegada del COVID-19. Para esto considera el siguiente 
modelo: 
𝑑𝑒𝑓𝑢𝑛𝑐𝑖ó𝑛% = 𝛽# + 𝛽! × 𝑝𝑜𝑏𝑟𝑒𝑧𝑎% + 𝛽" ×𝑚𝑎𝑦𝑜𝑟𝑒𝑠% + 𝑢% , 
donde 𝑑𝑒𝑓𝑢𝑛𝑐𝑖ó𝑛% es la tasa de defunción en la comuna 𝑖, 𝑝𝑜𝑏𝑟𝑒𝑧𝑎% es la fracción de la 
población de la comuna 𝑖 en situación de pobreza, y 𝑚𝑎𝑦𝑜𝑟𝑒𝑠% es la fracción de adultos 
mayores en la comuna 𝑖. 
En la muestra están las 89 comunas más grandes de Chile según su población, de las cuales 
41 pertenecen a la Región Metropolitana. Usted considera la tasa de defunción por comuna 
en los meses de mayo y junio de 2020 pero también, para efectos de comparación, obtiene 
los datos para el mismo período en 2019. 
Los resultados de la estimación para distintas muestras son los siguientes: 
 Todas las comunas 
Comunas Región 
Metropolitana 
Otras comunas 
2019 y 2020 
SCR 
R2 
116.85 
0.185 
SCR 
R2 
101.63 
0.175 
SCR 
R2 
13.51 
0.289 
Sólo 2019 
SCR 
R2 
19.47 
0.284 
SCR 
R2 
11.03 
0.311 
SCR 
R2 
6.64 
0.332 
Sólo 2020 
SCR 
R2 
86.91 
0.194 
SCR 
R2 
74.01 
0.197 
SCR 
R2 
6.76 
0.247 
 
a. Considereel siguiente modelo: 
𝑑𝑒𝑓𝑢𝑛𝑐𝑖ó𝑛% = 𝛽# + 𝛽! × 𝑝𝑜𝑏𝑟𝑒𝑧𝑎% + 𝛽" ×𝑚𝑎𝑦𝑜𝑟𝑒𝑠% + 𝛽, × 𝑅𝑀%
+ 𝛽- × (𝑝𝑜𝑏𝑟𝑒𝑧𝑎% × 𝑅𝑀%) + 𝛽. × (𝑚𝑎𝑦𝑜𝑟𝑒𝑠% × 𝑅𝑀%) + 𝑢% , 
donde 𝑅𝑀% es una variable binaria que toma el valor de 1 si la comuna pertenece a la 
Región Metropolitana. En base a la información disponible, calcule la SCR, la SCT y 
el R2 para la muestra con las 89 comunas en 2019. 
b. En base al modelo de la pregunta anterior, y considerando un nivel de significancia de 
5%, evalúe la hipótesis nula que 𝛽, = 𝛽- = 𝛽. = 0. 
c. (5 puntos) Finalmente, evalúe formalmente si el COVID-19 ha cambiado la relación 
entre la tasa de defunción, la pobreza y la fracción de adultos mayores en la Región 
Metropolitana. 
 
7) Sea 𝒚 = 𝑿𝜷 + 𝒖 el modelo de regresión lineal múltiple con 𝑘 > 1 variables explicativas, 
y sea 𝑴 = [𝑰 − 𝑿(𝑿/𝑿)0𝟏𝑿′] una matriz simétrica e idempotente. 
a. Muestre que los residuos de MCO se pueden escribir como 𝒖X = 𝑴𝒖. 
b. Muestre que la SCR se puede escribir como 𝒖X/𝒖X = 𝒚/𝒚 − 𝒚′𝑿𝜷Y. 
8) Imagine que desea estimar el efecto del tamaño de la sala sobre el desempeño académico. 
Para ello decide distribuir a los alumnos de manera aleatoria en clases de tamaño regular y 
clases de tamaño pequeño, y registrar los puntajes obtenidos al final del semestre en una 
prueba de lenguaje y matemáticas. 
Sean score el puntaje obtenido en la prueba y small una variable binaria que toma el valor 
de 1 si el estudiante fue asignado a una clase pequeña y es 0 en caso contrario. Se pide que: 
a. Sabiendo que el puntaje promedio en las salas de tamaño regular es igual a 918.3 y que 
en las salas pequeñas es igual a 932.5, estime la regresión simple de score sobre small 
y luego interprete los coeficientes. Justifique su respuesta. 
b. Preocupado de que profesores más experimentados puedan contribuir a un mayor 
aprendizaje que luego se traduzca en puntajes más altos, decide incorporar a la variable 
tch_exper que corresponde a los años de experiencia del profesor: 
 
 
 
Evalúe la significancia individual de tch_exper, y luego evalúe la hipótesis nula que el 
efecto de una sala pequeña es equivalente al de un profesor con 12 años de experiencia. 
Considere un nivel de significancia de 1%. 
 
c. Ahora decide incorporar 3 variables de control binarias: beca (que toma el valor de 1 
si el alumno está becado), rural (que toma el valor de 1 si la escuela está ubicada en 
una zona rural) y eng_lrn (que toma el valor de 1 si el inglés no es la lengua materna 
del alumno): 
 
 
 
Evalúe la significancia conjunta de estos controles al 5%, y luego calcule el R2 ajustado 
de este modelo. 
d. ¿Cómo se explica la disminución en el error estándar del coeficiente que acompaña a 
small respecto del que fuera reportado en la parte b)? ¡Sea preciso!

Continuar navegando

Materiales relacionados

6 pag.
8 pag.
Pba 1 2021 - I

User badge image

Central de Apuntes

58 pag.
73 pag.
1502-1619-TellaArduinoFG

UBAM

User badge image

Contenidos Muy Locos