Logo Studenta

Tarea 1

¡Este material tiene más páginas!

Vista previa del material en texto

PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE
FACULTAD DE CIENCIAS ECONÓMICAS Y ADMINISTRATIVAS
ESCUELA DE ECONOMÍA
ECONOMETRÍA EAE250A | 2016-01
TAREA N°1
TRABAJO GRUPAL EN GRETL
29.04.2016
Javier Castelló | Ignacio González | Joaquín Metzner
1. Ejercicio C3.1
Un problema de interés para los funcionarios de salud (y para otros) es determinar los efectos que el fumar durante el embarazo tiene sobre la salud infantil. Una medida de la salud infantil es el peso al nacer; un peso demasiado bajo puede ubicar al niño en riesgo de contraer varias enfermedades. Ya que es probable que otros factores que afectan el peso al nacer estén correlacionados con fumar, deben considerarse. Por ejemplo, un nivel de ingresos más alto en general da como resultado el acceso a mejores cuidados prenatales y a una mejor nutrición de la madre. Una ecuación que reconoce estos factores es
i) ¿Cuál es el signo más probable para β2?
Según el enunciado, un nivel de ingresos más alto en general, da como resultado el acceso a mejores cuidados prenatales y a una mejor nutrición de la madre, lo que haría que al aumentar el ingreso familiar (faminc), el peso del recién nacido (bwght) debiese aumentar, lo que se refleja en un β2 positivo. Esto está respaldado por la siguiente tabla de datos obtenida en Gretl.
ii) ¿Cree que cigs y faminc estén correlacionados? Explique por qué la correlación puede ser positiva o negativa.
Nosotros creemos que cigs y faminc están correlacionados negativamente. Esto podría deberse a diversas razones, como por ejemplo que una familia con mayores ingresos puede tener menos preocupaciones económicas, por lo cual priorizaría más la salud del bebé. Mientras que una familia de bajo nivel de ingreso, podría tener muchas preocupaciones debido a la escasez de dinero, por lo que no se preocuparía tanto por la salud del bebé. Además, faminc está correlacionado positivamente con la educación, la que a su vez está correlacionada negativamente con cigs, por lo que si aumenta faminc, disminuye cigs. Esto está respaldado por la siguiente tabla de datos obtenida en Gretl.
iii) Ahora, calcule la ecuación con y sin faminc utilizando los datos del archivo BWGHT.RAW. Dé los resultados en forma de ecuación incluyendo el tamaño de la muestra y la R-cuadrada. Explique sus resultados enfocándose en si el añadir faminc modifica de manera sustancial el efecto esperado de cigs sobre bwght.
Ecuación 1:	 
Tamaño muestral: 1388	R-cuadrada: 0.029805
Ecuación 2:	 
Tamaño muestral: 1388	R-cuadrada: 0.022729
Los datos de la ecuación 1 se obtienen de la tabla del ejercicio i). Los datos de la ecuación 2 se obtienen de la siguiente tabla.
Si se saca del modelo la variable faminc, el coeficiente que acompaña a cigs, debería disminuir, ya que absorbe parte de lo explicado por la variable faminc y estas dos variables están correlacionadas negativamente. 
2. Ejercicio C3.4
Variable atndrte: mide el porcentaje de clases asistidas por el alumno.
Variable priGPA: promedio de notas acumulado de high school.
Variable ACT: puntaje de American College Testing (evaluación de admisión a la universidad)
Intervalo de confianza al 95%:
i) Obtenga los valores mínimo, máximo y promedio para las variables atndrte, priGPA, y ACT.
Para la variable atndrte podemos observar que los valores mínimo, máximo y promedio son 6.25, 100 y 81.71 respectivamente.
Para la variable priGPA podemos observar que los valores mínimo, máximo y promedio son 0.857, 3.93 y 2.5868 respectivamente.
Para la variable ACT podemos observar que los valores mínimo, máximo y promedio son 13, 32 y 22.51 respectivamente.
ii) Estime el modelo , y escriba los resultados en forma de ecuación. Interprete el intercepto. ¿Tiene un significado útil?
El intercepto nos dice que una persona que tiene un priGPA y un ACT igual a 0, va a asistir a un 75.7% de las clases. Este intercepto es útil, ya que nos da una aproximación de cuanto asiste un alumno con mal rendimiento. Pero no es tan realista porque el 0 no está incluido en el priGPA ni en el ACT. Los resultados los obtuvimos de la siguiente tabla mediante Gretl.
iii) Analice los coeficientes de pendiente estimados. ¿Hay alguna sorpresa?
El coeficiente que acompaña a priGPA es 17.2606, lo que significa que ante un aumento de un punto en priGPA, aumenta el porcentaje de asistencia en un 17.2606%. 
El coeficiente que acompaña a ACT es -1.71655, lo que significa que ante un aumento de un punto en ACT, disminuye el porcentaje de asistencia en un 1.71655%.
La sorpresa está en el coeficiente que acompaña a ACT, ya que la intuición nos dice que un alumno que tiene mejor ACT debería tener un mayor porcentaje de asistencia a clases. Esto porque como le va mejor, aprovecha más las horas de clases. Sin embargo en el modelo esto no se cumple.
iv) ¿Cuál es el atndrte si priGPA = 3.65 y ACT = 20? ¿Qué piensa de este resultado? ¿Hay alumnos en la muestra con estos valores de las variables explicativas?
Esto representa que al tener un priGPA de 3.65 y un ACT de 20, se tendrá un porcentaje de asistencia de 104.37%, lo que no es factible ya que el máximo es 100%. Esto se explica debido al error. El alumno 569 cumple con estas características. Este alumno tiene un atndrte de 87.5, por lo que el error estimado de este alumno es 16.87059.
v) Si el alumno A tiene priGPA = 3.1 y ACT = 21 y el alumno B tiene priGPA = 2.1 y ACT = 26, ¿cuál es la diferencia predicha en sus tasas de asistencia?
Alumno A: 
Alumno B: 
La diferencia predicha en sus tasas de asistencia es de 25.84335
3. Ejercicio C3.6
Resuelva el problema C3.6 para entender el efecto de omitir variables relevantes. Adicionalmente, compare la varianza de los estimadores y , y discuta si se cumple el Teorema de Gauss-Markov para .
i) Corra una regresión simple de IQ sobre educ para obtener el coeficiente de pendiente, por ejemplo .
El coeficiente de pendiente es 3.53383
ii) Corra la regresión simple de log(wage) sobre educ y obtenga el coeficiente de pendiente .
El coeficiente de pendiente es 0.0598392
iv) Corra la regresión múltiple de log(wage) sobre educ e IQ y obtenga los coeficientes de pendiente, y , respectivamente.
El coeficiente de pendiente es 0.0391199 y es 0.00586313
v) Verifique que .
Reemplazamos los valores encontrados en las preguntas anteriores y nos da que:
vi) Pregunta enunciado: compare la varianza de los estimadores y , y discuta si se cumple el Teorema de Gauss-Markov para .
Como proviene de un modelo subestimado, según los supuestos de Gauss-Markov, va a tener una menor varianza que , pero va a ser sesgado. La varianza de es 4,6761110-5, que es mayor a la varianza de , que es 3,5558510-5.
El sesgo de es lo que hace que su esperanza sea diferente a , es decir, . Como este sesgo es distinto de cero, es sesgado.
4. Ejercicio C6.2
Para este ejercicio emplee los datos del archivo WAGE1.RAW
i) Use MCO para estimar la ecuación
ii) ¿Es exper2 estadísticamente significativa al nivel de 1%?
Si es significativo, ya que su p-value es , el cual es menor a 1%, lo que nos dice que es estadísticamente significativa al nivel de 1%.
iii) Empleando la aproximación
Determine el rendimiento aproximado que tiene el quinto año de experiencia. ¿Cuál es el rendimiento aproximado del vigésimo año de experiencia?
Usando y . Al quinto año de experiencia, el cambio porcentual del salario producido por un año más de experiencia es de 3.387332%. Al vigésimo año de experiencia, el cambio porcentual del salario producido por un año más de experiencia es de 1.246658%
iv) ¿Cuál es el valor de exper al que más experiencia disminuye el log(wage) predicho? ¿En esta muestra cuántas personas tienen una experiencia mayor que ese nivel?
A partir de los 28.73550573 años de experiencia, más experiencia disminuye el log(wage). Para ver cuántas personas tenían una experiencia mayor a 28.736, vimos la distribución de frecuencia para la variable exper con un intervalo de 2.8736. Esto nos dio un total de 121 personas que cumplen esa característica.
5. Ejercicio C6.3Considere un modelo en el que el rendimiento de la educación depende de la cantidad de experiencia de trabajo (y viceversa):
i) Muestre que el rendimiento de un año más de educación (en forma decimal, manteniendo exper constante), es .
Para saber el rendimiento de un año más de educación, basta con derivar la ecuación en torno a educación (educ), y eso nos da que un año extra de educación rinde .
ii) Establezca la hipótesis nula de que el rendimiento de la educación no depende del nivel de exper. ¿Cuál piensa que sea la alternativa adecuada?
Hipótesis nula H0: Pensamos que el modelo que incluye el efecto de la experiencia en el rendimiento de la educación es más adecuado ya que en realidad son dos cosas que están ligadas y se afectan mutuamente. No tiene mucho sentido que un año extra de educación no afecte también en cuanto rinde la experiencia, ya que a mayor educación, más debería rendir la experiencia. Es decir.
iii) Emplee los datos del archivo WAGE2.RAW para probar la hipótesis nula del inciso ii) contra la alternativa dada por usted.
La hipótesis nula H0:, se rechaza para todos los niveles mayores o iguales al p-value, es decir, se rechaza cuando el nivel de significancia es mayor o igual a 0,0364772. Si por ejemplo, el nivel de significancia es de 5%, se rechaza H0:.
iv) Sea el rendimiento de la educación (en forma decimal) cuando exper = 10: . Obtenga y un intervalo de confianza de 95% para .
Reescribimos la ecuación reemplazando 
Definimos la variable 
Podemos ver que y el intervalo de confianza de a un 95% de confianza es entre 0.0630974 y 0.0890617.

Continuar navegando