Logo Studenta

Tarea 1 Econometria casi final

¡Este material tiene más páginas!

Vista previa del material en texto

TAREA N°1
 ECONOMETRÍA
Nicolás Besa.
José Tomás Ramírez.
Pedro Pablo Lizana.
Problema 1: Capitulo 3, ejercicio 4.
I)
 Atndrte: Variable que representa el porcentaje de asistencia a clases. 
 PriGPA: Variable que representa la calificación promedio general acumulada hasta el semestre anterior.
Act: Variable que representa la calificación en el examen de admisión universitaria, medida por puntaje.
II)
Atndrte= βo + β1*prigpa + β2*ACT + u
Atndrte= 75,7004 + 17,2606*prigpa + (-1,71655)*ACT + u
El intercepto si es relevante, ya que le permite a la regresión pasar por el promedio de los datos, cumpliendo con las propiedades aritméticas del MCO. 
III)
El coeficiente que acompaña a la variable priGPA es positiva y significante (valor-p muy pequeño), esto quiere decir que poseer un alto promedio de notas acumuladas influye positivamente en la asistencia a clases.
Por otro lado el coeficiente que acompaña a ACT es negativa y significante (valor-p muy pequeño), esto implica que haber tenido un puntaje de ingreso a la universidad alto su aporte marginal (entiéndase como cada punto extra) tiene una repercusión negativa en la asistencia)
Esto lo encontramos sorpresivo, ya que la intuición señalaría que los alumnos mientras más puntaje obtenga también tenderían a tener un mejor porcentaje promedio de asistencia ya que debiesen ser más aplicados y más estudiosos.
 IV) 
Al resolver el modelo con los datos proporcionados nos da un resultado de atndrte= 104,37059 con lo cual al analizarlo nos damos cuenta que, primero los datos de priGpa= 3,65 si es un dato de la variable explicativa que es posible que se encuentre en la muestra ya que pertenece al rango de la muestra ( es decir esta entre el mínimo y el máximo) y que a su vez el dato de ACT= 20 también posee las mismas características y es un dato posible de encontrar en la muestra ya que también pertenece al rango posible. Pero no así con el resultado de atndrte = 104,37059 el cual supera al máximo posible entregado por el modelo el cual es el 100% por lo que queda analizar que existe un “u” el cual es negativo y con esto se puede decir que la regresión esta sobre pronosticada.
V)
Resolviendo el modelo al reemplazar con los datos del tipo A el cual tenía priGpa=3,1 y ACT= 21 nos da que su atndrte= 93,16071% y el del tipo B el que tenía un priGpa= 2,1 y un ACT= 26, obtuvo un atndrte= 67,31736% con lo cual al analizarlo vemos que la diferencia que predice el modelo para estos dos individuos es de 25,84335% al tener los valores respectivos en las variables explicativas.
Ahora un “intervalo de Confianza” al 95% de los coeficientes.
Problema 2: Capitulo 3, ejercicio 6. 
I)
Con lo que el coeficiente de pendiente es 3,53383
II)
Con lo que el coeficiente de pendiente es 0,0598392
III)
B1 (educación) = 0,0391199 y B2 (IQ) = 0,00586313
IV) 
Al verificar :
Tenemos que = 0,0391199 + 0,00586313 x 3,53383
Con lo cual = 0,0598392, con lo que queda demostrado. Esto tiene sentido con el teorema de Gauss Markov al ser una estimacion de los coeficientes mediante MCO, vemos que los entregados son insesgados y que las varianzas correspondientes son las de minima varianza al ser realizada mediante el programa Gretl.
Problema 3: Capitulo 3, ejercicio 8.
I)
El promedio en la muestra de prpblck es 0,11349 esto significa que aproximadamente un 11% de la población de la muestra es afro estadounidense. Su desviación estándar es de 0,18242, la unidad de prpblck es la proporción medida en personas de afro estadounidense según código postal. 
El promedio en la muestra de income es de 47054 USD y su desviación estándar es de 13179. La unidad de medida está en USD según los ingresos de la población de Nueva Jersey y Pennsylvania. 
II)
Psoda= 0.956320+ 0.1149888*prpblck+0.00000160267*income+ u
Utilizando 401 observaciones 
R²= 0.0642204
Interpretación de B1: Por aumento de 1% en la proporción de la población afro estadounidense significa un aumento de 0.11498 USD en el precio de las sodas. No estimamos que sea grande desde el punto de vista económico puesto que significa una proporción muy pequeña ya que es una fracción insignificante de dólar. 
III) 
Cuando se omite el ingreso el coeficiente disminuye a 0.0649269 contra un 0.1149888 de regresión anterior. Con lo cual vemos que existe una menor discriminación. 
IV)
Debido a la que la variable prpblock está en porcentajes (dado que es una proporción) y la variable dependiente se encuentra en logaritmo, un cambio de un del 20% en variable prpblck significará un cambio porcentual de 43.16%. 
V) 
Podemos ver que el coeficiente de prpblck disminuye a 0.0728071 y esto se puede deber a la existencia de una correlación de 0.6803 entre la proporción de personas en pobreza (prppov) y la proporción de afroestadounidense, con lo cual al agregar un nuevo parametro se pueden separar los efectos de las respectivas variables. Podriamos comprobar el efecto que tiene prppov sobre prpblck a través de una regresión auxiliar. 
VI)
Correlación entre log (income) y prppov es de -0.8385, esto la hace muy negativa, es decir que cuando sube el porcentaje de ingreso disminuye la proporción de personas en pobreza. Esto es algo claramente esperable. 
VII)
A pesar de que están muy fuertemente correlacionados igual entrega nueva información, sin embargo, es necesario estudiar el R² ajustado, para ver como penaliza la inclusión de nuevas variables. 
Estudiando los modelos 3 y 4, tanto el R² como el R² ajustado en ambos casos aumentan, por lo que agregar una nueva variable si entrega información que resulta ser relevante. Es conveniente la inclusión de una nueva variable. 
· l_income alto: (mayores 205 sueldos)
· l_income bajo: (menores 205 sueldos)
Problema 4: Capitulo 4, ejercicio 2.
I)
El coeficiente que acompaña al ranking es negativo y signficativo, por esta razón se rechaza la hipotesis nula de que el ranking no tiene efecto ceteris paribus sobre el salario medio. 
II)
A nivel individual se puede ver que GPA es significativo, LSAT no lo es. Para ver la significancia en conjunto tendremos que hacer un test de hipotesis ==0.
III)
Claramente se aprecia que clize no es una variable significativa (valor-p muy alto). R² disminuye por lo que no entrega nueva información, aumento muy mínimo en el R² ajustado.
Para la variable faculty también se aprecia no significancia, mismo analisis que para la variable clize.
IV)
De los parametros que no se han agregado al modelo de regresion lineal, y que podrian tener una relacio con el ranking es la variable AGE, la cual a su vez se esperaria que posiblemente tenga una correlacion positiva ya que mientras más años tenga la facultad de derecho es de esperar que tenga un mejor ranking por tema de experiencia y reputacion por ejemplo.
Problema 5: Capitulo 4, ejercicio 6.
I) 
Bajo el modelo de regresión:
Log(wage)= +educ+exper+tenure+ u
Nuestro hipotesis nula H0 vendría siendo que B2=B3 o de similar forma B2-B3 es igual a 0. 
II) 
Como valor p es 0,68053 no se puede rechazar hipotesis nula a un nivel de significancia del 5%.
Los intervalos de Confianza respectivos para los coeficientes son:
Problema 6: Capitulo 4, ejercicio 9.
I) 
La ecuación es: 
El valor-p de es 0,0181, por lo que a un nivel de significancia de 5% se rechaza la hipótesis nula H0:=0 en favor de H1:. A un nivel de significancia de 1%, no es posible rechazar H0, puesto que el valor-p es más grande que el α.
II) La correlación entre ln(income) y prppov es de -0,8385, lo que significa un alta correlación negativa. Los coeficientes son significantes estadísticamente, pues tienen t alto y, por lo tanto, valores-p bajos que hacen significante aquello. Los valores p de dos colas son: 
*Para -> 0,00000048
*Para -> 0,0044 
III)
^l_psoda = -0,842 + 0,0976*prpblck - 0,0530*l_income + 0,0521*prppov + 0,121*l_hseval
 (0,292) (0,0293) (0,0375)(0,134) (0,0177)
n = 401, R-cuadrado = 0,184 
(Desviaciones típicas entre paréntesis)
El coeficiente de ln(hseval) se puede interpretar como que por un aumento de 1% en el valor promedio de la vivienda por zona postal, con todo lo demás constante, significa un aumento de 0,12% en el precio de la soda. El valor-p de dos colas es = 0,0000000000266813.
IV) Las variables l_income y prppov se vuelven estadisticamente insignificantes por si solas, puesto que tienen un valor-p muy alto. Cuando se ven de forma conjunta, con el test en que H0:==0, vemos que sí son significantes conjuntamente:
V) Viendo que en la regresión de iii) las variables ln(income) y prppov pasan a ser insignificantes en términos estadísticos, se podría decir que esta es mejor que la i), puesto que el término ln(hseval) es significativo para la regresión, y aquella variable no se incluye en i). (Aparte de tener mayor R² ajustado)

Otros materiales