Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Econometŕıa Gúıa 2: Regresión Lineal, Presentación y Supuestos Pilar Alcalde∗ Universidad de los Andes 1 Presentación e Interpretación de la Regresión Lineal 1. Ejercicios de Wooldridge: (a) Ejercicio 2.1 (b) Ejercicio 2.4 (c) Ejercicio 2.5 (d) Ejercicio 3.1 (e) Ejercicio 3.2 (f) Ejercicio 3.4 2. Comente Verdadero (V), Falso (F) o Incierto (I). Explique su respuesta. (a) Nunca se obtendrán los mismos estimadores (betas) al pasar de estimar una regresión simple a estimar una múltiple con dos variables explicativas, cuando se agrega una variable relevante al modelo inicial. (b) En una regresión lineal simple, da igual si la correlación entre X e Y es positiva o negativa ya que β̂1 siempre será positivo. (c) En un estudio sobre los determinantes del PIB de distintos páıses, la regresión entre el PIB y el promedio de escolaridad del páıs tiene un R2 de 0.74. En cambio, la regresión entre el logaritmo del PIB y el logaritmo del promedio de escolaridad tiene un R2 de 0.83. Entonces, se prefiere la especificación en logaritmos. (d) Independiente de la muestra que se tenga, la función de regresión muestral estimada siempre será la misma y cercana a la poblacional. (e) Considere el modelo econométrico estimado: bwghti = 119.77−0.514 ·cigsi. Aqúı, para la i-ésima madre, bwghti es el peso de su bebé al nacer (en onzas) y cigsi es el número de cigarros que ella fumó durante su embarazo. Entre los datos que se usaron para estimar este modelo, se observó a una madre que fumó exactamente 25 cigarros durante su embarazo y su bebé pesó 109 onzas al nacer. En este caso, claramente el modelo econométrico estimado subestima el peso del bebé en 2,08 onzas. (f) En el modelo de regresión lineal, la suma de los residuos (usando MCO) es siempre cero. (g) Considerando la varianza de una variable aleatoria, siempre es mejor tener un estimador para su media - por malo que sea - que no tener estimador. (h) Como el estimador de MCO minimiza la suma de cuadrados de residuo (SCR) de un modelo, entonces la suma de cuadrados explicados (SCE) será grande y el modelo estimado será muy bueno para predecir por su alto R2. ∗Esta gúıa contiene ejercicios de pruebas y controles de años anteriores, correspondientes a los profesores Pilar Alcalde, Alejandro Hirmas, Ignacio Inostroza, David Kimber, y Sebastin Rey, a los cuales agradezco por facilitarme el material. 1 3. Explique qué es el coeficiente de determinación, cómo se interpreta y cómo se puede calcular. ¿Qué sucede con este coeficiente cuando se agregan variables independientes a la regresión? 4. En un estudio, se registran salarios (en dólares anuales) de una muestra de profesores de una facultad (Si), aśı como también sus años de educación (Ei) y los años que lleva ejerciendo su profesión (Xi). Con estos datos, se provee la siguiente regresión estimada: Si = 24697− 3340 · Ei + ui Pero, al incorporar la variable Xi, usando la misma muestra el modelo estimado es: Si = 18065 + 201 · Ei + 759 ·Xi + vi Como podrá darse cuenta, al incorporar la variable Xi, la estimación del coeficiente asociado a Ei cambió de signo. ¿Cómo puede producirse este fenómeno? Justifique con claridad. 5. Suponga que Ud. obtuvo la siguiente estimación usando MCO en una muestra de tamaño n =41: Vi = 52.4− 0.45 · Pi + 0.32 · Ci + û donde • Vi: ventas totales del almacén i durante la primera semana de marzo, en miles de pesos. • Pi: precio promedio de todos los productos del almacén i, en pesos. • Ci: precio promedio de todos los productos de los tres almacenes más cercanos al almacén i, en pesos. (a) Interprete con exactitud el coeficiente que acompaña a la variable Pi. (b) Si la varianza muestral de Vi es S=200 y la varianza estimada del error es σ̂ 2 =80, encuentre el R2 de la regresión. Nota: recuerde los denominadores respectivos de ambos valores entregados. 2 Supuestos y Propiedades de la Regresión Lineal 1. Ejercicios de Wooldridge: (a) Ejercicio 2.6 (b) Ejercicio 3.5 (c) Ejercicio 3.6 (d) Ejercicio 3.7 (e) Ejercicio 3.8 (f) Ejercicio 3.10 2. Comente Verdadero (V), Falso (F) o Incierto (I). Explique su respuesta. (a) La exclusión de variables relevantes no tiene ningún efecto sobre la homocedasticidad del modelo. (b) Un investigador tiene dos muestras equivalentes en todo, sólo que en la muestra 1 la variable independiente X1 tiene una varianza mucho mayor que en la muestra 2. Entonces es mejor usar la muestra 2 para tener estimadores más precisos. (c) En un modelo de regresión lineal simple, si no se conoce la distribución de probabilidad de los errores, entonces los estimadores MCO del intercepto y de la pendiente no tienen varianza mı́nima. (d) La inclusión de variables relevantes a un modelo econométrico disminuye la varianza estimada de los estimadores. (e) Los supuestos de Gauss Markov para el modelo de regresión lineal equivalen a suponer que tanto la media condicional como la varianza condicional de Y dependen de las variables X. 2 (f) El incumplimiento del supuesto de normalidad del error genera problemas en la estimación de los parámetros, de las varianzas, y en la validez de los tests de hipótesis. (g) La omisión de una variable relevante en un modelo siempre sesga la estimación de los otros coefi- cientes y aumenta su varianza estimada. El efecto es el mismo al incluir una variable irrelevante en el modelo. (h) El incumplimiento del supuesto de media condicional nula es igualmente grave que el incumplim- iento del supuesto de normalidad del error. Ambos tienen el mismo efecto sobre la validez de la estimación y la validez de los tests de hipótesis. (i) Considere el modelo yi = β0 + β1xi + ui, el cual satisface todos los supuestos del modelo lineal clásico. Luego, ceteris paribus, la varianza del estimador MCO de β1 será menor si la distribución de x está cada vez más concentrada en su respectivo promedio muestral. (j) Considere un modelo de regresión que satisface todos los supuestos del modelo lineal clásico. En este modelo, la inclusión de variables relevantes disminuye la estimación de la varianza de los estimadores. (k) En el modelo de regresión simple yi = β0 + β1 · · ·xi + ui, con E(ui|xi) = 6, la estimación MCO de β0 es sesgada, pero la estimación MCO de β1 no lo es. (l) Tanto las propiedades como el valor del estimador serán siempre las mismas, independiente de la muestra espećıfica que se tenga. (m) El incluir una variable irrelevante en el modelo es igual de grave para el sesgo y la varianza del estimador que omitir una variable relevante. (n) Un investigador tiene dos muestras equivalentes en todo, sólo que en la muestra 1 la covarianza entre las variables independientes X1 y X2 es mayor que en la muestra 2. Entonces es mejor usar la muestra 1 para tener estimadores más precisos. (o) El supuesto de homocedasticidad es tan importante como el supuesto de no colinealidad perfecta para explicar las propiedades del estimador de Mı́nimos Cuadrados Ordinarios. (p) Si existe colinealidad entre las variables independientes del modelo, sea perfecta o imperfecta, en- tonces el estimador de Mı́nimos Cuadrados Ordinarios (MCO) estará sesgado (aunque se cumplan los demás supuestos). (q) Bajo el supuesto de homocedasticidad, los errores son siempre iguales, es decir no vaŕıan. (r) Un investigador quiere explicar la disposición a pagar por departamentos de una muestra de famil- ias dependiendo de su ingreso mensual. Para esto, propone usar como variables independientes: • el ingreso mensual familiar medido en miles de pesos • el ingreso mensual del padre medido en miles de pesos ($0 si no trabaja) • el ingreso mensual de la madre medido en miles de pesos ($0 si no trabaja) Usando MCO reporta que β̂1 = 0.3 es un estimador insesgado del efecto del ingreso familiar en la disposición a pagar por departamentos, todo lo demás constante. Suponiendo que sólo ambos padres pueden trabajar en cada hogar, comente si es verdadero, falsoo incierto, justificando su respuesta. (s) En un modelo de regresión múltiple, la varianza del estimador MCO de β1 será mayor si las variables explicativas tienen mayor varianza y si están menos correlacionadas entre śı. Esto significa que podŕıamos encontrar otro estimador que sea más eficiente. Comente. (t) Cuando agregamos observaciones nuevas a una muestra - con el mismo método que se obtuvo la muestra original - entonces los parámetros estimados no cambian porque siempre son iguales a los parámetros poblacionales. (u) El estimador de Mı́nimos Cuadrados Ordinarios es bastante simple porque no hace ningún supuesto sobre el valor esperado del error ui ni sobre su varianza. (v) Si no se cumple el supuesto de homocedasticidad es tan grave para la estimación como que no se cumpla el supuesto de linealidad, pues tienen las mismas consecuencias para el valor esperado de los parámetros, su varianza, y la capacidad de hacer inferencia. 3 (w) Si el modelo que estimamos tiene una alta correlación entre las variables independientes, el prob- lema que produce en la estimación es igual de grave que si se omite una variable relevante en el modelo. (x) Si un modelo no cumple con el supuesto de muestreo aleatorio, entonces el estimador de MCO estará sesgado y es posible encontrar otro estimador con mayor R2 para el mismo modelo. 3. Considere el modelo de regresión: yi = β0 + β1 · xi + ui. (a) Explique brevemente cada supuesto de Gauss-Markov asociado a este modelo. (b) Suponga que el modelo cumple todos los supuestos de insesgadez, excepto que E(ui|xi) = 10, para cada i. Reescriba este modelo tal que el modelo reescrito cumpla todos los supuestos de insesgadez. Argumente. 4. Suponga que el modelo yi = β0 + β1 · xi1 + β2 · xi2 + ui (1) satisface todos los supuestos de Gauss-Markov, con β2 < 0. Con una m.a.s. de tamaño n de las tres variables involucradas, Ud. reporta el modelo estimado: ỹi = β̃0 + β̃1 · xi1. (a) Qué signo tiene el sesgo de β̃1, como estimador de β1? Explique brevemente. (b) Compare la varianza de β̃1 con la varianza del estimador de β1 que se obtiene al estimar el modelo (1). (c) Si Ud. estima el modelo (1), qué factores afectan a la varianza del estimador de β1? Explique brevemente cómo la afectan. 5. Nombre los supuestos de insesgadez de parámetros poblacionales y explique 3 de éstos. 6. Considere el modelo: yi = 3 + 5xi + ui, donde ui ∼ N(0, σ2). (a) Sólo en esta parte, usted genera una muestra aleatoria simple de tamaño 80 proveniente del modelo del enunciado, suponiendo que σ2 = 0. Con estos 80 datos, usted estima por MCO el modelo: yi = β0 + β1xi + ui. Calcule el coeficiente de determinación, justificando su respuesta. (b) Sólo en esta parte, suponga que usted genera 10000 muestras aleatorias simples, cada una de tamaño 80, todas provenientes del modelo del enunciado, suponiendo que σ2 = 64. En cada muestra, usted pretende estimar el modelo: yi = β0 + β1xi + ui, donde el estimador que usará para la pendiente tiene sesgo negativo (distinto a MCO). Pero, antes de obtener estas estimaciones, un amigo suyo le afirma: “Todas las estimaciones de la pendiente que obtendrás serán mayores que 5”. Comente esta afirmación. 7. Un t́ıo suyo le pide analizar la estructura de incentivos de su empresa, y para esto, le pide estimar el efecto del tamaño del bono que entrega a cada trabajador a fin de año en la productividad del trabajador. Esto se traduce en siguiente regresión: Pi = β0 + β1Bi + ui donde para cada trabajador i: • Pi : productividad de i medida a través de una escala determinada, durante una semana. • Bi : bono entregado a i a fin de año, en miles de pesos. (a) Nombre los dos supuestos que este modelo de regresión hace sobre el valor esperado del error ui. (b) Su t́ıo leyó que la productividad de cada trabajador está relacionada con su escolaridad. Expĺıquele, en no más de cinco ĺıneas, cuál es la implicancia de su respuesta en (a) con respecto a la relación entre el tamaño del bono y la escolaridad de cada trabajador. ¿Cree que se cumple este supuesto? ¿Por qué? 4 8. Una empresa que cambia parabrisas de autos que se han roto le pide analizar la estructura de incentivos de su empresa, y para esto, le pide estimar el efecto del sueldo semanal de cada trabajador en la cantidad de parabrisas que cambia en una semana. Esto se traduce en la siguiente regresión: Pi = β0 + β1Si + ui donde para cada trabajador i: • Pi : número de parabrisas cambiados por el trabajador i durante una semana. • Si : sueldo semanal del trabajador i, en miles de pesos. (a) Nombre los dos supuestos que este modelo de regresión hace sobre el valor esperado del error ui. (b) Un amigo comenta: “Da igual si la correlación entre P y S es positiva o negativa, porque β̂1 siempre será positivo.” Comente, señalando si es V o F y porqué. (c) Suponga que β̂0 =-8 y β̂1 =0,2. Entre los datos que se usaron para estimar este modelo, se observó a un trabajador que gana $110.000 (ciento diez mil pesos) y que cambia 13 parabrisas en una semana. En este caso, claramente el modelo econométrico estimado sobreestima el número de parabrisas cambiados en 1 unidad. Comente, señalando si es V o F y porqué. (d) El incumplimiento del supuesto de muestra aleatoria simple es igualmente grave que el incumplim- iento del supuesto de homocedasticidad, ya que ambos tienen el mismo efecto sobre la validez de la estimación. Comente, señalando si es V o F y porqué. (e) El gerente de la empresa sospecha que la productividad de cada trabajador (número de parabrisas que cambia) está relacionada con su escolaridad (años de estudios), la cual es una variable que no está incluida en la regresión. Expĺıquele brevemente cuál es la implicancia de su respuesta en (1) con respecto a la relación entre el sueldo S y la escolaridad de cada trabajador. ¿Cree que se cumple este supuesto? ¿Por qué? 9. El gerente de Cemento Melón le pide analizar el efecto que tiene el precio de su producto (cemento) en la cantidad de toneladas de cemento vendidas en un mes. Esto se traduce en siguiente regresión: Ti = β0 + β1Pi + ui donde para cada mes i: • Ti : número de toneladas de cemento vendidas en el mes i. • Pi : precio de la tonelada de cemento cobrada en el mes i. (a) Nombre los dos supuestos que este modelo de regresión hace sobre el valor esperado del error ui. ¿Cuál es el signo que espera para β̂1? (b) El gerente de la empresa cree que la cantidad de cemento vendida en un mes puede depender también del precio de la competencia, Cementos B́ıo-b́ıo. Expĺıquele, en no más de cinco ĺıneas, cuál es la implicancia de su respuesta en (a) con respecto a la relación entre el precio de la empresa y el de la competencia. ¿Cree que se cumple este supuesto? ¿Por qué? 10. La empresa frut́ıcola “Las Dos Peras” vende exclusivamente frutas, por lo que su ĺınea de negocios -y por lo tanto sus ventas- se puede dividir completamente en “peras” y “otros productos”. Un investigador propone estimar la siguiente regresión: Yi = β0 + β1Pi + β2Oi + ui donde • Yi: ingresos totales por venta de la empresa el mes i, en miles de pesos. • Pi: ingresos por la venta de peras el mes i, en miles de pesos. • Oi: ingresos por la venta de otros productos el mes i, en miles de pesos. Obtenga el valor esperado para β̂0, β̂1, β̂2, y para σ̂ 2. Justifique por qué su respuesta. 5
Compartir