Logo Studenta

2_regresion_lineal_presentacion_y_supuestos

¡Estudia con miles de materiales!

Vista previa del material en texto

Econometŕıa
Gúıa 2: Regresión Lineal, Presentación y Supuestos
Pilar Alcalde∗
Universidad de los Andes
1 Presentación e Interpretación de la Regresión Lineal
1. Ejercicios de Wooldridge:
(a) Ejercicio 2.1
(b) Ejercicio 2.4
(c) Ejercicio 2.5
(d) Ejercicio 3.1
(e) Ejercicio 3.2
(f) Ejercicio 3.4
2. Comente Verdadero (V), Falso (F) o Incierto (I). Explique su respuesta.
(a) Nunca se obtendrán los mismos estimadores (betas) al pasar de estimar una regresión simple a
estimar una múltiple con dos variables explicativas, cuando se agrega una variable relevante al
modelo inicial.
(b) En una regresión lineal simple, da igual si la correlación entre X e Y es positiva o negativa ya
que β̂1 siempre será positivo.
(c) En un estudio sobre los determinantes del PIB de distintos páıses, la regresión entre el PIB y el
promedio de escolaridad del páıs tiene un R2 de 0.74. En cambio, la regresión entre el logaritmo
del PIB y el logaritmo del promedio de escolaridad tiene un R2 de 0.83. Entonces, se prefiere la
especificación en logaritmos.
(d) Independiente de la muestra que se tenga, la función de regresión muestral estimada siempre será
la misma y cercana a la poblacional.
(e) Considere el modelo econométrico estimado: bwghti = 119.77−0.514 ·cigsi. Aqúı, para la i-ésima
madre, bwghti es el peso de su bebé al nacer (en onzas) y cigsi es el número de cigarros que ella
fumó durante su embarazo. Entre los datos que se usaron para estimar este modelo, se observó a
una madre que fumó exactamente 25 cigarros durante su embarazo y su bebé pesó 109 onzas al
nacer. En este caso, claramente el modelo econométrico estimado subestima el peso del bebé en
2,08 onzas.
(f) En el modelo de regresión lineal, la suma de los residuos (usando MCO) es siempre cero.
(g) Considerando la varianza de una variable aleatoria, siempre es mejor tener un estimador para su
media - por malo que sea - que no tener estimador.
(h) Como el estimador de MCO minimiza la suma de cuadrados de residuo (SCR) de un modelo,
entonces la suma de cuadrados explicados (SCE) será grande y el modelo estimado será muy
bueno para predecir por su alto R2.
∗Esta gúıa contiene ejercicios de pruebas y controles de años anteriores, correspondientes a los profesores Pilar Alcalde,
Alejandro Hirmas, Ignacio Inostroza, David Kimber, y Sebastin Rey, a los cuales agradezco por facilitarme el material.
1
3. Explique qué es el coeficiente de determinación, cómo se interpreta y cómo se puede calcular. ¿Qué
sucede con este coeficiente cuando se agregan variables independientes a la regresión?
4. En un estudio, se registran salarios (en dólares anuales) de una muestra de profesores de una facultad
(Si), aśı como también sus años de educación (Ei) y los años que lleva ejerciendo su profesión (Xi).
Con estos datos, se provee la siguiente regresión estimada:
Si = 24697− 3340 · Ei + ui
Pero, al incorporar la variable Xi, usando la misma muestra el modelo estimado es:
Si = 18065 + 201 · Ei + 759 ·Xi + vi
Como podrá darse cuenta, al incorporar la variable Xi, la estimación del coeficiente asociado a Ei
cambió de signo. ¿Cómo puede producirse este fenómeno? Justifique con claridad.
5. Suponga que Ud. obtuvo la siguiente estimación usando MCO en una muestra de tamaño n =41:
Vi = 52.4− 0.45 · Pi + 0.32 · Ci + û
donde
• Vi: ventas totales del almacén i durante la primera semana de marzo, en miles de pesos.
• Pi: precio promedio de todos los productos del almacén i, en pesos.
• Ci: precio promedio de todos los productos de los tres almacenes más cercanos al almacén i, en
pesos.
(a) Interprete con exactitud el coeficiente que acompaña a la variable Pi.
(b) Si la varianza muestral de Vi es S=200 y la varianza estimada del error es σ̂
2 =80, encuentre el
R2 de la regresión. Nota: recuerde los denominadores respectivos de ambos valores entregados.
2 Supuestos y Propiedades de la Regresión Lineal
1. Ejercicios de Wooldridge:
(a) Ejercicio 2.6
(b) Ejercicio 3.5
(c) Ejercicio 3.6
(d) Ejercicio 3.7
(e) Ejercicio 3.8
(f) Ejercicio 3.10
2. Comente Verdadero (V), Falso (F) o Incierto (I). Explique su respuesta.
(a) La exclusión de variables relevantes no tiene ningún efecto sobre la homocedasticidad del modelo.
(b) Un investigador tiene dos muestras equivalentes en todo, sólo que en la muestra 1 la variable
independiente X1 tiene una varianza mucho mayor que en la muestra 2. Entonces es mejor usar
la muestra 2 para tener estimadores más precisos.
(c) En un modelo de regresión lineal simple, si no se conoce la distribución de probabilidad de los
errores, entonces los estimadores MCO del intercepto y de la pendiente no tienen varianza mı́nima.
(d) La inclusión de variables relevantes a un modelo econométrico disminuye la varianza estimada de
los estimadores.
(e) Los supuestos de Gauss Markov para el modelo de regresión lineal equivalen a suponer que tanto
la media condicional como la varianza condicional de Y dependen de las variables X.
2
(f) El incumplimiento del supuesto de normalidad del error genera problemas en la estimación de los
parámetros, de las varianzas, y en la validez de los tests de hipótesis.
(g) La omisión de una variable relevante en un modelo siempre sesga la estimación de los otros coefi-
cientes y aumenta su varianza estimada. El efecto es el mismo al incluir una variable irrelevante
en el modelo.
(h) El incumplimiento del supuesto de media condicional nula es igualmente grave que el incumplim-
iento del supuesto de normalidad del error. Ambos tienen el mismo efecto sobre la validez de la
estimación y la validez de los tests de hipótesis.
(i) Considere el modelo yi = β0 + β1xi + ui, el cual satisface todos los supuestos del modelo lineal
clásico. Luego, ceteris paribus, la varianza del estimador MCO de β1 será menor si la distribución
de x está cada vez más concentrada en su respectivo promedio muestral.
(j) Considere un modelo de regresión que satisface todos los supuestos del modelo lineal clásico. En
este modelo, la inclusión de variables relevantes disminuye la estimación de la varianza de los
estimadores.
(k) En el modelo de regresión simple yi = β0 + β1 · · ·xi + ui, con E(ui|xi) = 6, la estimación MCO
de β0 es sesgada, pero la estimación MCO de β1 no lo es.
(l) Tanto las propiedades como el valor del estimador serán siempre las mismas, independiente de la
muestra espećıfica que se tenga.
(m) El incluir una variable irrelevante en el modelo es igual de grave para el sesgo y la varianza del
estimador que omitir una variable relevante.
(n) Un investigador tiene dos muestras equivalentes en todo, sólo que en la muestra 1 la covarianza
entre las variables independientes X1 y X2 es mayor que en la muestra 2. Entonces es mejor usar
la muestra 1 para tener estimadores más precisos.
(o) El supuesto de homocedasticidad es tan importante como el supuesto de no colinealidad perfecta
para explicar las propiedades del estimador de Mı́nimos Cuadrados Ordinarios.
(p) Si existe colinealidad entre las variables independientes del modelo, sea perfecta o imperfecta, en-
tonces el estimador de Mı́nimos Cuadrados Ordinarios (MCO) estará sesgado (aunque se cumplan
los demás supuestos).
(q) Bajo el supuesto de homocedasticidad, los errores son siempre iguales, es decir no vaŕıan.
(r) Un investigador quiere explicar la disposición a pagar por departamentos de una muestra de famil-
ias dependiendo de su ingreso mensual. Para esto, propone usar como variables independientes:
• el ingreso mensual familiar medido en miles de pesos
• el ingreso mensual del padre medido en miles de pesos ($0 si no trabaja)
• el ingreso mensual de la madre medido en miles de pesos ($0 si no trabaja)
Usando MCO reporta que β̂1 = 0.3 es un estimador insesgado del efecto del ingreso familiar en
la disposición a pagar por departamentos, todo lo demás constante. Suponiendo que sólo ambos
padres pueden trabajar en cada hogar, comente si es verdadero, falsoo incierto, justificando su
respuesta.
(s) En un modelo de regresión múltiple, la varianza del estimador MCO de β1 será mayor si las
variables explicativas tienen mayor varianza y si están menos correlacionadas entre śı. Esto
significa que podŕıamos encontrar otro estimador que sea más eficiente. Comente.
(t) Cuando agregamos observaciones nuevas a una muestra - con el mismo método que se obtuvo la
muestra original - entonces los parámetros estimados no cambian porque siempre son iguales a
los parámetros poblacionales.
(u) El estimador de Mı́nimos Cuadrados Ordinarios es bastante simple porque no hace ningún supuesto
sobre el valor esperado del error ui ni sobre su varianza.
(v) Si no se cumple el supuesto de homocedasticidad es tan grave para la estimación como que no se
cumpla el supuesto de linealidad, pues tienen las mismas consecuencias para el valor esperado de
los parámetros, su varianza, y la capacidad de hacer inferencia.
3
(w) Si el modelo que estimamos tiene una alta correlación entre las variables independientes, el prob-
lema que produce en la estimación es igual de grave que si se omite una variable relevante en el
modelo.
(x) Si un modelo no cumple con el supuesto de muestreo aleatorio, entonces el estimador de MCO
estará sesgado y es posible encontrar otro estimador con mayor R2 para el mismo modelo.
3. Considere el modelo de regresión: yi = β0 + β1 · xi + ui.
(a) Explique brevemente cada supuesto de Gauss-Markov asociado a este modelo.
(b) Suponga que el modelo cumple todos los supuestos de insesgadez, excepto que E(ui|xi) = 10,
para cada i. Reescriba este modelo tal que el modelo reescrito cumpla todos los supuestos de
insesgadez. Argumente.
4. Suponga que el modelo
yi = β0 + β1 · xi1 + β2 · xi2 + ui (1)
satisface todos los supuestos de Gauss-Markov, con β2 < 0. Con una m.a.s. de tamaño n de las tres
variables involucradas, Ud. reporta el modelo estimado: ỹi = β̃0 + β̃1 · xi1.
(a) Qué signo tiene el sesgo de β̃1, como estimador de β1? Explique brevemente.
(b) Compare la varianza de β̃1 con la varianza del estimador de β1 que se obtiene al estimar el modelo
(1).
(c) Si Ud. estima el modelo (1), qué factores afectan a la varianza del estimador de β1? Explique
brevemente cómo la afectan.
5. Nombre los supuestos de insesgadez de parámetros poblacionales y explique 3 de éstos.
6. Considere el modelo: yi = 3 + 5xi + ui, donde ui ∼ N(0, σ2).
(a) Sólo en esta parte, usted genera una muestra aleatoria simple de tamaño 80 proveniente del modelo
del enunciado, suponiendo que σ2 = 0. Con estos 80 datos, usted estima por MCO el modelo:
yi = β0 + β1xi + ui. Calcule el coeficiente de determinación, justificando su respuesta.
(b) Sólo en esta parte, suponga que usted genera 10000 muestras aleatorias simples, cada una de
tamaño 80, todas provenientes del modelo del enunciado, suponiendo que σ2 = 64. En cada
muestra, usted pretende estimar el modelo: yi = β0 + β1xi + ui, donde el estimador que usará
para la pendiente tiene sesgo negativo (distinto a MCO). Pero, antes de obtener estas estimaciones,
un amigo suyo le afirma: “Todas las estimaciones de la pendiente que obtendrás serán mayores
que 5”. Comente esta afirmación.
7. Un t́ıo suyo le pide analizar la estructura de incentivos de su empresa, y para esto, le pide estimar
el efecto del tamaño del bono que entrega a cada trabajador a fin de año en la productividad del
trabajador. Esto se traduce en siguiente regresión:
Pi = β0 + β1Bi + ui
donde para cada trabajador i:
• Pi : productividad de i medida a través de una escala determinada, durante una semana.
• Bi : bono entregado a i a fin de año, en miles de pesos.
(a) Nombre los dos supuestos que este modelo de regresión hace sobre el valor esperado del error ui.
(b) Su t́ıo leyó que la productividad de cada trabajador está relacionada con su escolaridad. Expĺıquele,
en no más de cinco ĺıneas, cuál es la implicancia de su respuesta en (a) con respecto a la relación
entre el tamaño del bono y la escolaridad de cada trabajador. ¿Cree que se cumple este supuesto?
¿Por qué?
4
8. Una empresa que cambia parabrisas de autos que se han roto le pide analizar la estructura de incentivos
de su empresa, y para esto, le pide estimar el efecto del sueldo semanal de cada trabajador en la cantidad
de parabrisas que cambia en una semana. Esto se traduce en la siguiente regresión:
Pi = β0 + β1Si + ui
donde para cada trabajador i:
• Pi : número de parabrisas cambiados por el trabajador i durante una semana.
• Si : sueldo semanal del trabajador i, en miles de pesos.
(a) Nombre los dos supuestos que este modelo de regresión hace sobre el valor esperado del error ui.
(b) Un amigo comenta: “Da igual si la correlación entre P y S es positiva o negativa, porque β̂1
siempre será positivo.” Comente, señalando si es V o F y porqué.
(c) Suponga que β̂0 =-8 y β̂1 =0,2. Entre los datos que se usaron para estimar este modelo, se
observó a un trabajador que gana $110.000 (ciento diez mil pesos) y que cambia 13 parabrisas en
una semana. En este caso, claramente el modelo econométrico estimado sobreestima el número
de parabrisas cambiados en 1 unidad. Comente, señalando si es V o F y porqué.
(d) El incumplimiento del supuesto de muestra aleatoria simple es igualmente grave que el incumplim-
iento del supuesto de homocedasticidad, ya que ambos tienen el mismo efecto sobre la validez de
la estimación. Comente, señalando si es V o F y porqué.
(e) El gerente de la empresa sospecha que la productividad de cada trabajador (número de parabrisas
que cambia) está relacionada con su escolaridad (años de estudios), la cual es una variable que
no está incluida en la regresión. Expĺıquele brevemente cuál es la implicancia de su respuesta en
(1) con respecto a la relación entre el sueldo S y la escolaridad de cada trabajador. ¿Cree que se
cumple este supuesto? ¿Por qué?
9. El gerente de Cemento Melón le pide analizar el efecto que tiene el precio de su producto (cemento)
en la cantidad de toneladas de cemento vendidas en un mes. Esto se traduce en siguiente regresión:
Ti = β0 + β1Pi + ui
donde para cada mes i:
• Ti : número de toneladas de cemento vendidas en el mes i.
• Pi : precio de la tonelada de cemento cobrada en el mes i.
(a) Nombre los dos supuestos que este modelo de regresión hace sobre el valor esperado del error ui.
¿Cuál es el signo que espera para β̂1?
(b) El gerente de la empresa cree que la cantidad de cemento vendida en un mes puede depender
también del precio de la competencia, Cementos B́ıo-b́ıo. Expĺıquele, en no más de cinco ĺıneas,
cuál es la implicancia de su respuesta en (a) con respecto a la relación entre el precio de la empresa
y el de la competencia. ¿Cree que se cumple este supuesto? ¿Por qué?
10. La empresa frut́ıcola “Las Dos Peras” vende exclusivamente frutas, por lo que su ĺınea de negocios -y por
lo tanto sus ventas- se puede dividir completamente en “peras” y “otros productos”. Un investigador
propone estimar la siguiente regresión:
Yi = β0 + β1Pi + β2Oi + ui
donde
• Yi: ingresos totales por venta de la empresa el mes i, en miles de pesos.
• Pi: ingresos por la venta de peras el mes i, en miles de pesos.
• Oi: ingresos por la venta de otros productos el mes i, en miles de pesos.
Obtenga el valor esperado para β̂0, β̂1, β̂2, y para σ̂
2. Justifique por qué su respuesta.
5

Continuar navegando

Materiales relacionados