2_regresion_lineal_presentacion_y_supuestos

•
Outros

0
Estudiando Ingenieria
24/5/2022
¡Estudia con miles de materiales!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Ingeniería Civil

106.454 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
Econometŕıa
Gúıa 2: Regresión Lineal, Presentación y Supuestos
Pilar Alcalde∗
Universidad de los Andes
1 Presentación e Interpretación de la Regresión Lineal
1. Ejercicios de Wooldridge:
(a) Ejercicio 2.1
(b) Ejercicio 2.4
(c) Ejercicio 2.5
(d) Ejercicio 3.1
(e) Ejercicio 3.2
(f) Ejercicio 3.4
2. Comente Verdadero (V), Falso (F) o Incierto (I). Explique su respuesta.
(a) Nunca se obtendrán los mismos estimadores (betas) al pasar de estimar una regresión simple a
estimar una múltiple con dos variables explicativas, cuando se agrega una variable relevante al
modelo inicial.
(b) En una regresión lineal simple, da igual si la correlación entre X e Y es positiva o negativa ya
que β̂1 siempre será positivo.
(c) En un estudio sobre los determinantes del PIB de distintos páıses, la regresión entre el PIB y el
promedio de escolaridad del páıs tiene un R2 de 0.74. En cambio, la regresión entre el logaritmo
del PIB y el logaritmo del promedio de escolaridad tiene un R2 de 0.83. Entonces, se prefiere la
especificación en logaritmos.
(d) Independiente de la muestra que se tenga, la función de regresión muestral estimada siempre será
la misma y cercana a la poblacional.
(e) Considere el modelo econométrico estimado: bwghti = 119.77−0.514 ·cigsi. Aqúı, para la i-ésima
madre, bwghti es el peso de su bebé al nacer (en onzas) y cigsi es el número de cigarros que ella
fumó durante su embarazo. Entre los datos que se usaron para estimar este modelo, se observó a
una madre que fumó exactamente 25 cigarros durante su embarazo y su bebé pesó 109 onzas al
nacer. En este caso, claramente el modelo econométrico estimado subestima el peso del bebé en
2,08 onzas.
(f) En el modelo de regresión lineal, la suma de los residuos (usando MCO) es siempre cero.
(g) Considerando la varianza de una variable aleatoria, siempre es mejor tener un estimador para su
media - por malo que sea - que no tener estimador.
(h) Como el estimador de MCO minimiza la suma de cuadrados de residuo (SCR) de un modelo,
entonces la suma de cuadrados explicados (SCE) será grande y el modelo estimado será muy
bueno para predecir por su alto R2.
∗Esta gúıa contiene ejercicios de pruebas y controles de años anteriores, correspondientes a los profesores Pilar Alcalde,
Alejandro Hirmas, Ignacio Inostroza, David Kimber, y Sebastin Rey, a los cuales agradezco por facilitarme el material.
1
3. Explique qué es el coeficiente de determinación, cómo se interpreta y cómo se puede calcular. ¿Qué
sucede con este coeficiente cuando se agregan variables independientes a la regresión?
4. En un estudio, se registran salarios (en dólares anuales) de una muestra de profesores de una facultad
(Si), aśı como también sus años de educación (Ei) y los años que lleva ejerciendo su profesión (Xi).
Con estos datos, se provee la siguiente regresión estimada:
Si = 24697− 3340 · Ei + ui
Pero, al incorporar la variable Xi, usando la misma muestra el modelo estimado es:
Si = 18065 + 201 · Ei + 759 ·Xi + vi
Como podrá darse cuenta, al incorporar la variable Xi, la estimación del coeficiente asociado a Ei
cambió de signo. ¿Cómo puede producirse este fenómeno? Justifique con claridad.
5. Suponga que Ud. obtuvo la siguiente estimación usando MCO en una muestra de tamaño n =41:
Vi = 52.4− 0.45 · Pi + 0.32 · Ci + û
donde
• Vi: ventas totales del almacén i durante la primera semana de marzo, en miles de pesos.
• Pi: precio promedio de todos los productos del almacén i, en pesos.
• Ci: precio promedio de todos los productos de los tres almacenes más cercanos al almacén i, en
pesos.
(a) Interprete con exactitud el coeficiente que acompaña a la variable Pi.
(b) Si la varianza muestral de Vi es S=200 y la varianza estimada del error es σ̂
2 =80, encuentre el
R2 de la regresión. Nota: recuerde los denominadores respectivos de ambos valores entregados.
2 Supuestos y Propiedades de la Regresión Lineal
1. Ejercicios de Wooldridge:
(a) Ejercicio 2.6
(b) Ejercicio 3.5
(c) Ejercicio 3.6
(d) Ejercicio 3.7
(e) Ejercicio 3.8
(f) Ejercicio 3.10
2. Comente Verdadero (V), Falso (F) o Incierto (I). Explique su respuesta.
(a) La exclusión de variables relevantes no tiene ningún efecto sobre la homocedasticidad del modelo.
(b) Un investigador tiene dos muestras equivalentes en todo, sólo que en la muestra 1 la variable
independiente X1 tiene una varianza mucho mayor que en la muestra 2. Entonces es mejor usar
la muestra 2 para tener estimadores más precisos.
(c) En un modelo de regresión lineal simple, si no se conoce la distribución de probabilidad de los
errores, entonces los estimadores MCO del intercepto y de la pendiente no tienen varianza mı́nima.
(d) La inclusión de variables relevantes a un modelo econométrico disminuye la varianza estimada de
los estimadores.
(e) Los supuestos de Gauss Markov para el modelo de regresión lineal equivalen a suponer que tanto
la media condicional como la varianza condicional de Y dependen de las variables X.
2
(f) El incumplimiento del supuesto de normalidad del error genera problemas en la estimación de los
parámetros, de las varianzas, y en la validez de los tests de hipótesis.
(g) La omisión de una variable relevante en un modelo siempre sesga la estimación de los otros coefi-
cientes y aumenta su varianza estimada. El efecto es el mismo al incluir una variable irrelevante
en el modelo.
(h) El incumplimiento del supuesto de media condicional nula es igualmente grave que el incumplim-
iento del supuesto de normalidad del error. Ambos tienen el mismo efecto sobre la validez de la
estimación y la validez de los tests de hipótesis.
(i) Considere el modelo yi = β0 + β1xi + ui, el cual satisface todos los supuestos del modelo lineal
clásico. Luego, ceteris paribus, la varianza del estimador MCO de β1 será menor si la distribución
de x está cada vez más concentrada en su respectivo promedio muestral.
(j) Considere un modelo de regresión que satisface todos los supuestos del modelo lineal clásico. En
este modelo, la inclusión de variables relevantes disminuye la estimación de la varianza de los
estimadores.
(k) En el modelo de regresión simple yi = β0 + β1 · · ·xi + ui, con E(ui|xi) = 6, la estimación MCO
de β0 es sesgada, pero la estimación MCO de β1 no lo es.
(l) Tanto las propiedades como el valor del estimador serán siempre las mismas, independiente de la
muestra espećıfica que se tenga.
(m) El incluir una variable irrelevante en el modelo es igual de grave para el sesgo y la varianza del
estimador que omitir una variable relevante.
(n) Un investigador tiene dos muestras equivalentes en todo, sólo que en la muestra 1 la covarianza
entre las variables independientes X1 y X2 es mayor que en la muestra 2. Entonces es mejor usar
la muestra 1 para tener estimadores más precisos.
(o) El supuesto de homocedasticidad es tan importante como el supuesto de no colinealidad perfecta
para explicar las propiedades del estimador de Mı́nimos Cuadrados Ordinarios.
(p) Si existe colinealidad entre las variables independientes del modelo, sea perfecta o imperfecta, en-
tonces el estimador de Mı́nimos Cuadrados Ordinarios (MCO) estará sesgado (aunque se cumplan
los demás supuestos).
(q) Bajo el supuesto de homocedasticidad, los errores son siempre iguales, es decir no vaŕıan.
(r) Un investigador quiere explicar la disposición a pagar por departamentos de una muestra de famil-
ias dependiendo de su ingreso mensual. Para esto, propone usar como variables independientes:
• el ingreso mensual familiar medido en miles de pesos
• el ingreso mensual del padre medido en miles de pesos ($0 si no trabaja)
• el ingreso mensual de la madre medido en miles de pesos ($0 si no trabaja)
Usando MCO reporta que β̂1 = 0.3 es un estimador insesgado del efecto del ingreso familiar en
la disposición a pagar por departamentos, todo lo demás constante. Suponiendo que sólo ambos
padres pueden trabajar en cada hogar, comente si es verdadero, falsoo incierto, justificando su
respuesta.
(s) En un modelo de regresión múltiple, la varianza del estimador MCO de β1 será mayor si las
variables explicativas tienen mayor varianza y si están menos correlacionadas entre śı. Esto
significa que podŕıamos encontrar otro estimador que sea más eficiente. Comente.
(t) Cuando agregamos observaciones nuevas a una muestra - con el mismo método que se obtuvo la
muestra original - entonces los parámetros estimados no cambian porque siempre son iguales a
los parámetros poblacionales.
(u) El estimador de Mı́nimos Cuadrados Ordinarios es bastante simple porque no hace ningún supuesto
sobre el valor esperado del error ui ni sobre su varianza.
(v) Si no se cumple el supuesto de homocedasticidad es tan grave para la estimación como que no se
cumpla el supuesto de linealidad, pues tienen las mismas consecuencias para el valor esperado de
los parámetros, su varianza, y la capacidad de hacer inferencia.
3
(w) Si el modelo que estimamos tiene una alta correlación entre las variables independientes, el prob-
lema que produce en la estimación es igual de grave que si se omite una variable relevante en el
modelo.
(x) Si un modelo no cumple con el supuesto de muestreo aleatorio, entonces el estimador de MCO
estará sesgado y es posible encontrar otro estimador con mayor R2 para el mismo modelo.
3. Considere el modelo de regresión: yi = β0 + β1 · xi + ui.
(a) Explique brevemente cada supuesto de Gauss-Markov asociado a este modelo.
(b) Suponga que el modelo cumple todos los supuestos de insesgadez, excepto que E(ui|xi) = 10,
para cada i. Reescriba este modelo tal que el modelo reescrito cumpla todos los supuestos de
insesgadez. Argumente.
4. Suponga que el modelo
yi = β0 + β1 · xi1 + β2 · xi2 + ui (1)
satisface todos los supuestos de Gauss-Markov, con β2 < 0. Con una m.a.s. de tamaño n de las tres
variables involucradas, Ud. reporta el modelo estimado: ỹi = β̃0 + β̃1 · xi1.
(a) Qué signo tiene el sesgo de β̃1, como estimador de β1? Explique brevemente.
(b) Compare la varianza de β̃1 con la varianza del estimador de β1 que se obtiene al estimar el modelo
(1).
(c) Si Ud. estima el modelo (1), qué factores afectan a la varianza del estimador de β1? Explique
brevemente cómo la afectan.
5. Nombre los supuestos de insesgadez de parámetros poblacionales y explique 3 de éstos.
6. Considere el modelo: yi = 3 + 5xi + ui, donde ui ∼ N(0, σ2).
(a) Sólo en esta parte, usted genera una muestra aleatoria simple de tamaño 80 proveniente del modelo
del enunciado, suponiendo que σ2 = 0. Con estos 80 datos, usted estima por MCO el modelo:
yi = β0 + β1xi + ui. Calcule el coeficiente de determinación, justificando su respuesta.
(b) Sólo en esta parte, suponga que usted genera 10000 muestras aleatorias simples, cada una de
tamaño 80, todas provenientes del modelo del enunciado, suponiendo que σ2 = 64. En cada
muestra, usted pretende estimar el modelo: yi = β0 + β1xi + ui, donde el estimador que usará
para la pendiente tiene sesgo negativo (distinto a MCO). Pero, antes de obtener estas estimaciones,
un amigo suyo le afirma: “Todas las estimaciones de la pendiente que obtendrás serán mayores
que 5”. Comente esta afirmación.
7. Un t́ıo suyo le pide analizar la estructura de incentivos de su empresa, y para esto, le pide estimar
el efecto del tamaño del bono que entrega a cada trabajador a fin de año en la productividad del
trabajador. Esto se traduce en siguiente regresión:
Pi = β0 + β1Bi + ui
donde para cada trabajador i:
• Pi : productividad de i medida a través de una escala determinada, durante una semana.
• Bi : bono entregado a i a fin de año, en miles de pesos.
(a) Nombre los dos supuestos que este modelo de regresión hace sobre el valor esperado del error ui.
(b) Su t́ıo leyó que la productividad de cada trabajador está relacionada con su escolaridad. Expĺıquele,
en no más de cinco ĺıneas, cuál es la implicancia de su respuesta en (a) con respecto a la relación
entre el tamaño del bono y la escolaridad de cada trabajador. ¿Cree que se cumple este supuesto?
¿Por qué?
4
8. Una empresa que cambia parabrisas de autos que se han roto le pide analizar la estructura de incentivos
de su empresa, y para esto, le pide estimar el efecto del sueldo semanal de cada trabajador en la cantidad
de parabrisas que cambia en una semana. Esto se traduce en la siguiente regresión:
Pi = β0 + β1Si + ui
donde para cada trabajador i:
• Pi : número de parabrisas cambiados por el trabajador i durante una semana.
• Si : sueldo semanal del trabajador i, en miles de pesos.
(a) Nombre los dos supuestos que este modelo de regresión hace sobre el valor esperado del error ui.
(b) Un amigo comenta: “Da igual si la correlación entre P y S es positiva o negativa, porque β̂1
siempre será positivo.” Comente, señalando si es V o F y porqué.
(c) Suponga que β̂0 =-8 y β̂1 =0,2. Entre los datos que se usaron para estimar este modelo, se
observó a un trabajador que gana $110.000 (ciento diez mil pesos) y que cambia 13 parabrisas en
una semana. En este caso, claramente el modelo econométrico estimado sobreestima el número
de parabrisas cambiados en 1 unidad. Comente, señalando si es V o F y porqué.
(d) El incumplimiento del supuesto de muestra aleatoria simple es igualmente grave que el incumplim-
iento del supuesto de homocedasticidad, ya que ambos tienen el mismo efecto sobre la validez de
la estimación. Comente, señalando si es V o F y porqué.
(e) El gerente de la empresa sospecha que la productividad de cada trabajador (número de parabrisas
que cambia) está relacionada con su escolaridad (años de estudios), la cual es una variable que
no está incluida en la regresión. Expĺıquele brevemente cuál es la implicancia de su respuesta en
(1) con respecto a la relación entre el sueldo S y la escolaridad de cada trabajador. ¿Cree que se
cumple este supuesto? ¿Por qué?
9. El gerente de Cemento Melón le pide analizar el efecto que tiene el precio de su producto (cemento)
en la cantidad de toneladas de cemento vendidas en un mes. Esto se traduce en siguiente regresión:
Ti = β0 + β1Pi + ui
donde para cada mes i:
• Ti : número de toneladas de cemento vendidas en el mes i.
• Pi : precio de la tonelada de cemento cobrada en el mes i.
(a) Nombre los dos supuestos que este modelo de regresión hace sobre el valor esperado del error ui.
¿Cuál es el signo que espera para β̂1?
(b) El gerente de la empresa cree que la cantidad de cemento vendida en un mes puede depender
también del precio de la competencia, Cementos B́ıo-b́ıo. Expĺıquele, en no más de cinco ĺıneas,
cuál es la implicancia de su respuesta en (a) con respecto a la relación entre el precio de la empresa
y el de la competencia. ¿Cree que se cumple este supuesto? ¿Por qué?
10. La empresa frut́ıcola “Las Dos Peras” vende exclusivamente frutas, por lo que su ĺınea de negocios -y por
lo tanto sus ventas- se puede dividir completamente en “peras” y “otros productos”. Un investigador
propone estimar la siguiente regresión:
Yi = β0 + β1Pi + β2Oi + ui
donde
• Yi: ingresos totales por venta de la empresa el mes i, en miles de pesos.
• Pi: ingresos por la venta de peras el mes i, en miles de pesos.
• Oi: ingresos por la venta de otros productos el mes i, en miles de pesos.
Obtenga el valor esperado para β̂0, β̂1, β̂2, y para σ̂
2. Justifique por qué su respuesta.
5