Logo Studenta

clase16 - Zaida Moreno Páez

¡Este material tiene más páginas!

Vista previa del material en texto

Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Clase 16
Econometŕıa I
Tomás Rau Binder
10 de octubre
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Contenidos
Omisión de Variables Relevantes
Impacto sobre el Insesgamiento
Impacto sobre la Varianza
Ejemplo
Inclusión de Variable Irrelevantes
Impacto sobre Insesgamiento
Impacto sobre Varianza
Ejemplo
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Omisión de Variables Relevantes
Sea el siguiente modelo poblacional:
Y = X1β1 + X2β2 + u
Suponga ahora que el investigador se equivoca (o no tiene X2) y
estima el siguiente modelo:
Y = X1β1 + ũ
El estimador MCO de β1 en el modelo incompleto es en general
sesgado:
E (β̂1) = E [(X
′
1X1)
−1
X
′
1Y ]
= β1 + E [(X
′
1X1)
−1
X
′
1X2]β2
= β1 + Zβ2
donde Z = E [(X ′
1
X1)
−1
X
′
1
X2]. También es inconsistente.
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Omisión de Variables Relevantes
Note que en dos ocacaciones no habrá sesgo:
Si X ′
1
X2 = 0, es decir cuando X1 es ortogonal a X2
Cuando β2 = 0, es decir cuando X2 es una variable
irrelevante que no pertenece al modelo.
Para el caso de consistencia, se puede demostrar que cuando X1 y
X2 son escalares
plimβ̂1 = β1 +
Cov(X1,X2)
V (X1)
β2
De lo anterior, se desprende que la dirección del sesgo depende de
como covarien las variables incluidas con respecto a las excluidas y
del signo del parámetro omitido.
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Omisión de Variables Relevantes
Impacto sobre la Varianza
Estimando el modelo “incompleto”, el estimador de la varianza
será:
V (β̂1|X1) = σ
2(X ′1X1)
−1
mientras que si hubiéramos estimado el modelo correcto, se puede
demostrar que la varianza del estimador insesgado de β1 (β̂
∗
1
)
correspondeŕıa a:
V (β̂∗1 |X1,X2) = σ
2(X ′1M2X1)
−1
donde M2 = I − X2(X
′
2
X2)
−1
X
′
2
.
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Omisión de Variables Relevantes
Se puede demostrar que
V (β̂1|X1) ≤ V (β̂
∗
1 |X1,X2)
Por lo tanto, el omitir variables relevantes implica que los
parámetros estimados serán sesgados y que sus varianzas serán
menores.
También es posible demostrar que el estimador de la varianza de
los errores (σ̃2) es sesgado hacia arriba.
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Omisión de Variables Relevantes
La omisión de variables relevantes produce sesgo e
inconsistencia
Produce varianzas menores que las correctas
Gauss-markov no se cumple, por cuanto se ha violado el
supuesto 3 en el modelo corto (E (ũ|X ) = 0).
Es un problema serio y debemos tener precaución en
incorporar las variables relevantes del modelo.
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Ejemplo
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Omisión de Variables Relevantes
Suponga que un investigador quiere estimar el retorno a la
educación y que el modelo verdadero(obviamente es un caso
ilustrativo) está dado por:
Wi = β1Ei + β2EXPi + ui (1)
Donde Wi corresponde al logaritmo del salario del individuo i, Ei
corresponde a los años de educación del individuo i, EXPi
corresponde a los años de experiencia laboral del individuo i y ui
corresponde a un término de error bien comportado.
Sin embargo este investigador utiliza el siguiente modelo para su
estimación.
Wi = β1Ei + ui (2)
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Ejemplo
Los resultados del modelo verdadero son
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Ejemplo
Los resultados el modelo incorrecto
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Ejemplo
Podemos ver el parámetro que acompaña a la variable años de
educación es menor en el modelo estimado que en el modelo
verdadero.
Esta dirección del sesgo se puede explicar por el signo del
parámetro que acompaña a la variable experiencia en el
modelo verdadero y a la relación negativa existente entre
educación y experiencia en la muestra
Note que el error estándar del modelo incompleto es menor.
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Inclusión de Variable Irrelevantes
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Inclusión de Variable Irrelevantes
Considere ahora el siguiente modelo poblacional:
Y = X1β1 + u
Suponga ahora que el investigador se equivoca y estima el
siguiente modelo:
Y = X1β1 + X2β2 + u
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Inclusión de Variable Irrelevantes
Estimando el modelo “incorrecto” o “largo” obtenemos
β̂ = (X ′X )−1X ′Y (con X = [X1,X2]) y se puede extraer β̂1,
obteniéndose:
β̂1 = (X
′
1M2X1)
−1
X
′
1M2Y
= β1 + (X
′
1M2X1)
−1
X
′
1M2u
donde M2 se define igual que el la sección anterior. Entonces se
puede demostrar que:
E (β̂1) = β1
y también se puede demostrar que E (σ̃2) = σ2:
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Inclusión de Variable Irrelevantes
La inclusión de variable irrelevantes no causa sesgo en los
parámetros estimados, ni en la varianza de los errores
estimados.
Bajo dichos resultados, pareciera que es mejor poner muchos
regresores en nuestro modelo. Sin embargo, nos falta estudiar
que sucede con la varianza de los parámetros estimados.
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Inclusión de Variable Irrelevantes
Recordemos que en el modelo largo (incorrecto):
β̂1 = β1 + (X
′
1M2X1)
−1
X
′
1M2u
con lo cual, la varianza estimada:
V (β̂1|X1,X2) = σ
2(X ′1M2X1)
−1
mientras que la varianza verdadera:
V (β̂1
∗
|X1) = σ
2(X ′1X1)
−1
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Inclusión de Variable Irrelevantes
Entonces, como discutimos con anterioridad, la varianza del
modelo corto (verdadera en este caso) es menor que la
varianza estimada.
Ello implica que el incluir regresores adicionales, aumenta la
varianza de nuestros parámetros estimados, lo cual se traduce
en parámetros menos eficientes.
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Ejemplo
Suponga que un investigador quiere estimar el retorno a la
educación y que el modelo verdadero(obviamente es un caso
ilustrativo) está dado por:
Wi = β1 + β2Ei + ui (1)
Donde Wi corresponde al logaritmo del salario del individuo i, Ei
corresponde a los años de educación del individuo i y ui
corresponde a u término de error bien comportado.
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Ejemplo
Sin embargo este investigador utiliza el siguiente modelo para su
estimación.
Wi = β1 + β2Ei + β3Di + ui (1)
Donde Di corresponde a una variable dicotómica que toma el valor
1 si el individuo fuma y 0 si no fuma.
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Ejemplo
Los resultados del modelo verdadero son
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Ejemplo
Los resultados el modelo estimado son:
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Ejemplo
Podemos ver no existe una variación importante en los
parámetros del modelo estimado y el modelo verdadero.
Sin embargo, tal como discutimos, la varianza de los
parámetros aumenta disminuyendo entoncesla eficiencia.
Clase 16 Econometŕıa I
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes
Summing up
La omisión de variables relevantes sesga los parámetros. La
dirección del sesgo dependerá del signo del parámetro de la
variable omitida y de la covarianza de la variable omitida con
las otras variables del modelo. Además, los errores estándar
serán menores lo cual es perjudicial para la inferencia.
La inclusión de variable irrelevante no produce sesgo pero si
aumenta los errores estándar de los parámetros. Esto también
es perjudicial puesto que tenderemos a cometer error tipo II
con mayor probabilidad (no rechazar la nula cuando esta es
falsa)
Clase 16 Econometŕıa I
	Omisión de Variables Relevantes
	Impacto sobre el Insesgamiento
	Impacto sobre la Varianza
	Ejemplo
	Inclusión de Variable Irrelevantes
	Impacto sobre Insesgamiento
	Impacto sobre Varianza
	Ejemplo

Continuar navegando