Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Clase 16 Econometŕıa I Tomás Rau Binder 10 de octubre Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Contenidos Omisión de Variables Relevantes Impacto sobre el Insesgamiento Impacto sobre la Varianza Ejemplo Inclusión de Variable Irrelevantes Impacto sobre Insesgamiento Impacto sobre Varianza Ejemplo Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Omisión de Variables Relevantes Sea el siguiente modelo poblacional: Y = X1β1 + X2β2 + u Suponga ahora que el investigador se equivoca (o no tiene X2) y estima el siguiente modelo: Y = X1β1 + ũ El estimador MCO de β1 en el modelo incompleto es en general sesgado: E (β̂1) = E [(X ′ 1X1) −1 X ′ 1Y ] = β1 + E [(X ′ 1X1) −1 X ′ 1X2]β2 = β1 + Zβ2 donde Z = E [(X ′ 1 X1) −1 X ′ 1 X2]. También es inconsistente. Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Omisión de Variables Relevantes Note que en dos ocacaciones no habrá sesgo: Si X ′ 1 X2 = 0, es decir cuando X1 es ortogonal a X2 Cuando β2 = 0, es decir cuando X2 es una variable irrelevante que no pertenece al modelo. Para el caso de consistencia, se puede demostrar que cuando X1 y X2 son escalares plimβ̂1 = β1 + Cov(X1,X2) V (X1) β2 De lo anterior, se desprende que la dirección del sesgo depende de como covarien las variables incluidas con respecto a las excluidas y del signo del parámetro omitido. Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Omisión de Variables Relevantes Impacto sobre la Varianza Estimando el modelo “incompleto”, el estimador de la varianza será: V (β̂1|X1) = σ 2(X ′1X1) −1 mientras que si hubiéramos estimado el modelo correcto, se puede demostrar que la varianza del estimador insesgado de β1 (β̂ ∗ 1 ) correspondeŕıa a: V (β̂∗1 |X1,X2) = σ 2(X ′1M2X1) −1 donde M2 = I − X2(X ′ 2 X2) −1 X ′ 2 . Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Omisión de Variables Relevantes Se puede demostrar que V (β̂1|X1) ≤ V (β̂ ∗ 1 |X1,X2) Por lo tanto, el omitir variables relevantes implica que los parámetros estimados serán sesgados y que sus varianzas serán menores. También es posible demostrar que el estimador de la varianza de los errores (σ̃2) es sesgado hacia arriba. Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Omisión de Variables Relevantes La omisión de variables relevantes produce sesgo e inconsistencia Produce varianzas menores que las correctas Gauss-markov no se cumple, por cuanto se ha violado el supuesto 3 en el modelo corto (E (ũ|X ) = 0). Es un problema serio y debemos tener precaución en incorporar las variables relevantes del modelo. Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Ejemplo Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Omisión de Variables Relevantes Suponga que un investigador quiere estimar el retorno a la educación y que el modelo verdadero(obviamente es un caso ilustrativo) está dado por: Wi = β1Ei + β2EXPi + ui (1) Donde Wi corresponde al logaritmo del salario del individuo i, Ei corresponde a los años de educación del individuo i, EXPi corresponde a los años de experiencia laboral del individuo i y ui corresponde a un término de error bien comportado. Sin embargo este investigador utiliza el siguiente modelo para su estimación. Wi = β1Ei + ui (2) Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Ejemplo Los resultados del modelo verdadero son Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Ejemplo Los resultados el modelo incorrecto Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Ejemplo Podemos ver el parámetro que acompaña a la variable años de educación es menor en el modelo estimado que en el modelo verdadero. Esta dirección del sesgo se puede explicar por el signo del parámetro que acompaña a la variable experiencia en el modelo verdadero y a la relación negativa existente entre educación y experiencia en la muestra Note que el error estándar del modelo incompleto es menor. Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Inclusión de Variable Irrelevantes Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Inclusión de Variable Irrelevantes Considere ahora el siguiente modelo poblacional: Y = X1β1 + u Suponga ahora que el investigador se equivoca y estima el siguiente modelo: Y = X1β1 + X2β2 + u Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Inclusión de Variable Irrelevantes Estimando el modelo “incorrecto” o “largo” obtenemos β̂ = (X ′X )−1X ′Y (con X = [X1,X2]) y se puede extraer β̂1, obteniéndose: β̂1 = (X ′ 1M2X1) −1 X ′ 1M2Y = β1 + (X ′ 1M2X1) −1 X ′ 1M2u donde M2 se define igual que el la sección anterior. Entonces se puede demostrar que: E (β̂1) = β1 y también se puede demostrar que E (σ̃2) = σ2: Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Inclusión de Variable Irrelevantes La inclusión de variable irrelevantes no causa sesgo en los parámetros estimados, ni en la varianza de los errores estimados. Bajo dichos resultados, pareciera que es mejor poner muchos regresores en nuestro modelo. Sin embargo, nos falta estudiar que sucede con la varianza de los parámetros estimados. Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Inclusión de Variable Irrelevantes Recordemos que en el modelo largo (incorrecto): β̂1 = β1 + (X ′ 1M2X1) −1 X ′ 1M2u con lo cual, la varianza estimada: V (β̂1|X1,X2) = σ 2(X ′1M2X1) −1 mientras que la varianza verdadera: V (β̂1 ∗ |X1) = σ 2(X ′1X1) −1 Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Inclusión de Variable Irrelevantes Entonces, como discutimos con anterioridad, la varianza del modelo corto (verdadera en este caso) es menor que la varianza estimada. Ello implica que el incluir regresores adicionales, aumenta la varianza de nuestros parámetros estimados, lo cual se traduce en parámetros menos eficientes. Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Ejemplo Suponga que un investigador quiere estimar el retorno a la educación y que el modelo verdadero(obviamente es un caso ilustrativo) está dado por: Wi = β1 + β2Ei + ui (1) Donde Wi corresponde al logaritmo del salario del individuo i, Ei corresponde a los años de educación del individuo i y ui corresponde a u término de error bien comportado. Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Ejemplo Sin embargo este investigador utiliza el siguiente modelo para su estimación. Wi = β1 + β2Ei + β3Di + ui (1) Donde Di corresponde a una variable dicotómica que toma el valor 1 si el individuo fuma y 0 si no fuma. Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Ejemplo Los resultados del modelo verdadero son Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Ejemplo Los resultados el modelo estimado son: Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Ejemplo Podemos ver no existe una variación importante en los parámetros del modelo estimado y el modelo verdadero. Sin embargo, tal como discutimos, la varianza de los parámetros aumenta disminuyendo entoncesla eficiencia. Clase 16 Econometŕıa I Omisión de Variables Relevantes Inclusión de Variable Irrelevantes Summing up La omisión de variables relevantes sesga los parámetros. La dirección del sesgo dependerá del signo del parámetro de la variable omitida y de la covarianza de la variable omitida con las otras variables del modelo. Además, los errores estándar serán menores lo cual es perjudicial para la inferencia. La inclusión de variable irrelevante no produce sesgo pero si aumenta los errores estándar de los parámetros. Esto también es perjudicial puesto que tenderemos a cometer error tipo II con mayor probabilidad (no rechazar la nula cuando esta es falsa) Clase 16 Econometŕıa I Omisión de Variables Relevantes Impacto sobre el Insesgamiento Impacto sobre la Varianza Ejemplo Inclusión de Variable Irrelevantes Impacto sobre Insesgamiento Impacto sobre Varianza Ejemplo
Compartir