Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Pontificia Universidad Católica de Chile Instituto de Economía Primer Semestre de 2005 Econometría de Datos de Panel Ayudantía 2: Solución de la Tarea 1 1. Usted tiene un panel con observaciones sobre gasto en vestimenta (Yit) de personas solteras. Además usted tiene los datos sobre ingreso de estas personas (Xit). Tal como lo indican los subíndices de estas variables, usted tienen observaciones a través del personas y a través del tiempo. Usted desea estimar y en el siguiente modelo: Yit = Xitβ + γSi + uit t = 1, 2, ..., T i = 1, 2, ..., I uit = µi + vit vit ∼ iid(0, σ2v) donde Si = 1 si la persona es mujer y cero si es hombre. Usted está particularmente interesado en saber si las mujeres solteras gastan más en ropa que los hombres solteros. a) Discuta un procedimiento de dos etapas que le permita obtener esti- madores consistentes de γ . b) ¿Es eficiente este procedimiento? ¿Bajo qué condiciones existen esti- madores más eficientes de γ ? En ese caso, ¿Cuál es el estimador más eficiente? ¿Cómo elige entre los estimadores surgidos de la primera parte de la pregunta vs este segundo tipo de estimadores? Solución a) Si estimamos Yit = Xitβ + γSi + uit con OLS el bβOLS es sesgado e inconsistente a menos que E [uit |Xit, Si ] = 0 = E [u |X,S ] (la primera igualdad daría la consistencia y la segunda la insesgadez). Entonces puede usarse el procedimiento en dos etapas Primera etapa: Within regression Corremos la regresión transformada: QY = QXβ +QSγ +QZµµ+Qv es claro que QZµ = 0. Pero también QS = (I−P )S = S−PS = S− S = 0 (es un efecto individual). Osea que el elemento representativo de la regresión que se corre es: (yit − yi·) = (xit − xi·)β + (vit − vi·) bβW es estimador consistente β ya que E [(vit − vi·) |(xit − xi·) ] = E [vit] = 0, e insesgado porque los vit distribuyen independientemente. Falta un estimador para γ. 1 Segunda etapa: Between regression La regresión es: Z ≡ PY − PXbβW = PSγ + PZµµ+ Pv cuyo elemento representativo es: zi ≡ yi· − xi·bβW = Siγ + ei (se construye la serie z) donde ei = µi + vi·. En este caso bγB es estimador consistente de γ si ocurre E [ei |Si ] = E [µi + vi· |Si ] = E [µi |Si ] = 0. Si esto se cumple y bγ es positivo y significativo no rechazamos la hipótesis nula de que las mujeres gastan más en ropa que los hombres. b) GLS es consistente y el más eficiente. La consistencia necesita de E [µi |Xit, Si ] = 0, i.e. E [µiXit] = 0 y E [µiSi] = 0. Si la primera de esta condiciones no se cumple, no importa porque la endogeneidad se elimina con la transformación within. Pero si no se cumple la segunda (regresor endógeno), no obtendríamos consistencia y hablar de eficiencia no tendría sentido. El test de Hausman permite descartar el estimador GLS por presunta incosistecncia (no nos dice si el estimador within es el mejor esti- mador o no). Partiendo de que bβW es siempre consistente (cuando E [(vit − vi·) |(xit − xi·) ] = 0, ya que se eliminan los efectos fijos), este test evalúa la significancia estadística de la discrepancia eq1 =bβGLS − bβW . Si no se puede rechazar que eq1 es significativamente distinto de 0, no puede rechazarse la hipótesis de que bβGLS es con- sistente. 2. Considere el siguiente modelo lineal de datos de panel: yit = α+ βxit + uit donde α y β son escalares. a) Ocupando la siguiente transformación: ex = NX i=1 TX t=1 xit NT Reescriba el modelo en desviaciones de medias totales de la siguiente forma: yit − ey = β1 (xit − exi) + β2 (exi − ex) + (uit − eu) (1) donde exi = TP t=1 xit T .[Ayuda: es más fácil obtener los resultados si trabaja con productos Kroenecker]. 2 b) Obtenga los estimadores β1 y β2. ¿ A qué estimadores ampliamente conocidos por usted, se parecen estos estimadores? c) Asuma que uit = µi + vit µi ∼ iid(0, σ2µ) vit ∼ iid(0, σ2v) y que son independientes. ¿Qué se obtiene de estimar el modelo de la parte a) por OLS versus GLS? Solución a) Definimos: G ≡ (IN ⊗ IT )− (IN ⊗ JT )− (JN ⊗ IT ) + (JN ⊗ JT ) de la cual el primer elemento mantiene los niveles, el segundo obtiene los promedios individuales, el tercero los promedios temporales (para cada t sobre todos los individuos) y el último los promedios de los promedios (los promedios promedio). Entonces el vector Gy como elemento representativo: ygit ≡ yit − eyi − eyt + ey la composición de cada uno de los elementos es: yit = α+ βxit + µi + viteyi = α+ βexi + µi + evieyt = α+ βext + eµ+ evtey = α+ βex+ eµ+ ev donde eµ = NP i=1 µi N y (ev, evi, evt) se definen como se hizo con x. Reem- plazando en la definición de ygit : ygit ≡ (βxit − βexi − βext + βex) + (vit − evi − evt + ev) luego yit − ey ≡ ygit + eyi + eyt − 2ey yit − ey = (βxit − βexi − βext + βex) + (vit − evi − evt + ev) + α+ βexi + µi + evi +α+ βext + eµ+ evt − 2(α+ βex+ eµ+ ev) = (βxit − βex) + (µi − eµ) + (vit − ev) = β (xit − ex) + (uit − eu) Sumando y restando βexi : yit − ey ≡ β1 (xit − exi) + β2 (exi − ex) + (uit − eu) (2) 3 £ (IN ⊗ IT )− (JN ⊗ JT ) ¤ y = β1 £ (IN ⊗ IT )− (IN ⊗ JT ) ¤ x+ β2 £ (IN ⊗ JT )− (JN ⊗ JT ) ¤ x+£ (IN ⊗ IT )− (JN ⊗ JT ) ¤ u Noten que estamos imponiendo β1 = β2 = β. b) Los términos (xit − exi) y (exi − ex) tienen que ser ortogonales!!! Note- mos que se forman a partir de las expresiones £ (IN ⊗ IT )− (IN ⊗ JT ) ¤ x = Qx y £ (IN ⊗ JT )− (JN ⊗ JT ) ¤ x. Entonces, cuando se estiman los be- tas de 2 (conjuntamente) el término de interacción entre ambos betas debe ser cero. Este término es: Término de interacción = £ (IN ⊗ IT )− (IN ⊗ JT ) ¤́ £ (IN ⊗ JT )− (JN ⊗ JT ) ¤ = (IN ⊗ IT )(IN ⊗ JT )− (IN ⊗ IT )(JN ⊗ JT )− (IN ⊗ JT )(IN ⊗ JT ) + (IN ⊗ JT )(JN ⊗ JT ) = (IN ⊗ JT )− (JN ⊗ JT )− (IN ⊗ JT ) + (JN ⊗ JT ) = 0 En consecuencia, estimar los betas por separado es equivalente a hacerlo conjuntamente. Así: bβ1 = x́ £(IN ⊗ IT )− (IN ⊗ JT )¤́ £(IN ⊗ IT )− (JN ⊗ JT )¤ yx́Q́Qx = x́ £ (IN ⊗ IT )(IN ⊗ IT )− (IN ⊗ IT )(JN ⊗ JT ) ¤ y x́Qx − x́ £ (IN ⊗ JT )(IN ⊗ IT )− (IN ⊗ JT )(JN ⊗ JT ) ¤ y x́Qx = x́ £ (IN ⊗ IT )− (JN ⊗ JT )− (IN ⊗ JT ) + (JN ⊗ JT ) ¤ y x́Qx = x́ £ (IN ⊗ IT )− (IN ⊗ JT ) ¤ y x́Qx = x́Qy x́Qx = bβW Si se piensa en la regresión 2, entonces es claro que: bβ1 = NP i=1 TP t=1 (xit − exi) (yit − ey) (xit − exi)2 4 En cuanto a bβ2 : bβ2 = x́ £(IN ⊗ JT )− (JN ⊗ JT )¤́ £(IN ⊗ IT )− (JN ⊗ JT )¤ y x́ £ (IN ⊗ JT )− (JN ⊗ JT ) ¤́ £ (IN ⊗ JT )− (JN ⊗ JT ) ¤ x = x́ £ (IN ⊗ JT )(IN ⊗ IT )− (IN ⊗ JT )(JN ⊗ JT )− (JN ⊗ JT )(IN ⊗ IT ) + (JN ⊗ JT )(JN ⊗ JT x́ £ (IN ⊗ JT )(IN ⊗ JT )− (IN ⊗ JT )(JN ⊗ JT )− (JN ⊗ JT )(IN ⊗ JT ) + (JN ⊗ JT )(JN ⊗ J = x́ £ (IN ⊗ JT )− (JN ⊗ JT )− (JN ⊗ JT ) + (JN ⊗ JT ) ¤ y x́ £ (IN ⊗ JT )− (JN ⊗ JT )− (JN ⊗ JT ) + (JN ⊗ JT ) ¤ x = x́ £ (IN ⊗ JT )− (JN ⊗ JT ) ¤ y x́ £ (IN ⊗ JT )− (JN ⊗ JT ) ¤ x c) Si se cumple E [xitµi] = E [xµ] = 0, se obtienen estimadores insesgados y consistentes, pero ineficientes (se está asumiendo que la matriz de varianzas y covarianzas es la identidad, cuando en realidad no lo es). 3. Suponga un modelo con un única variable explicativa, x∗it, como el sigu- iente: yit = α+ βx ∗ it + uit t = 1, 2, ..., T i = 1, 2, ...,N (3) uit = µi + vit Lamentablemente la variable x∗it está medida con error: xit + x ∗ it = ηit donde µi ∼ iid(0, σ2µ), vit ∼ iid(0, σ2v) y ηit ∼ iid(0, σ2η), todas independi- entes unas de las otras. Además x∗it es independiente de (vit,ηit). a) Suponga usted está evaluando estimar por pooled OLS. ¿Consistente este estimador? Demuestre su respuesta. b) Alternativamente alguien le sugiere estimar este modelo por dos méto- dos distintos: (1) estimador within (2) estimador de primeras diferencias de los datos (First diferences. Tomar las primeras diferencias de sus datos y correr la regresión por OLS). ¿Cuál prefiere? ¿Por qué? Derive los estimadores y explique. Solución [vean también Baltagi p.183 y Griliches & Hausman 86 (en NBER)] Para que sea más fácil redefinamos el ejercicio poniéndole otros nom- bres a las variables. El modelo verdadero es: yit = α+ βxit + uit t = 1, 2, ..., T i = 1, 2, ...,N (4) uit = µi + vit 5 Pero xit estámedida con error, tal que en vez de observarla directa- mente, vemos zit definida como: zit = xit + ηit de tal manera que el modelo verdadero expresado en términos de la variable observada es: yit = α+ βzit + uit − βηit = α+ βzit + eit (5) donde eit ≡ µi + vit − βηit. a) Si estimamos 5 por OLS el estimador de β es: bβOLS = (źz)−1 (źy) Para evaluar su consistencia buscamos el límite de probabilidad ha- ciendo a N tender al infinito (para dejar a T constante): p lim bβOLS = p lim (źz)−1 (ź (βz + e)) = β + p lim (źz) −1 (źe) = β + p lim (źz)−1 (ź (µ+ v − βη)) Hay dos fuentes de sesgo asintótico: i) La correlación entre z y µ (efectos individuales) ii) La correlación entre z y η (por definición) Estos efectos hacen pensar que p lim (źz)−1 (ź (µ+ v − βη)) 6= 0, es decir,bβOLS es inconsitente. b) Estimador within Se obtiene de: yit − yi· = β (zit − zi·) + (eit − ei·) (6) Digamos: eyit = βezit + eeit (7) tal que bβW = eźeyeźez Para evaluar la consistencia: p lim bβW = p lim (eźez)−1 (eźey) = p lim (eźez)−1 (eź (βez + ee)) = β + p lim (eźez)−1 (eźee) p lim bβW − β = p limµ eźez NT ¶−1 p lim µ eźee NT ¶ 6 donde (eźee) = (zit − zi·) (eit − ei·) = (zit − zi·) (vit − vi· − βηit + βηi·) . O sea, la primera fuente de correlación del estimador OLS desaparece, pero persiste la segunda (correlación entre z y η). Para encontrar el sesgo asintótico veamos: E [(zit − zi·) (eit − ei·)] = E [(zit − zi·) (vit − vi· − βηit + βηi·)] = E [(xit + ηit − xit − ηi·) (vit − βηit − vi· + βηi·)] = −βE £η2it¤+ 2βE [ηitηi·]− βE £η2i·¤ = −βσ2η + 2βE " ηit X t 1 T ηit # − βE "X t 1 T 2 η2it # = −βσ2η + 2β 1 T σ2η − 1 T βσ2η = −βσ2η + 1 T βσ2η = β( T − 1 T )σ2η Como usualmente, suponemos p limN→∞ ¡ eźez NT ¢−1 = V AR (ez)−1 =eQ−1.Luego: p lim bβW = β(1− T − 1 T σ2η eQ−1) Estimador first differences Se obtiene de: yit − yit−1 = β (zit − zit−1) + (eit − eit−1) (8) dyit = βdzit + deit (9) Luego: bβFD = dźdy dźdz Para evaluar la consistencia: p lim bβFD = p lim (dźdz)−1 (dźdy) = p lim (dźdz)−1 (dź (βdz + de)) = β + p lim (dźdz) −1 (dźde) p lim bβW − β = p limµdźdz NT ¶−1 p lim µ dźde NT ¶ Notemos que: E [dzitdeit] = E [(zit − zit−1) (eit − eit−1)] = E £¡ xit + ηit − zit−1 − ηit−1 ¢ ¡ vit − βηit − vit−1 + βηit−1 ¢¤ = −βE £η2it¤+ 2βE £ηitηit−1¤− βE £η2it−1¤ = −2βσ2η 7 y supongamos que p lim ¡ dźdz NT ¢−1 = Q−1d .Entonces p lim bβFD = β(1− 2σ2ηQ−1d ) Entonces cuál estimador deberíamos preferir depende de 2Q−1d ≷ T − 1 T eQ−1 cuyo resultado es crítico en el valor de T. 8
Compartir