Logo Studenta

Ayudantia2_2005_1

Vista previa del material en texto

Pontificia Universidad Católica de Chile
Instituto de Economía
Primer Semestre de 2005
Econometría de Datos de Panel
Ayudantía 2: Solución de la Tarea 1
1. Usted tiene un panel con observaciones sobre gasto en vestimenta (Yit)
de personas solteras. Además usted tiene los datos sobre ingreso de estas
personas (Xit). Tal como lo indican los subíndices de estas variables, usted
tienen observaciones a través del personas y a través del tiempo. Usted
desea estimar y en el siguiente modelo:
Yit = Xitβ + γSi + uit t = 1, 2, ..., T i = 1, 2, ..., I
uit = µi + vit vit ∼ iid(0, σ2v)
donde Si = 1 si la persona es mujer y cero si es hombre. Usted está
particularmente interesado en saber si las mujeres solteras gastan más en
ropa que los hombres solteros.
a) Discuta un procedimiento de dos etapas que le permita obtener esti-
madores consistentes de γ .
b) ¿Es eficiente este procedimiento? ¿Bajo qué condiciones existen esti-
madores más eficientes de γ ? En ese caso, ¿Cuál es el estimador más
eficiente? ¿Cómo elige entre los estimadores surgidos de la primera
parte de la pregunta vs este segundo tipo de estimadores?
Solución
a) Si estimamos Yit = Xitβ + γSi + uit con OLS el bβOLS es sesgado
e inconsistente a menos que E [uit |Xit, Si ] = 0 = E [u |X,S ] (la
primera igualdad daría la consistencia y la segunda la insesgadez).
Entonces puede usarse el procedimiento en dos etapas
Primera etapa: Within regression
Corremos la regresión transformada:
QY = QXβ +QSγ +QZµµ+Qv
es claro que QZµ = 0. Pero también QS = (I−P )S = S−PS = S−
S = 0 (es un efecto individual). Osea que el elemento representativo
de la regresión que se corre es:
(yit − yi·) = (xit − xi·)β + (vit − vi·)
bβW es estimador consistente β ya que E [(vit − vi·) |(xit − xi·) ] =
E [vit] = 0, e insesgado porque los vit distribuyen independientemente.
Falta un estimador para γ.
1
Segunda etapa: Between regression
La regresión es:
Z ≡ PY − PXbβW = PSγ + PZµµ+ Pv
cuyo elemento representativo es:
zi ≡ yi· − xi·bβW = Siγ + ei
(se construye la serie z) donde ei = µi + vi·. En este caso bγB es
estimador consistente de γ si ocurre E [ei |Si ] = E [µi + vi· |Si ] =
E [µi |Si ] = 0. Si esto se cumple y bγ es positivo y significativo no
rechazamos la hipótesis nula de que las mujeres gastan más en ropa
que los hombres.
b) GLS es consistente y el más eficiente. La consistencia necesita de
E [µi |Xit, Si ] = 0, i.e. E [µiXit] = 0 y E [µiSi] = 0. Si la primera de
esta condiciones no se cumple, no importa porque la endogeneidad
se elimina con la transformación within. Pero si no se cumple la
segunda (regresor endógeno), no obtendríamos consistencia y hablar
de eficiencia no tendría sentido.
El test de Hausman permite descartar el estimador GLS por presunta
incosistecncia (no nos dice si el estimador within es el mejor esti-
mador o no). Partiendo de que bβW es siempre consistente (cuando
E [(vit − vi·) |(xit − xi·) ] = 0, ya que se eliminan los efectos fijos),
este test evalúa la significancia estadística de la discrepancia eq1 =bβGLS − bβW . Si no se puede rechazar que eq1 es significativamente
distinto de 0, no puede rechazarse la hipótesis de que bβGLS es con-
sistente.
2. Considere el siguiente modelo lineal de datos de panel:
yit = α+ βxit + uit
donde α y β son escalares.
a) Ocupando la siguiente transformación:
ex = NX
i=1
TX
t=1
xit
NT
Reescriba el modelo en desviaciones de medias totales de la siguiente
forma:
yit − ey = β1 (xit − exi) + β2 (exi − ex) + (uit − eu) (1)
donde exi = TP
t=1
xit
T .[Ayuda: es más fácil obtener los resultados si
trabaja con productos Kroenecker].
2
b) Obtenga los estimadores β1 y β2. ¿ A qué estimadores ampliamente
conocidos por usted, se parecen estos estimadores?
c) Asuma que
uit = µi + vit
µi ∼ iid(0, σ2µ) vit ∼ iid(0, σ2v)
y que son independientes. ¿Qué se obtiene de estimar el modelo de
la parte a) por OLS versus GLS?
Solución
a) Definimos:
G ≡ (IN ⊗ IT )− (IN ⊗ JT )− (JN ⊗ IT ) + (JN ⊗ JT )
de la cual el primer elemento mantiene los niveles, el segundo obtiene
los promedios individuales, el tercero los promedios temporales (para
cada t sobre todos los individuos) y el último los promedios de los
promedios (los promedios promedio). Entonces el vector Gy como
elemento representativo:
ygit ≡ yit − eyi − eyt + ey
la composición de cada uno de los elementos es:
yit = α+ βxit + µi + viteyi = α+ βexi + µi + evieyt = α+ βext + eµ+ evtey = α+ βex+ eµ+ ev
donde eµ = NP
i=1
µi
N y (ev, evi, evt) se definen como se hizo con x. Reem-
plazando en la definición de ygit :
ygit ≡ (βxit − βexi − βext + βex) + (vit − evi − evt + ev)
luego
yit − ey ≡ ygit + eyi + eyt − 2ey
yit − ey = (βxit − βexi − βext + βex) + (vit − evi − evt + ev) + α+ βexi + µi + evi
+α+ βext + eµ+ evt − 2(α+ βex+ eµ+ ev)
= (βxit − βex) + (µi − eµ) + (vit − ev)
= β (xit − ex) + (uit − eu)
Sumando y restando βexi :
yit − ey ≡ β1 (xit − exi) + β2 (exi − ex) + (uit − eu) (2)
3
£
(IN ⊗ IT )− (JN ⊗ JT )
¤
y = β1
£
(IN ⊗ IT )− (IN ⊗ JT )
¤
x+
β2
£
(IN ⊗ JT )− (JN ⊗ JT )
¤
x+£
(IN ⊗ IT )− (JN ⊗ JT )
¤
u
Noten que estamos imponiendo β1 = β2 = β.
b) Los términos (xit − exi) y (exi − ex) tienen que ser ortogonales!!! Note-
mos que se forman a partir de las expresiones
£
(IN ⊗ IT )− (IN ⊗ JT )
¤
x =
Qx y
£
(IN ⊗ JT )− (JN ⊗ JT )
¤
x. Entonces, cuando se estiman los be-
tas de 2 (conjuntamente) el término de interacción entre ambos betas
debe ser cero. Este término es:
Término de interacción =
£
(IN ⊗ IT )− (IN ⊗ JT )
¤́ £
(IN ⊗ JT )− (JN ⊗ JT )
¤
= (IN ⊗ IT )(IN ⊗ JT )− (IN ⊗ IT )(JN ⊗ JT )−
(IN ⊗ JT )(IN ⊗ JT ) + (IN ⊗ JT )(JN ⊗ JT )
= (IN ⊗ JT )− (JN ⊗ JT )− (IN ⊗ JT ) + (JN ⊗ JT )
= 0
En consecuencia, estimar los betas por separado es equivalente a
hacerlo conjuntamente. Así:
bβ1 = x́ £(IN ⊗ IT )− (IN ⊗ JT )¤́ £(IN ⊗ IT )− (JN ⊗ JT )¤ yx́Q́Qx
=
x́
£
(IN ⊗ IT )(IN ⊗ IT )− (IN ⊗ IT )(JN ⊗ JT )
¤
y
x́Qx
−
x́
£
(IN ⊗ JT )(IN ⊗ IT )− (IN ⊗ JT )(JN ⊗ JT )
¤
y
x́Qx
=
x́
£
(IN ⊗ IT )− (JN ⊗ JT )− (IN ⊗ JT ) + (JN ⊗ JT )
¤
y
x́Qx
=
x́
£
(IN ⊗ IT )− (IN ⊗ JT )
¤
y
x́Qx
=
x́Qy
x́Qx
= bβW
Si se piensa en la regresión 2, entonces es claro que:
bβ1 =
NP
i=1
TP
t=1
(xit − exi) (yit − ey)
(xit − exi)2
4
En cuanto a bβ2 :
bβ2 = x́ £(IN ⊗ JT )− (JN ⊗ JT )¤́ £(IN ⊗ IT )− (JN ⊗ JT )¤ y
x́
£
(IN ⊗ JT )− (JN ⊗ JT )
¤́ £
(IN ⊗ JT )− (JN ⊗ JT )
¤
x
=
x́
£
(IN ⊗ JT )(IN ⊗ IT )− (IN ⊗ JT )(JN ⊗ JT )− (JN ⊗ JT )(IN ⊗ IT ) + (JN ⊗ JT )(JN ⊗ JT
x́
£
(IN ⊗ JT )(IN ⊗ JT )− (IN ⊗ JT )(JN ⊗ JT )− (JN ⊗ JT )(IN ⊗ JT ) + (JN ⊗ JT )(JN ⊗ J
=
x́
£
(IN ⊗ JT )− (JN ⊗ JT )− (JN ⊗ JT ) + (JN ⊗ JT )
¤
y
x́
£
(IN ⊗ JT )− (JN ⊗ JT )− (JN ⊗ JT ) + (JN ⊗ JT )
¤
x
=
x́
£
(IN ⊗ JT )− (JN ⊗ JT )
¤
y
x́
£
(IN ⊗ JT )− (JN ⊗ JT )
¤
x
c) Si se cumple E [xitµi] = E [xµ] = 0, se obtienen estimadores insesgados
y consistentes, pero ineficientes (se está asumiendo que la matriz de
varianzas y covarianzas es la identidad, cuando en realidad no lo es).
3. Suponga un modelo con un única variable explicativa, x∗it, como el sigu-
iente:
yit = α+ βx
∗
it + uit t = 1, 2, ..., T i = 1, 2, ...,N (3)
uit = µi + vit
Lamentablemente la variable x∗it está medida con error:
xit + x
∗
it = ηit
donde µi ∼ iid(0, σ2µ), vit ∼ iid(0, σ2v) y ηit ∼ iid(0, σ2η), todas independi-
entes unas de las otras. Además x∗it es independiente de (vit,ηit).
a) Suponga usted está evaluando estimar por pooled OLS. ¿Consistente
este estimador? Demuestre su respuesta.
b) Alternativamente alguien le sugiere estimar este modelo por dos méto-
dos distintos:
(1) estimador within
(2) estimador de primeras diferencias de los datos (First diferences. Tomar
las primeras diferencias de sus datos y correr la regresión por OLS).
¿Cuál prefiere? ¿Por qué? Derive los estimadores y explique.
Solución [vean también Baltagi p.183 y Griliches & Hausman
86 (en NBER)]
Para que sea más fácil redefinamos el ejercicio poniéndole otros nom-
bres a las variables. El modelo verdadero es:
yit = α+ βxit + uit t = 1, 2, ..., T i = 1, 2, ...,N (4)
uit = µi + vit
5
Pero xit estámedida con error, tal que en vez de observarla directa-
mente, vemos zit definida como:
zit = xit + ηit
de tal manera que el modelo verdadero expresado en términos de la
variable observada es:
yit = α+ βzit + uit − βηit = α+ βzit + eit (5)
donde eit ≡ µi + vit − βηit.
a) Si estimamos 5 por OLS el estimador de β es:
bβOLS = (źz)−1 (źy)
Para evaluar su consistencia buscamos el límite de probabilidad ha-
ciendo a N tender al infinito (para dejar a T constante):
p lim bβOLS = p lim (źz)−1 (ź (βz + e))
= β + p lim (źz)
−1
(źe)
= β + p lim (źz)−1 (ź (µ+ v − βη))
Hay dos fuentes de sesgo asintótico:
i) La correlación entre z y µ (efectos individuales)
ii) La correlación entre z y η (por definición)
Estos efectos hacen pensar que p lim (źz)−1 (ź (µ+ v − βη)) 6= 0, es decir,bβOLS es inconsitente.
b) Estimador within
Se obtiene de:
yit − yi· = β (zit − zi·) + (eit − ei·) (6)
Digamos: eyit = βezit + eeit (7)
tal que bβW = eźeyeźez
Para evaluar la consistencia:
p lim bβW = p lim (eźez)−1 (eźey) = p lim (eźez)−1 (eź (βez + ee))
= β + p lim (eźez)−1 (eźee)
p lim bβW − β = p limµ eźez
NT
¶−1
p lim
µ eźee
NT
¶
6
donde (eźee) = (zit − zi·) (eit − ei·) = (zit − zi·) (vit − vi· − βηit + βηi·) .
O sea, la primera fuente de correlación del estimador OLS desaparece,
pero persiste la segunda (correlación entre z y η). Para encontrar el
sesgo asintótico veamos:
E [(zit − zi·) (eit − ei·)] = E [(zit − zi·) (vit − vi· − βηit + βηi·)]
= E [(xit + ηit − xit − ηi·) (vit − βηit − vi· + βηi·)]
= −βE £η2it¤+ 2βE [ηitηi·]− βE £η2i·¤
= −βσ2η + 2βE
"
ηit
X
t
1
T
ηit
#
− βE
"X
t
1
T 2
η2it
#
= −βσ2η + 2β
1
T
σ2η −
1
T
βσ2η
= −βσ2η +
1
T
βσ2η
= β(
T − 1
T
)σ2η
Como usualmente, suponemos p limN→∞
¡ eźez
NT
¢−1
= V AR (ez)−1 =eQ−1.Luego:
p lim bβW = β(1− T − 1
T
σ2η eQ−1)
Estimador first differences
Se obtiene de:
yit − yit−1 = β (zit − zit−1) + (eit − eit−1) (8)
dyit = βdzit + deit (9)
Luego: bβFD = dźdy
dźdz
Para evaluar la consistencia:
p lim bβFD = p lim (dźdz)−1 (dźdy) = p lim (dźdz)−1 (dź (βdz + de))
= β + p lim (dźdz)
−1
(dźde)
p lim bβW − β = p limµdźdz
NT
¶−1
p lim
µ
dźde
NT
¶
Notemos que:
E [dzitdeit] = E [(zit − zit−1) (eit − eit−1)]
= E
£¡
xit + ηit − zit−1 − ηit−1
¢ ¡
vit − βηit − vit−1 + βηit−1
¢¤
= −βE £η2it¤+ 2βE £ηitηit−1¤− βE £η2it−1¤
= −2βσ2η
7
y supongamos que p lim
¡
dźdz
NT
¢−1
= Q−1d .Entonces
p lim bβFD = β(1− 2σ2ηQ−1d )
Entonces cuál estimador deberíamos preferir depende de
2Q−1d ≷
T − 1
T
eQ−1
cuyo resultado es crítico en el valor de T.
8

Otros materiales

Materiales relacionados

24 pag.
Apuntes Econometría

User badge image

Central de Apuntes

59 pag.
Capitulo5Final

User badge image

Apuntes Generales

48 pag.