Logo Studenta

1S 2017

¡Este material tiene más páginas!

Vista previa del material en texto

Econometŕıa
Examen - con Pauta
Profesor: Pilar Alcalde, Universidad de los Andes
Fecha: 28 Junio 2017
Ojo que esta pauta es una referencia, algunas respuestas pueden variar en la redacción, pero lo importante
es que los conceptos estén claros.
1 Preguntas Cortas (50 pts)
Responda las siguientes preguntas. Cada pregunta debe ser respondida en un máximo de 10 ĺıneas, respuestas
adicionales no serán consideradas - piense antes de escribir. (5 pts cada una).
1. Cometer un error tipo I siempre es más grave que cometer un error tipo II, por las consecuencias que
cada error tiene en la estimación. De hecho, en un test de Box-Cox de que Y debe ir especificado
en logaritmos es más grave cometer un error tipo I que un error tipo II, al igual que en un test de
significancia conjunta. Comente si es verdadero o falso y justifique.
R. Falso (0.5 pt), cada error tiene consecuencias distintas dependiendo del test que se trate, y por
lo tanto no hay uno siempre más grave que otro (0.5 pt). En el test de Box-Cox que aparece en el
enunciado, el error tipo I corresponde a especificar Y en niveles cuando debiera ir en logaritmos (0.5
pt) y el error tipo II corresponde a especificar Y en logaritmos cuando debiera ir en niveles (0.5), ambos
son igual de graves porque ambos hacen que se rompa el supuesto de media condicional nula y generan
sesgo en la estimación (1 pt). En cambio, en el test de significacia conjunta el error tipo I corresponde
a incluir dos o más variables irrelevantes (0.5 pt), lo cual no produce sesgo en la estimación pero
aumenta las varianzas de los coeficientes (0.5 pt), pero el error tipo II corresponde a eliminar dos o
más variables relevantes (0.5 pt), lo cual śı produce sesgo en los coeficientes estimados pero podŕıa
disminuir las varianzas (0.5 pt). Descontar puntaje si responde como si fuera una variable - test de
significancia individual.
2. En un modelo de regresión, un mayor error de medición en la variable independiente tiene el mismo
efecto en la regresión que un mayor error de medición en la variable dependiente. Comente si es
verdadero o falso y justifique.
R. Falso (1 pt). Un mayor error de medición en X rompe el supuesto de media condicional nula, por
lo que los coeficientes quedan sesgados a la baja, lo que se conoce como sesgo de atenuación (2 pt).
En cambio, un mayor error de medición en Y sólo entra como un error adicional, no se rompen los
supuestos por lo que el estimador sigue siendo insesgado y eficiente, y sólo aumenta la varianza de los
coeficientes (2 pt).
3. Suponga el siguiente modelo con interacciones:
Y = β0 + β1X1 + β2X2 + β3X3 + β4X2 ·X3 + ui
¿Cuál es el efecto esperado en Y si X2 aumenta en una unidad y X3 aumenta también en una unidad?
¿Cómo se interpreta β4? ¿Cuál es la diferencia entre ambos, en términos de los parámetros del modelo?
R. El efecto esperado en Y si X2 aumenta en una unidad y X3 aumenta también en una unidad
corresponde a
∆E(Y |X) = β2 · 1 + β3 · 1 + β4 · 1 · 1 = β2 + β3 + β4
(2 pt, descontar puntaje si faltan parámetros, agregan el error u otras faltas). En cambio, β4 es el
efecto que tiene un aumento de X2 en el efecto que tiene un aumento de X3 en Y (2 pt, o el efecto
de un aumento de X3 en el efecto que tiene un aumento de X2 en Y ). La diferencia entre ambos
conceptos está dada por β2 + β3, el efecto en Y de un cambio en cada variable cuando la otra es cero
(1 pt).
1
4. La pendiente de una regresión siempre representa el cambio causal en el valor esperado de Y ante un
cambio de una unidad de X. Comente si es verdadero o falso y justifique.
R. Falso (0.5 pt), en realidad la pendiente de una regresión sólo representa la correlación parcial entre
X e Y , manteniendo constantes las otras variables incluidas (1.5 pt). Si es que existen variables
omitidas que estén relacionadas con X ya no se puede interpretar como el efecto causal porque la
estimación estará sesgada (1.5 pt, también pueden hablar del sesgo de selección), y sólo podemos estar
seguros de que es el efecto causal cuando estamos frente a un experimento o asignación aleatoria (1.5
pt).
5. Los supuestos de Gauss-Markov sobre el error de la regresión equivalen a suponer que tanto la media
como la varianza condicional de Y vaŕıan con X. Comente si es verdadero o falso y justifique.
R. Falso (1 pt). El supuesto de media condicional nula efectivamente equivale a suponer que la media
condicional E(Y |X) vaŕıa con X - de hecho E(Y |X) = Xβ (2 pt), pero el supuesto de homocedasticidad
V (u|X) = σ2 implica que la varianza condicional V (Y |X) no vaŕıa con X - de hecho V (Y |X) = σ2 (2
pt).
6. Considere las posibles soluciones que vimos en el curso para la heterocedasticidad. Si en el test de
Breusch-Pagan Ud. comete un error tipo I, y en base a esto corrige o cambia su modelo, ¿qué efectos
tendrá su decisión en su estimación? ¿Cómo cambia el efecto de su decisión si en realidad comete un
error tipo II?
R. En el test de Breusch-Pagan, el error tipo I corresponde a creer que el modelo es heterocedástico
cuando no lo es (0.5 pt). Si para corregir la heterocedasticidad se usan errores robustos, los coeficientes
son los mismos por lo que siguien siendo insesgados, si la muestra es chica las nuevas varianzas es-
tarán mal calculadas y el estimador no será eficiente, pero si la muestra es grande las nuevas varianzas
serán muy similares a las correctas (2 pt por la explicación completa). En cambio si para corregir la
heterocedasticidad se usa Mı́nimos Cuadrados Ponderados, los coeficientes cambian pero también son
insesgados aunque la varianza no es la mı́nima (1 pt).
Por otro lado, el error tipo II corresponde a creer que el modelo es homocedástico cuando es hete-
rocedástico (0.5 pt). En ese caso no se corrige el modelo, la estimación será insesgada pero no es
eficiente, y los test de hipótesis no son válidos (1 pt).
7. La facultad está considerando cambiar la malla de la carrera. Para ver si el cambio fue positivo, un
integrante del Centro de Alumnos propone comparar los sueldos al egresar de los alumnos que tuvieron
la malla nueva y la malla antigua. Otro integrante propone seguir a aquellos alumnos que trabajan y
estudian al mismo tiempo y compararlos al principio y al final de la carrera. Señale en cada situación
cuál es el grupo de tratamiento y cuál el de control, y un potencial problema de cada comparación.
R. En la primera situación, el grupo de tratamiento son los alumnos de un año que egresaron con
la malla nueva (0.75p) y el grupo de control son los alumnos de un año anterior que egresaron con
la malla antigua (0.75p). El problema de comparar ambos grupos es que éstos son distintos tanto en
factores observados como no observados, y por lo tanto la comparación no muestra el efecto causal
de cambiar la malla; pueden dar cualquier ejemplo concreto, por ejemplo que los alumnos de la malla
nueva pueden tener mejores puntajes de ingreso que la generación anterior y eso puede afectar sus
sueldos (1 p). Otro problema podŕıa ser que además son años distintos por lo que podŕıa haber un
efecto del tiempo, por ej puede que haya una recesión en cualquiera de los dos años que afecte los
salarios de forma distinta (también vale 1p como potencial problema).
En la segunda situación, el grupo de tratamiento son los alumnos de la malla nueva que trabajan
y estudian al mismo tiempo, observados al final de la carrera (0.75p) y el grupo de control son los
mismos alumnos observados al principio de la carrera (0.75p). Aqúı pueden haber varias causas de
problemas, cualquiera vale de forma teórica o con un ejemplo concreto (1pt): (1) es un grupo sesgado
de los alumnos de la carrera por lo que no son representativos, (2) naturalmente habrá un efecto de
aumento de sueldo por el solo hecho de terminar la carrera por lo que no mediŕıa el efecto de la malla
propiamente tal, (3) uevamente puede haber un problema temporal, por ej puede que haya una recesión
en cualquiera de los dos años que afecte los salarios de formadistinta.
8. Un alumno comenta: “en este modelo vemos que se cumple el supuesto de media condicional nula
porque los residuos tienen media cero.” Expĺıquele a este alumno si está en lo correcto o no y por qué.
2
R. Está equivocado (1pt), porque el supuesto de media condicional nula se hace sobre el error de la
regresión, es decir que los factores no observados no cambian su media a medida que se mueven los
factores observados (2pt). En cambio, los residuos tienen media cero de forma mecánica, cada vez que
la regresión incluye un intercepto (2 pt).
9. Considere un modelo que satisface todos los supuestos del modelo lineal clásico. Ceteris paribus, la
varianza del estimador de la pendiente será menor si tanto la distribución de Y y la distribución de X
están cada vez más concentradas en su respectivo promedio muestral.
R. Falso (1 pt). La fórmula de la varianza del estimador de la pendiente está dada por (1 pt):
V (β̂j) =
σ2
SCTj(1−R2j )
y por lo tanto si la varianza de Y es menor entonces σ2 disminuye y V (β̂j) también (1.5 pt), en cambio
si la varianza de X es menor entonces SCTj disminuye y V (β̂j) aumenta (1.5 pt).
10. En un modelo de regresión, si la muestra está sesgada en base a la variable independiente tiene el
mismo efecto en la regresión que si la muestra está sesgada en base a la variable dependiente. Comente
si es verdadero o falso y justifique.
R. Falso (1 pt). Aunque se rompa el supuesto de muestra aleatoria, si la muestra está sesgada en
base a la variable independiente no se genera sesgo porque se está condicionando en esa variable,
sólo aumentan las varianzas (2 pt). Si la muestra está sesgada en base a la variable dependiente
entonces śı se genera sesgo porque la muestra no sigue la misma distribución de la población (2 pt), o
porque la regresión ya no corresponde a la media condicional E(Y |X), sino a otra condicional distinta,
E(Y |X,Y > Y ∗) (también vale 2 pt si está bien explicado). Ojo: poner que se rompe el supuesto de
media condicional nula en ambos casos por lo que el efecto es siempre el mismo vale sólo 2 pt máximo.
3
2 Precios de Venta de Autos Usados (62 pts)
Una conocida automotora lo contrata para realizar una asesoŕıa respecto a los precios de venta de su ĺınea
de autos usados de marca BMW. Ud. obtiene una muestra aleatoria con información de 201 autos, con las
siguientes variables:
• precio : precio de venta del auto i, en dólares - desde $19,595 a $41,575.
• antig : años de antigüedad del auto i - desde 0 a 5 años.
• millas : uso del auto i medido en millas recorridas - desde 736 a 71,994.
• model : categoŕıas del modelo de auto: 325 ó 330.
• tipo : categoŕıas de tipo de auto: i, ci, ó xi.
Responda las siguientes preguntas. Si no sabe alguna respuesta, sáltese la pregunta; no todas están
unidas entre śı.
1. (6 pts) La siguiente tabla muestra, para las distintas combinaciones de modelo y sólo 2 tipos de auto,
la distribución en la muestra y el promedio de precio de venta.
Distribución Precio Promedio
325 330 325 330
i 65 29 27,150 31,637
ci 37 26 32,156 33,937
Plantee expĺıcitamente un modelo econométrico que explique el precio de venta de un auto usado en
función de las distintas combinaciones de modelos y tipos de auto de la tabla; sólo esos: note que
hay otros tipos de autos que no están incluidos en la tabla. Sea expĺıcito en definir la muestra que
necesita para estimar el modelo, cuál es el tamaño de la muestra, qué variables necesita y cuáles son
los parámetros.
R. Para estimar el modelo se necesita restrigir la muestra a sólo los autos de cualquier modelo, pero
tipo i o ci solamente (1pt), por lo que el tamaño de muestra ahora será N = 157 (1pt). Para definir
las variables, se puede hacer de dos formas igualmente correctas: una es definir dos variables binarias
y usar interacciones, y otra es definir tres variables binarias.
Para la primera opción necesitamos definir las siguientes variables (2 pt, naturalmente los nombres no
son relevantes, sólo ser consistente):
• M330i : toma valor 1 si el auto es modelo 330, 0 si es modelo 325.
• Tcii : toma valor 1 si el auto es tipo ci, 0 si es tipo i.
Entonces el modelo que se necesita estimar es (2 pt):
Pi = β0 + β1M330i + β2Tcii + β3M330i · Tcii + ui
Para la segunda opción, los puntajes son los mismos.. hay que definir:
• M325Tcii : toma valor 1 si el auto es modelo 325 y tipo ci, 0 si no.
• M330Tii : toma valor 1 si el auto es modelo 330 y tipo i, 0 si no.
• M330Tcii : toma valor 1 si el auto es modelo 330 y tipo ci, 0 si no.
Entonces el modelo que se necesita estimar es:
Pi = β0 + β1M325Tcii + β2M330Tii + β3M330Tci+ ui
En ambas opciones, naturalmente se puede tomar cualquier grupo de referencia, mientras sea consis-
tente en su definición.
4
2. (4 pts) Si Ud. estimara el modelo que planteó en la pregunta anterior, señale cuáles seŕıan todos los
valores de los coeficientes que encontraŕıa.
R. Los valores espećıficos dependen del modelo que hayan escrito y cuál sea el grupo de referencia
que consideraron. Lo que śı es importante es que recuerden que en un modelo que sólo tiene variables
binarias, los coeficientes corresponden al promedio de cada grupo o a las diferencias entre los promedios
de distintos grupos.
Para encontrar los coeficientes sólo hay que pesar en cuáles dos grupos se están comparando. Por
ejemplo, para las dos opciones que consideré yo arriba, los coeficientes estimados seŕıan (1 pt cada
coeficiente, puntaje parcial si no encuentran el valor pero explican de dónde sale o qué significa el
coeficiente de forma correcta):
β̂0 β̂1 β̂2 β̂3
Opción 1 27,150 4,487 5,006 -2,706
Opción 2 27,150 5,006 4,487 6,787
3. (3 pts) Considere ahora el siguiente modelo, estimado con la muestra completa:
Pi = β0 + β1antigi + β2millasi + β3tipocii + β4tipoxii + ui (1)
donde las variables tipocii y tipoxii toman valor 1 si el tipo del auto corresponde a ci y xi respectiva-
mente, y 0 si no. Interprete de la forma más completa posible los parámetros β1 y β3.
R. Las interpretaciones pedidas son (1.5 pt cada una, tener ojo que es sobre el precio esperado y qué
es lo que se mantiene constante):
• β1: representa el aumento en el precio esperado por un aumento de la antigüedad en un año,
manteniendo constante el uso del auto y su tipo.
• β4: representa el aumento en el precio esperado de un auto tipo ci versus uno tipo i, manteniendo
contante el uso del auto y su antigüedad.
4. (12 pts) Ud. evalúa si en el modelo (1) corresponde especificar la variable dependiente en niveles o
en logaritmos. Para eso cuenta con la siguiente información (de las salidas de Stata y la tabla):
Pi ln(Pi)
R2 0.5401 0.5542
AIC 3724.81 -421.9267
Max VIF 1.92 1.92
Test Ramsey: valor-p 0.4059 0.0843
Test Link: valor-p 0.582 0.069
Test White: valor-p 0.9186 0.1443
Test Shapiro-Wilk: valor-p 0 0.00001
5
Para cada modelo, señale claramente si se cumplen o no los supuestos de Gauss-Markov y porqué. La
justificación es importante para su respuesta.
R. 1 pt cada supuesto de cada modelo, incluyendo la justificación; decir si sólo se cumple o no vale 0.3
y la justificación es 0.7, aceptar puntaje parcial. Para el primer modelo (precio lineal) se tiene que:
(a) Linealidad: No se cumple, el test de Box-Cox muestra que corresponde especificar en logs.
(b) Muestreo aleatorio: Se asume por el enunciado.
(c) No colinealidad perfecta: No existe colinealidad perfecta, tampoco hay multicolinealidad porque el
VIF es muy pequeño.
(d) Media condicional nula: Se cumple porque no se rechaza el test de Ramsey (no hay variables
omitidas) ni el test de Link (no hay problemas de forma funcional, más allá del supuesto 1).
También está correcto decir que se rompe por el problema de forma funcional en el test de Box-
Cox.
(e) Homocedasticidad: Se cumple porque no se rechaza el test de White.
(f) Normalidad: No se cumple porque se rechaza el test de Shapiro-Wilk.
Para el segundo modelo (precio en logs) se tiene que:
(a) Linealidad:Se cumple, el test de Box-Cox muestra que corresponde especificar en logs.
6
(b) Muestreo aleatorio: Se asume por el enunciado.
(c) No colinealidad perfecta: No existe colinealidad perfecta, tampoco hay multicolinealidad porque el
VIF es muy pequeño.
(d) Media condicional nula: No se cumple porque al 10% se rechaza el test de Ramsey (hay variables
omitidas) y el test de Link (hay problemas de forma funcional).
(e) Homocedasticidad: Se cumple porque no se rechaza el test de White.
(f) Normalidad: No se cumple porque se rechaza el test de Shapiro-Wilk.
5. (5 pts) Comente la siguiente afirmación de la forma más completa posible: “Cambiar la variable
dependiente de niveles a logaritmos hace que el coeficiente de la variable millas se vuelva cero y no
significativo.”
R. Falso (1 pt), el coeficiente se vuelve cercano a cero pero śı es significativo (1 pt), y lo que ocurre
es que cambia la interpretación por un problema en la magnitud de las unidades de medida - es que
aumentar el uso de un auto en una milla es muy poquito: en el modelo en niveles un aumento de una
milla de uso disminuye el precio en US$0.11, en cambio en el modelo en niveles disminuye el precio
en 0.0004%, que con un precio de US$20,000 también son US$0.08 (3 pt por la explicación).
6. (3 pts) Si los modelos se hubieran redefinido tal que el grupo de referencia fuera el tipo ci, ¿qué es lo
más probable que hubiera ocurrido con β̂4?
R. Vemos que tanto en el modelo en niveles como el modelo en log, en los cuales el tipo i es el grupo
de referencia, el coeficiente de tipoci y tipoxi son casi idénticos – la diferencia de precio de un auto
tipo i con cualquiera de esos dos tipos es casi el mismo (1pt). Entonces si ci es el grupo de referencia,
β̂4 seŕıa la diferencia en el precio predicho entre un auto tipo xi y uno tipo ci (1 pt), y entonces lo más
probable es que este coeficiente sea muy pequeño y no significativo (1 pt).
7. (3 pts) En la tabla de la pregunta 4, el máximo V IF es igual en ambos modelos, ¿por qué? Explique
cuidadosamente su respuesta.
R. El V IF mide la correlación que existe entre las variables independientes del modelo, usando re-
gresiones auxiliares (1 pt), y como las variables independientes son las mismas entre ambos modelos
(sólo cambia la forma funcional de la variable depediente, 1pt), entonces el V IF para cada variable del
modelo es el mismo (1 pt).
8. (6 pts) Explique claramente qué ocurriŕıa con los coeficientes estimados de ambos modelos si, partiendo
siempre desde el modelo original:
(a) el precio de venta se definiera en miles de dólares.
(b) el uso del auto se definiera en miles de millas.
R. En ambos casos la variable correspondiente se divide por 1,000. En el caso (a), si cambia la unidad
de medida de la variable dependiente, cuando está en niveles entonces todos los β se dividen por 1,000
(2pt), en cambio si está en logs las pendientes no cambian pero el intercepto disminuye en ln(1, 000) (2
pt). En el caso (b), si cambia la unidad de medida de una variable independiente, en ambos modelos
aumenta el coeficiente de millasi en 1,000 y no cambia ningún otro coeficiente (2 pt).
9. (3 pts) De acuerdo a la información de la pregunta 4, ¿cuál especificación prefiere para la variable
dependiente, y por qué? Explique cuidadosamente su respuesta.
R. Se prefiere el modelo en logs porque no se rechaza esa hipótesis nula en el test de Box-Cox. Podŕıan
equivocarse en creer que hay que elegir segun Akaike, o el modelo que cumpla con más supuestos. 1 pt
para cuál se prefiere, 2 pt porqué.
10. (6 pts) Considere el siguiente modelo con interacciones:
Escriba la ecuación del modelo que se está estimando, y haga un gráfico lo más completo posible
que muestre las relaciones descritas por estos resultados, considerando el signo, la magnitud y la
7
significancia de los coeficientes (considere α =0.9 para este gráfico).
R. La ecuación del modelo que se estima está dada por:
Pi = β0 + β1mod330i + β2tipoii + β3millasi + β4mod330i ·millasi + β5tipoii ·millasi + ui
1.5 pt por la ecuación completa, incluyendo todas las variables, y siendo consistentes si ponen parámetros-
error, o coeficientes-residuo. Para el gráfico, con α =0.9 entonces β2 es no significativo pero β5 śı lo
es. Entonces el gráfico pedido está dado por: Asignar 4.5 pt al gráfico: 0.5p a cada coeficiente correcto,
0.5 a los nombres de las funciones.Pueden poner los valores o los coeficientes.
11. (3 pts) Interprete de la forma más completa posible los coeficientes que acompañan a modelo330 y
tipoi · millas.
R. Las interpretaciones pedidas son:
8
• β1: la diferencia en el precio predicho entre un auto modelo 330 y un modelo 325, condicional en
el tipo de auto y su uso (1 pt).
• β5: la diferencia en el efecto que tiene en el precio predicho una milla de uso adicional, entre un
auto tipo i y cualquier otro modelo de auto, condicional en el modelo (2 pt).
12. (8 pts) A partir de la información anterior, comente las siguientes afirmaciones, señalando si son
verdaderas o falsas y porqué:
(a) “El precio de venta esperado de un auto tipo i siempre es más bajo que otros tipos, para cualquier
modelo y nivel de uso.”
R. Verdadera (1pt), efectivamente en el gráfico se puede ver que el precio predicho para autos
tipo i es siempre más bajo que para otros tipos de auto, condicional en el modelo y uso (3 pt por
explicación).
(b) “El precio de venta esperado de un auto modelo 325 siempre es más bajo que un modelo 330,
para cualquier tipo y nivel de uso.”
R. Falso (1 pt), cuando el auto tiene poco uso el precio predicho es mayor para un modelo 330,
pero cuando el auto tiene mucho uso el precio predicho es mayor para un modelo 325, el punto de
corte exacto depende del tipo de auto ((3 pt por explicación).
9
3 Limones (32 pts)
Siguiendo con los datos de la pregunta anterior, un “limón” es un auto de mala calidad que el comprador
se da cuenta de que es defectuoso después de comprarlo, y por lo tanto sólo es posible en un contexto de
información asimétrica. Para nuestro curso, suponga que un “limón” es un auto de peor calidad que la
esperada dadas sus caracteŕısticas observables. La siguiente muestra la tabla de frecuencia de limones en los
datos, dada la antigüedad del auto.
limón
antig 0 1 total
0 4 0 4
1 6 0 6
2 23 1 24
3 46 9 55
4 45 53 98
5 1 13 14
total 125 76
1. (4 pts) Use la información de la tabla para calcular la probabilidad total de que un auto sea un limón,
y la probabilidad de que sea un limón según su antigüedad. Explique brevemente su procedimiento.
R. Para calcular las probabilidades pedidas es necesario considerar la frecuencia de cada caso, es decir
(1 pt por una explicación correcta)
P̂ r(Li = 1) =
casos favorables
casos totales
Entonces, la probabilidad total en la muestra de que un auto sea un limón es de 76/201 = 37.8%
(0.75p), y la probabilidad de que sea un limón según su antigüedad es de (2.25 pt):
antig %
0 0%
1 0%
2 4.17%
3 16.36%
4 54.08%
5 92.85%
2. (4 pts) Usando un punto de corte c = 1/3 y su cálculo anterior, obtenga el porcentaje de casos
correctamente clasificados.
R. Para clasificar las observaciones, se usa la siguiente regla: si P̂ r(Li = 1) > c, entonces L̂i = 1 (1
pt por la regla). Con el punto de corte dado, la tabla de predicciones está dada por (2 pt por la tabla o
similar):
y por lo tanto el porcentaje de correctamente clasificados es 145/201 = 71.14% (1 pt).
10
antig L̂i = 0 L̂i = 1 bien clasificados
0 4 0 4
1 6 0 6
2 24 0 23
3 55 0 46
4 0 98 53
5 0 14 13
total 145
3. (2 pts) Ud estima el siguiente modelo:
Interprete el parámetro que acompaña a antig.
R. Cuando la antigüedad del auto aumenta en un año adicional, la probabilidad predicha de que el auto
sea un limón (0.5 pt) aumenta en 11.96 (0.5 pt) puntos porcentuales (0.5 pt por la medida), condicional
en el uso del auto (0.5 pt).
4. (3 pts) Señale tres problemas concretos que tiene esta estimación.
R. La respuesta tiene que ser en base a las tablasde la pregunta anterior. Presenta los siguientes
11
problemas, sólo tienen que nombrar 3, 1 pt cada uno:
• Las probabilidades predichas están fuera del intervalo [0, 1].
• Presenta variables omitidas porque se rechaza el test de Ramsey.
• Presenta problemas en la forma funcional de las variables porque se rechaza el test Link.
• Presenta heterocedasticidad porque se rechaza el test de Breusch-Pagan.
5. (3 pts) Si el uso de auto promedio de la muestra son 32,765.1 millas, obtenga de acuerdo al modelo
de la pregunta 3 la probabilidad predicha de que un auto sea un limón para los distintos niveles de
antigüedad posible.
R. De acuerdo a los parámetros estimados, la probabilidad predicha de que un auto sea un limón según
su antigüedad está dada por P̂ r(Li = 1) = −0.4814 + 0.0000139 · 32, 765.1 + 0.1196antig (0.5 pt), lo
que corresponde a (2.5 pt, 0.25 cada uno):
antig %
0 -2.56%
1 9.36%
2 21.32%
3 33.29%
4 45.25%
5 57.21%
6. (4 pts) Usando un punto de corte c = 1/3 y su cálculo anterior, obtenga nuevamente el porcentaje de
casos correctamente clasificados y compare con su respuesta en la pregunta 2.
R. Para clasificar las observaciones, se usa la misma regla anterior: si P̂ r(Li = 1) > c, entonces
L̂i = 1, ahora no vale puntaje. Con el punto de corte dado, la tabla de predicciones está dada por (2
pt por la tabla o similar):
antig L̂i = 0 L̂i = 1 bien clasificados
0 4 0 4
1 6 0 6
2 24 0 23
3 0 55 9
4 0 98 53
5 0 14 13
total 108
y por lo tanto el porcentaje de correctamente clasificados es 108/201 = 53.73% (1 pt). En el modelo
de probabilidad lineal usado, el porcentaje de casos correctamente clasificados es menor que cuando se
usa la tabla de frecuencias (1 pt).
12
7. (3 pts) Ud estima el siguiente modelo:
¿Cuál es ahora el efecto de tener un auto un año más antiguo en la probabilidad de que sea un limón?
A la luz de este resultado, ¿qué puede decir de su respuesta en la pregunta 3?
R. Ahora el efecto de tener un año más de antigüedad en la probabilidad de que el auto sea un limón es
de 28.6 puntos porcentuales, medida en la media de las caracteŕısticas observables (1.5 pt, si contesta
que el efecto es el β̂ = 1.57 tiene 0.5 pt). De acuerdo a esto, la respuesta de la pregunta anterior
está subestimada, el año adicional de antigüedad tiene un efecto mucho mayor en el precio cuando se
considera una relación no lineal, aunque esto es cierto sólo en la media (1.5 pt por la comparación).
8. (4 pts) Si el uso de auto promedio de la muestra son 32,765.1 millas, la siguiente tabla muestra la
probabilidad predicha de que un auto sea un limón para los distintos niveles de antigüedad posible
usando el modelo de la pregunta 7. Usando un punto de corte c = 1/3 y su cálculo anterior, obtenga
nuevamente el porcentaje de casos correctamente clasificados y compare con su respuesta en las pre-
guntas 2 y 6.
antig P̂ r(Li = 1)
0 0.0015
1 0.0074
2 0.0344
3 0.1461
4 0.4513
5 0.7981
R. Con el punto de corte dado, la tabla de predicciones está dada por (2 pt por la tabla o similar):
y por lo tanto el porcentaje de correctamente clasificados es 145/201 = 71.14% (1 pt). Es más alto que
la capacidad de predicción del MPL, pero igual a la capacidad de predicción usando frecuencias (1 pt).
9. (5 pts) ¿Por qué en su respuesta anterior, ninguno de los dos modelos es capaz de mejorar el porcentaje
de clasificación con respecto a la tabla de frecuencias de la pregunta 2? ¿Qué haŕıa Ud. para mejorar
13
antig L̂i = 0 L̂i = 1 bien clasificados
0 4 0 4
1 6 0 6
2 24 0 23
3 55 0 46
4 0 98 53
5 0 14 13
total 145
su predicción (sin cambiar la estimación)?
R. El problema es que al predecir usando los dos modelos, no se está usando el uso ni la antigüedad de
cada una de las observaciones, sino sólo se está usando el uso promedio y todo el rango de antigüedades
posibles, por eso no es posible mejorar la capacidad de predicción con respecto al cálculo de frecuencias
(3 pt por una explicación completa, asignar puntaje intermedio). Para mejorar la predicción, usaŕıa el
uso y la antigüedad propia de cada observación (2 pt).
14

Continuar navegando