Logo Studenta

Clase 27 - Inferencia Estadística

¡Estudia con miles de materiales!

Vista previa del material en texto

Inferencia Estad́ıstica: Clase 27 - Repaso Segundo semestre de 2022
Ejercicio 1
Se quiere estudiar la relación entre el kilometraje y el precio de los autos usados. Para
ello se toma una muestra de autos usados en venta y se registran las variables
precio = precio del auto en miles de pesos
kil = kilometraje del auto en miles de km
A continuación se muestra un gráfico de dispersión de las variables junto con el ajuste de
un modelo lineal simple de precio en kil.
a) Decidir cuáles de los siguientes valores corresponden a los coeficientes estimados:
Posibles valores de β̂0: 7538,687, 6538,687, −7538,687, −6538,687
Posibles valores de β̂1: 23,720, 13,720, −23,720, −13,720
b) Predecir el valor de un auto de...
i. 110.000 km.
ii. 400.000 km.
¿Tienen sentido ambas predicciones? ¿Por qué?
c) ¿Cuánto disminuye el precio predicho de un auto cuando el kilometraje aumenta en
2000 km?
d) A continuación se presenta parte de la salida del ajuste y la varianza muestral del
kilometraje.
1
Inferencia Estad́ıstica: Clase 27 - Repaso Segundo semestre de 2022
summary(lm(precio ~ kil))
# Coefficients:
# Estimate Std. Error t value Pr(>t)
# (Intercept) 429.983 15.207 < 2e-16 ***
# kil
# ---
# Residual standard error: 1483 on 48 degrees of freedom
# Multiple R-squared: 0.4211 , Adjusted R-squared: 0.409
# F-statistic: 34.91 on 1 and 48 DF , p-value: 3.455e-07
var(kil)
# 2784.935
¿Hay asociación significativa a nivel 5% entre el kilometraje y el precio? Aclare
qué hipótesis está testeando y por qué, cuál es el estad́ıstico del test y cuál es su
distribución (exacta o asintótica) bajo H0.
(Resolver usando la tabla de la distribución adecuada).
e) Calcule e interprete un IC de nivel 0,95 para el coeficiente del kilometraje. ¿El nivel
es exacto o asintótico?
Ejercicio 2
Se llevó a cabo un estudio para estudiar factores asociados a la variable Y = indicadora
de que un paciente con cáncer alcanza la remisión (1 = śı, 0 = no). Una variable explicativa
importante fue un ı́ndice de etiquetado (LI = porcentaje de células “etiquetadas”) que mide
la actividad proliferativa de células después de que un paciente recibe una inyección de
timidina tritiada. La siguiente tabla muestra parte de la salida de un modelo de regresión
loǵıstica ajustado con R.
summary(glm(y ~ LI , family = binomial))
# Coefficients:
# Estimate Std. Error z value Pr(>z)
# (Intercept) -3.77714 1.37862 -2.740 0.00615 **
# LI 0.05934
# ---
a) Calcule el coeficiente estimado de LI, sabiendo que cuando LI aumenta en una unidad
el odds de remision se multiplica por 1,16.
2
Inferencia Estad́ıstica: Clase 27 - Repaso Segundo semestre de 2022
b) En base a la información del ajuste ¿cuál de los siguientes boxplots paralelos (“a” ó
“b”) diŕıa que corresponde a los datos? Justifique.
c) Escriba la ecuacion del modelo estimado.
d) ¿Para qué valor de LI el Odds estimado de remisión es 3? ¿Cuál es la probabilidad
de remisión de un paciente con un Odds de 3?
e) ¿Hay evidencia significativa a nivel 1% de que el coeficiente de LI es distinto de
cero? ¿y a nivel 5%? (Aclare qué hipótesis está testeando, cuál es el estad́ıstico del
test y cuál es su distribución (exacta o asintótica) bajo H0. Resolver usando la tabla
que considere adecuada.)
f) ¿Qué puede concluir acerca de la relación entre LI y la probabilidad de remisión?
g) Calcule un IC de nivel 99% para el coeficiente de LI e interprételo en el contexto.
Ejercicio 3
En cierta ciudad, se llevaron a cabo estudios para analizar los niveles de plomo en el
agua potable. Para ello, se analizaron muestras de agua potable de 100 casas, de dos sec-
ciones diferentes de dicha ciudad. Estos análisis dieron las siguientes medias y desviaciones
estándar de niveles de plomo (en partes por millón):
Sección I Sección II
Tamaño muestral 100 100
Media 34.1 36.0
Desviación estándar 5.9 6.0
a) Plantee un test para decidir si hay diferencia significativa entre los niveles medios
de plomo de ambas secciones. Concretamente, defina...
3
Inferencia Estad́ıstica: Clase 27 - Repaso Segundo semestre de 2022
las hipótesis a testear,
el estad́ıstico de prueba, aclarando su distribución asintótica o exacta bajo H0.
(justifique),
la región de rechazo de nivel α.
b) Calcule el p-valor acorde a las hipótesis del ı́tem a). ¿Qué decisión se tomaŕıa con
un nivel de significación del 5%?
c) Use un intervalo de confianza del 95% para estimar la diferencia en los niveles medios
de plomo para las dos secciones de la ciudad. Justifique cómo lo calcula. Interprete
dicho intervalo.
d) ¿El cero pertenece al IC? ¿Podŕıamos haber anticipado la respuesta sin calcular el
IC?
e) Suponga que ingenieros ambientales del municipio se preocuparán sólo si detectan
una diferencia de más de 5 partes por millón entre las dos secciones de la ciudad.
En base al intervalo de confianza calculado en el ı́tem c), ¿diŕıa que la diferencia
entre los niveles de plomo de ambas secciones es significativa desde el punto de vista
práctico para los ingenieros del municipio? Justifique.
4

Continuar navegando

Otros materiales