Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Inferencia Estad́ıstica: Clase 27 - Repaso Segundo semestre de 2022 Ejercicio 1 Se quiere estudiar la relación entre el kilometraje y el precio de los autos usados. Para ello se toma una muestra de autos usados en venta y se registran las variables precio = precio del auto en miles de pesos kil = kilometraje del auto en miles de km A continuación se muestra un gráfico de dispersión de las variables junto con el ajuste de un modelo lineal simple de precio en kil. a) Decidir cuáles de los siguientes valores corresponden a los coeficientes estimados: Posibles valores de β̂0: 7538,687, 6538,687, −7538,687, −6538,687 Posibles valores de β̂1: 23,720, 13,720, −23,720, −13,720 b) Predecir el valor de un auto de... i. 110.000 km. ii. 400.000 km. ¿Tienen sentido ambas predicciones? ¿Por qué? c) ¿Cuánto disminuye el precio predicho de un auto cuando el kilometraje aumenta en 2000 km? d) A continuación se presenta parte de la salida del ajuste y la varianza muestral del kilometraje. 1 Inferencia Estad́ıstica: Clase 27 - Repaso Segundo semestre de 2022 summary(lm(precio ~ kil)) # Coefficients: # Estimate Std. Error t value Pr(>t) # (Intercept) 429.983 15.207 < 2e-16 *** # kil # --- # Residual standard error: 1483 on 48 degrees of freedom # Multiple R-squared: 0.4211 , Adjusted R-squared: 0.409 # F-statistic: 34.91 on 1 and 48 DF , p-value: 3.455e-07 var(kil) # 2784.935 ¿Hay asociación significativa a nivel 5% entre el kilometraje y el precio? Aclare qué hipótesis está testeando y por qué, cuál es el estad́ıstico del test y cuál es su distribución (exacta o asintótica) bajo H0. (Resolver usando la tabla de la distribución adecuada). e) Calcule e interprete un IC de nivel 0,95 para el coeficiente del kilometraje. ¿El nivel es exacto o asintótico? Ejercicio 2 Se llevó a cabo un estudio para estudiar factores asociados a la variable Y = indicadora de que un paciente con cáncer alcanza la remisión (1 = śı, 0 = no). Una variable explicativa importante fue un ı́ndice de etiquetado (LI = porcentaje de células “etiquetadas”) que mide la actividad proliferativa de células después de que un paciente recibe una inyección de timidina tritiada. La siguiente tabla muestra parte de la salida de un modelo de regresión loǵıstica ajustado con R. summary(glm(y ~ LI , family = binomial)) # Coefficients: # Estimate Std. Error z value Pr(>z) # (Intercept) -3.77714 1.37862 -2.740 0.00615 ** # LI 0.05934 # --- a) Calcule el coeficiente estimado de LI, sabiendo que cuando LI aumenta en una unidad el odds de remision se multiplica por 1,16. 2 Inferencia Estad́ıstica: Clase 27 - Repaso Segundo semestre de 2022 b) En base a la información del ajuste ¿cuál de los siguientes boxplots paralelos (“a” ó “b”) diŕıa que corresponde a los datos? Justifique. c) Escriba la ecuacion del modelo estimado. d) ¿Para qué valor de LI el Odds estimado de remisión es 3? ¿Cuál es la probabilidad de remisión de un paciente con un Odds de 3? e) ¿Hay evidencia significativa a nivel 1% de que el coeficiente de LI es distinto de cero? ¿y a nivel 5%? (Aclare qué hipótesis está testeando, cuál es el estad́ıstico del test y cuál es su distribución (exacta o asintótica) bajo H0. Resolver usando la tabla que considere adecuada.) f) ¿Qué puede concluir acerca de la relación entre LI y la probabilidad de remisión? g) Calcule un IC de nivel 99% para el coeficiente de LI e interprételo en el contexto. Ejercicio 3 En cierta ciudad, se llevaron a cabo estudios para analizar los niveles de plomo en el agua potable. Para ello, se analizaron muestras de agua potable de 100 casas, de dos sec- ciones diferentes de dicha ciudad. Estos análisis dieron las siguientes medias y desviaciones estándar de niveles de plomo (en partes por millón): Sección I Sección II Tamaño muestral 100 100 Media 34.1 36.0 Desviación estándar 5.9 6.0 a) Plantee un test para decidir si hay diferencia significativa entre los niveles medios de plomo de ambas secciones. Concretamente, defina... 3 Inferencia Estad́ıstica: Clase 27 - Repaso Segundo semestre de 2022 las hipótesis a testear, el estad́ıstico de prueba, aclarando su distribución asintótica o exacta bajo H0. (justifique), la región de rechazo de nivel α. b) Calcule el p-valor acorde a las hipótesis del ı́tem a). ¿Qué decisión se tomaŕıa con un nivel de significación del 5%? c) Use un intervalo de confianza del 95% para estimar la diferencia en los niveles medios de plomo para las dos secciones de la ciudad. Justifique cómo lo calcula. Interprete dicho intervalo. d) ¿El cero pertenece al IC? ¿Podŕıamos haber anticipado la respuesta sin calcular el IC? e) Suponga que ingenieros ambientales del municipio se preocuparán sólo si detectan una diferencia de más de 5 partes por millón entre las dos secciones de la ciudad. En base al intervalo de confianza calculado en el ı́tem c), ¿diŕıa que la diferencia entre los niveles de plomo de ambas secciones es significativa desde el punto de vista práctico para los ingenieros del municipio? Justifique. 4
Compartir