Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
1 Primera Fecha Recuperatorio del Segundo Regulatorio Bioestadística Primer cuatrimestre 2021 Ejercicios de Distribución de la Varianza Muestral Ejercicio 1 Se sabe que una variable aleatoria 𝑋 tiene una distribución normal con media 45 y desvío estándar 5. Calcular la probabilidad de que al tomar una muestra de tamaño 25 se obtenga una varianza muestral entre 24,309 y 37,932. Resolución Como 𝑋~𝑁(45; 5) y el tamaño de muestra 𝑛 = 25, sabemos que (𝑛−1)𝑆2 𝜎2 ~𝜒𝑛−1 2 y entonces 𝑃(24,309 < 𝑆2 < 37,932) = 𝑃 ( 24∗24,309 25 < 𝑌 < 24∗37,932 25 ) = = 𝑃(23,336 < 𝑌 < 36,414) = 𝐹(36,414) − 𝐹(23,336) ≅ 𝐹(36,415) − 𝐹(23,337) = (1 − 0,05) − (1 − 0,5) = 0,95 − 0,5 = 0,45. Hemos usado que 𝑌~𝜒24 2 y aproximamos a los valores de tabla. Ejercicio 2 A partir de estudios previos se sabe que una variable aleatoria 𝑋 tiene una distribución normal con media 95 y desvío estándar 4. Calcular la probabilidad de que al tomar una muestra de tamaño 20 se obtenga una varianza muestral entre 22,909 y 25,384 Resolución Como 𝑋~𝑁(95; 4) y el tamaño de muestra 𝑛 = 20, sabemos que (𝑛−1)𝑆2 𝜎2 ~𝜒𝑛−1 2 y entonces 𝑃(24,309 < 𝑆2 < 37,932) = 𝑃 ( 19∗22,909 16 < 𝑌 < 19∗25,384 16 ) = = 𝑃(27,204 < 𝑌 < 30,143) = 𝐹(30,143) − 𝐹(27,204) ≅ 𝐹(30,144) − 𝐹(27,204) = (1 − 0,05) − (1 − 0,1) = 0,95 − 0,9 = 0,05. Hemos usado que 𝑌~𝜒19 2 y aproximamos a los valores de tabla. Ejercicio 3 Para una variable normal con varianza 3 se toma una muestra de tamaño 20. Hallar el número 𝑏 tal que 𝑃(𝑆2 > 𝑏) = 0,10. Resolución Sabemos que (𝑛−1)𝑆2 𝜎2 ~𝜒𝑛−1 2 . Luego 𝑃(𝑆2 > 𝑏) = 𝑃 ( 19∗𝑆2 2 𝜎2 > 19∗𝑏 𝜎2 ) = 0,10 y de tabla resulta 19∗𝑏 𝜎2 = 27,204, finalmente despejando 𝑏 = 27,204∗3 19 ≅ 4,295 2 Ejercicio 4 Para una variable normal con varianza 2,5 se toma una muestra de tamaño 25. Hallar el número 𝑏 tal que 𝑃(𝑆2 > 𝑏) = 0,10. Resolución Sabemos que (𝑛−1)𝑆2 𝜎2 ~𝜒𝑛−1 2 y entonces 𝑃(𝑆2 > 𝑏) = 𝑃 ( 24∗𝑆2 2 𝜎2 > 24∗𝑏 𝜎2 ) = 0,10 y de tabla resulta 24∗𝑏 𝜎2 = 33,196, finalmente despejando 𝑏 = 33,196∗2,5 24 ≅ 3,458 Ejercicios de ANOVA Ejercicio 1 Un grupo de investigación decidió estudiar el efecto de una dieta rica en grasas sobre la expresión de la enzima hemooxigenasa-1 (HO1) en diferentes órganos. Para ello tomaron 15 ratas, a las que alimentaron con una dieta rica en grasas, y las dividieron en 3 grupos de igual tamaño; a las ratas del grupo 1 se les extrajo muestras de pulmón; a las del grupo 2, de músculo y a las del grupo 3, de corazón. Se midió la expresión relativa de la HO1 con respecto de ratas alimentadas con una dieta normal. Luego realizaron un ANOVA de un factor y obtuvieron los siguientes resultados: Definir las variables aleatorias, enunciar las suposiciones del modelo, plantear las hipótesis correspondientes y definir el estadístico de prueba. Decidir, con un nivel de significación del 5%, si hay diferencias significativas en la expresión relativa media de HO1 en los diferentes órganos de ratas alimentadas con una dieta rica en grasas, e indicar entre qué órganos se observan dichas diferencias, planteando el estadístico correspondiente. Justificar y dar las conclusiones en términos del problema. Resolución Definición de variables: 𝑌𝑖𝑗: 𝑒𝑥𝑝𝑟𝑒𝑠𝑖ó𝑛 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑑𝑒 𝐻𝑂1 𝑒𝑛 𝑙𝑎 𝑟𝑎𝑡𝑎 𝑗 𝑑𝑒𝑙 𝑔𝑟𝑢𝑝𝑜 𝑖. Modelo: 𝑌𝑖𝑗 = 𝜇𝑖 + 𝜀𝑖𝑗 ; 1 ≤ 𝑖 ≤ 3 ; 1 ≤ 𝑗 ≤ 5 3 𝜀𝑖𝑗~𝑁(0; 𝜎) 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠 ; 𝐻𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝑠 Hipótesis: 𝐻0: 𝜇1 = 𝜇2 = 𝜇3 ; 𝐻1: 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝜇𝑖 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 Estadístico de prueba: 𝐹𝑚 = 𝐶𝑀𝐸𝑛𝑡𝑟𝑒 𝐶𝑀𝐷𝑒𝑛𝑡𝑟𝑜 Decisión e interpretación del ANOVA: Dado que el p-valor es menor que α (0,0017 < 0,05), se rechaza la hipótesis nula. No todas las medias de la expresión relativa de HO1 son iguales entre los grupos. Prueba a posteriori: Se realizó la prueba de Tukey, cuyas hipótesis y estadístico de prueba son: 𝐻0: 𝜇𝑖 = 𝜇𝑖′ ; 𝐻1: 𝜇𝑖 ≠ 𝜇𝑖′ 𝐷𝑖−𝑖′ = 𝑌𝑖.̅ − 𝑌𝑖′.̅̅̅̅ √ 𝐶𝑀𝐷 𝐽 Decisión e interpretación de la prueba a posteriori: A partir de la salida de InfoStat, se observa que hay diferencia significativa en la expresión relativa de HO1 entre el grupo del que se extrajo pulmón y el grupo del que se extrajo corazón, con un nivel de significación de 0,05. No hay evidencia suficiente para afirmar que haya diferencia en la expresión relativa de HO1 entre el grupo del que se extrajo músculo y del que se extrajo pulmón, ni entre el grupo del que se extrajo músculo y del que se extrajo corazón. Ejercicio 2 Un grupo de investigación decidió estudiar el efecto de una dieta rica en grasas sobre la expresión de la enzima hemooxigenasa-1 (HO1) en diferentes órganos. Para ello tomaron 15 ratas, a las que alimentaron con una dieta rica en grasas, y las dividieron en 3 grupos de igual tamaño; a las ratas del grupo 1 se les extrajo muestras de cerebro; a las del grupo 2, de riñón y a las del grupo 3, de hígado. Se midió la expresión relativa de la HO-1 con respecto de ratas alimentadas con una dieta normal. Luego realizaron un ANOVA de un factor y obtuvieron los siguientes resultados: 4 Definir las variables aleatorias, enunciar las suposiciones del modelo, plantear las hipótesis correspondientes y definir el estadístico de prueba. Decidir, con un nivel de significación del 5%, si hay diferencias significativas en la expresión relativa media de HO1 en los diferentes órganos de ratas alimentadas con una dieta rica en grasas, e indicar entre qué órganos se observan dichas diferencias, planteando el estadístico correspondiente. Justificar y dar las conclusiones en términos del problema. Resolución Definición de variables: 𝑌𝑖𝑗: 𝑒𝑥𝑝𝑟𝑒𝑠𝑖ó𝑛 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑑𝑒 𝐻𝑂1 𝑒𝑛 𝑙𝑎 𝑟𝑎𝑡𝑎 𝑗 𝑑𝑒𝑙 𝑔𝑟𝑢𝑝𝑜 𝑖. Modelo: 𝑌𝑖𝑗 = 𝜇𝑖 + 𝜀𝑖𝑗 ; 1 ≤ 𝑖 ≤ 3 ; 1 ≤ 𝑗 ≤ 5 𝜀𝑖𝑗~𝑁(0; 𝜎) 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠 ; 𝐻𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝑠 Hipótesis: 𝐻0: 𝜇1 = 𝜇2 = 𝜇3 ; 𝐻1: 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝜇𝑖 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 Estadístico de prueba: 𝐹𝑚 = 𝐶𝑀𝐸𝑛𝑡𝑟𝑒 𝐶𝑀𝐷𝑒𝑛𝑡𝑟𝑜 Decisión e interpretación del ANOVA: Dado que el p-valor es menor que α (0,0001 < 0,05), se rechaza la hipótesis nula. No todas las medias de la expresión relativa de HO1 son iguales entre los grupos. Prueba a posteriori: Se realizó la prueba de Tukey, cuyas hipótesis y estadístico de prueba son: 𝐻0: 𝜇𝑖 = 𝜇𝑖′ ; 𝐻1: 𝜇𝑖 ≠ 𝜇𝑖′ 5 𝐷𝑖−𝑖′ = 𝑌𝑖.̅ − 𝑌𝑖′.̅̅̅̅ √ 𝐶𝑀𝐷 𝐽 Decisión e interpretación de la prueba a posteriori: A partir de la salida de InfoStat, se observa que hay diferencia significativa en la expresión relativa de HO1 entre el grupo del que se extrajo cerebro y el grupo del que se extrajo riñón, y entre el grupo del que se extrajo cerebro y el grupo del que se extrajo hígado, con un nivel de significación de 0,05. No hay evidencia suficiente para afirmar que haya diferencia en la expresión relativa de HO1 entre el grupo del que se extrajo riñón y del que se extrajo hígado. Ejercicio 3 Un grupo de investigación decidió estudiar el efecto de una dieta rica en grasas sobre la expresión de la enzima hemooxigenasa-1 (HO1) en diferentes órganos. Para ello tomaron 15 ratas, a las que alimentaron con una dieta rica en grasas, y las dividieron en 3 grupos de igual tamaño; a las ratas del grupo 1 se les extrajo muestras de pulmón; a las del grupo 2, de músculo y a las del grupo 3, de hígado. Se midió la expresión relativa de la HO-1 con respecto de ratas alimentadas con una dieta normal. Luego realizaron un ANOVA de un factor y obtuvieron los siguientes resultados: Definir las variables aleatorias, enunciar las suposiciones del modelo,plantear las hipótesis correspondientes y definir el estadístico de prueba. Decidir, con un nivel de significación del 5%, si hay diferencias significativas en la expresión relativa media de HO1 en los diferentes órganos de ratas alimentadas con una dieta rica en grasas, e indicar entre qué órganos se observan dichas diferencias, planteando el estadístico correspondiente. Justificar y dar las conclusiones en términos del problema. Resolución Definición de variables: 𝑌𝑖𝑗: 𝑒𝑥𝑝𝑟𝑒𝑠𝑖ó𝑛 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑑𝑒 𝐻𝑂1 𝑒𝑛 𝑙𝑎 𝑟𝑎𝑡𝑎 𝑗 𝑑𝑒𝑙 𝑔𝑟𝑢𝑝𝑜 𝑖. Modelo: 𝑌𝑖𝑗 = 𝜇𝑖 + 𝜀𝑖𝑗 ; 1 ≤ 𝑖 ≤ 3 ; 1 ≤ 𝑗 ≤ 5 6 𝜀𝑖𝑗~𝑁(0; 𝜎) 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠 ; 𝐻𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝑠 Hipótesis: 𝐻0: 𝜇1 = 𝜇2 = 𝜇3 ; 𝐻1: 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝜇𝑖 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 Estadístico de prueba: 𝐹𝑚 = 𝐶𝑀𝐸𝑛𝑡𝑟𝑒 𝐶𝑀𝐷𝑒𝑛𝑡𝑟𝑜 Decisión e interpretación del ANOVA: Dado que el p-valor es menor que α (0,0001 < 0,05), se rechaza la hipótesis nula. No todas las medias de la expresión relativa de HO1 son iguales entre los grupos. Prueba a posteriori: Se realizó la prueba de Tukey, cuyas hipótesis y estadístico de prueba son: 𝐻0: 𝜇𝑖 = 𝜇𝑖′ ; 𝐻1: 𝜇𝑖 ≠ 𝜇𝑖′ 𝐷𝑖−𝑖′ = 𝑌𝑖.̅ − 𝑌𝑖′.̅̅̅̅ √ 𝐶𝑀𝐷 𝐽 Decisión e interpretación de la prueba a posteriori: A partir de la salida de InfoStat, se observa que hay diferencia significativa en la expresión relativa de HO1 entre el grupo del que se extrajo pulmón y el grupo del que se extrajo músculo, entre el grupo del que se extrajo pulmón y el grupo del que se extrajo hígado, y entre el grupo del que se extrajo músculo y el grupo del que se extrajo hígado, con un nivel de significación de 0,05. Ejercicio 4 Un grupo de investigación decidió estudiar el efecto de una dieta rica en grasas sobre la expresión de la enzima hemooxigenasa-1 (HO1) en diferentes órganos. Para ello tomaron 15 ratas, a las que alimentaron con una dieta rica en grasas, y las dividieron en 3 grupos de igual tamaño; a las ratas del grupo 1 se les extrajo muestras de cerebro; a las del grupo 2, de pulmón y a las del grupo 3, de corazón. Se midió la expresión relativa de la HO-1 con respecto de ratas alimentadas con una dieta normal. Luego realizaron un ANOVA de un factor y obtuvieron los siguientes resultados: 7 Definir las variables aleatorias, enunciar las suposiciones del modelo, plantear las hipótesis correspondientes y definir el estadístico de prueba. Decidir, con un nivel de significación del 5%, si hay diferencias significativas en la expresión relativa media de HO1 en los diferentes órganos de ratas alimentadas con una dieta rica en grasas, e indicar entre qué órganos se observan dichas diferencias, planteando el estadístico correspondiente. Justificar y dar las conclusiones en términos del problema. Resolución Definición de variables: 𝑌𝑖𝑗: 𝑒𝑥𝑝𝑟𝑒𝑠𝑖ó𝑛 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑑𝑒 𝐻𝑂1 𝑒𝑛 𝑙𝑎 𝑟𝑎𝑡𝑎 𝑗 𝑑𝑒𝑙 𝑔𝑟𝑢𝑝𝑜 𝑖. Modelo: 𝑌𝑖𝑗 = 𝜇𝑖 + 𝜀𝑖𝑗 ; 1 ≤ 𝑖 ≤ 3 ; 1 ≤ 𝑗 ≤ 5 𝜀𝑖𝑗~𝑁(0; 𝜎) 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠 ; 𝐻𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝑠 Hipótesis: 𝐻0: 𝜇1 = 𝜇2 = 𝜇3 ; 𝐻1: 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝜇𝑖 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 Estadístico de prueba: 𝐹𝑚 = 𝐶𝑀𝐸𝑛𝑡𝑟𝑒 𝐶𝑀𝐷𝑒𝑛𝑡𝑟𝑜 Decisión e interpretación del ANOVA: Dado que el p-valor es menor que α (0,0020 < 0,05), se rechaza la hipótesis nula. No todas las medias de la expresión relativa de HO1 son iguales entre los grupos. Prueba a posteriori: Se realizó la prueba de Tukey, cuyas hipótesis y estadístico de prueba son: 𝐻0: 𝜇𝑖 = 𝜇𝑖′ ; 𝐻1: 𝜇𝑖 ≠ 𝜇𝑖′ 8 𝐷𝑖−𝑖′ = 𝑌𝑖.̅ − 𝑌𝑖′.̅̅̅̅ √ 𝐶𝑀𝐷 𝐽 Decisión e interpretación de la prueba a posteriori: A partir de la salida de InfoStat, se observa que hay diferencia significativa en la expresión relativa de HO1 entre el grupo del que se extrajo cerebro y el grupo del que se extrajo corazón, y entre el grupo del que se extrajo pulmón y el grupo del que se extrajo corazón, con un nivel de significación de 0,05. No hay evidencia suficiente para afirmar que haya diferencia en la expresión relativa de HO1 entre el grupo del que se extrajo cerebro y del que se extrajo pulmón. Ejercicios de Regresión Lineal Ejercicio 1 El Voriconazol es una droga antifúngica que debe ser monitoreada debido a su gran variabilidad farmacocinética y sus efectos adversos. A fin de determinar la concentración de Voriconazol sérica mediante HPLC se hace una curva de calibración. Para esto, en el laboratorio del Dr. C. Andida se toman 9 muestras de concentraciones conocidas, se extrae el Voriconazol con solventes orgánicos y se miden las áreas del cromatograma obtenido. Los resultados obtenidos son los siguientes: Considerando que se cumplen los supuestos del modelo, ¿es significativa la regresión (α=0,05)? Indicar el área esperada para una concentración de 950 ng/ml. Resolución Concentración (ng/ml) 200 300 400 500 600 700 800 900 1.000 Área 758 842 912 1.001 1.140 1.184 1.214 1.321 1.451 9 Sí, la regresión es significativa (p < 0,0001). 𝑌�̂� = 591,84 + 0,83 ∙ 𝑥𝑘 𝑌950̂ = 591,84 + 0,83 ∙ 950 = 1380,34 Ejercicio 2 El Voriconazol es una droga antifúngica que debe ser monitoreada debido a su gran variabilidad farmacocinética y sus efectos adversos. A fin de determinar la concentración de Voriconazol sérica mediante HPLC se hace una curva de calibración. Para esto, en el laboratorio del Dr. C. Andida se toman 9 muestras de concentraciones conocidas, se extrae el Voriconazol con solventes orgánicos y se miden las áreas del cromatograma obtenido. Los resultados obtenidos son los siguientes: Concentración (ng/ml) 200 300 400 500 600 700 800 900 1.000 Área 858 742 912 801 840 784 914 821 951 Considerando que se cumplen los supuestos del modelo, ¿es significativa la regresión (α=0,05)? Indicar el área esperada para una concentración de 645 ng/ml. Resolución No hay evidencia para afirmar que la regresión es significativa. No se puede calcular el área esperada. Ejercicio 3 Se realizó un experimento aleatorio controlado, para estudiar el efecto de una nueva droga sobre la frecuencia cardíaca de ratas sanas. Cinco ratas fueron asignadas aleatoriamente a una de 5 dosis (de 0,5 a 2,5mg), registrándose la máxima disminución observada en la frecuencia 10 cardíaca, en una hora. Suponiendo válido el modelo lineal, se estimó la recta de regresión por el método de mínimos cuadrados utilizando el paquete estadístico InfoStat: Explicitar la ecuación de la recta ajustada. Estimar la máxima disminución de la frecuencia cardíaca (MDFC), cuando la dosis es de 0,85 mg. Sabiendo que �̅� =1,5 y SXX = 2,5 , hallar un intervalo de predicción del 95% para la MDFC, cuando la dosis es de 0,85 mg. Definir las variables aleatorias, enunciar el Modelo de Regresión Lineal Simple y plantear sus supuestos. Resolución La máxima disminución de la frecuencia cardíaca cuando la dosis es de 0,85 mg, es igual a �̂�𝑘 = 2,7 + 5,4. 𝑋 = 2,7 + 5,4 . 0,85 = 7,29 El intervalo de predicción del 95% para la MDFC, cuando la dosis de la droga es de 0,85 mg, es (4,33; 10,25): (�̂� + 𝛽 ̂𝑥𝑘) ± 𝑡𝛼 2⁄ ;𝑛−2 √𝐶𝑀𝑟𝑒𝑠 [1 + 1 𝑛 + (𝑥𝑘 − �̅�)2 𝑆𝑋𝑋 ] 7,29 ± 3,1824√0,633 [1 + 1 5 + (0,85−1,5)2 2,5 ] = 7,29 ± 2,9625 𝑃 (4,33 < 𝑌𝑘 < 10,25) = 0,95 Ejercicio 4 Los médicos tienen interés en saber qué relación existe entre la dosis de un medicamento y el tiempo que necesita el paciente para recuperarse. Se fijaron para el estudio distintas dosis del medicamento (entre 1 y 1,5 gramos), que se administraron a cada uno de 5 pacientes. Se midió el tiempo de recuperación (en horas), a partir de la dosis aplicada. Suponiendo válido el modelo 11 lineal, se estimó la recta de regresiónpor el método de mínimos cuadrados utilizando el paquete estadístico InfoStat: Explicitar la ecuación de la recta ajustada. Predecir el tiempo de recuperación de un paciente al que se le administran 1,25 gramos de este medicamento. ¿Es útil la regresión obtenida para predecir el tiempo de recuperación si se administran 2,5 gramos? ¿Cuáles son las hipótesis que se ponen a prueba cuando se testea la significación de la regresión? ¿Cuál es la decisión en este caso y qué significa? Definir las variables aleatorias, enunciar el Modelo de Regresión Lineal Simple y plantear sus supuestos. Resolución x1,….., x5 dosis prefijadas del medicamento; Yi: tiempo de recuperación en horas, del paciente que recibió la dosis i. �̂�𝑘 = 97,21 − 58,42. 𝑋 Para una dosis de 1,25 gramos, se predice un tiempo de recuperación de 24,2 horas. No se puede extrapolar para una dosis de 2,5 gramos. Ho) 𝛽 = 0 vs. H1) 𝛽 ≠ 0. Se rechaza Ho teniendo en cuenta el IC(95%) para la pendiente beta, que no contiene al cero: (-70,36; -46,48); o el test de Student cuyo estadístico es T = -15,57 y el p_valor=0,0006. Por lo tanto, podemos concluir que el tiempo de recuperación depende de la dosis administrada del medicamento. Ejercicios de Prueba de Hipótesis Ejercicio 1 La concentración de histidina en el plasma de las mujeres de entre 20 y 25 años cumplidos sigue una distribución aproximadamente normal con media 14,4 µg/ml. Se seleccionó una muestra aleatoria de 7 mujeres de entre 40 y 45 años y se realizó un test de hipótesis con 12 InfoStat, para determinar si la concentración media de histidina en plasma (en µg/ml) dentro de este grupo puede suponerse distinta a la correspondiente al grupo etario 20-25. Definir la variable aleatoria de interés, escribir los supuestos y las hipótesis del test, completar los dos resultados faltantes en la salida de InfoStat y concluir en base al intervalo de confianza, informando cuál es el nivel de significación. Resolución X: Concentración de histidina en plasma (en µg/ml) de una mujer de entre 40 y 45 años Suponemos 𝑋 ∼ 𝑁(𝜇; 𝜎) y se quiere testear 𝐻𝑜) 𝜇 = 14,4 𝐻1) 𝜇 ≠ 14,4 El estadístico observado del Test de Student es 𝑇 = 1,65 Entonces: �̅�−𝜇0 𝑠 √𝑛 = 16,14−14,4 𝑠 √7 = 1,65 ⇒ 𝑠 = 1,74 1,65 ⋅ √7 = 2,79 1, 2 (95) n S LI X t n 𝑡𝑛−1,𝛼 2 = 𝑡6;0,025 = 2,447 𝐿𝐼(95) = 16,14 − 2,447 ⋅ 2,79 √7 = 13,56 Entonces el intervalo de confianza del 95% para 𝜇 es 𝐼 = (13,56; 18,73), y como 14,4 ∈ 𝐼 no rechazamos 𝐻0 ⟹ la concentración media de histidina de las mujeres de entre 40 y 45 años no difiere significativamente de la correspondiente a las mujeres de entre 20 y 25 años. El nivel de significación de este test es 0,05. Ejercicio 2 El rendimiento de la cosecha de maíz híbrido proveniente de la empresa semillera A se distribuye normalmente con media 95,75 kg/parcela. Se seleccionó una muestra aleatoria de 8 parcelas sembradas con maíz híbrido proveniente de la empresa semillera B, y se realizó un test de hipótesis con InfoStat para determinar si el rendimiento medio de la cosecha de maíz híbrido de la empresa B puede suponerse distinto al correspondiente a la empresa A. Definir la variable aleatoria de interés, escribir los supuestos y las hipótesis del test, completar los dos resultados faltantes en la salida de InfoStat y concluir en base al intervalo de confianza, informando cuál es el nivel de significación. Resolución X: Rendimiento de la cosecha de maíz híbrido (en kg/parcela) de una parcela de la empresa semillera B 13 Suponemos 𝑋 ∼ 𝑁(𝜇; 𝜎) y se quiere testear 𝐻𝑜) 𝜇 = 95,75 𝐻1)𝜇 ≠ 95,75 El estadístico observado del Test de Student es 𝑇 = −2,66 Entonces: �̅�−𝜇0 𝑠 √𝑛 = 86,13−95,75 𝑠 √8 = −2,66 ⇒ 𝑠 = −9,62 −2,66 ⋅ √8 = 10,23 𝐿𝑆(95) = �̅� + 𝑡𝑛−1,𝛼 2 ⋅ 𝑆 √𝑛 𝑡𝑛−1,𝛼 2 = 𝑡7;0,025 = 2,365 𝐿𝑆(95) = 86,13 + 2,365 ⋅ 10,23 √8 = 94,68 Entonces el intervalo de confianza del 95% para 𝜇 es 𝐼 = (77,58; 94,68), y como 95,75 ∉ 𝐼 rechazamos 𝐻0 ⟹ el rendimiento medio de la cosecha de maíz híbrido de la empresa B difiere significativamente del correspondiente a la cosecha de maíz híbrido de la empresa A. El nivel de significación de este test es 0,05. Ejercicio 3 Se sabe que un nivel de colesterol elevado constituye un factor de alto riesgo en el desarrollo de la aterosclerosis cardíaca y coronaria, por lo que resulta de vital importancia determinar los niveles a esperar en los diferentes grupos de edad. En virtud de ello, se realizó un estudio para comparar los niveles de colesterol (en mg/dl) en varones de entre 25 y 35 años, frente a mujeres del mismo grupo etario, a fin de determinar si puede suponerse que el nivel medio de colesterol de las mujeres es mayor que el correspondiente a los varones dentro de la franja de edad considerada. Se obtuvieron los siguientes datos: Indicar cuál fue el test aplicado, cuáles son sus supuestos y las hipótesis planteadas; completar los 4 valores faltantes e informar la conclusión en base al p-valor (calculado o acotado). Resolución Sean las variables: 𝑋1: Nivel de colesterol (en mg/dl) de una mujer de entre 25 y 35 años 𝑋2: Nivel de colesterol (en mg/dl) de un varón de entre 25 y 35 años Suponemos 𝑋1 ∼ 𝑁(𝜇1; 𝜎1); 𝑋2 ∼ 𝑁(𝜇2; 𝜎2) variables independientes, con 𝜎1 2 = 𝜎2 2. Planteamos las hipótesis: 𝐻0) 𝜇1 ≤ 𝜇2 𝐻1) 𝜇1 > 𝜇2 O, equivalentemente: 𝐻0) 𝜇1 − 𝜇2 ≤ 0 𝐻1) 𝜇1 − 𝜇2 > 0 14 Aplicaremos el test de Student para diferencia de medias en muestras independientes. El estadístico de prueba es 𝑇 = �̅�1−�̅�2−𝑎 𝑆𝑃√ 1 𝑛1 + 1 𝑛2 donde 𝑆𝑃 2 = (𝑛1−1)𝑆1 2+(𝑛2−1)𝑆2 2 𝑛1+𝑛2−2 Bajo 𝐻0 T tiene distribución T de Student con 𝑛1 + 𝑛2 − 2= 90 grados de libertad. Con los datos muestrales resulta: 𝑆𝑃 2 = (44 − 1). 322 + (48 − 1). 302 90 = 959,24 𝑇𝑂𝐵𝑆 = 10,96 √959,24√ 1 44 + 1 48 =1,696 Se deduce de la tabla que, siendo 1,662 <1,696 < 1,987 0,025 < p-valor < 0,05 Con InfoStat p-valor= 0,0467 Por lo tanto, rechazamos 𝐻0 : el nivel medio de colesterol (en mg/dl) en el grupo etario 25 - 35 años es efectivamente mayor en las mujeres, con respecto a los varones. Grupo 1: Mujeres Grupo 2: Varones N 44 48 Media 178,12 167,16 Desvío 32 30 Media(1) – Media (2) 10,96 T 1,696 Gl 90 p-valor Entre 0,025 y 0,05 Ejercicio 4 En un estudio sobre hábitos de alimentación en cierta subespecie de aves, se marcaron 25 hembras y 11 machos y se los rastreó por radio, a fin de recabar información sobre la distancia recorrida (en metros) volando en una pasada en busca de alimento. Con los datos obtenidos se realizó un test de hipótesis, a fin de determinar si puede suponerse que la distancia media recorrida por las hembras de la especie es mayor a la correspondiente a los machos de la misma especie. Se obtuvieron los siguientes datos: 15 Indicar cuál fue el test aplicado, cuáles son sus supuestos y las hipótesis planteadas; completar los 4 valores faltantes e informar la conclusión en base al p-valor (calculado o acotado). Resolución Sean las variables: 𝑋1: Distancia recorrida (en metros) por una hembra de una cierta subespecie de aves volando en una pasada en busca de alimento 𝑋2: Distancia recorrida (en metros) por una macho de una cierta subespecie de aves volando en una pasada en busca de alimento Suponemos 𝑋1 ∼ 𝑁(𝜇1; 𝜎1); 𝑋2 ∼ 𝑁(𝜇2; 𝜎2) variables independientes, con 𝜎1 2 = 𝜎2 2. Planteamos las hipótesis: 𝐻0) 𝜇1 ≤ 𝜇2 𝐻1) 𝜇1 > 𝜇2 O, equivalentemente: 𝐻0) 𝜇1 − 𝜇2 ≤ 0 𝐻1) 𝜇1 − 𝜇2 > 0 Aplicaremos el test de Student para diferencia de medias en muestras independientes. El estadístico de prueba es 𝑇 = �̅�1−�̅�2−𝑎 𝑆𝑃√ 1 𝑛1 + 1 𝑛2 donde 𝑆𝑃 2 = (𝑛1−1)𝑆12+(𝑛2−1)𝑆2 2 𝑛1+𝑛2−2 Bajo 𝐻0 T tiene distribución T de Student con 𝑛1 + 𝑛2 − 2= 34 grados de libertad. Con los datos muestrales resulta: 𝑆𝑃 2 = (25−1).1002+(11−1).952 34 =9713,24 𝑇𝑂𝐵𝑆 = 70 √9713,24√ 1 25 + 1 11 =1,963 Se deduce de la tabla que, siendo 1,691 <1,963 < 2,032 0,025 < p-valor < 0,05 Con InfoStat p-valor= 0,0289 Por lo tanto, rechazamos 𝐻0 : la distancia media recorrida por las aves de una cierta subespecie (en metros) volando en una pasada en busca de alimento es efectivamente mayor en las hembras, con respecto a los machos. 16 Grupo 1: Hembras Grupo 2: Machos N 25 11 Media 205 135 Desvío 100 95 Media (1) – Media (2) 70 T 1,963 Grados de libertad 34 p-valor Entre 0,025 y 0,05 Ejercicios de Intervalos de Confianza Ejercicio 1 Se proyecta estudiar el impacto de una dieta hipocalórica suplementada con ácidos grasos Omega-3, sobre el metabolismo de lípidos en individuos adultos con obesidad diagnosticada. Como variable de respuesta, se medirá el peso (Kg) de cada individuo transcurridos seis meses de tratamiento. Calcular el tamaño muestral mínimo necesario, para construir un intervalo de confianza de nivel 0,95 y aproximación menor a 0,50 Kg para el valor medio de la variable aleatoria en estudio. Suponer que dicha variable sigue una distribución aproximadamente normal, con varianza = 1,25 Kg2. Resolución X = Peso (Kg) de individuo adulto con obesidad diagnosticada, transcurridos seis meses de tratamiento con la dieta. Suposiciones: X~N (μ ; σ) , con σ conocida Intervalo de Confianza de nivel 1-α para la media de una variable aleatoria normal, con varianza conocida: 𝐶 (�̅� − 𝑍𝛼 2 × 𝜎 √𝑛 < 𝜇 < �̅�+ 𝑍𝛼 2 × 𝜎 √𝑛 ) = 1-α Aproximación: 𝑍𝛼 2 × 𝜎 √𝑛 < 0,50 𝑍0,05 2 × √ 1,25 √𝑛 < 0,50 1,960 × √ 1,25 √𝑛 < 0,50 𝑛 > 19,2 Mínimo tamaño muestral: 20 individuos. 17 Ejercicio 2 Se proyecta estudiar el impacto de una dieta hiperproteica sobre la función renal, en individuos adultos con diagnóstico de enfermedad renal crónica. Como variable de respuesta, se medirá la proteinuria (mg proteína/día), de cada individuo, transcurridos dos meses de tratamiento. Calcular el tamaño muestral mínimo necesario para construir un intervalo de confianza de nivel 0,90 y aproximación menor a 5 mg proteína/día para el valor medio de la variable aleatoria en estudio. Suponer que dicha variable sigue una distribución aproximadamente normal, con varianza = 140 mg2/día2. Resolución X = Proteinuria (mg proteína/día) de individuo adulto con diagnóstico de enfermedad renal crónica, transcurridos dos meses de tratamiento con la dieta. Suposiciones: X~N (μ ; σ) , con σ conocida Intervalo de Confianza de nivel 1-α para la media de una variable aleatoria normal, con varianza conocida: 𝐶 (�̅� − 𝑍𝛼 2 × 𝜎 √𝑛 < 𝜇 < �̅�+ 𝑍𝛼 2 × 𝜎 √𝑛 ) = 1-α Aproximación: 𝑍𝛼 2 × 𝜎 √𝑛 < 5 𝑍0,10 2 × √140 √𝑛 < 5 1,645 × √140 √𝑛 < 5 𝑛 > 15,1 Mínimo tamaño muestral: 16 individuos. Ejercicio 3 A partir de la información suministrada en la salida de InfoStat, construir un Intervalo de Confianza del 95% para la varianza de la variable aleatoria “Concentración de albúmina en orina (mg/24 hs) de individuo insuficiente renal”. Suponer que dicha variable sigue una distribución aproximadamente normal. Resolución X = Concentración de albúmina en orina (mg/24 hs) de individuo insuficiente renal. Suposiciones: X~N (μ ; σ) , con σ desconocida 18 Intervalo de Confianza de nivel 1-α para la media de una variable aleatoria normal, con varianza desconocida: 𝐶 (�̅� − 𝑡𝑛−1 ; 𝛼 2 × 𝑠 √𝑛 < 𝜇 < �̅�+ 𝑡𝑛−1 ; 𝛼 2 × 𝑠 √𝑛 ) = 1-α A partir de la salida de InfoStat: 𝐸𝑟𝑟𝑜𝑟 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟 = 𝑠 √𝑛 = 1,06 𝑠 = 1,06 × √𝑛 𝑠 = 1,06 × √12 𝑠 = 3,67 Intervalo de Confianza de nivel 1-α para la varianza de una variable aleatoria normal: 𝐶 ( 𝑆2(𝑛 − 1) 𝜒 𝑛−1; 𝛼 2 2 < 𝜎 2 < 𝑆2(𝑛 − 1) 𝜒 𝑛−1; 1−𝛼 2 2 ) = 1 − 𝛼 𝐶 ( 3,672(12 − 1) 𝜒 12−1; 0,05 2 2 < 𝜎 2 < 3,672(12 − 1) 𝜒 12−1; 1−0,05 2 2 ) = 1 − 0,05 𝐶 ( 3,672(12 − 1) 21,920 < 𝜎2 < 3,672(12 − 1) 3,816 ) = 1 − 0,05 𝐶(6,76 < 𝜎2 < 38,82) = 0,95 Ejercicio 4 A partir de la información suministrada en la salida de InfoStat, construir un Intervalo de Confianza del 99% para la varianza de la variable aleatoria “Concentración de leptina (ng/mL) en sangre de individuo con obesidad diagnosticada”. Suponer que dicha variable sigue una distribución aproximadamente normal. Resolución X = Concentración de leptina (ng/mL) en sangre de individuo con obesidad diagnosticada. Suposiciones: X~N (μ ; σ) , con σ desconocida Intervalo de Confianza de nivel 1-α para la media de una variable aleatoria normal, con varianza desconocida: 19 𝐶 (�̅� − 𝑡𝑛−1 ; 𝛼 2 × 𝑠 √𝑛 < 𝜇 < �̅�+ 𝑡𝑛−1 ; 𝛼 2 × 𝑠 √𝑛 ) = 1-α A partir de la salida de InfoStat: 𝐸𝑟𝑟𝑜𝑟 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟 = 𝑠 √𝑛 = 1,44 𝑠 = 1,44 × √𝑛 𝑠 = 1,44 × √12 𝑠 = 4,99 Intervalo de Confianza de nivel 1-α para la varianza de una variable aleatoria normal: 𝐶 ( 𝑆2(𝑛 − 1) 𝜒 𝑛−1; 𝛼 2 2 < 𝜎 2 < 𝑆2(𝑛 − 1) 𝜒 𝑛−1; 1−𝛼 2 2 ) = 1 − 𝛼 𝐶 ( 4,992(12 − 1) 𝜒 12−1; 0,01 2 2 < 𝜎 2 < 4,992(12 − 1) 𝜒 12−1; 1−0,01 2 2 ) = 1 − 0,01 𝐶 ( 4,992(12 − 1) 26,757 < 𝜎2 < 4,992(12 − 1) 2,603 ) = 1 − 0,01 𝐶(10,24 < 𝜎2 < 105,23) = 0,99
Compartir