Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
1 Segundo Regulatorio Bioestadística Primer cuatrimestre 2021 Prueba de Hipótesis Ejercicio 1 Se desean comparar dos métodos A y B de medición de tiroxina libre, para lo cual se toma una muestra de tiroxina y se la mide 10 veces por el método A y 9 veces por el método B, obteniéndose los siguientes resultados: A: 𝑛 = 10 �̅�𝐴 = 0,97 𝑠 = 0,067 B: 𝑛 = 9 �̅�𝐵 = 1,20 𝑠 = 0,118 ¿Son igual de precisos ambos métodos? Definir las variables, plantear los supuestos necesarios, la hipótesis del problema y decidir en función del p-valor. Resolución XA = Medición de tiroxina libre con el método A ~ N(µA, σA) XB = Medición de tiroxina libre con el método B ~ N(µB, σB) H0 : 𝜎𝐴 2 = 𝜎𝐵 2 vs H1: 𝜎𝐴 2 ≠ 𝜎𝐵 2 𝐹 = 𝑆𝑚𝑎𝑦𝑜𝑟 2 𝑆𝑚𝑒𝑛𝑜𝑟 2 ~ 𝐹8;9 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠, 𝐹𝑐 = 0,1182 0,0672 = 3,10 Como 𝐹8;9;0,10 = 2,47 < 3,10 < 3,23 = 𝐹8;9;0,05 ⇒ 0,10 < 𝑝 < 0,20 Conclusión: no tengo evidencia suficiente para decidir que un método es más preciso que el otro. Ejercicio 2 Se desea comparar el efecto de la ingestión de dosis bajas de ácido acetilsalicílico (AAS) sobre el metabolismo de las grasas en pacientes hipertensos leves. Un conjunto de 28 de tales pacientes se dividió al azar en 2 grupos homogéneos con respecto a los niveles de triglicéridos, administrándoles a uno de ellos AAS (una dosis de 100 mg/día al acostarse) y al otro no. Al cabo de 3 meses de tratamiento, se les midió el nivel de triglicéridos (en mg/dl) y se obtuvo: Sin AAS: 𝑛 = 13 �̅� = 134,4 𝑠 = 90,3 Con AAS: 𝑛 = 15 �̅� = 86,7 𝑠 = 51,8 Asumiendo que el nivel de triglicéridos sigue una distribución aproximadamente normal, verificar si se cumplen el resto de las suposiciones que nos permitan probar si hay diferencias 2 entre los grupos. Definir las variables, plantear los supuestos necesarios y las hipótesis correspondientes. Resolución XA = Nivel de triglicéridos sin AAS ~ N(µA, 𝜎𝐴) XB = Nivel de triglicéridos con AAS ~ N(µB, 𝜎𝐵) Tengo que verificar la hipótesis de igualdad de varianzas H0 : 𝜎𝐴 2 = 𝜎𝐵 2 vs H1: 𝜎𝐴 2 ≠ 𝜎𝐵 2 𝐹 = 𝑆𝑚𝑎𝑦𝑜𝑟 2 𝑆𝑚𝑒𝑛𝑜𝑟 2 ~ 𝐹12;14 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠, 𝐹𝑐 = 90,32 51,82 = 3,039 Como 𝐹12;14;0,10 = 2,05 < 3,039 , rechazo la hipótesis de igualdad de varianzas. Ejercicio 3 Un investigador realizó un estudio para comparar dos formulaciones de un fármaco para determinar el tiempo hasta la concentración máxima (Cmax). Para ello se seleccionaron voluntarios, de similares condiciones, y se les asignó aleatoriamente una de las dos formulaciones. Formulación A: 𝑛 = 21 �̅� = 127 𝑠 = 6,14 Formulación B: 𝑛 = 21 �̅� = 136,54 𝑠 = 8,09 Asumiendo que el tiempo hasta la concentración máxima sigue una distribución aproximadamente normal, verificar si se cumplen el resto de las suposiciones que nos permitan probar si hay diferencias entre los grupos. Definir las variables, plantear los supuestos necesarios y las hipótesis correspondientes. Resolución XA = Tiempo de Cmax para la formulación A ~ N(µA, 𝜎𝐴) XB = Tiempo de Cmax para la formulación A ~ N(µB, 𝜎𝐵) Tengo que verificar la hipótesis de igualdad de varianzas H0 : 𝜎𝐴 2 = 𝜎𝐵 2 vs H1: 𝜎𝐴 2 ≠ 𝜎𝐵 2 𝐹 = 𝑆𝑚𝑎𝑦𝑜𝑟 2 𝑆𝑚𝑒𝑛𝑜𝑟 2 ~ 𝐹20;20 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠, 𝐹𝑐 = 8,092 6,142 = 1,73 Como 𝐹20;20;0,10 = 1,79 ≮ 1,73 , no puedo rechazar la hipótesis de igualdad de varianzas. Supongo válida la suposición de homogeneidad. Ejercicio 4 Se compara la velocidad de disolución de dos formulaciones de un nuevo fármaco. Para ello se prueban 10 comprimidos de cada formulación y se observa el porcentaje de disolución. 3 Formulación A: 𝑛 = 10 �̅� = 77,1 𝑠 = 5,78 Formulación B: 𝑛 = 10 �̅� = 71,4 𝑠 = 6,98 D = Formulación A - Formulación B: 𝑛 = 10 �̅� = 5,7 𝑠 = 8,67 Utilizando de la información brindada, la adecuada al problema, ¿existe diferencia entre los valores medios de la velocidad de disolución de las 2 formulaciones? Utilizar α = 0,05. Definir las variables aleatorias y enunciar los supuestos e hipótesis del problema. Resolución XA = Velocidad de disolución de la formulación A ~ N(µA, σ) XB = Velocidad de disolución de la formulación B ~ N(µB, σ) XA y XB independientes H0 : µ𝐴 = µ𝐵 vs H1: µ𝐴 ≠ µ𝐵 𝑆𝑝 2 = 9 . 5,782+9 . 6,982 12−2 = 41,072 𝑡𝑐 = 77,1−71,4 √41,072 . 2 10 = 1,99 Rechazo si |𝑡𝑐| > 2,101 = 𝑡18,0,05 2 Como 1,99 ≯ 2,101 , no puedo rechazar la hipótesis de igualdad de medias. No tengo evidencia significativa para decidir que las velocidades medias de disolución de ambas formulaciones, son diferentes. Ejercicio 5 Se toma una muestra de un lote específico de comprimidos y se divide al azar en 2 grupos. Un grupo es analizado por los propios laboratorios de control de calidad del fabricante. El segundo grupo de comprimidos se envía a un laboratorio contratado para un análisis idéntico. Fabricante: 𝑛 = 6 �̅� = 99,83 𝑠 = 1,11 Contratado: 𝑛 = 6 �̅� = 98,95 𝑠 = 1,30 D = Fabricante – Contratado: 𝑛 = 6 �̅� = 0,88 𝑠 = 1,92 Utilizando de la información brindada, la adecuada al problema, ¿existe diferencia significativa entre los 2 laboratorios? Utilizar α = 0,05. Definir las variables aleatorias y enunciar los supuestos e hipótesis del problema. Resolución XA = Análisis generado por el Fabricante ~ N(µA, σ) XB = Análisis generado por el laboratorio contratado ~ N(µB, σ) 4 XA y XB independientes H0 : µ𝐴 = µ𝐵 vs H1: µ𝐴 ≠ µ𝐵 𝑆𝑝 2 = 5 . 1,112+5 . 1,302 12−2 = 1,4585 𝑡𝑐 = 99,83−98,95 √1,4585 . 2 6 = 0,88 0,6972 = 1,262 Rechazo si |𝑡𝑐| > 2,228 = 𝑡10,0,05 2 Como 1,262 ≯ 2,228 , no puedo rechazar la hipótesis de igualdad de medias. No tengo evidencia significativa para decidir que los resultados generados por los 2 laboratorios son diferentes. Ejercicio 6 Se realizó un estudio para determinar si hay diferencias en la eficacia de dos tratamientos para la hipertensión. Con este fin se seleccionaron sujetos hipertensos a uno de los dos grupos de tratamiento: el grupo 1 recibe un tratamiento basado en el primer fármaco y el grupo 2 recibe un tratamiento basado en el segundo. Grupo 1: 𝑛 = 15 �̅� = 131,8 𝑠 = 12,53 Grupo 2: 𝑛 = 15 �̅� = 135,2 𝑠 = 10,42 D = Grupo 1 – Grupo 2: 𝑛 = 15 �̅� = −3,4 𝑠 = 9,41 Utilizando de la información brindada, la adecuada al problema, ¿existe diferencia significativa entre los 2 fármacos? Utilizar α = 0,05. Definir las variables aleatorias y enunciar los supuestos e hipótesis del problema. Resolución X1 = Presión arterial Grupo 1 ~ N(µ1, σ) X2 = Presión arterial Grupo 2 ~ N(µ2, σ) XA y XB independientes H0 : µ1 = µ2 vs H1: µ1 ≠ µ2 𝑆𝑝 2 = 14 . 12,532+14 . 10,422 30−2 = 132,814 5 𝑡𝑐 = 131,80 − 135,20 √132,814 . 2 15 = −0,808 Rechazo si |𝑡𝑐| > 2,048 = 𝑡28,0,05 2 Como 0,808 ≯ 2,048 , no puedo rechazar la hipótesis de igualdad de medias. No tengo evidencia significativa para decidir que las presiones arteriales medias de ambos grupos son diferentes. Ejercicio 7 La tabla proporciona los resultados de la determinación de la concentración de paracetamol (%m/m) en comprimidos por 2 métodos diferentes. Se analizaron 10 comprimidos de diez lotes diferentes. Método 1: 𝑛 = 10 �̅� = 84,001 𝑠 = 0,407 Método 2: 𝑛 = 10 �̅� = 83,898 𝑠 = 0,339 D = Método 1 – Método 2: 𝑛 = 10 �̅� = 0,109 𝑠 = 0,615 Utilizando de la información brindada, la adecuada al problema, ¿existe diferencia significativa entre los 2 métodos? Utilizar α = 0,05. Definir las variables aleatorias y enunciar los supuestos e hipótesisdel problema. Resolución X1 = determinación por el método 1 X2 = determinación por el método 2 D = Determinación método 1 – determinación método 2 ~ N(µd, σd) H0 : µ1 = µ2 vs H1: µ1 ≠ µ2 o H0 : µ𝑑 = 0 vs H1: µ𝑑 ≠ 0 𝑡𝑐 = 0,109 0,615/√10 = 0,56 Rechazo si |𝑡𝑐| > 2,262 = 𝑡9,0,05 2 Como 0,56 ≯ 2,262 , no puedo rechazar la hipótesis de igualdad de medias. No tengo evidencia significativa para decidir que los resultados generados por los 2 métodos son diferentes. Ejercicio 8 Se desea determinar si un remedio para el resfriado que se vende sin prescripción médica tiene como efecto colateral la alteración de la presión arterial sistólica. Para ello, se tomaron medidas de línea base de presión arterial para cada paciente, se les administro el medicamento 6 para el resfriado y después de un cierto tiempo específico, se les mide la presión arterial por segunda vez. Primera medición: 𝑛 = 15 �̅� = 116,267 𝑠 = 17,491 Segunda medición: 𝑛 = 15 �̅� = 122,667 𝑠 = 16,378 D = Segunda medición – Primera medición: 𝑛 = 15 �̅� = 6,40 𝑠 = 8,458 Utilizando de la información brindada, la adecuada al problema, ¿existe diferencia significativa entre los valores medios de la presión arterial entre la Primera y la Segunda medición? Utilizar α = 0,05. Definir las variables aleatorias y enunciar los supuestos e hipótesis del problema. Resolución X1 = presión arterial Primera medición X2 = presión arterial Segunda medición D = Presión arterial Segunda medición – presión arterial Primera medición ~ N(µd, σd) H0 : µ1 = µ2 vs H1: µ1 ≠ µ2 o H0 : µ𝑑 = 0 vs H1: µ𝑑 ≠ 0 𝑡𝑐 = 6,40 8,458/√15 = 2,93 Rechazo si |𝑡𝑐| > 2,145 = 𝑡14,0,05 2 Como 2,93 > 1,761 , rechazo la hipótesis de igualdad de medias. Tengo evidencia significativa para decir que hubo una diferencia de presión arterial. Intervalos de Confianza Ejercicio 1 El nivel de bilirrubina en infantes a días de nacidos puede suponerse una variable aleatoria que está normalmente distribuida. Se construyó un intervalo de confianza para la varianza de dicha variable a partir de 25 observaciones, obteniéndose: 𝐶(1,171 < 𝜎2 < 3,716) = 0,95 Calcular la longitud del intervalo de confianza del 95% para la esperanza de la misma variable. Resolución X: nivel de bilirrubina en infantes a días de nacidos. 𝑋 ∼ 𝑁(𝜇; 𝜎) Del primer intervalo se obtiene 𝑆2 = 1,921 7 24 ∗ 𝑆2 39,364 = 1,171 ⟹ 𝑆2 = 1,171 ∗ 39,364 24 = 1,921 El valor de tabla del intervalo para la media es 𝑡 24; 0.05 2 = 2,064 Planteamos la fórmula de la longitud: 2 ∗ 𝑡 24; 0,05 2 ∗ 𝑆 √𝑛 = 2 ∗ 2,064 ∗ √ 1,921 25 = 1,144 Ejercicio 2 Se estima que el tiempo de reacción a un estímulo de cierto dispositivo electrónico está distribuido normalmente con desviación estándar de 0,05 segundos. ¿Cuál es el número mínimo de mediciones que deberán efectuarse para construir un intervalo de confianza del 95%, con aproximación no mayor que 0,01? Resolución X: tiempo de reacción a un estímulo de cierto dispositivo electrónico. 𝑋 ∼ 𝑁(𝜇; 𝜎) 𝑧0,05 2⁄ ∗ 0,05 √𝑛 < 0,01 ⟹ 𝑛 > ( 1,96 ∗ 0,05 0,01 ) 2 = 96,04 ⟹ 𝑛𝑚í𝑛 = 97 Ejercicio 3 Se utiliza una máquina para llenar botellas de plástico con detergente para máquinas lavaplatos. Se sabe que la desviación estándar del volumen de llenado es 𝜎 = 0,8 onzas de líquido. Se toma una muestra aleatoria de 12 botellas. El volumen promedio de llenado es �̄� = 30,87 onzas de líquido. Asumiendo que el volumen de llenado sigue una distribución normal, construir un intervalo de confianza de nivel 90% para la esperanza del volumen de llenado. Resolución X: volumen de llenado de botellas de plástico. 𝑋 ∼ 𝑁(𝜇; 𝜎) 30,87 ± 𝑍0,10 2 ∗ 0,8 √12 ⟹ 𝐶(30,49 < 𝜇 < 31,25) = 0,90 𝛼 = 0,10, 𝑧0,1 2⁄ = 1,645. Ejercicio 4 8 Un fabricante de detergente líquido está interesado en la uniformidad de la máquina utilizada para llenar las botellas. De manera específica, es deseable que la desviación estándar del proceso de llenado sea menor que 0,15 onzas de líquido; de otro modo, existe un porcentaje mayor del deseable de botellas con un contenido menor de detergente. Supongamos que la distribución del volumen de llenado es aproximadamente normal. Al tomar una muestra aleatoria de 20 botellas, se obtiene una varianza muestral 𝑆2 = 0,0153. Hallar un intervalo de confianza de nivel 0,95 para la varianza poblacional del volumen de llenado. Resolución X: volumen de llenado de botellas. 𝑋 ∼ 𝑁(𝜇; 𝜎) 𝐶 ( 19 ∗ 0,0153 32,85 < 𝜎2 < 19 ∗ 0,0153 8,91 ) = 𝐶(0,0089 < 𝜎2 < 0,0326) = 0,95 Valores de tabla 𝜒0,975;19 = 8,91𝜒0,025;19 = 32,85 Ejercicio 5 Se utiliza una máquina para llenar botellas de plástico con detergente para máquinas lavaplatos. Se tomó una muestra aleatoria de tamaño 15 de las botellas envasadas por la máquina y se midió el volumen promedio de llenado y la varianza. El volumen promedio resultó 30,87 onzas y la varianza, 14,18 onzas2. Asumiendo que el volumen de llenado sigue una distribución normal, construir un intervalo de confianza del 95% para el volumen medio de llenado. Resolución X: Volumen de llenado de una botella en onzas; 𝑋 ∼ 𝑁(𝜇; 𝜎) �̄� ± 𝑡𝛼 2 ;𝑛−1 . 𝑆 √𝑛 30,87 ± 2,145 ∗ √ 14,1815 15 ⟹ 30,87 ± 2,086 𝐶(28,78 < 𝜇 < 32,96) = 0,95 Ejercicio 6 Un fabricante de detergente líquido está interesado en la uniformidad de la máquina utilizada para llenar las botellas. Una especificación técnica exige que la varianza del volumen de llenado no difiera significativamente de 2 onzas2. Supongamos que la distribución del volumen de llenado es aproximadamente normal. Al tomar una muestra aleatoria de 20 botellas, se obtiene una varianza muestral 𝑆2 = 1,53. Hallar un intervalo de confianza de nivel 0,90 para la varianza poblacional del volumen de llenado. 9 Resolución X: Volumen de llenado de una botella en onzas; 𝑋 ∼ 𝑁(𝜇; 𝜎) 𝐶 ( (𝑛 − 1). 𝑠2 𝜒 𝑛−1; 𝛼 2 2 < 𝜎 2 < (𝑛 − 1). 𝑠2 𝜒 𝑛−1;1− 𝛼 2 2 ) = 1 − 𝛼 𝐶 ( 19 ∗ 1,53 30,144 < 𝜎2 < 19 ∗ 1,53 10,117 ) = 0,90 𝐶(0,964 < 𝜎2 < 2,873) = 0,90 Ejercicio 7 El nivel de bilirrubina en infantes a días de nacidos puede suponerse una variable aleatoria que está normalmente distribuida. Se construyó un intervalo de confianza para la varianza de dicha variable a partir de 16 observaciones, obteniéndose: 𝐶(0,824 < 𝜎2 < 3,617) = 0,90 Calcular la longitud del intervalo de confianza del 95% para la esperanza de la misma variable. Resolución X: nivel de bilirrubina en infantes a días de nacidos. 𝑋 ∼ 𝑁(𝜇; 𝜎) Del primer intervalo se obtiene 𝑆2 = 1,373. 15 ∗ 𝑆2 24,996 = 0,824 ⟹ 𝑆2 = 0,824 ∗ 24,996 15 = 1,373 El valor de tabla del intervalo para la media es 𝑡 15; 0.05 2 = 2,131 Planteamos la fórmula de la longitud: 2 ∗ 𝑡 15; 0.05 2 ∗ 𝑆 √𝑛 = 2 ∗ 2,131 ∗ √1,373 4 = 1,249 Ejercicio 8 El nivel de bilirrubina en infantes a días de nacidos puede suponerse una variable aleatoria que está normalmente distribuida. Se construyó un intervalo de confianza para la varianza de dicha variable a partir de 25 observaciones, obteniéndose: 𝐶(1,171 < 𝜎2 < 3,716) = 0,95 Calcular la longitud del intervalo de confianza del 99% para la esperanza de la misma variable. 10 Resolución X: nivel de bilirrubina en infantes a días de nacidos. 𝑋 ∼ 𝑁(𝜇; 𝜎) Del primer intervalo se obtiene 𝑆2 = 1,921 24 ∗ 𝑆2 39,364 = 1,171 ⟹ 𝑆2 = 1,171 ∗ 39,364 24 = 1,921 El valor de tabla del intervalo para la media es 𝑡 24; 0.01 2 = 2,797 Planteamos la fórmula de la longitud: 2 ∗ 𝑡 24; 0.01 2 ∗ 𝑆 √𝑛 = 2 ∗ 2,797 ∗ √ 1,921 25 = 1,551 Regresión Lineal Ejercicio 1 Se sospecha que valor del Gasto Energético en Reposo (GER, en Kcal/día), en individuos varones que practicancierto deporte, disminuye con la edad. Para estudiarlo, se tomó una muestra de 24 individuos de edades fijas (15; 20; 30; 35; 40 y 55 años), a quienes se les determinó el GER por el método de Calorimetría Indirecta. Con los datos obtenidos se realizó un análisis de Regresión Lineal Simple, cuya salida se adjunta. Con nivel de significación del 5%, ¿puede afirmarse que el GER disminuye, en promedio, 8,09 Kcal/día, por cada aumento de un año de edad? 11 Definir las variables aleatorias, enunciar el modelo de Regresión Lineal Simple y sus supuestos, y plantear el test adecuado para analizar la Significación de la Regresión. Explicitar la ecuación de la recta ajustada por el método de Mínimos Cuadrados. Resolución Definición de las variables aleatorias: x1; x2 ; x3 ; x4 ; x5 ; x6 = Valores fijos de edad de los individuos varones que practican cierto deporte. Yij = Valor j-ésimo de GER (Kcal/día) de varón que practica cierto deporte, de edad i-ésima. Supuestos: Yij ~ N (μi ;σ) , independientes ∀ 1 ≤ i ≤ 6 ∀ 1 ≤ j ≤ ni Modelo: Yij = α + β xi + εij con εij ~ N (0 ;σ ) , independientes ∀ 1 ≤ i ≤ 6 ∀ 1 ≤ j ≤ ni Análisis de la Significación de la Regresión: Test de hipótesis para el parámetro β: Hipótesis a testear: H0: β = 0 H1: β ≠ 0 Estadístico de prueba: Zona de rechazo de H0: |T| ≥ t n-2;α/2 Decisión: Se rechaza la hipótesis nula. La regresión es significativa (p-valor < 0,0001), por lo tanto, puede afirmarse que el GER disminuye, en promedio, 8,09 Kcal/día, por cada aumento de un año de edad. Ecuación de la recta ajustada por el método de Mínimos Cuadrados: 𝑌 ̂𝑘 = �̂� + �̂� 𝑥𝑘 = 1675,57 − 8,09 𝑥𝑘 Ejercicio 2 Se sospecha que la administración de la droga Metimazol disminuye el Gasto Energético en Reposo (GER, en Kcal/día), en individuos hipertiroideos. Para estudiarlo, se tomó una muestra de 20 individuos con diagnóstico de tiroiditis, y se la dividió aleatoriamente en 4 grupos; a cada grupo se le administró una dosis prefijada de Metamizol (2,5; 5; 10 y 15 12 mg/día) y, transcurrido un tiempo determinado, se le midió el GER por el método de Calorimetría Indirecta. Con los datos obtenidos se realizó un análisis de Regresión Lineal Simple, cuya salida se adjunta. Con nivel de significación del 5%, ¿puede afirmarse que el GER disminuye, en promedio, 20,50 Kcal/día, por cada aumento de 1 mg/día en la dosis de Metimazol? Definir las variables aleatorias, enunciar el modelo de Regresión Lineal Simple y sus supuestos, y plantear el test adecuado para analizar la Significación de la Regresión. Explicitar la ecuación de la recta ajustada por el método de Mínimos Cuadrados. Resolución Definición de las variables aleatorias: x1; x2 ; x3 ; x4 = Valores fijos de dosis de Metimazol (mg/día). Yij = Valor j-ésimo de GER (Kcal/día) de individuo con diagnóstico de tiroiditis, que recibió la dosis i-ésima de Metimazol. Supuestos: Yij ~ N (μi ;σ) , independientes ∀ 1 ≤ i ≤ 4 ∀ 1 ≤ j ≤ ni Modelo: Yij = α + β xi + εij con εij ~ N (0 ;σ ) , independientes ∀ 1 ≤ i ≤ 4 ∀ 1 ≤ j ≤ ni Análisis de la Significación de la Regresión: Test de hipótesis para el parámetro β: Hipótesis a testear: H0: β = 0 H1: β ≠ 0 Estadístico de prueba: 13 Zona de rechazo de H0: |T| ≥ t n-2;α/2 Decisión: Se rechaza la hipótesis nula. La regresión es significativa (p-valor < 0.0001), por lo tanto, puede afirmarse que el GER disminuye, en promedio, 20.50 Kcal/día, por cada aumento de 1 mg/día en la dosis de Metimazol. Ecuación de la recta ajustada por el método de Mínimos Cuadrados: �̂�𝑘 = �̂� + �̂� 𝑥𝑘 = 2046.58 − 20.50 𝑥𝑘 Ejercicio 3 Se sospecha que valor del Gasto Energético en Reposo (GER, en Kcal/día), en individuos varones que practican cierto deporte, disminuye con la edad. Para estudiarlo, se tomó una muestra de 24 individuos de edades fijas (15; 20; 30; 35; 40 y 55 años), a quienes se les determinó el GER por el método de Calorimetría Indirecta. Con los resultados obtenidos al aplicar el modelo de Regresión Lineal Simple, se verificó la significatividad de la regresión (p-valor < 0,0001). Definir las variables aleatorias, enunciar el modelo de Regresión Lineal Simple y sus supuestos. Explicitar la ecuación de la recta ajustada por el método de Mínimos Cuadrados. Calcular un Intervalo de Predicción del 95% para el valor de Yk dado un xk = 25 años, sabiendo que Sxx = 4144,19 14 Resolución Ecuación de la recta ajustada por el método de Mínimos Cuadrados: 𝑌 ̂𝑘 = �̂� + �̂� 𝑥𝑘 = 1675,57 − 8,09 𝑥𝑘 a) Intervalo de Predicción (95%) para el valor de Yk, dado xk = 25 años. (�̂� + 𝛽 ̂𝑥𝑘) ± 𝑡𝛼 2⁄ ;𝑛−2 √𝐶𝑀𝑟𝑒𝑠 [1 + 1 𝑛 + (𝑥𝑘 − �̅�)2 𝑆𝑋𝑋 ] (1675,57 − 8,09 ∗ 25) ± 2,074√1272,42 [1 + 1 24 + (25 − 32,5)2 4144,19 ] 𝑃 (1397,41 < 𝑌𝑘 < 1549,39) = 0,95 Ejercicio 4 Se sospecha que la administración de la droga Metimazol disminuye el Gasto Energético en Reposo (GER, en Kcal/día), en individuos hipertiroideos. Para estudiarlo, se tomó una muestra de 20 individuos con diagnóstico de tiroiditis, y se la dividió aleatoriamente en 4 grupos; a cada grupo se le administró una dosis prefijada de Metamizol (2.5, 5, 10 y 15 mg/día) y, transcurrido un tiempo determinado, se le midió el GER por el método de Calorimetría Indirecta. Con los resultados obtenidos al aplicar el modelo de Regresión Lineal Simple, se verificó la significatividad de la regresión (p-valor < 0,0001). 15 Definir las variables aleatorias, enunciar el modelo de Regresión Lineal Simple y sus supuestos. Explicitar la ecuación de la recta ajustada por el método de Mínimos Cuadrados. Calcular un Intervalo de Predicción del 95% para el valor de Yk dado un xk = 12 mg/día, sabiendo que Sxx = 461,00 Resolución Ecuación de la recta ajustada por el método de Mínimos Cuadrados: �̂�𝑘 = �̂� + �̂� 𝑥𝑘 = 2046,58 − 20,50 𝑥𝑘 Intervalo de Predicción (95%) para el valor de Yk, dado xk = 12 mg/día. (�̂� + 𝛽 ̂𝑥𝑘) ± 𝑡𝛼 2⁄ ;𝑛−2 √𝐶𝑀𝑟𝑒𝑠 [1 + 1 𝑛 + (𝑥𝑘 − �̅�)2 𝑆𝑋𝑋 ] (2046,58 − 20,50 ∗ 12) ± 2,101√4081,05 [1 + 1 20 + (12 − 8,125)2 461,00 ] 𝑃(1660,91 < 𝑌𝑘 < 1940,20) = 0,95 Ejercicio 5 A partir de una muestra aleatoria de 24 mujeres embarazadas, de entre 28 y 38 semanas de gestación, se registró el peso del feto (en kg). Se ajustó una recta de mínimos cuadrados a los datos mencionados y se obtuvo la salida siguiente: Definir las variables aleatorias, enunciar el modelo de Regresión Lineal Simple y sus supuestos. ¿La regresión es significativa? Justificar. A partir de los resultados obtenidos, ¿se puede saber cuántos gramos de peso aumenta el feto, en promedio, por cada semana de gestación? 16 Calcular las semanas de gestación de un feto de 2 kg de peso. Resolución Definición de las variables aleatorias x1; ….; xI = valores fijos de semanas de gestación, entre 28 y 38. Yij = Peso en gramos del j-ésimo feto, con i semanas de gestación i Modelo Yij = α + β xi + εij con εij ~ N (0 ;σ ) , independientes ∀ 1 ≤ i ≤ I ∀ 1 ≤ j ≤ ni Supuestos Yij ~ N (μi ;σ) , independientes ∀ 1 ≤ i ≤ I ∀ 1 ≤ j ≤ ni La regresión es significativa: β ∈ (0,176; 0,209) al 95% para las edades gestacionales indicadas. El peso aumenta 193 gramos por cada semana de gestación. 𝑌 ̂𝑘 = �̂� + �̂� 𝑥𝑘 = −4,302 + 0,193. 𝑥𝑘 2 = −4,302 + 0,193. 𝑥𝑘 𝑥𝑘 = 2 + 4,302 0,193 = 32,65 El feto tiene aproximadamente 33 semanas de gestación. Ejercicio 6 A partir de una muestra de 14 niños tomadosal azar, de entre 3 y 9 meses de edad (�̅� = 5), se registró la estatura (en cm) de cada uno y se ajustó una recta de mínimos cuadrados. Se obtuvo la salida siguiente: 17 De la salida que se adjunta, se puede concluir que la regresión es significativa. Justificar la última afirmación, indicando qué hipótesis se testean y el nivel justo de significación. Informar la ecuación de la recta ajustada por el método de mínimos cuadrados. A partir de la relación lineal entre la estatura y la edad, obtener un intervalo del 95% de confianza para la estatura media de niños de 7 meses, utilizando la recta de regresión y sabiendo que SXX = 52. Resolución Hipótesis a testear: H0: β = 0 vs. H1: β ≠ 0 -IC(95%) para 𝛽: (1,60; 3,28) no contiene al cero -Test de hipótesis para 𝛽: T = 6,34, p_valor<0,0001 -Anova para la regresión significativa: F = 40,16, p_valor<0,0001 𝑌 ̂𝑘 = �̂� + �̂� 𝑥𝑘 = 53,63 + 2,44. 𝑥𝑘 Un IC(95%) para la estatura media de los niños de 7 meses, es (68,38; 73,04) y se calcula de la siguiente manera: (�̂� + 𝛽 ̂𝑥𝑘) ± 𝑡𝛼 2⁄ ;𝑛−2 √𝐶𝑀𝑟𝑒𝑠 [ 1 𝑛 + (𝑥𝑘 − �̅�)2 𝑆𝑋𝑋 ] 18 (53,63 + 2,44 ∗ 7) ± 2,179 √7,72 [ 1 14 + (7 − 5)2 52 ] 70,71 ± 2,33 Ejercicio 7 A 10 individuos sanos, con concentración de Calcio en plasma entre 5 y 11 mg/100ml, se les midió la concentración de hormona paratiroidea (PTH) en 𝜇g/ml. Se ajustó una recta de cuadrados mínimos obteniéndose la salida siguiente: En base a los resultados obtenidos, ¿se puede afirmar que la regresión es significativa? Justificar. ¿Qué nivel medio de PTH le corresponde a un nivel de Calcio de 10 unidades? ¿Qué nivel medio de Calcio le corresponde a una PTH de 1,5 unidades? ¿y a una de 3 unidades? Resolución Hipótesis a testear: H0: β = 0 vs. H1: β ≠ 0 - IC(95%) para 𝛽: (-0,7221; -0,3161) no contiene al cero - Test de hipótesis para 𝛽: T = -5,8962, p-valor = 0,0004 Existe relación lineal entre ambas concentraciones. La pendiente negativa indica que la PTH disminuye cuando aumenta el Calcio y viceversa. 𝑌 ̂𝑘 = �̂� + �̂� 𝑥𝑘 = 6,536 − 0,5191. 𝑥𝑘 𝑌 ̂𝑘 = 6,536 − 0,5191.10 = 1,345 𝜇g/ml 19 𝑌 ̂𝑘 = 6,536 − 0,5191. 𝑥𝑘 1,5 = 6,536 − 0,5191. 𝑥𝑘 𝑥𝑘 = 6,536−1,5 0,5191 = 9,7 mg/100ml 3 = 6,536 − 0,5191. 𝑥𝑘 𝑥𝑘 = 6,536−3 0,5191 = 6,8 mg/100ml Ejercicio 8 A partir de una muestra de 14 niños tomados al azar, de entre 3 y 9 meses de edad (�̅� = 5), se registró la estatura (en cm) de cada uno y se ajustó una recta de mínimos cuadrados. Se obtuvo la salida siguiente: Definir las variables aleatorias, enunciar el modelo de Regresión Lineal Simple, sus supuestos y, a partir de la salida, justificar si la regresión es significativa. ¿Se puede saber cuántos centímetros aumenta la estatura, en promedio, por cada mes de crecimiento del niño? Sabiendo que SXX = 52, predecir mediante un intervalo del 95%, la estatura de un niño de 7 meses. 20 Resolución Definición de las variables aleatorias: x1; ….; xI = valores fijos de edad, entre 3 y 9 meses. Yij = estatura del j-ésimo niño de edad i Modelo: Yij = α + β xi + εij con εij ~ N (0 ;σ ) , independientes ∀ 1 ≤ i ≤ I ∀ 1 ≤ j ≤ ni Supuestos: Yij ~ N (μi ;σ) , independientes ∀ 1 ≤ i ≤ I ∀ 1 ≤ j ≤ ni Análisis de la Significación de la Regresión: Hipótesis a testear: H0: β = 0 vs. H1: β ≠ 0 -IC(95%) para 𝛽: (1,60; 3,28) no contiene al cero -Test de hipótesis para 𝛽: T = 6,34, p_valor < 0,0001 -Anova para la regresión significativa: F = 40,16, p_valor < 0,0001 La regresión es significativa (p_valor < 0,0001). Puede afirmarse que la estatura aumenta, en promedio, 2,44 cm por cada aumento de 1 mes en la edad del niño. El intervalo de predicción del 95% para la talla de un niño de 7 meses es (64,22; 77,2) y se obtiene de la siguiente manera: (�̂� + 𝛽 ̂𝑥𝑘) ± 𝑡𝛼 2⁄ ;𝑛−2 √𝐶𝑀𝑟𝑒𝑠 [1 + 1 𝑛 + (𝑥𝑘 − �̅�)2 𝑆𝑋𝑋 ] (53,63 + 2,44 ∗ 7) ± 2,179 √7,72 [1 + 1 14 + (7 − 5)2 52 ] 70,71 ± 6,49 Distribución de la media muestral y del desvío muestral Ejercicio 1 El tiempo de espera entre colectivos en una parada se supone una variable de distribución normal, con esperanza 10 minutos y desvío estándar de = 3 minutos. Si un inspector 21 selecciona 16 intervalos al azar y registra los tiempos de espera entre colectivos, ¿cuál es la probabilidad de que la varianza muestral de los tiempos de espera registrados resulte mayor a 15 (min)2? Resolución X: tiempo de espera entre colectivos en una parada. 𝑋 ∼ 𝑁(𝜇; 𝜎) S2: varianza del tiempo de espera entre colectivos en una determinada parada. 𝑃(𝑆2 > 15) = 𝑃 (𝜒15 2 > 15 ∗ 15 9 ) = 𝑃(𝜒15 2 > 25) = 0,05 Ejercicio 2 El tiempo de espera entre colectivos en una parada se supone una variable de distribución normal, con esperanza 15 minutos y desvío estándar de = 5 minutos. Si un inspector selecciona 20 intervalos al azar y registra los tiempos de espera entre colectivos, ¿cuál es la probabilidad de que la varianza muestral de los tiempos de espera resulte menor a 36 (min)2? Resolución X: tiempo de espera entre colectivos en una parada. 𝑋 ∼ 𝑁(𝜇; 𝜎) S2: varianza del tiempo de espera entre colectivos en una determinada parada. 𝑃(𝑆2 < 36) = 𝑃 (𝜒19 2 < 36 ∗ 19 25 ) = 𝑃(𝜒20 2 < 27,36) ≅ 0,90 Ejercicio 3 Durante el proceso de homologación de una aguja hipodérmica cuya medición del diámetro externo tiene un desvío poblacional , se tomó una muestra aleatoria de 101 agujas de la producción. ¿Cuál es el máximo valor de la desviación estándar poblacional para que la probabilidad de que la varianza muestral resulte menor que 229,514 (m)2 sea mayor que 0,99? 22 Resolución X: diámetro externo de una aguja hipodérmica. 𝑋 ∼ 𝑁(𝜇; 𝜎) 𝑃(𝑆2 < 229,514) > 0,99 ⟹ 𝑃 ( 𝑆2 ∗ 100 𝜎2 < 229,514 ∗ 100 𝜎2 ) = 𝑃 (𝜒100 2 < 22951,4 𝜎2 ) > 0,99 ⟹ 22951,4 𝜎2 > 135,807 ⟹ 𝜎2 < 169,000125 ⟹ 𝜎 < 13,0 Ejercicio 4 Durante el proceso de homologación de una aguja hipodérmica cuya medición del diámetro externo tiene un desvío poblacional , se tomó una muestra aleatoria de 101 agujas de la producción. ¿Cuál es el máximo valor de la desviación estándar poblacional para que la probabilidad de que la varianza muestral resulte menor que 260 (m)2 sea mayor que 0,95? Resolución X: diámetro externo de una aguja hipodérmica. 𝑋 ∼ 𝑁(𝜇; 𝜎) 𝑃(𝑆2 < 260) > 0,95 ⟹ 𝑃 ( 𝑆2 ∗ 100 𝜎2 < 260 ∗ 100 𝜎2 ) = 𝑃 (𝜒100 2 < 26000 𝜎2 ) > 0,95 ⟹ 26000 𝜎2 > 123,342 ⟹ 𝜎2 < 209,1007 ⟹ 𝜎 < 14,4603 Ejercicio 5 La dimensión del diámetro craneal sigue una distribución aproximadamente normal, con una media de 184,6 mm y una desviación estándar de 13,1 mm. La probabilidad de que el promedio del diámetro craneal de una muestra de tamaño n resulte menor que 183,2 mm, es 0,2578. ¿Cuál es el tamaño de la muestra? Resolución X: diámetro craneal, en mm, de una población. 𝑋~𝑁(184,6; 13,1) ⇒ �̅�~𝑁 (184,6; 13,1 √𝑛 ) 𝑃(�̅� < 183,2) = 𝑃 (𝑍 < 183,2 − 184,6 13,1 √𝑛 ) = 𝑃(𝑍 < −0,107√𝑛) = 0,2578 ⇒ 𝑃(𝑍 < 0,107√𝑛) = 0,7422 23 ⇒ 0,107√𝑛 = 0,65 𝒏 = 𝟑𝟕 Ejercicio 6 La dimensión del diámetro craneal sigue una distribución aproximadamente normal, con una media de 183,7 mm y una desviación estándar de 12,7 mm. La probabilidad de que el promedio del diámetro craneal de una muestra de tamaño n resulte mayor que 182 mm, es 0,8461. ¿Cuál es el tamaño de la muestra? Resolución X: diámetro craneal, en mm, de una población. 𝑋~𝑁(183,7; 12,7) ⇒ �̅�~𝑁 (183,7; 12,7 √𝑛 ) 𝑃(�̅� > 182) = 𝑃 (𝑍 > 182 − 183,7 12,7 √𝑛 ) = 𝑃(𝑍 > −0,134√𝑛) = 0,8461 ⇒ 𝑃(𝑍 > −0,134√𝑛) = 0,8461 ⇒ −0,134√𝑛 = −1,02𝒏 = 𝟓𝟖 Ejercicio 7 El tiempo en el que una nueva aspirina tarda en calmar el dolor de cabeza sigue una distribución normal con media 20 min y varianza 30 (min)2. Al tomar una muestra aleatoria de 15 pacientes con dolor de cabeza a los que se les suministra la aspirina, ¿Cuál es la probabilidad de que el tiempo promedio de efecto en la muestra no supere los 23 min, sabiendo que supera los 18 min? Resolución X: tiempo, en minutos, que tarda una nueva aspirina en calmar el dolor de cabeza 𝑋~𝑁(20; 5,48) ⇒ �̅�~𝑁 (20; 5,48 √15 ) 24 𝑃[(�̅� < 23) (�̅� > 18)⁄ ] = 𝑃(18 < �̅� < 23) 𝑃(�̅� > 18) = 𝑃(−1,41 < 𝑍 < 2,12) 𝑃(�̅� > −1,41) = = 𝐹𝑧(2,12) − 𝐹𝑧(−1,41) 𝐹𝑧(1,41) = 0,9830 − 0,0793 0,9207 = 𝟎, 𝟗𝟖𝟏𝟓 Ejercicio 8 El tiempo en el que una nueva aspirina tarda en calmar el dolor de cabeza sigue una distribución normal con media 23 min y desvío estándar 4,5 min. Al tomar una muestra aleatoria de 12 pacientes con dolor de cabeza a los que se les suministra la aspirina, ¿Cuál es la probabilidad de que el tiempo promedio de efecto en la muestra se encuentre entre los 21 min y los 26 min? Resolución X: tiempo, en minutos, que tarda una nueva aspirina en calmar el dolor de cabeza 𝑋~𝑁(23; 4,5) ⇒ �̅�~𝑁 (23; 4,5 √12 ) 𝑃(21 < �̅� < 26) = 𝑃(−1,54 < 𝑍 < 2,31) = 𝐹𝑧(2,31) − 𝐹𝑧(−1,54) = = 0,9896 − 0,0618 = 𝟎, 𝟗𝟐𝟕𝟖 ANOVA Ejercicio 1 Se proporcionaron 4 medicamentos diferentes a 44 pacientes que padecían convulsiones, y luego de cierto tiempo se midieron los niveles de actividad de fosfatasa alcalina en el suero. Los datos obtenidos fueron: Medicamento A Medicamento B Medicamento C Medicamento D i n 10 12 13 9 i s 25 47 30 46 𝑆𝐶𝑇𝑂𝑇𝐴𝐿 = 122.558 Definir las variables aleatorias, establecer los supuestos necesarios, plantear las hipótesis, indicar el estadístico de prueba correspondiente y decidir si hay diferencias significativas entre los efectos medios de los distintos medicamentos, concluir en términos del problema. Resolución 25 Definimos las variables: 𝑌𝑖𝑗: Nivel de fosfatasa alcalina en el suero del j-ésimo paciente tratado con el medicamento i 1 ≤ 𝑖 ≤ 4, 1 ≤ 𝑗 ≤ 𝑛𝑖 𝐼 = 4 𝑛1 = 10 𝑛2 = 12 𝑛3 = 13 𝑛4 = 9 44n = Suponemos 𝑌𝑖𝑗 ∼ 𝑁(𝜇𝑖; 𝜎) independientes 1 4i 0 1 2 3 4 1 ) ) No todas las son iguales i H H = = = 4 2 2 2 2 2 1 1 ( 1) (10 1) 25 (12 1) 47 (13 1) 30 (9 1) 46 57652 I Dentro i i i i SC n s = = = − = − + − + − + − = = Se sabe además que 122558TOTALSC = Entonces 122558 57652 64906Entre Total DentroSC SC SC= − = − = Fuente de variación SC gl CM F Entre trat. 64906 I-1 = 3 21635,33 15,011 Dentro trat. 57652 n-I = 40 1441,3 Total 122558 n-1 = 43 Rechazo 0H si 1, ,I n I F F − − es decir, si 𝐹 ≥ 𝐹3,40,0.05 = 2,84 (tomamos 0, 05 = ) Como 15,011 ≥ 2,84 se rechaza 0H . Luego concluimos que existen diferencias entre los niveles medios de actividad de fosfatasa alcalina en el suero de pacientes tratados con los distintos medicamentos. Ejercicio 2 En un laboratorio se quiere comparar el funcionamiento de tres máquinas de llenado de frascos de cierto medicamento. Se midieron los volúmenes (en cm3) vertidos por cada máquina en 𝑛𝑖 frascos seleccionados aleatoriamente. Máquina 1 Máquina 2 Máquina 3 i n 4 5 6 26 i y 10,3 10,2 10,1 𝑆𝐶𝐷𝐸𝑁𝑇𝑅𝑂 = 4,3025 Definir las variables aleatorias, indicar los supuestos, plantear las hipótesis, indicar el estadístico de prueba correspondiente y decidir si hay diferencias significativas entre las cantidades medias vertidas por cada máquina, con nivel de significación del 5%. Dar las conclusiones en términos del problema. Resolución Definimos las variables: : ij Y ” Volumen del j-ésimo frasco vertido con la máquina i” 1 3i , 1 ij n 3I = 1 2 34 5 6n n n= = = 15n = Suponemos 𝑌𝑖𝑗 ∼ 𝑁(𝜇𝑖; 𝜎) independientes 1 3i . 0 1 2 3 1 ) ) No todas las son iguales i H H = = Observemos que i i iT y n= 1 2 3 10, 3 4 41, 2 10, 2 5 51 10,1 6 60, 6 T T T = = = = = = 2 1556,52 T C n = = 2 1 1697, 44 2601 3672, 36 1556, 52 0,1 4 5 6 I i Entre i i T SC C n= = − = + + − = Fuente de variación SC gl CM F Entre trat. 0,1 I-1 = 2 0,05 0,1395 Dentro trat. 4,3025 n-I = 12 0,3585 Total 4,4025 n-1 = 14 Rechazo 0H si 1, ,I n I F F − − es decir, si 2,12,0.05 3,89F F = (tomamos 0, 05 = ) Como 0,1395 < 3,89 no se rechaza 0H . 27 Luego concluimos que no existen diferencias significativas entre las cantidades medias vertidas por cada máquina. Ejercicio 3 Para estudiar el efecto de 4 dietas sobre la disminución de peso en cierta raza se administró cada dieta aleatoriamente a un grupo de 4 gatos; se obtuvieron las siguientes disminuciones de peso promedio al cabo de cierto período de tiempo: Dieta A Dieta B Dieta C Dieta D i y 432 458,5 467,25 464,5 i s 5,04 4,42 4,18 4,06 Luego de realizar un Análisis de Varianza se concluyó que no todas las dietas tenían el mismo efecto, con un nivel de significación de 0,05. Definir las variables aleatorias, indicar los supuestos, plantear las hipótesis e indicar el estadístico de prueba correspondiente al ANOVA. Decidir con un nivel de significación global de 0,05; con el método de Tukey, si hay diferencias significativas entre las disminuciones de peso promedio producidas por las dietas: i) A y D ii) B y C Dar las conclusiones en términos del problema. Resolución : ij Y ”Disminución j de peso en cierta raza de gato con la dieta i.” Suponemos 𝑌𝑖𝑗 ∼ 𝑁(𝜇𝑖; 𝜎) independientes 0 ´ 1 ´ ) ) i i i i H H = 4 i n J= = ´ ´ i i ii Dentro y y T CM J − = Rechazamos 0H si ´ , ,ii I N I T q − O, equivalentemente, rechazamos 0H si ´ , , Dentro i i I N I CM y y q J − − =MDS 28 4 2 2 2 2 2 1 1 ( 1) (4 1) 5, 04 (4 1) 4, 42 (4 1) 4,18 (4 1) 4, 06 I Dentro i i i i SC n s = = = − = − + − + − + − = = 236,682 236, 682 236, 682 19, 7235 16 4 12 Dentro Dentro SC CM n I = = = = − − , , 4 ,12,0,05 4, 20 I n I q q − = = Luego 19, 7235 4, 20 9,3263 4 MDS = = 432 464, 5 32, 5 A D y y− = − = A D y y MDS− Luego hay diferencias significativas entre las disminuciones medias de pesos en gatos tratados con las dietas A y D. 458, 5 467, 25 8, 75 B C y y− = − = B C y y MDS− Luego no hay diferencias significativas entre las disminuciones medias de pesos en gatos tratados con las dietas B y C. Ejercicio 4 Para estudiar el efecto de 4 dietas sobre el aumento de peso en cierta raza se administró cada dieta aleatoriamente a un grupo de 4 perros; se obtuvieron las siguientes disminuciones de peso promedio al cabo de cierto período de tiempo: Dieta A Dieta B Dieta C Dieta D i y 458,5 467,25 464,5 432 i s 4,42 4,18 4,06 5,04 Luego se realizar un Análisis de Varianza se concluyó que no todas las dietas tenían el mismo efecto medio, con un nivel de significación de 0,05. Definir las variables aleatorias, indicar Dieta A Dieta B Dieta C Dieta D i y 432 458,5 467,25 464,5 i s 5,04 4,42 4,18 4,06 29 los supuestos, plantear las hipótesis e indicar el estadístico de prueba correspondiente al ANOVA. Decidir con un nivel de significación global de 0.05, con el método de Tukey, si hay diferencias significativas entre las disminuciones de peso promedio producidas por las dietas: i) A y C ii) B y D. Dar las conclusiones en términos del problema. Resolución : ij Y ”Aumento j de peso en cierta raza de perro con la dieta i.” Suponemos𝑌𝑖𝑗 ∼ 𝑁(𝜇𝑖; 𝜎) independientes 0 ´ 1 ´ ) ) i i i i H H = 4 i n J= = ´ ´ i i ii Dentro y y T CM J − = Rechazamos 0H si ´ , ,ii I N I T q − O, equivalentemente, rechazamos 0H si ´ , , Dentro i i I N I CM y y q J − − =MDS 4 2 2 2 2 2 1 1 ( 1) (4 1) 5, 04 (4 1) 4, 42 (4 1) 4,18 (4 1) 4, 06 I Dentro i i i i SC n s = = = − = − + − + − + − = = 236,682 236, 682 236, 682 19, 7235 16 4 12 Dentro Dentro SC CM n I = = = = − − , , 4 ,12,0,05 4, 20 I n I q q − = = Luego 19, 7235 4, 20 9,3263 4 MDS = = Dieta A Dieta B Dieta C Dieta D i y 458,5 467,25 464,5 432 30 i s 4,42 4,18 4,06 5,04 458, 5 464, 5 6 A C y y− = − = A C y y MDS− Luego no hay diferencias significativas entre los aumentos medios de pesos en perros tratados con las dietas A y C. 467, 25 432 35, 25 B D y y− = − = B D y y MDS− Luego hay diferencias significativas entre los aumentos medios de pesos en perros tratados con las dietas B y D. Ejercicio 5 Se estudió la concentración de hierro en ciertas hojas luego de administrarles 3 tratamientos diferentes, y se obtuvieron los siguientes datos: Tratamiento 1 2 3 i n 8 10 9 i s 8,2 6,8 5,0 𝑆𝐶𝐸𝑁𝑇𝑅𝐸 = 417,57 Decidir si hay diferencias significativas entre las concentraciones medias con un nivel de significación 𝛼 = 0,01 . Definir las variables aleatorias, indicar los supuestos, plantear las hipótesis, indicar el estadístico de prueba y las conclusiones en términos del problema. Resolución Definimos las variables: : ij Y ” Concentración de hierro en la j-ésima hoja que recibió el tratamiento i” 1 3i , 1 ij n 3I = 1 2 3 8 10 9n n n= = = 27n = Suponemos 𝑌𝑖𝑗 ∼ 𝑁(𝜇𝑖; 𝜎) independientes 1 3i . 0 1 2 3 1 ) ) No todas las son iguales i H H = = 3 2 2 2 2 1 1 ( 1) (8 1) 8, 2 (10 1) 6,8 (9 1) 5, 0 1086,84 I Dentro i i i i SC n s = = = − = − + − + − = 31 Fuente de variación SC gl CM F Entre trat. 417,57 I-1 = 2 208,785 4,611 Dentro trat. 1086,64 n-I = 24 45,277 Total 1504,21 n-1 = 26 2,24,0.01 = 5 ,61F Como F = 4,611 < 5,61 no se rechaza 0H y se concluye que no hay diferencias significativas entre las concentraciones medias de hierro en las hojas según los tratamientos administrados. Ejercicio 6 A efectos de estudiar el rendimiento físico de pacientes recientemente recuperados luego de una afección pulmonar leve, se seleccionaron al azar tres grupos de 5 personas cada uno, que entrenaron con métodos diferentes. El primer grupo realizó largos recorridos de caminata a ritmo pausado, el segundo grupo realizó series cortas de ejercicios de alta intensidad sin peso adicional, y el tercero trabajó en el gimnasio con pesas. Después de un mes de entrenamiento se realizó un test de rendimiento puntuado. Definir las variables aleatorias, indicar los supuestos del modelo, plantear las hipótesis completar los valores faltantes en la salida de Infostat, y dar la conclusión del test en función del p-valor: Resolución Definimos las variables: : ij Y Puntuación obtenida en el test por el j-ésimo paciente que entrenó con el método i 1 3i , 1 ij n 3I = 5 para todo i n i= 15n = Suponemos ( ; ) ij i Y N independientes 1 3i . 32 0 1 2 3 1 ) ) No todas las son iguales i H H = = Fuente de variación SC gl CM F Método 25,6 I-1 = 2 12,80 4,267 Error 36 n-I = 12 3 Total 61,6 n-1 = 14 Como p-valor = 0,0398, para 0,0398 no se rechaza 0H , y para 0,0398 se rechaza 0 H . Ejercicio 7 Se realizó una experiencia para determinar posibles diferencias significativas en la captación celular de epinefrina marcada con 14C bajo la acción de tres inhibidores (codificados como 1, 2 y 3). Para ello se seleccionaron 18 ratas de laboratorio, las cuales fueron asignadas al azar a cada uno de los inhibidores en un diseño balanceado (n1= n2 = n3). Se registró el porcentaje de captación por miligramo de peso seco de cultivo de tejido de rata. Luego de realizar un Análisis de la Varianza se rechazó la hipótesis de igualdad de medias, con un nivel de significación de 0,05. Se sabe además que el valor estimado de F = 10,802 y 𝑆𝐶𝐸𝑁𝑇𝑅𝐸 = 1,75 Definir las variables aleatorias, indicar los supuestos, plantear las hipótesis e indicar el estadístico de prueba correspondiente al ANOVA. Completar los datos faltantes en la salida de InfoStat y definir qué pares de medias difieren significativamente con un nivel de significación global de 0,05. Dar las conclusiones en términos del problema. Resolución Definimos las variables: Yij: “Porcentaje de captación (por miligramo de peso seco) de cultivo de tejido de la j-ésima rata bajo la acción del i-ésimo inhibidor” Donde 33 Suponemos además independientes Sabemos que luego de realizar un Análisis de la Varianza se rechazó la hipótesis de igualdad de medias, con un nivel de significación de 0,05. Para completar los datos de la salida de InfoStat dada, podemos pensar-en principio- que los grados de libertad asociados a la suma de cuadrados “entre” tratamientos pueden obtenerse como “I-1”, luego en este caso van a ser iguales a 2. Entonces, De aquí: Los grados de libertad asociados a la suma de cuadrados “dentro” de los tratamientos pueden obtenerse como “n-I”, luego en este caso van a ser iguales a 15. Por último, para analizar qué pares de medias difieren significativamente con un nivel de significación global de 0,05 planteamos en general: El estadístico de prueba correspondiente al test de Tukey es: En este caso, siendo resulta: 34 , de donde puede verse sencillamente que al 5% sólo hay diferencias significativas entre los porcentajes medios de captación asociados a los inhibidores 1 y 3 y 2 y 3. Ejercicio 8 Se realizó un estudio sobre la respuesta del organismo humano a un fármaco. Se analizaron tres grupos de 7 individuos: controles normales, pacientes con cirrosis hepática y pacientes con hepatitis activa crónica (codificados como 1, 2 y 3, respectivamente). A cada individuo se le suministró oralmente una cierta cantidad del fármaco por Kg de peso. Basándose en los análisis de sangre posteriores se determinó para cada uno el tiempo de máxima concentración en plasma (en horas). Se sabe que el valor estimado de F = 15,02 y 𝑆𝐶𝐸𝑁𝑇𝑅𝐸 = 3488,42 Al realizar un Análisis de la Varianza se rechazó la hipótesis de igualdad de medias, con un nivel de significación de 0,05. Definir las variables aleatorias, indicar los supuestos, plantear las hipótesis e indicar el estadístico de prueba correspondiente al ANOVA. Completar los datos faltantes en la salida de InfoStat y definir qué pares de medias difieren significativamente con un nivel de significación global de 0,05. Dar las conclusiones en términos del problema. Resolución Definimos las variables: Yij: “Tiempo de máxima concentración de un fármaco en plasma (en horas) del j-ésimo individuo perteneciente al i-ésimo grupo” Donde Suponemos además independientes 35 Sabemos que luego de realizar un Análisis de la Varianza se rechazó la hipótesis de igualdad de medias, con un nivel de significación del 5%. Para completar los datos de la salida de InfoStat dada, podemos pensar-en principio- que los grados de libertad asociados a la suma de cuadrados “entre” tratamientos pueden obtenerse como “I-1”, luego en este caso van a ser iguales a 2. Entonces, De aquí: Los grados de libertad asociados a la suma de cuadrados “dentro” de los tratamientos pueden obtenerse como “n-I”, luego en este caso van a ser iguales a 18. Por último, para analizar qué pares de medias difieren significativamente al 5%, planteamos en general:El estadístico de prueba correspondiente al test de Tukey es: En este caso, siendo resulta: 36 de donde puede verse sencillamente que al 5% sólo hay diferencias significativas entre los tiempos medios de concentración del fármaco en plasma de los grupos 1 y 2 y entre los grupos 1 y 3.
Compartir