Logo Studenta

SEGUNDO REGU 1C 2021 RESUELTOS

¡Este material tiene más páginas!

Vista previa del material en texto

1 
 
Segundo Regulatorio 
Bioestadística 
Primer cuatrimestre 2021 
 
Prueba de Hipótesis 
Ejercicio 1 
Se desean comparar dos métodos A y B de medición de tiroxina libre, para lo cual se toma 
una muestra de tiroxina y se la mide 10 veces por el método A y 9 veces por el método B, 
obteniéndose los siguientes resultados: 
A: 𝑛 = 10 �̅�𝐴 = 0,97 𝑠 = 0,067 
B: 𝑛 = 9 �̅�𝐵 = 1,20 𝑠 = 0,118 
¿Son igual de precisos ambos métodos? Definir las variables, plantear los supuestos 
necesarios, la hipótesis del problema y decidir en función del p-valor. 
Resolución 
XA = Medición de tiroxina libre con el método A ~ N(µA, σA) 
XB = Medición de tiroxina libre con el método B ~ N(µB, σB) 
H0 : 𝜎𝐴
2 = 𝜎𝐵
2 vs H1: 𝜎𝐴
2 ≠ 𝜎𝐵
2 
 𝐹 = 
𝑆𝑚𝑎𝑦𝑜𝑟
2
𝑆𝑚𝑒𝑛𝑜𝑟
2 ~ 𝐹8;9 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠, 𝐹𝑐 = 
0,1182
0,0672
= 3,10 
Como 𝐹8;9;0,10 = 2,47 < 3,10 < 3,23 = 𝐹8;9;0,05 ⇒ 0,10 < 𝑝 < 0,20 
Conclusión: no tengo evidencia suficiente para decidir que un método es más 
preciso que el otro. 
Ejercicio 2 
Se desea comparar el efecto de la ingestión de dosis bajas de ácido acetilsalicílico (AAS) 
sobre el metabolismo de las grasas en pacientes hipertensos leves. Un conjunto de 28 de tales 
pacientes se dividió al azar en 2 grupos homogéneos con respecto a los niveles de 
triglicéridos, administrándoles a uno de ellos AAS (una dosis de 100 mg/día al acostarse) y 
al otro no. Al cabo de 3 meses de tratamiento, se les midió el nivel de triglicéridos (en mg/dl) 
y se obtuvo: 
Sin AAS: 𝑛 = 13 �̅� = 134,4 𝑠 = 90,3 
Con AAS: 𝑛 = 15 �̅� = 86,7 𝑠 = 51,8 
Asumiendo que el nivel de triglicéridos sigue una distribución aproximadamente normal, 
verificar si se cumplen el resto de las suposiciones que nos permitan probar si hay diferencias 
2 
 
entre los grupos. Definir las variables, plantear los supuestos necesarios y las hipótesis 
correspondientes. 
Resolución 
XA = Nivel de triglicéridos sin AAS ~ N(µA, 𝜎𝐴) 
XB = Nivel de triglicéridos con AAS ~ N(µB, 𝜎𝐵) 
Tengo que verificar la hipótesis de igualdad de varianzas 
H0 : 𝜎𝐴
2 = 𝜎𝐵
2 vs H1: 𝜎𝐴
2 ≠ 𝜎𝐵
2 
 𝐹 = 
𝑆𝑚𝑎𝑦𝑜𝑟
2
𝑆𝑚𝑒𝑛𝑜𝑟
2 ~ 𝐹12;14 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠, 𝐹𝑐 = 
90,32
51,82
= 3,039 
Como 𝐹12;14;0,10 = 2,05 < 3,039 , rechazo la hipótesis de igualdad de varianzas. 
 
Ejercicio 3 
Un investigador realizó un estudio para comparar dos formulaciones de un fármaco para 
determinar el tiempo hasta la concentración máxima (Cmax). Para ello se seleccionaron 
voluntarios, de similares condiciones, y se les asignó aleatoriamente una de las dos 
formulaciones. 
Formulación A: 𝑛 = 21 �̅� = 127 𝑠 = 6,14 
Formulación B: 𝑛 = 21 �̅� = 136,54 𝑠 = 8,09 
Asumiendo que el tiempo hasta la concentración máxima sigue una distribución 
aproximadamente normal, verificar si se cumplen el resto de las suposiciones que nos 
permitan probar si hay diferencias entre los grupos. Definir las variables, plantear los 
supuestos necesarios y las hipótesis correspondientes. 
Resolución 
XA = Tiempo de Cmax para la formulación A ~ N(µA, 𝜎𝐴) 
XB = Tiempo de Cmax para la formulación A ~ N(µB, 𝜎𝐵) 
Tengo que verificar la hipótesis de igualdad de varianzas 
H0 : 𝜎𝐴
2 = 𝜎𝐵
2 vs H1: 𝜎𝐴
2 ≠ 𝜎𝐵
2 
 𝐹 = 
𝑆𝑚𝑎𝑦𝑜𝑟
2
𝑆𝑚𝑒𝑛𝑜𝑟
2 ~ 𝐹20;20 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠, 𝐹𝑐 = 
8,092
6,142
= 1,73 
Como 𝐹20;20;0,10 = 1,79 ≮ 1,73 , no puedo rechazar la hipótesis de igualdad de 
varianzas. Supongo válida la suposición de homogeneidad. 
 
Ejercicio 4 
Se compara la velocidad de disolución de dos formulaciones de un nuevo fármaco. Para ello 
se prueban 10 comprimidos de cada formulación y se observa el porcentaje de disolución. 
3 
 
 
Formulación A: 𝑛 = 10 �̅� = 77,1 𝑠 = 5,78 
Formulación B: 𝑛 = 10 �̅� = 71,4 𝑠 = 6,98 
D = Formulación A - Formulación B: 𝑛 = 10 �̅� = 5,7 𝑠 = 8,67 
Utilizando de la información brindada, la adecuada al problema, ¿existe diferencia entre los 
valores medios de la velocidad de disolución de las 2 formulaciones? Utilizar α = 0,05. 
Definir las variables aleatorias y enunciar los supuestos e hipótesis del problema. 
 
Resolución 
XA = Velocidad de disolución de la formulación A ~ N(µA, σ) 
XB = Velocidad de disolución de la formulación B ~ N(µB, σ) 
XA y XB independientes 
H0 : µ𝐴 = µ𝐵 vs H1: µ𝐴 ≠ µ𝐵 
 𝑆𝑝
2 = 
9 . 5,782+9 . 6,982
12−2 
= 41,072 
𝑡𝑐 = 
77,1−71,4 
√41,072 .
2
10
 
= 1,99 
Rechazo si |𝑡𝑐| > 2,101 = 𝑡18,0,05
2
 
Como 1,99 ≯ 2,101 , no puedo rechazar la hipótesis de igualdad de medias. No 
tengo evidencia significativa para decidir que las velocidades medias de disolución 
de ambas formulaciones, son diferentes. 
 
Ejercicio 5 
Se toma una muestra de un lote específico de comprimidos y se divide al azar en 2 grupos. 
Un grupo es analizado por los propios laboratorios de control de calidad del fabricante. El 
segundo grupo de comprimidos se envía a un laboratorio contratado para un análisis idéntico. 
Fabricante: 𝑛 = 6 �̅� = 99,83 𝑠 = 1,11 
Contratado: 𝑛 = 6 �̅� = 98,95 𝑠 = 1,30 
D = Fabricante – Contratado: 𝑛 = 6 �̅� = 0,88 𝑠 = 1,92 
Utilizando de la información brindada, la adecuada al problema, ¿existe diferencia 
significativa entre los 2 laboratorios? Utilizar α = 0,05. 
Definir las variables aleatorias y enunciar los supuestos e hipótesis del problema. 
 
Resolución 
XA = Análisis generado por el Fabricante ~ N(µA, σ) 
XB = Análisis generado por el laboratorio contratado ~ N(µB, σ) 
4 
 
XA y XB independientes 
H0 : µ𝐴 = µ𝐵 vs H1: µ𝐴 ≠ µ𝐵 
 𝑆𝑝
2 = 
5 . 1,112+5 . 1,302
12−2 
= 1,4585 
 
𝑡𝑐 = 
99,83−98,95
√1,4585 .
2
6
 
=
0,88
0,6972
= 1,262 
Rechazo si |𝑡𝑐| > 2,228 = 𝑡10,0,05
2
 
Como 1,262 ≯ 2,228 , no puedo rechazar la hipótesis de igualdad de medias. No 
tengo evidencia significativa para decidir que los resultados generados por los 2 
laboratorios son diferentes. 
 
 
 
Ejercicio 6 
Se realizó un estudio para determinar si hay diferencias en la eficacia de dos tratamientos 
para la hipertensión. Con este fin se seleccionaron sujetos hipertensos a uno de los dos grupos 
de tratamiento: el grupo 1 recibe un tratamiento basado en el primer fármaco y el grupo 2 
recibe un tratamiento basado en el segundo. 
Grupo 1: 𝑛 = 15 �̅� = 131,8 𝑠 = 12,53 
Grupo 2: 𝑛 = 15 �̅� = 135,2 𝑠 = 10,42 
D = Grupo 1 – Grupo 2: 𝑛 = 15 �̅� = −3,4 𝑠 = 9,41 
Utilizando de la información brindada, la adecuada al problema, ¿existe diferencia 
significativa entre los 2 fármacos? Utilizar α = 0,05. 
Definir las variables aleatorias y enunciar los supuestos e hipótesis del problema. 
 
Resolución 
X1 = Presión arterial Grupo 1 ~ N(µ1, σ) 
X2 = Presión arterial Grupo 2 ~ N(µ2, σ) 
XA y XB independientes 
H0 : µ1 = µ2 vs H1: µ1 ≠ µ2 
 𝑆𝑝
2 = 
14 . 12,532+14 . 10,422
30−2
= 132,814 
5 
 
𝑡𝑐 = 
131,80 − 135,20
√132,814 .
2
15
 
= −0,808 
 Rechazo si |𝑡𝑐| > 2,048 = 𝑡28,0,05
2
 
Como 0,808 ≯ 2,048 , no puedo rechazar la hipótesis de igualdad de medias. No 
tengo evidencia significativa para decidir que las presiones arteriales medias de ambos 
grupos son diferentes. 
 
Ejercicio 7 
La tabla proporciona los resultados de la determinación de la concentración de paracetamol 
(%m/m) en comprimidos por 2 métodos diferentes. Se analizaron 10 comprimidos de diez 
lotes diferentes. 
Método 1: 𝑛 = 10 �̅� = 84,001 𝑠 = 0,407 
Método 2: 𝑛 = 10 �̅� = 83,898 𝑠 = 0,339 
D = Método 1 – Método 2: 𝑛 = 10 �̅� = 0,109 𝑠 = 0,615 
Utilizando de la información brindada, la adecuada al problema, ¿existe diferencia 
significativa entre los 2 métodos? Utilizar α = 0,05. 
Definir las variables aleatorias y enunciar los supuestos e hipótesisdel problema. 
 
Resolución 
X1 = determinación por el método 1 
X2 = determinación por el método 2 
D = Determinación método 1 – determinación método 2 ~ N(µd, σd) 
H0 : µ1 = µ2 vs H1: µ1 ≠ µ2 o H0 : µ𝑑 = 0 vs H1: µ𝑑 ≠ 0 
𝑡𝑐 = 
0,109
0,615/√10 
= 0,56 
Rechazo si |𝑡𝑐| > 2,262 = 𝑡9,0,05
2
 
Como 0,56 ≯ 2,262 , no puedo rechazar la hipótesis de igualdad de medias. No 
tengo evidencia significativa para decidir que los resultados generados por los 2 
métodos son diferentes. 
 
Ejercicio 8 
Se desea determinar si un remedio para el resfriado que se vende sin prescripción médica 
tiene como efecto colateral la alteración de la presión arterial sistólica. Para ello, se tomaron 
medidas de línea base de presión arterial para cada paciente, se les administro el medicamento 
6 
 
para el resfriado y después de un cierto tiempo específico, se les mide la presión arterial por 
segunda vez. 
Primera medición: 𝑛 = 15 �̅� = 116,267 𝑠 = 17,491 
Segunda medición: 𝑛 = 15 �̅� = 122,667 𝑠 = 16,378 
D = Segunda medición – Primera medición: 𝑛 = 15 �̅� = 6,40 𝑠 = 8,458 
Utilizando de la información brindada, la adecuada al problema, ¿existe diferencia 
significativa entre los valores medios de la presión arterial entre la Primera y la Segunda 
medición? Utilizar α = 0,05. 
Definir las variables aleatorias y enunciar los supuestos e hipótesis del problema. 
 
Resolución 
X1 = presión arterial Primera medición 
X2 = presión arterial Segunda medición 
D = Presión arterial Segunda medición – presión arterial Primera medición ~ N(µd, σd) 
H0 : µ1 = µ2 vs H1: µ1 ≠ µ2 o H0 : µ𝑑 = 0 vs H1: µ𝑑 ≠ 0 
𝑡𝑐 = 
6,40
8,458/√15 
= 2,93 
 
Rechazo si |𝑡𝑐| > 2,145 = 𝑡14,0,05
2
 
Como 2,93 > 1,761 , rechazo la hipótesis de igualdad de medias. Tengo evidencia 
significativa para decir que hubo una diferencia de presión arterial. 
 
Intervalos de Confianza 
Ejercicio 1 
El nivel de bilirrubina en infantes a días de nacidos puede suponerse una variable aleatoria 
que está normalmente distribuida. Se construyó un intervalo de confianza para la varianza de 
dicha variable a partir de 25 observaciones, obteniéndose: 
𝐶(1,171 < 𝜎2 < 3,716) = 0,95 
Calcular la longitud del intervalo de confianza del 95% para la esperanza de la misma 
variable. 
 
Resolución 
X: nivel de bilirrubina en infantes a días de nacidos. 
𝑋 ∼ 𝑁(𝜇; 𝜎) 
Del primer intervalo se obtiene 𝑆2 = 1,921 
7 
 
24 ∗ 𝑆2
39,364
= 1,171 ⟹ 𝑆2 =
1,171 ∗ 39,364
24
= 1,921 
 
El valor de tabla del intervalo para la media es 𝑡
24;
0.05
2
= 2,064 
Planteamos la fórmula de la longitud: 
2 ∗ 𝑡
24;
0,05
2
∗
𝑆
√𝑛
= 2 ∗ 2,064 ∗ √
1,921
25
= 1,144 
 
Ejercicio 2 
Se estima que el tiempo de reacción a un estímulo de cierto dispositivo electrónico está 
distribuido normalmente con desviación estándar de 0,05 segundos. ¿Cuál es el número 
mínimo de mediciones que deberán efectuarse para construir un intervalo de confianza del 
95%, con aproximación no mayor que 0,01? 
Resolución 
X: tiempo de reacción a un estímulo de cierto dispositivo electrónico. 
𝑋 ∼ 𝑁(𝜇; 𝜎) 
 
𝑧0,05 2⁄ ∗
0,05
√𝑛
< 0,01 ⟹ 𝑛 > (
1,96 ∗ 0,05
0,01
)
2
= 96,04 ⟹ 𝑛𝑚í𝑛 = 97 
 
Ejercicio 3 
Se utiliza una máquina para llenar botellas de plástico con detergente para máquinas lavaplatos. 
Se sabe que la desviación estándar del volumen de llenado es 𝜎 = 0,8 onzas de líquido. Se toma 
una muestra aleatoria de 12 botellas. El volumen promedio de llenado es �̄� = 30,87 onzas de 
líquido. Asumiendo que el volumen de llenado sigue una distribución normal, construir un 
intervalo de confianza de nivel 90% para la esperanza del volumen de llenado. 
Resolución 
X: volumen de llenado de botellas de plástico. 
𝑋 ∼ 𝑁(𝜇; 𝜎) 
30,87 ± 𝑍0,10
2
∗
0,8
√12
⟹ 𝐶(30,49 < 𝜇 < 31,25) = 0,90 
𝛼 = 0,10, 𝑧0,1 2⁄ = 1,645. 
 
Ejercicio 4 
8 
 
Un fabricante de detergente líquido está interesado en la uniformidad de la máquina utilizada 
para llenar las botellas. De manera específica, es deseable que la desviación estándar del proceso 
de llenado sea menor que 0,15 onzas de líquido; de otro modo, existe un porcentaje mayor del 
deseable de botellas con un contenido menor de detergente. Supongamos que la distribución del 
volumen de llenado es aproximadamente normal. Al tomar una muestra aleatoria de 20 botellas, 
se obtiene una varianza muestral 𝑆2 = 0,0153. Hallar un intervalo de confianza de nivel 0,95 
para la varianza poblacional del volumen de llenado. 
Resolución 
X: volumen de llenado de botellas. 
𝑋 ∼ 𝑁(𝜇; 𝜎) 
 
𝐶 (
19 ∗ 0,0153
32,85
< 𝜎2 <
19 ∗ 0,0153
8,91
) = 𝐶(0,0089 < 𝜎2 < 0,0326) = 0,95 
Valores de tabla 𝜒0,975;19 = 8,91𝜒0,025;19 = 32,85 
 
Ejercicio 5 
Se utiliza una máquina para llenar botellas de plástico con detergente para máquinas 
lavaplatos. Se tomó una muestra aleatoria de tamaño 15 de las botellas envasadas por la 
máquina y se midió el volumen promedio de llenado y la varianza. El volumen promedio 
resultó 30,87 onzas y la varianza, 14,18 onzas2. Asumiendo que el volumen de llenado sigue 
una distribución normal, construir un intervalo de confianza del 95% para el volumen medio 
de llenado. 
Resolución 
X: Volumen de llenado de una botella en onzas; 𝑋 ∼ 𝑁(𝜇; 𝜎) 
�̄� ± 𝑡𝛼
2
;𝑛−1
.
𝑆
√𝑛
 
30,87 ± 2,145 ∗ √
14,1815
15
⟹ 30,87 ± 2,086 
𝐶(28,78 < 𝜇 < 32,96) = 0,95 
 
Ejercicio 6 
Un fabricante de detergente líquido está interesado en la uniformidad de la máquina utilizada 
para llenar las botellas. Una especificación técnica exige que la varianza del volumen de 
llenado no difiera significativamente de 2 onzas2. Supongamos que la distribución del 
volumen de llenado es aproximadamente normal. Al tomar una muestra aleatoria de 20 
botellas, se obtiene una varianza muestral 𝑆2 = 1,53. Hallar un intervalo de confianza de 
nivel 0,90 para la varianza poblacional del volumen de llenado. 
9 
 
Resolución 
X: Volumen de llenado de una botella en onzas; 𝑋 ∼ 𝑁(𝜇; 𝜎) 
𝐶 (
(𝑛 − 1). 𝑠2
𝜒
𝑛−1;
𝛼
2
2 < 𝜎
2 <
(𝑛 − 1). 𝑠2
𝜒
𝑛−1;1−
𝛼
2
2 ) = 1 − 𝛼 
𝐶 (
19 ∗ 1,53
30,144
< 𝜎2 <
19 ∗ 1,53
10,117
) = 0,90 
𝐶(0,964 < 𝜎2 < 2,873) = 0,90 
 
Ejercicio 7 
El nivel de bilirrubina en infantes a días de nacidos puede suponerse una variable aleatoria 
que está normalmente distribuida. Se construyó un intervalo de confianza para la varianza de 
dicha variable a partir de 16 observaciones, obteniéndose: 
𝐶(0,824 < 𝜎2 < 3,617) = 0,90 
Calcular la longitud del intervalo de confianza del 95% para la esperanza de la misma 
variable. 
 
Resolución 
X: nivel de bilirrubina en infantes a días de nacidos. 
𝑋 ∼ 𝑁(𝜇; 𝜎) 
Del primer intervalo se obtiene 𝑆2 = 1,373. 
15 ∗ 𝑆2
24,996
= 0,824 ⟹ 𝑆2 =
0,824 ∗ 24,996
15
= 1,373 
El valor de tabla del intervalo para la media es 𝑡
15;
0.05
2
= 2,131 
Planteamos la fórmula de la longitud: 
2 ∗ 𝑡
15;
0.05
2
∗
𝑆
√𝑛
= 2 ∗ 2,131 ∗
√1,373
4
= 1,249 
Ejercicio 8 
El nivel de bilirrubina en infantes a días de nacidos puede suponerse una variable aleatoria 
que está normalmente distribuida. Se construyó un intervalo de confianza para la varianza de 
dicha variable a partir de 25 observaciones, obteniéndose: 
𝐶(1,171 < 𝜎2 < 3,716) = 0,95 
Calcular la longitud del intervalo de confianza del 99% para la esperanza de la misma 
variable. 
 
 
10 
 
Resolución 
X: nivel de bilirrubina en infantes a días de nacidos. 
𝑋 ∼ 𝑁(𝜇; 𝜎) 
 
Del primer intervalo se obtiene 𝑆2 = 1,921 
24 ∗ 𝑆2
39,364
= 1,171 ⟹ 𝑆2 =
1,171 ∗ 39,364
24
= 1,921 
 
El valor de tabla del intervalo para la media es 𝑡
24;
0.01
2
= 2,797 
Planteamos la fórmula de la longitud: 
2 ∗ 𝑡
24;
0.01
2
∗
𝑆
√𝑛
= 2 ∗ 2,797 ∗ √
1,921
25
= 1,551 
 
Regresión Lineal 
Ejercicio 1 
Se sospecha que valor del Gasto Energético en Reposo (GER, en Kcal/día), en individuos 
varones que practicancierto deporte, disminuye con la edad. Para estudiarlo, se tomó una 
muestra de 24 individuos de edades fijas (15; 20; 30; 35; 40 y 55 años), a quienes se les 
determinó el GER por el método de Calorimetría Indirecta. Con los datos obtenidos se realizó 
un análisis de Regresión Lineal Simple, cuya salida se adjunta. 
 
 
 
Con nivel de significación del 5%, ¿puede afirmarse que el GER disminuye, en promedio, 
8,09 Kcal/día, por cada aumento de un año de edad? 
11 
 
Definir las variables aleatorias, enunciar el modelo de Regresión Lineal Simple y sus 
supuestos, y plantear el test adecuado para analizar la Significación de la Regresión. 
Explicitar la ecuación de la recta ajustada por el método de Mínimos Cuadrados. 
 
Resolución 
Definición de las variables aleatorias: 
x1; x2 ; x3 ; x4 ; x5 ; x6 = Valores fijos de edad de los individuos varones que practican cierto 
deporte. 
Yij = Valor j-ésimo de GER (Kcal/día) de varón que practica cierto deporte, de edad i-ésima. 
 
Supuestos: 
Yij ~ N (μi ;σ) , independientes ∀ 1 ≤ i ≤ 6 ∀ 1 ≤ j ≤ ni 
 
Modelo: 
Yij = α + β xi + εij con εij ~ N (0 ;σ ) , independientes ∀ 1 ≤ i ≤ 6 ∀ 1 ≤ j ≤ ni 
 
Análisis de la Significación de la Regresión: 
Test de hipótesis para el parámetro β: 
 
Hipótesis a testear: H0: β = 0 H1: β ≠ 0 
 
Estadístico de prueba: 
 
Zona de rechazo de H0: |T| ≥ t n-2;α/2 
 
Decisión: Se rechaza la hipótesis nula. La regresión es significativa (p-valor < 0,0001), por 
lo tanto, puede afirmarse que el GER disminuye, en promedio, 8,09 Kcal/día, por cada 
aumento de un año de edad. 
 
Ecuación de la recta ajustada por el método de Mínimos Cuadrados: 
 
𝑌 ̂𝑘 = �̂� + �̂� 𝑥𝑘 = 1675,57 − 8,09 𝑥𝑘 
 
Ejercicio 2 
Se sospecha que la administración de la droga Metimazol disminuye el Gasto Energético en 
Reposo (GER, en Kcal/día), en individuos hipertiroideos. Para estudiarlo, se tomó una 
muestra de 20 individuos con diagnóstico de tiroiditis, y se la dividió aleatoriamente en 4 
grupos; a cada grupo se le administró una dosis prefijada de Metamizol (2,5; 5; 10 y 15 
12 
 
mg/día) y, transcurrido un tiempo determinado, se le midió el GER por el método de 
Calorimetría Indirecta. Con los datos obtenidos se realizó un análisis de Regresión Lineal 
Simple, cuya salida se adjunta. 
 
 
 
Con nivel de significación del 5%, ¿puede afirmarse que el GER disminuye, en promedio, 
20,50 Kcal/día, por cada aumento de 1 mg/día en la dosis de Metimazol? 
Definir las variables aleatorias, enunciar el modelo de Regresión Lineal Simple y sus 
supuestos, y plantear el test adecuado para analizar la Significación de la Regresión. 
Explicitar la ecuación de la recta ajustada por el método de Mínimos Cuadrados. 
 
Resolución 
Definición de las variables aleatorias: 
x1; x2 ; x3 ; x4 = Valores fijos de dosis de Metimazol (mg/día). 
Yij = Valor j-ésimo de GER (Kcal/día) de individuo con diagnóstico de tiroiditis, que recibió 
la dosis i-ésima de Metimazol. 
 
Supuestos: 
Yij ~ N (μi ;σ) , independientes ∀ 1 ≤ i ≤ 4 ∀ 1 ≤ j ≤ ni 
 
Modelo: 
Yij = α + β xi + εij con εij ~ N (0 ;σ ) , independientes ∀ 1 ≤ i ≤ 4 ∀ 1 ≤ j ≤ ni 
 
Análisis de la Significación de la Regresión: 
 
Test de hipótesis para el parámetro β: 
 
Hipótesis a testear: H0: β = 0 H1: β ≠ 0 
 
Estadístico de prueba: 
13 
 
 
Zona de rechazo de H0: |T| ≥ t n-2;α/2 
 
Decisión: Se rechaza la hipótesis nula. La regresión es significativa (p-valor < 0.0001), por 
lo tanto, puede afirmarse que el GER disminuye, en promedio, 20.50 Kcal/día, por cada 
aumento de 1 mg/día en la dosis de Metimazol. 
 
Ecuación de la recta ajustada por el método de Mínimos Cuadrados: 
 
�̂�𝑘 = �̂� + �̂� 𝑥𝑘 = 2046.58 − 20.50 𝑥𝑘 
 
 
Ejercicio 3 
Se sospecha que valor del Gasto Energético en Reposo (GER, en Kcal/día), en individuos 
varones que practican cierto deporte, disminuye con la edad. Para estudiarlo, se tomó una 
muestra de 24 individuos de edades fijas (15; 20; 30; 35; 40 y 55 años), a quienes se les 
determinó el GER por el método de Calorimetría Indirecta. 
Con los resultados obtenidos al aplicar el modelo de Regresión Lineal Simple, se verificó la 
significatividad de la regresión (p-valor < 0,0001). 
 
 
 
Definir las variables aleatorias, enunciar el modelo de Regresión Lineal Simple y sus 
supuestos. Explicitar la ecuación de la recta ajustada por el método de Mínimos Cuadrados. 
Calcular un Intervalo de Predicción del 95% para el valor de Yk dado un xk = 25 años, 
sabiendo que Sxx = 4144,19 
14 
 
 
Resolución 
Ecuación de la recta ajustada por el método de Mínimos Cuadrados: 
𝑌 ̂𝑘 = �̂� + �̂� 𝑥𝑘 = 1675,57 − 8,09 𝑥𝑘 
a) Intervalo de Predicción (95%) para el valor de Yk, dado xk = 25 años. 
(�̂� + 𝛽 ̂𝑥𝑘) ± 𝑡𝛼 2⁄ ;𝑛−2 
√𝐶𝑀𝑟𝑒𝑠 [1 +
1
𝑛
+
 (𝑥𝑘 − �̅�)2
𝑆𝑋𝑋
] 
(1675,57 − 8,09 ∗ 25) ± 2,074√1272,42 [1 +
1
24
+
 (25 − 32,5)2
4144,19
] 
𝑃 (1397,41 < 𝑌𝑘 < 1549,39) = 0,95 
 
Ejercicio 4 
Se sospecha que la administración de la droga Metimazol disminuye el Gasto Energético en 
Reposo (GER, en Kcal/día), en individuos hipertiroideos. Para estudiarlo, se tomó una 
muestra de 20 individuos con diagnóstico de tiroiditis, y se la dividió aleatoriamente en 4 
grupos; a cada grupo se le administró una dosis prefijada de Metamizol (2.5, 5, 10 y 15 
mg/día) y, transcurrido un tiempo determinado, se le midió el GER por el método de 
Calorimetría Indirecta. 
Con los resultados obtenidos al aplicar el modelo de Regresión Lineal Simple, se verificó la 
significatividad de la regresión (p-valor < 0,0001). 
 
 
 
15 
 
Definir las variables aleatorias, enunciar el modelo de Regresión Lineal Simple y sus 
supuestos. Explicitar la ecuación de la recta ajustada por el método de Mínimos Cuadrados. 
Calcular un Intervalo de Predicción del 95% para el valor de Yk dado un xk = 12 mg/día, 
sabiendo que Sxx = 461,00 
 
Resolución 
Ecuación de la recta ajustada por el método de Mínimos Cuadrados: 
 
�̂�𝑘 = �̂� + �̂� 𝑥𝑘 = 2046,58 − 20,50 𝑥𝑘 
Intervalo de Predicción (95%) para el valor de Yk, dado xk = 12 mg/día. 
(�̂� + 𝛽 ̂𝑥𝑘) ± 𝑡𝛼 2⁄ ;𝑛−2 
√𝐶𝑀𝑟𝑒𝑠 [1 +
1
𝑛
+
 (𝑥𝑘 − �̅�)2
𝑆𝑋𝑋
] 
(2046,58 − 20,50 ∗ 12) ± 2,101√4081,05 [1 +
1
20
+
 (12 − 8,125)2
461,00
] 
𝑃(1660,91 < 𝑌𝑘 < 1940,20) = 0,95 
 
 
Ejercicio 5 
A partir de una muestra aleatoria de 24 mujeres embarazadas, de entre 28 y 38 semanas de 
gestación, se registró el peso del feto (en kg). Se ajustó una recta de mínimos cuadrados a los 
datos mencionados y se obtuvo la salida siguiente: 
 
Definir las variables aleatorias, enunciar el modelo de Regresión Lineal Simple y sus 
supuestos. ¿La regresión es significativa? Justificar. 
A partir de los resultados obtenidos, ¿se puede saber cuántos gramos de peso aumenta el feto, 
en promedio, por cada semana de gestación? 
16 
 
Calcular las semanas de gestación de un feto de 2 kg de peso. 
 
Resolución 
Definición de las variables aleatorias 
x1; ….; xI = valores fijos de semanas de gestación, entre 28 y 38. 
Yij = Peso en gramos del j-ésimo feto, con i semanas de gestación i 
 
Modelo 
Yij = α + β xi + εij con εij ~ N (0 ;σ ) , independientes ∀ 1 ≤ i ≤ I ∀ 1 ≤ j ≤ ni 
 
Supuestos 
Yij ~ N (μi ;σ) , independientes ∀ 1 ≤ i ≤ I ∀ 1 ≤ j ≤ ni 
 
La regresión es significativa: β ∈ (0,176; 0,209) al 95% para las edades gestacionales 
indicadas. 
 
El peso aumenta 193 gramos por cada semana de gestación. 
 
𝑌 ̂𝑘 = �̂� + �̂� 𝑥𝑘 = −4,302 + 0,193. 𝑥𝑘 
2 = −4,302 + 0,193. 𝑥𝑘 
𝑥𝑘 =
2 + 4,302
0,193
= 32,65 
El feto tiene aproximadamente 33 semanas de gestación. 
 
Ejercicio 6 
A partir de una muestra de 14 niños tomadosal azar, de entre 3 y 9 meses de edad (�̅� = 5), 
se registró la estatura (en cm) de cada uno y se ajustó una recta de mínimos cuadrados. Se 
obtuvo la salida siguiente: 
 
17 
 
 
De la salida que se adjunta, se puede concluir que la regresión es significativa. 
Justificar la última afirmación, indicando qué hipótesis se testean y el nivel justo de 
significación. 
Informar la ecuación de la recta ajustada por el método de mínimos cuadrados. 
A partir de la relación lineal entre la estatura y la edad, obtener un intervalo del 95% de 
confianza para la estatura media de niños de 7 meses, utilizando la recta de regresión y 
sabiendo que SXX = 52. 
 
Resolución 
Hipótesis a testear: H0: β = 0 vs. H1: β ≠ 0 
 
-IC(95%) para 𝛽: (1,60; 3,28) no contiene al cero 
-Test de hipótesis para 𝛽: T = 6,34, p_valor<0,0001 
-Anova para la regresión significativa: F = 40,16, p_valor<0,0001 
 
𝑌 ̂𝑘 = �̂� + �̂� 𝑥𝑘 = 53,63 + 2,44. 𝑥𝑘 
 
Un IC(95%) para la estatura media de los niños de 7 meses, es (68,38; 73,04) y se calcula 
de la siguiente manera: 
(�̂� + 𝛽 ̂𝑥𝑘) ± 𝑡𝛼 2⁄ ;𝑛−2 
√𝐶𝑀𝑟𝑒𝑠 [
1
𝑛
+
 (𝑥𝑘 − �̅�)2
𝑆𝑋𝑋
] 
18 
 
(53,63 + 2,44 ∗ 7) ± 2,179 √7,72 [
1
14
+
 (7 − 5)2
52
] 
70,71 ± 2,33 
Ejercicio 7 
A 10 individuos sanos, con concentración de Calcio en plasma entre 5 y 11 mg/100ml, se les 
midió la concentración de hormona paratiroidea (PTH) en 𝜇g/ml. Se ajustó una recta de 
cuadrados mínimos obteniéndose la salida siguiente: 
 
En base a los resultados obtenidos, ¿se puede afirmar que la regresión es significativa? 
Justificar. 
¿Qué nivel medio de PTH le corresponde a un nivel de Calcio de 10 unidades? 
¿Qué nivel medio de Calcio le corresponde a una PTH de 1,5 unidades? ¿y a una de 3 
unidades? 
 
Resolución 
 
Hipótesis a testear: H0: β = 0 vs. H1: β ≠ 0 
 
- IC(95%) para 𝛽: (-0,7221; -0,3161) no contiene al cero 
- Test de hipótesis para 𝛽: T = -5,8962, p-valor = 0,0004 
 
Existe relación lineal entre ambas concentraciones. La pendiente negativa indica que la 
PTH disminuye cuando aumenta el Calcio y viceversa. 
 
𝑌 ̂𝑘 = �̂� + �̂� 𝑥𝑘 = 6,536 − 0,5191. 𝑥𝑘 
𝑌 ̂𝑘 = 6,536 − 0,5191.10 = 1,345 𝜇g/ml 
 
 
19 
 
𝑌 ̂𝑘 = 6,536 − 0,5191. 𝑥𝑘 
 
1,5 = 6,536 − 0,5191. 𝑥𝑘 
 𝑥𝑘 =
6,536−1,5
0,5191
= 9,7 mg/100ml 
 
3 = 6,536 − 0,5191. 𝑥𝑘 
 𝑥𝑘 =
6,536−3
0,5191
= 6,8 mg/100ml 
 
Ejercicio 8 
A partir de una muestra de 14 niños tomados al azar, de entre 3 y 9 meses de edad (�̅� = 5), 
se registró la estatura (en cm) de cada uno y se ajustó una recta de mínimos cuadrados. Se 
obtuvo la salida siguiente: 
 
Definir las variables aleatorias, enunciar el modelo de Regresión Lineal Simple, sus 
supuestos y, a partir de la salida, justificar si la regresión es significativa. 
¿Se puede saber cuántos centímetros aumenta la estatura, en promedio, por cada mes de 
crecimiento del niño? 
Sabiendo que SXX = 52, predecir mediante un intervalo del 95%, la estatura de un niño de 7 
meses. 
 
 
 
20 
 
Resolución 
Definición de las variables aleatorias: 
x1; ….; xI = valores fijos de edad, entre 3 y 9 meses. 
Yij = estatura del j-ésimo niño de edad i 
 
Modelo: 
Yij = α + β xi + εij con εij ~ N (0 ;σ ) , independientes ∀ 1 ≤ i ≤ I ∀ 1 ≤ j ≤ ni 
 
Supuestos: 
Yij ~ N (μi ;σ) , independientes ∀ 1 ≤ i ≤ I ∀ 1 ≤ j ≤ ni 
 
Análisis de la Significación de la Regresión: 
Hipótesis a testear: H0: β = 0 vs. H1: β ≠ 0 
 
-IC(95%) para 𝛽: (1,60; 3,28) no contiene al cero 
-Test de hipótesis para 𝛽: T = 6,34, p_valor < 0,0001 
-Anova para la regresión significativa: F = 40,16, p_valor < 0,0001 
 
La regresión es significativa (p_valor < 0,0001). 
 
Puede afirmarse que la estatura aumenta, en promedio, 2,44 cm por cada aumento de 1 mes 
en la edad del niño. 
 
El intervalo de predicción del 95% para la talla de un niño de 7 meses es (64,22; 77,2) y se 
obtiene de la siguiente manera: 
(�̂� + 𝛽 ̂𝑥𝑘) ± 𝑡𝛼 2⁄ ;𝑛−2 
√𝐶𝑀𝑟𝑒𝑠 [1 +
1
𝑛
+
 (𝑥𝑘 − �̅�)2
𝑆𝑋𝑋
] 
(53,63 + 2,44 ∗ 7) ± 2,179 √7,72 [1 +
1
14
+
 (7 − 5)2
52
] 
70,71 ± 6,49 
 
Distribución de la media muestral y del desvío muestral 
Ejercicio 1 
El tiempo de espera entre colectivos en una parada se supone una variable de distribución 
normal, con esperanza 10 minutos y desvío estándar de  = 3 minutos. Si un inspector 
21 
 
selecciona 16 intervalos al azar y registra los tiempos de espera entre colectivos, ¿cuál es la 
probabilidad de que la varianza muestral de los tiempos de espera registrados resulte mayor 
a 15 (min)2? 
Resolución 
X: tiempo de espera entre colectivos en una parada. 
𝑋 ∼ 𝑁(𝜇; 𝜎) 
S2: varianza del tiempo de espera entre colectivos en una determinada parada. 
 
𝑃(𝑆2 > 15) = 𝑃 (𝜒15
2 >
15 ∗ 15
9
) = 𝑃(𝜒15
2 > 25) = 0,05 
 
Ejercicio 2 
El tiempo de espera entre colectivos en una parada se supone una variable de distribución 
normal, con esperanza 15 minutos y desvío estándar de  = 5 minutos. Si un inspector 
selecciona 20 intervalos al azar y registra los tiempos de espera entre colectivos, ¿cuál es la 
probabilidad de que la varianza muestral de los tiempos de espera resulte menor a 36 (min)2? 
Resolución 
X: tiempo de espera entre colectivos en una parada. 
𝑋 ∼ 𝑁(𝜇; 𝜎) 
S2: varianza del tiempo de espera entre colectivos en una determinada parada. 
 
𝑃(𝑆2 < 36) = 𝑃 (𝜒19
2 <
36 ∗ 19
25
) = 𝑃(𝜒20
2 < 27,36) ≅ 0,90 
 
Ejercicio 3 
Durante el proceso de homologación de una aguja hipodérmica cuya medición del diámetro 
externo tiene un desvío poblacional , se tomó una muestra aleatoria de 101 agujas de la 
producción. ¿Cuál es el máximo valor de la desviación estándar poblacional para que la 
probabilidad de que la varianza muestral resulte menor que 229,514 (m)2 sea mayor que 
0,99? 
 
 
22 
 
Resolución 
X: diámetro externo de una aguja hipodérmica. 
𝑋 ∼ 𝑁(𝜇; 𝜎) 
𝑃(𝑆2 < 229,514) > 0,99 ⟹ 𝑃 (
𝑆2 ∗ 100
𝜎2
<
229,514 ∗ 100
𝜎2
) = 𝑃 (𝜒100
2 <
22951,4
𝜎2
)
> 0,99 ⟹
22951,4
𝜎2
> 135,807 ⟹ 𝜎2 < 169,000125 ⟹ 𝜎 < 13,0 
 
Ejercicio 4 
Durante el proceso de homologación de una aguja hipodérmica cuya medición del diámetro 
externo tiene un desvío poblacional , se tomó una muestra aleatoria de 101 agujas de la 
producción. ¿Cuál es el máximo valor de la desviación estándar poblacional para que la 
probabilidad de que la varianza muestral resulte menor que 260 (m)2 sea mayor que 0,95? 
Resolución 
X: diámetro externo de una aguja hipodérmica. 
𝑋 ∼ 𝑁(𝜇; 𝜎) 
𝑃(𝑆2 < 260) > 0,95 ⟹ 𝑃 (
𝑆2 ∗ 100
𝜎2
<
260 ∗ 100
𝜎2
) = 𝑃 (𝜒100
2 <
26000
𝜎2
) > 0,95
⟹
26000
𝜎2
> 123,342 ⟹ 𝜎2 < 209,1007 ⟹ 𝜎 < 14,4603 
Ejercicio 5 
La dimensión del diámetro craneal sigue una distribución aproximadamente normal, con una 
media de 184,6 mm y una desviación estándar de 13,1 mm. La probabilidad de que el 
promedio del diámetro craneal de una muestra de tamaño n resulte menor que 183,2 mm, es 
0,2578. ¿Cuál es el tamaño de la muestra? 
 
Resolución 
X: diámetro craneal, en mm, de una población. 
𝑋~𝑁(184,6; 13,1) ⇒ �̅�~𝑁 (184,6;
13,1
√𝑛
) 
𝑃(�̅� < 183,2) = 𝑃 (𝑍 <
183,2 − 184,6
13,1
√𝑛
) = 𝑃(𝑍 < −0,107√𝑛) = 0,2578 
 
 ⇒ 𝑃(𝑍 < 0,107√𝑛) = 0,7422 
23 
 
 
⇒ 0,107√𝑛 = 0,65 
 
𝒏 = 𝟑𝟕 
Ejercicio 6 
La dimensión del diámetro craneal sigue una distribución aproximadamente normal, con una 
media de 183,7 mm y una desviación estándar de 12,7 mm. La probabilidad de que el 
promedio del diámetro craneal de una muestra de tamaño n resulte mayor que 182 mm, es 
0,8461. ¿Cuál es el tamaño de la muestra? 
 
Resolución 
X: diámetro craneal, en mm, de una población. 
𝑋~𝑁(183,7; 12,7) ⇒ �̅�~𝑁 (183,7;
12,7
√𝑛
) 
𝑃(�̅� > 182) = 𝑃 (𝑍 >
182 − 183,7
12,7
√𝑛
) = 𝑃(𝑍 > −0,134√𝑛) = 0,8461 
 
 ⇒ 𝑃(𝑍 > −0,134√𝑛) = 0,8461 
 
⇒ −0,134√𝑛 = −1,02𝒏 = 𝟓𝟖 
Ejercicio 7 
El tiempo en el que una nueva aspirina tarda en calmar el dolor de cabeza sigue una 
distribución normal con media 20 min y varianza 30 (min)2. Al tomar una muestra aleatoria 
de 15 pacientes con dolor de cabeza a los que se les suministra la aspirina, ¿Cuál es la 
probabilidad de que el tiempo promedio de efecto en la muestra no supere los 23 min, 
sabiendo que supera los 18 min? 
 
Resolución 
X: tiempo, en minutos, que tarda una nueva aspirina en calmar el dolor de cabeza 
𝑋~𝑁(20; 5,48) ⇒ �̅�~𝑁 (20;
5,48
√15
) 
24 
 
 
𝑃[(�̅� < 23) (�̅� > 18)⁄ ] =
𝑃(18 < �̅� < 23)
𝑃(�̅� > 18)
=
𝑃(−1,41 < 𝑍 < 2,12)
𝑃(�̅� > −1,41)
= 
 
 =
𝐹𝑧(2,12) − 𝐹𝑧(−1,41)
𝐹𝑧(1,41)
=
0,9830 − 0,0793
0,9207
= 𝟎, 𝟗𝟖𝟏𝟓 
 
Ejercicio 8 
El tiempo en el que una nueva aspirina tarda en calmar el dolor de cabeza sigue una 
distribución normal con media 23 min y desvío estándar 4,5 min. Al tomar una muestra 
aleatoria de 12 pacientes con dolor de cabeza a los que se les suministra la aspirina, ¿Cuál es 
la probabilidad de que el tiempo promedio de efecto en la muestra se encuentre entre los 21 
min y los 26 min? 
 
Resolución 
X: tiempo, en minutos, que tarda una nueva aspirina en calmar el dolor de cabeza 
𝑋~𝑁(23; 4,5) ⇒ �̅�~𝑁 (23;
4,5
√12
) 
𝑃(21 < �̅� < 26) = 𝑃(−1,54 < 𝑍 < 2,31) = 𝐹𝑧(2,31) − 𝐹𝑧(−1,54) = 
= 0,9896 − 0,0618 = 𝟎, 𝟗𝟐𝟕𝟖 
ANOVA 
Ejercicio 1 
Se proporcionaron 4 medicamentos diferentes a 44 pacientes que padecían convulsiones, y 
luego de cierto tiempo se midieron los niveles de actividad de fosfatasa alcalina en el suero. 
Los datos obtenidos fueron: 
 Medicamento A Medicamento B Medicamento C Medicamento D 
i
n
 
10 12 13 9 
i
s 
25 47 30 46 
𝑆𝐶𝑇𝑂𝑇𝐴𝐿 = 122.558 
Definir las variables aleatorias, establecer los supuestos necesarios, plantear las hipótesis, 
indicar el estadístico de prueba correspondiente y decidir si hay diferencias significativas 
entre los efectos medios de los distintos medicamentos, concluir en términos del problema. 
Resolución 
25 
 
Definimos las variables: 
𝑌𝑖𝑗: Nivel de fosfatasa alcalina en el suero del j-ésimo paciente tratado con el medicamento i 
1 ≤ 𝑖 ≤ 4, 1 ≤ 𝑗 ≤ 𝑛𝑖 𝐼 = 4 𝑛1 = 10  𝑛2 = 12 𝑛3 = 13  𝑛4 = 9 44n = 
Suponemos 𝑌𝑖𝑗 ∼ 𝑁(𝜇𝑖; 𝜎) independientes 1 4i  
0 1 2 3 4 1
) ) No todas las son iguales
i
H H    = = = 
4
2 2 2 2 2
1 1
( 1) (10 1) 25 (12 1) 47 (13 1) 30 (9 1) 46
57652
I
Dentro i i
i i
SC n s
= =
= −  = −  + −  + −  + −  =
=
 
 
Se sabe además que 122558TOTALSC = 
Entonces 122558 57652 64906Entre Total DentroSC SC SC= − = − = 
 
Fuente de 
variación 
SC gl CM F 
Entre trat. 64906 I-1 = 3 21635,33 15,011 
Dentro trat. 57652 n-I = 40 1441,3 
Total 122558 n-1 = 43 
 
Rechazo 0H si 1, ,I n I
F F
− −

 es decir, si 𝐹 ≥ 𝐹3,40,0.05 = 2,84 (tomamos 
0, 05 = ) 
Como 15,011 ≥ 2,84 se rechaza 0H . 
Luego concluimos que existen diferencias entre los niveles medios de actividad de fosfatasa 
alcalina en el suero de pacientes tratados con los distintos medicamentos. 
 
Ejercicio 2 
En un laboratorio se quiere comparar el funcionamiento de tres máquinas de llenado de 
frascos de cierto medicamento. Se midieron los volúmenes (en cm3) vertidos por cada 
máquina en 𝑛𝑖 frascos seleccionados aleatoriamente. 
 
 Máquina 1 Máquina 2 Máquina 3 
i
n 
4 5 6 
26 
 
i
y 
10,3 10,2 10,1 
 𝑆𝐶𝐷𝐸𝑁𝑇𝑅𝑂 = 4,3025 
Definir las variables aleatorias, indicar los supuestos, plantear las hipótesis, indicar el 
estadístico de prueba correspondiente y decidir si hay diferencias significativas entre las 
cantidades medias vertidas por cada máquina, con nivel de significación del 5%. Dar las 
conclusiones en términos del problema. 
Resolución 
Definimos las variables: 
:
ij
Y
” Volumen del j-ésimo frasco vertido con la máquina i” 
1 3i  , 1 ij n  3I = 1 2 34 5 6n n n= = = 15n = 
Suponemos 𝑌𝑖𝑗 ∼ 𝑁(𝜇𝑖; 𝜎) independientes 1 3i  . 
0 1 2 3 1
) ) No todas las son iguales
i
H H   = = 
Observemos que i i iT y n=  
1
2
3
10, 3 4 41, 2
10, 2 5 51
10,1 6 60, 6
T
T
T
=  =
=  =
=  = 
2
1556,52
T
C
n
= = 
2
1
1697, 44 2601 3672, 36
1556, 52 0,1
4 5 6
I
i
Entre
i i
T
SC C
n=
= − = + + − = 
Fuente de 
variación 
SC gl CM F 
Entre trat. 0,1 I-1 = 2 0,05 0,1395 
Dentro trat. 4,3025 n-I = 12 0,3585 
Total 4,4025 n-1 = 14 
 
Rechazo 0H si 1, ,I n I
F F
− −

 es decir, si 2,12,0.05
3,89F F =
 (tomamos 0, 05 = ) 
Como 0,1395 < 3,89 no se rechaza 0H . 
27 
 
Luego concluimos que no existen diferencias significativas entre las cantidades medias 
vertidas por cada máquina. 
 
Ejercicio 3 
Para estudiar el efecto de 4 dietas sobre la disminución de peso en cierta raza se administró 
cada dieta aleatoriamente a un grupo de 4 gatos; se obtuvieron las siguientes disminuciones 
de peso promedio al cabo de cierto período de tiempo: 
 
 Dieta A Dieta B Dieta C Dieta D 
i
y 
432 458,5 467,25 464,5 
i
s 
5,04 4,42 4,18 4,06 
 
Luego de realizar un Análisis de Varianza se concluyó que no todas las dietas tenían el mismo 
efecto, con un nivel de significación de 0,05. Definir las variables aleatorias, indicar los 
supuestos, plantear las hipótesis e indicar el estadístico de prueba correspondiente al 
ANOVA. Decidir con un nivel de significación global de 0,05; con el método de Tukey, si 
hay diferencias significativas entre las disminuciones de peso promedio producidas por las 
dietas: 
i) A y D ii) B y C 
Dar las conclusiones en términos del problema. 
Resolución 
:
ij
Y
”Disminución j de peso en cierta raza de gato con la dieta i.” 
Suponemos 𝑌𝑖𝑗 ∼ 𝑁(𝜇𝑖; 𝜎) independientes 
0 ´ 1 ´
) )
i i i i
H H   = 
 
4
i
n J= = 
´
´
i i
ii
Dentro
y y
T
CM
J
−
=
 Rechazamos 0H si ´ , ,ii I N I
T q
−

 
O, equivalentemente, rechazamos 0H si
´ , ,
Dentro
i i I N I
CM
y y q
J
−
−  
=MDS 
 
28 
 
4
2 2 2 2 2
1 1
( 1) (4 1) 5, 04 (4 1) 4, 42 (4 1) 4,18 (4 1) 4, 06
I
Dentro i i
i i
SC n s
= =
= −  = −  + −  + −  + −  = 
 
= 236,682 
 
236, 682 236, 682
19, 7235
16 4 12
Dentro
Dentro
SC
CM
n I
= = = =
− − 
 
, , 4 ,12,0,05
4, 20
I n I
q q
−
= =
 Luego 
19, 7235
4, 20 9,3263
4
MDS =  =
 
 
432 464, 5 32, 5
A D
y y− = − =
 
A D
y y MDS− 
 Luego hay diferencias significativas entre las disminuciones medias de 
pesos en gatos tratados con las dietas A y D. 
458, 5 467, 25 8, 75
B C
y y− = − =
 
B C
y y MDS− 
 Luego no hay 
diferencias significativas entre las 
disminuciones medias de pesos en 
gatos tratados con las dietas B y C. 
 
Ejercicio 4 
Para estudiar el efecto de 4 dietas sobre el aumento de peso en cierta raza se administró cada 
dieta aleatoriamente a un grupo de 4 perros; se obtuvieron las siguientes disminuciones de 
peso promedio al cabo de cierto período de tiempo: 
 
 Dieta A Dieta B Dieta C Dieta D 
i
y 
458,5 467,25 464,5 432 
i
s 
4,42 4,18 4,06 5,04 
 
Luego se realizar un Análisis de Varianza se concluyó que no todas las dietas tenían el mismo 
efecto medio, con un nivel de significación de 0,05. Definir las variables aleatorias, indicar 
 Dieta A Dieta B Dieta C Dieta D 
i
y
 
432 458,5 467,25 464,5 
i
s 
5,04 4,42 4,18 4,06 
29 
 
los supuestos, plantear las hipótesis e indicar el estadístico de prueba correspondiente al 
ANOVA. Decidir con un nivel de significación global de 0.05, con el método de Tukey, si 
hay diferencias significativas entre las disminuciones de peso promedio producidas por las 
dietas: 
i) A y C ii) B y D. 
Dar las conclusiones en términos del problema. 
Resolución 
:
ij
Y
”Aumento j de peso en cierta raza de perro con la dieta i.” 
Suponemos𝑌𝑖𝑗 ∼ 𝑁(𝜇𝑖; 𝜎) independientes 
0 ´ 1 ´
) )
i i i i
H H   = 
 
4
i
n J= = 
´
´
i i
ii
Dentro
y y
T
CM
J
−
=
 Rechazamos 0H si ´ , ,ii I N I
T q
−

 
O, equivalentemente, rechazamos 0H si
´ , ,
Dentro
i i I N I
CM
y y q
J
−
−  
=MDS 
 
4
2 2 2 2 2
1 1
( 1) (4 1) 5, 04 (4 1) 4, 42 (4 1) 4,18 (4 1) 4, 06
I
Dentro i i
i i
SC n s
= =
= −  = −  + −  + −  + −  = 
 
= 236,682 
 
236, 682 236, 682
19, 7235
16 4 12
Dentro
Dentro
SC
CM
n I
= = = =
− − 
 
, , 4 ,12,0,05
4, 20
I n I
q q
−
= =
 Luego 
19, 7235
4, 20 9,3263
4
MDS =  =
 
 Dieta A Dieta B Dieta C Dieta D 
i
y
 
458,5 467,25 464,5 432 
30 
 
i
s 
4,42 4,18 4,06 5,04 
 
458, 5 464, 5 6
A C
y y− = − =
 
A C
y y MDS− 
 Luego no hay diferencias significativas entre los aumentos medios de 
pesos en perros tratados con las dietas A y C. 
467, 25 432 35, 25
B D
y y− = − =
 
B D
y y MDS− 
 Luego hay diferencias significativas entre los aumentos medios de 
pesos en perros tratados con las dietas B y D. 
 
Ejercicio 5 
Se estudió la concentración de hierro en ciertas hojas luego de administrarles 3 tratamientos 
diferentes, y se obtuvieron los siguientes datos: 
 
Tratamiento 1 2 3 
i
n 
8 10 9 
i
s 
8,2 6,8 5,0 
𝑆𝐶𝐸𝑁𝑇𝑅𝐸 = 417,57 
Decidir si hay diferencias significativas entre las concentraciones medias con un nivel de 
significación 𝛼 = 0,01 . Definir las variables aleatorias, indicar los supuestos, plantear las 
hipótesis, indicar el estadístico de prueba y las conclusiones en términos del problema. 
Resolución 
Definimos las variables: 
:
ij
Y
” Concentración de hierro en la j-ésima hoja que recibió el tratamiento i” 
1 3i  , 1 ij n  3I = 1 2 3
8 10 9n n n= = =
 27n = 
Suponemos 𝑌𝑖𝑗 ∼ 𝑁(𝜇𝑖; 𝜎) independientes 1 3i  . 
0 1 2 3 1
) ) No todas las son iguales
i
H H   = =
 
3
2 2 2 2
1 1
( 1) (8 1) 8, 2 (10 1) 6,8 (9 1) 5, 0 1086,84
I
Dentro i i
i i
SC n s
= =
= −  = −  + −  + −  =  
31 
 
 
Fuente de 
variación 
SC gl CM F 
Entre trat. 417,57 I-1 = 2 208,785 4,611 
Dentro trat. 1086,64 n-I = 24 45,277 
Total 1504,21 n-1 = 26 
 
2,24,0.01
 = 5 ,61F
 
Como F = 4,611 < 5,61 no se rechaza 0H y se concluye que no hay diferencias 
significativas entre las concentraciones medias de hierro en las hojas según los tratamientos 
administrados. 
Ejercicio 6 
A efectos de estudiar el rendimiento físico de pacientes recientemente recuperados luego de 
una afección pulmonar leve, se seleccionaron al azar tres grupos de 5 personas cada uno, que 
entrenaron con métodos diferentes. El primer grupo realizó largos recorridos de caminata a 
ritmo pausado, el segundo grupo realizó series cortas de ejercicios de alta intensidad sin peso 
adicional, y el tercero trabajó en el gimnasio con pesas. Después de un mes de entrenamiento 
se realizó un test de rendimiento puntuado. 
Definir las variables aleatorias, indicar los supuestos del modelo, plantear las hipótesis 
completar los valores faltantes en la salida de Infostat, y dar la conclusión del test en función 
del p-valor: 
 
 
 
 
 
Resolución 
Definimos las variables: 
:
ij
Y
 Puntuación obtenida en el test por el j-ésimo paciente que entrenó con el método i 
1 3i  , 1 ij n  3I = 
5 para todo 
i
n i=
 15n = 
Suponemos 
( ; )
ij i
Y N  
 independientes 1 3i  . 
32 
 
0 1 2 3 1
) ) No todas las son iguales
i
H H   = = 
Fuente de 
variación 
SC gl CM F 
Método 25,6 I-1 = 2 12,80 4,267 
Error 36 n-I = 12 3 
Total 61,6 n-1 = 14 
Como p-valor = 0,0398, para 0,0398  no se rechaza 0H , y para 0,0398  se rechaza 
0
H . 
 
Ejercicio 7 
Se realizó una experiencia para determinar posibles diferencias significativas en la captación 
celular de epinefrina marcada con 14C bajo la acción de tres inhibidores (codificados como 
1, 2 y 3). Para ello se seleccionaron 18 ratas de laboratorio, las cuales fueron asignadas al 
azar a cada uno de los inhibidores en un diseño balanceado (n1= n2 = n3). Se registró el 
porcentaje de captación por miligramo de peso seco de cultivo de tejido de rata. 
Luego de realizar un Análisis de la Varianza se rechazó la hipótesis de igualdad de medias, 
con un nivel de significación de 0,05. 
Se sabe además que el valor estimado de F = 10,802 y 𝑆𝐶𝐸𝑁𝑇𝑅𝐸 = 1,75 
Definir las variables aleatorias, indicar los supuestos, plantear las hipótesis e indicar el 
estadístico de prueba correspondiente al ANOVA. Completar los datos faltantes en la salida 
de InfoStat y definir qué pares de medias difieren significativamente con un nivel de 
significación global de 0,05. Dar las conclusiones en términos del problema. 
 
Resolución 
Definimos las variables: 
Yij: “Porcentaje de captación (por miligramo de peso seco) de cultivo de tejido de la j-ésima 
rata bajo la acción del i-ésimo inhibidor” 
Donde 
33 
 
Suponemos además independientes 
Sabemos que luego de realizar un Análisis de la Varianza se rechazó la hipótesis de igualdad 
de medias, con un nivel de significación de 0,05. 
Para completar los datos de la salida de InfoStat dada, podemos pensar-en principio- que los 
grados de libertad asociados a la suma de cuadrados “entre” tratamientos pueden obtenerse 
como “I-1”, luego en este caso van a ser iguales a 2. 
 
Entonces, 
De aquí: 
 
Los grados de libertad asociados a la suma de cuadrados “dentro” de los tratamientos pueden 
obtenerse como “n-I”, luego en este caso van a ser iguales a 15. 
Por último, para analizar qué pares de medias difieren significativamente con un nivel de 
significación global de 0,05 planteamos en general: 
 
El estadístico de prueba correspondiente al test de Tukey es: 
 
 
En este caso, siendo resulta: 
34 
 
 , de donde puede verse sencillamente 
que al 5% sólo hay diferencias significativas entre los porcentajes medios de captación 
asociados a los inhibidores 1 y 3 y 2 y 3. 
 
Ejercicio 8 
Se realizó un estudio sobre la respuesta del organismo humano a un fármaco. Se analizaron 
tres grupos de 7 individuos: controles normales, pacientes con cirrosis hepática y pacientes 
con hepatitis activa crónica (codificados como 1, 2 y 3, respectivamente). A cada individuo 
se le suministró oralmente una cierta cantidad del fármaco por Kg de peso. Basándose en los 
análisis de sangre posteriores se determinó para cada uno el tiempo de máxima concentración 
en plasma (en horas). 
Se sabe que el valor estimado de F = 15,02 y 𝑆𝐶𝐸𝑁𝑇𝑅𝐸 = 3488,42 
Al realizar un Análisis de la Varianza se rechazó la hipótesis de igualdad de medias, con un 
nivel de significación de 0,05. 
Definir las variables aleatorias, indicar los supuestos, plantear las hipótesis e indicar el 
estadístico de prueba correspondiente al ANOVA. Completar los datos faltantes en la salida 
de InfoStat y definir qué pares de medias difieren significativamente con un nivel de 
significación global de 0,05. Dar las conclusiones en términos del problema. 
 
Resolución 
Definimos las variables: 
Yij: “Tiempo de máxima concentración de un fármaco en plasma (en horas) del j-ésimo 
individuo perteneciente al i-ésimo grupo” 
Donde 
Suponemos además independientes 
35 
 
Sabemos que luego de realizar un Análisis de la Varianza se rechazó la hipótesis de igualdad 
de medias, con un nivel de significación del 5%. 
Para completar los datos de la salida de InfoStat dada, podemos pensar-en principio- que los 
grados de libertad asociados a la suma de cuadrados “entre” tratamientos pueden obtenerse 
como “I-1”, luego en este caso van a ser iguales a 2. 
Entonces, 
De aquí: 
 
Los grados de libertad asociados a la suma de cuadrados “dentro” de los tratamientos pueden 
obtenerse como “n-I”, luego en este caso van a ser iguales a 18. 
Por último, para analizar qué pares de medias difieren significativamente al 5%, planteamos 
en general:El estadístico de prueba correspondiente al test de Tukey es: 
 
 
En este caso, siendo resulta: 
 
36 
 
de donde puede verse sencillamente que al 5% sólo hay diferencias significativas entre los 
tiempos medios de concentración del fármaco en plasma de los grupos 1 y 2 y entre los 
grupos 1 y 3.

Continuar navegando