Logo Studenta

Análisis de la Varianza-Estadistica

¡Este material tiene más páginas!

Vista previa del material en texto

Cuadernillo de Aplicación Unidad III – 2020 
 
Cátedra de Cálculo Estadístico y Biometría. Facultad de Ciencias Agrarias. UNCuyo. Año 2020 
 
ANÁLISIS DE VARIANZA 
PROTOCOLO DE RESOLUCIÓN DE CASOS 
1- Determinar cuál es la variable respuesta (variable aleatoria), definir y determinar si los datos 
para dicha variable son observacionales o experimentales 
2- Determinar las poblaciones o grupos que se quieren comparar y el número de unidades de 
análisis o experimentales, según sea el caso. 
3- Realizar un análisis exploratorio de los datos. 
4- Comprobar los supuestos sobre la variable respuesta. 
5- Plantear el modelo. 
6- Realizar la prueba de hipótesis en forma completa 
7- Comprobar los supuestos sobre los residuos. 
8- Realizar la comparación de medias 
9- Emitir una conclusión final para cada caso. 
 
SE HA ELIMINADO EL EJERCICIO 3 DEL PRÁCTICO (porque para su resolución se necesitan 
conocimientos que no están dentro del programa de grado) Y SE HA TRABAJADO CON TRES 
EJERCICIOS. 
Ejercicio 1 
Se han utilizado tres métodos analíticos (1, 2 y 3) para determinar el contenido de oxígeno disuelto 
en el agua de un lago. Cada uno de los métodos se ha aplicado seis veces. Compruebe si los 
métodos arrojan diferentes resultados. 
 
Método O2 en mg/l 
1 10,96 10,77 10,90 10,69 10,87 10,60 
2 10,88 10,75 10,80 10,81 10,70 10,82 
3 10,73 10,79 10,78 10,82 10,88 10,81 
Fuente: Ejemplo extraído del libro Biostatistical Analysis de J.H. Zar 
 
 
 
RESOLUCIÓN: 
1. Determinar cuál es la variable respuesta (variable aleatoria), definir y determinar si los datos para 
dicha variable son observacionales o experimentales. 
• La variable respuesta es Y: “Contenido de oxígeno disuelto en el agua de un lago en mg/L”. 
• Los datos de la variable son de tipo observacionales. 
2. Determinar las poblaciones o grupos que se quieren comparar y el número de unidades de 
análisis o unidades experimentales, según sea el caso. 
• Grupo 1: Contenido de oxígeno disuelto en el agua de un lago, en mg/L, utilizando el método 1. 
• Grupo 2: Contenido de oxígeno disuelto en el agua de un lago, en mg/L, utilizando el método 2. 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
• Grupo 3: Contenido de oxígeno disuelto en el agua de un lago, en mg/L, utilizando el método 3. 
𝑛1 = 6; 𝑛2 = 6; 𝑛3 = 6 En total tenemos 18 unidades de análisis 
 
3. Realizar un análisis exploratorio de los datos. 
 
 
 
 
 
 
 
4. Comprobar los supuestos sobre la variable respuesta. 
• Supuesto de Normalidad: 
 
Dado que los errores tienen una distribución normal con media 0 y varianza 𝜎2 (𝜀𝑖𝑗 ~𝑁(0, 𝜎
2)) , 
suponemos que 𝑌~𝑁(𝑦; 𝜇𝑗 , 𝜎
2) o sea la variable cantidad de oxígeno disuelta (mg/L) tiene una 
distribución Normal con media µ y varianza 𝜎2 
 A su vez, debe suponerse que los efetos debidos al azar, así como los factores no comparados, 
están distribuidos de forma normal. En la práctica se utiliza la gráfica de probabilidad normal (QQ-
plot) para comprobar el cumplimiento de este supuesto. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 1: Diagrama de cajas de la cantidad de 
oxígeno disuelta (en mg/L) según el método analítico 
utilizado 
 
Figura 2: Gráfico Q-Q plot de cuantiles observados con 
respecto a los cuantiles de una Normal. 
 
Es razonable suponer por la 
Figura 2 que se cumple el 
supuesto de normalidad, por la 
tendencia lineal del patrón de 
datos que se ajusta bien a una 
recta trazada a 45°. 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
➔ Pasos para la obtención de gráficos utilizando Infostat. 
1°. Cargar los datos en una misma columna y clasificarlos según los métodos. 
 
 
 
 
2° En la parte superior seleccionar sobre el botón de gráficos, y posteriormente indicar como tipo de 
gráfico el QQ-plot. 
 
 
 
 
 
 
 
 
 
 
 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
3° Seleccionar la variable e indicarle al software el tipo de distribución que tiene dicha variable. En 
este caso es Normal. 
 
 
 
4° Presionar el botón de aceptar y ya tendrán el gráfico QQ-Plot listo. 
 
• Supuesto de homogeneidad de varianza: 
 
𝜎1
2 = 𝜎1
2 = 𝜎3
2 = 𝜎2 
Las varianzas de las k poblaciones son iguales y además son iguales a la varianza debido al error 
aleatorio: 
𝜎1
2 = 𝜎1
2 = 𝜎3
2 = 𝜎2 = 𝜎𝜀
2. 
 En la práctica se puede analizar el cumplimiento del supuesto a través de un análisis empírico 
realizando el cociente entre la desviación típica mayor y la desviación típica menor, en nuestro caso: 
s1 / s3 = 0,14/0,05 = 2,8 
Si el supuesto se cumple, este análisis empírico debería tener como resultado un número menor o 
igual a 2. El cociente es mayor a 2, ¿debemos entonces considerar que no se cumple el supuesto? 
Los aspectos a tener en cuenta para continuar con el análisis son que la variable es cuantitativa 
continua y sólo se tienen 6 repeticiones de cada grupo. Por el momento vamos a continuar con el 
análisis. (1) 
Supuesto de independencia: Debe suponerse independencia entre las observaciones. Si la toma 
de muestras se realiza al azar se asegura la independencia entre los errores aleatorios de las 
observaciones. 
 
5. Plantear el modelo. 
Bajo hipótesis nula cierta, el modelo que explica el comportamiento de la variable a observar es: 
ijijY  += ; j = 1,2, ..., k e i = 1,2, ..., nj 
Este modelo se conoce como modelo de media. 
 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
Si la hipótesis nula se rechaza, el modelo es otro. En este caso en que los datos son observacionales 
se plantea el modelo de medias: 
Modelo de medias 
𝑌𝑖𝑗 = 𝜇𝑗 + 𝜀𝑖𝑗 𝑗 = 1, 2, 3 𝜀𝑖𝑗 ~𝑁(0, 𝜎
2) 
𝑖 = 1, 2, 3, … ,6 
Donde: 
𝑌𝑖𝑗: i-ésima observación del j-ésimo grupo. 
𝜇𝑗: media del j-ésimo grupo 
𝜀𝑖𝑗: es el error experimental para la i-ésima observación del j-ésimo grupo 
6. Realizar la prueba de hipótesis en forma completa. 
• Hipótesis científica: El contenido de oxígeno disuelto en el agua de un lago es diferente según el 
método analítico que se haya utilizado para su determinación. 
• 𝐻0: µ1 = µ2 = µ3 
• 𝐻1= al menos una media es distinta. 
• Nivel de significancia: α = 0,05 
• Estadígrafo de prueba: 
𝐹 =
𝐶𝑀𝑇 
𝐶𝑀𝐸
 = 
𝑆𝐶𝑇/𝑣𝑇
𝑆𝐶𝐸/𝑣𝐸
~𝐹 (𝑣𝑇; 𝑣𝐸) 
 
 
 
 
 
 
 
 
 
 
 
 
 
• Regla de decisión: 
 
Rechazar H0 si 𝐹(𝛼, 𝑣𝑇 , 𝑣𝐸) < 
𝐶𝑀𝑇
𝐶𝑀𝐸
 o dicho de otra forma si Fm > Fc 
𝑣𝑇 = 𝑘 − 1 = 3 − 1 = 2 
𝑣𝐸 = 𝑛𝑘 − 𝑘 = 6 ∗ 3 − 3 = 15 
 
→ Cálculo de 𝐹𝑐 utilizando Infostat 
 
Fc= 3,68 
 0,05 
 0,095 
1) Criterio de los puntos críticos 
Si Fm > Fc se rechaza la hipótesis nula 
 
2) Criterio del p-valor 
Si el p-valor es menor que el nivel de 
significancia, se rechaza la hipótesis 
nula. 
p-valor(probabilidad) <α(probabilidad) 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
 
→ Cálculo de 𝐹𝑐 utilizando Excel 
 
=INV.F(probabilidad acumulada;gl de los tratamientos;gl del error) 
=INV.F(0,95;2;15) = 3,68 
 
 
• Cálculo de la tabla de ADEVA 
 
Tabla 1. Contenido de oxígeno disuelto en agua de un lago (mg/L) 
medido con 3 métodos analíticos 
 
 Método 
 1 2 3 
 10,96 10,88 10,73 
 10,77 10,75 10,79 
 10,90 10,80 10,78 
 10,69 10,81 10,82 
 10,87 10,70 10,88 
 10,60 10,82 10,81 
𝑦.𝑗 64,79 64,76 64,81 
�̅�.𝑗 10,7983 10,7933 10,8017 
𝑦.. 194,36 
�̅�.. 10,7978 
 
 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de CienciasAgrarias – UNCuyo- Año 2020 
Tabla 2. Análisis de la Varianza. Cálculo del estadígrafo de prueba muestral (Fm) 
Fuente de 
variación 
SC Gl CM Estadígrafo F 
Total SCG= ∑ ∑ (𝑦𝑖𝑗 − �̅�..)
2𝑛𝑗
𝑖=1
𝑘
𝑗=1 nk-1 
CMT/CME Grupos SCT= ∑ 𝑛𝑗(�̅�.𝑗̅̅ ̅ − 𝑦..̅)
2𝑘
𝑗=1 k-1 SCT/(k-1) 
Error SCE= ∑ ∑ (𝑦𝑖𝑗 − �̅�.𝑗)
2𝑛𝑗
𝑖=1
𝑘
𝑗=1 nk-k SCE/(nk-1) 
SCG= (10,962 + 10,772 + ⋯ 10,812) −
194,362
18
 =0,1251 
SCT = 
64,792+64,792+64,812
6
−
194,362
18
 = 0,00021 
SCE= SCG- SCT = 0,1251 – 0,00021 = 0,1249 
𝐶𝑀𝑇 = 𝑆𝐶𝑇/𝑣𝑇 = 0,00021/2 = 0,000105 
𝐶𝑀𝐸 = 𝑆𝐶𝐸/𝑣𝐸 = 0,1249/15 = 0,00833 
F = CMT/ CME = 0,0126 
Tabla resumen: 
Fuente de 
variación 
SC Gl CM Estadígrafo F 
Total 0,1251 17 
0,0126 Grupos 0,00021 2 0,000105 
Error 0,1249 15 0,00833 
Cálculo usando Infostat (ver pasos en video subido al campus): 
 
• Toma de decisión: 
 
o Como Fm (0,0126) es menor que Fc (3,68) no se rechaza o se acepta la H0 para un nivel de 
significancia de α=0,05. 
 
o El p-valor (0,9874) es mayor al nivel de significancia α (0,05) por lo tanto, no se rechaza o se 
acepta la H0. 
 
• Interpretación: 
 
Se tiene evidencia muestral suficiente para decir que no existe diferencia en la medición de oxígeno 
disuelto en agua de un lago, realizado por tres métodos distintos, para un nivel de significancia de 
0,05. 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
• Conclusión: 
El contenido medio de oxígeno en el lago es el mismo con cualquiera de los tres métodos utilizados 
para su determinación. 
 
7. Comprobar los supuestos sobre los residuos. 
 
• Normalidad de los residuos 
 
 
Infostat permite también la comprobación del supuesto de normalidad realizando la prueba de 
hipótesis de Shapiro-Wilks con el valor de los residuos (RDUO). 
 
Las hipótesis que se someten a prueba son: 
 
H0: Los residuos tienen distribución normal. 
H1: Los residuos no tienen distribución normal. 
En este caso no hay evidencias para rechazar el supuesto de distribución normal (p=0,9780). 
 
• Homogeneidad de la varianza 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Puede verse en la Figura 3 que 
los puntos están distribuidos 
de forma uniforme alrededor 
de una línea recta, lo que 
indicaría una aparente 
normalidad en la distribución 
de los residuos. 
Figura 3: Gráfico Q-Q plot (normal) de los residuos 
estandarizados. 
 
Figura 4: Gráfico de dispersión para los valores predichos y los 
residuos 
 
 
 
Puede verse en la Figura 4 por 
la dispersión de los puntos que 
no se observa ningún patrón 
que indique alguna desviación 
del supuesto de Homogeneidad 
de varianzas. Por esto es que 
fue importante al inicio del 
práctico seguir con el análisis 
(Ver 1) 
 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
• Independencia 
En general, un buen proceso de aleatorización asegura el cumplimiento del supuesto de 
independencia. 
 
8. Realizar la comparación de medias. 
No se realiza comparación de medias, ya que se aceptó la hipótesis nula de igualdad de medias. 
9. Emitir una conclusión final. 
A partir del análisis de los datos obtenidos, se puede decir que no hay diferencia en los contenidos 
medios de oxígeno disuelto en agua de un lago medido con los distintos métodos. 
Ejercicio 2 
Se ha realizado un experimento a campo utilizando ajo “semilla” tratado previo a la siembra, con 
cuatro nematicidas diferentes (A, B, C y D) y sin aplicación de nematicida (E). Cada tratamiento se ha 
aplicado 5 veces. A continuación, se dan los rendimientos parcelarios al momento de cosecha 
(kg/parcela). 
 
A B C D E 
13.7 9.6 11.6 7.5 4.8 
17.4 16.1 11.9 19.6 9.8 
10.9 21.0 19.4 16.7 8.8 
24.4 20.4 14.2 12.6 10.5 
12,5 22,3 13,8 26,5 11,5 
 
RESOLUCIÓN: 
 
1. Determinar cuál es la variable respuesta (variable aleatoria), definir y determinar si los datos para 
dicha variable son observacionales o experimentales. 
 
• La variable respuesta es Y: “Rendimiento de ajo al momento de cosecha en kg/parcela”. 
 
• En este caso, los datos son experimentales. 
 
2. Determinar las poblaciones o grupos que se quieren comparar y el número de unidades de 
análisis o unidades experimentales, según sea el caso. 
 
• Grupo A: Rendimiento parcelario de ajo, en kg/parcela, tratado con el nematicida A al 
momento de cosecha. 
 
• Grupo B: Rendimiento parcelario de ajo, en kg/parcela, tratado con el nematicida B al 
momento de cosecha. 
 
• Grupo C: Rendimiento parcelario de ajo, en kg/parcela, tratado con el nematicida C al 
momento de cosecha. 
 
• Grupo D: Rendimiento parcelario de ajo, en kg/parcela, tratado con el nematicida D al 
momento de cosecha. 
 
• Grupo E: Rendimiento parcelario de ajo, en kg/parcela, sin aplicación de nematicida al 
momento de cosecha. 
 
 𝑛𝐴 = 𝑛𝐵 = 𝑛𝐶 = 𝑛𝐷 = 𝑛𝐸 = 5 En total tenemos 25 unidades de análisis 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
3. Realizar un análisis exploratorio de los datos. 
Para realizar el análisis exploratorio de los datos, obtenemos las medidas resumen mediante el 
software InfoStat (puede realizarse también con Excel): 
 
Medidas resumen 
Nematicida Variable n Media D.E. Mín Máx 
A Rendimiento 5 15,78 5,38 10,90 24,40 
B Rendimiento 5 17,88 5,18 9,60 22,30 
C Rendimiento 5 14,18 3,13 11,60 19,40 
D Rendimiento 5 16,58 7,17 7,50 26,50 
E Rendimiento 5 9,08 2,59 4,80 11,50 
 
También podemos realizar el diagrama de cajas: 
 
 
 
 
 
Del análisis exploratorio, podemos decir que aparentemente hay una diferencia entre las medias del 
rendimiento parcelario de ajo al momento de la cosecha, es notable la diferencia entre los grupos 
tratados con el nematicida y el grupo testigo (E). 
 
4. Comprobar los supuestos sobre la variable respuesta. 
 
• Supuesto de Normalidad: 
Dado que los errores 𝜀𝑖𝑗 ~𝑁(0, 𝜎
2) , suponemos que 𝑌~𝑁(𝑦; 𝜇𝑗 , 𝜎
2) o sea la variable rendimiento de 
ajo (kg/parcela) al momento de la cosecha tiene una distribución Normal con media µ y varianza 𝜎2 
Analizamos el cumplimiento de este supuesto a través de la gráfica de probabilidad normal (QQ plot): 
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil VersiónEstudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
A B C D E
Nematicida
3,71
9,68
15,65
21,62
27,59
R
e
n
d
im
ie
n
to
Figura 1: Diagrama de cajas del rendimiento parcelario de 
ajo (en kg/parcela) según el nematicida utilizado 
 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
 
 
Puede verse en la Figura 2 que los puntos están distribuidos de forma uniforme alrededor de la recta, 
por lo que es razonable suponer que se cumple que la variable respuesta Y tiene distribución normal. 
También se puede probar el cumplimiento de este supuesto a través de una prueba de hipótesis. En 
el test de Shapiro Wilks las hipótesis que se someten a prueba son: 
H0: Y tiene distribución normal. 
H1: Y no tiene distribución normal. 
Los resultados obtenidos a través de Infostat son: 
Shapiro-Wilks (modificado) 
 Variable n Media D.E. W* p (Unilateral D) 
Rendimiento 25 14,70 5,51 0,95 0,5544 
 
En este caso no hay evidencias para rechazar el supuesto de distribución normal del rendimiento 
parcelario de ajo al momento de la cosecha, ya que el p-valor obtenido es p = 0,5544 > 0,05. 
• Supuesto de homogeneidad de varianza: 
 
𝜎𝐴
2 = 𝜎𝐵
2 = 𝜎𝐶
2 = 𝜎𝐷
2 = 𝜎𝐸
2 = 𝜎2 
Las varianzas de las 5 poblaciones son iguales y además son iguales a la varianza debido al error 
aleatorio: 
𝜎𝐴
2 = 𝜎𝐵
2 = 𝜎𝐶
2 = 𝜎𝐷
2 = 𝜎𝐸
2 = 𝜎2 = 𝜎𝜀
2 
En la práctica se puede analizar el cumplimiento del supuesto a través de un análisis empírico 
realizando el cociente entre la desviación típica mayor y la desviación típica menor, en nuestro caso: 
𝑠𝐷
𝑠𝐸
=
7,17
2,59
= 2,77. 
Si el supuesto se cumple, este análisis empírico debería tener como resultado un número menor o 
igual a 2, esto no se cumple. Pero también es válido considerar que la variable es cuantitativa 
continua y sólo se tienen 5 repeticiones de cada grupo. Por el momento vamos a considerar 
varianzas homogéneas y continuar con el análisis. 
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
3,88 9,53 15,19 20,84 26,50
Cuantiles de una Normal(14,7,30,349)
3,88
9,53
15,19
20,84
26,50
C
u
a
n
ti
le
s
 o
b
s
e
rv
a
d
o
s
(R
e
n
d
im
ie
n
to
)
n= 25 r= 0,985 (Rendimiento)
Figura 2: Gráfico Q-Q plot de cuantiles observados con 
respecto a los cuantiles de una Normal. 
 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
• Supuesto de independencia: Debe suponerse independencia entre las observaciones. Si la toma 
de muestras se realiza al azar se asegura la independencia entre los errores aleatorios de las 
observaciones. 
 
5. Plantear el modelo. 
Como ya dijimos en el ejercicio 1, bajo hipótesis nula cierta, el modelo que explica el 
comportamiento de la variable a observar es: 
ijijY  += ; j = 1,2, ..., k e i = 1,2, ..., nj 
 
Este modelo se conoce como modelo de media. 
 
Si la hipótesis nula se rechaza, y los datos son experimentales el modelo es otro. Existirá una 
diferencia entre la media de la j-ésima población o grupo (j) y la media general () que se puede 
atribuir a lo que se llama un efecto del grupo o muestra. A este efecto lo denotaremos por j (  es 
la letra griega tau), de modo que: 
 −= jj 
o bien  += jj para j = 1,2, ..., k. 
 
Con base a esto y, puede formularse el modelo ADEVA 
ijjijY  ++= ; j = 1,2, ..., k e i = 1,2, ..., nj 
Donde: 
𝑌𝑖𝑗: i-ésimo rendimiento parcelario de ajo al momento de la cosecha del j-ésimo grupo. 
 : es la media sobre todas las k poblaciones, 
j : es el efecto sobre la respuesta debido al j-ésimo nematicida y 
i : es el error experimental para la i-ésimo rendimiento de ajo al momento de la cosecha bajo el j-
ésimo nematicida 
 Según este modelo, el valor de yij está formado por la suma de tres componentes o efectos: un 
efecto común (), un efecto del j-ésimo grupo ( j ) y un efecto aleatorio (ij). 
6. Realizar la prueba de hipótesis en forma completa. 
• Hipótesis científica: El rendimiento medio de ajo, en kg/parcela, al momento de la cosecha es 
diferente según el nematicida con el que fue tratado. 
• 𝐻0: j = 0 para todo j; j = A, B, C, D, E 
• 𝐻1= j ǂ 0 al menos para algún j 
• Nivel de significancia: α = 0,05 
• Estadígrafo de prueba: 
𝐹 =
𝐶𝑀𝑇 
𝐶𝑀𝐸
 = 
𝑆𝐶𝑇/𝑣𝑇
𝑆𝐶𝐸/𝑣𝐸
 ~𝐹 (𝑣𝑇; 𝑣𝐸) 
siendo: 
𝑣𝑇 = 𝑘 − 1 = 5 − 1 = 4 
𝑣𝐸 = 𝑛𝑘 − 𝑘 = 5 ∗ 5 − 5 = 20 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
o Regla de decisión: 
 
1) Criterio de los puntos críticos 
Si 𝐹𝑚 > 𝐹𝑐 se rechaza la hipótesis nula 
 
2) Criterio del p-valor 
Si el p-valor es menor que el nivel de significancia, se rechaza la hipótesis nula. 
 
 
 
 
 
 
 
 
 
 
 
 
 
Si calculamos 𝐹𝑚, 𝐹𝑐 y el p-valor utilizando Infostat: 
 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 233,34 4 58,34 2,36 0,0884 
Nematicida 233,34 4 58,34 2,36 0,0884 
Error 495,04 20 24,75 
Total 728,38 24 
 
 
• Toma de decisión: 
 
o Si utilizamos el Criterio de los puntos críticos, como 𝐹𝑚 = 2,36 < 2,87 = 𝐹𝑐 no se rechaza H0 
para un nivel de significancia de α=0,05. 
 
o Si utilizamos el Criterio del p-valor, como el p-valor = 0,0884 > 0,05 no se rechaza H0. 
 
 
𝐹𝑚 = 2,36 
p-valor = 0,0884 
𝐹𝑐 = 2,87 
𝐹𝑐 = 2,87 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
• Interpretación:Se tiene evidencia muestral suficiente para decir que no existe diferencia en el rendimiento medio de 
ajo al momento de la cosecha, según el nematicida aplicados, para un nivel de significancia de 0,05. 
 
• Conclusión: 
Los rendimientos medios de ajo al momento de cosecha son iguales, cualquiera sea el nematicida 
aplicado, incluso para el testigo. 
 
7. Comprobar los supuestos sobre los residuos. 
 
o Normalidad de los residuos 
 
 
 
 
Si realizamos la prueba de Shapiro-Wilks: 
 
Las hipótesis que se someten a prueba son: 
 
H0: Los residuos tienen distribución normal. 
H1: Los residuos no tienen distribución normal. 
Utilizando Infostat para realizar este test de hipótesis, obtenemos los siguientes resultados: 
Shapiro-Wilks (modificado) 
 Variable n Media D.E. W* p(Unilateral D) 
RDUO Rendimiento 25 0,00 4,54 0,97 0,8936 
 
Podemos concluir que no hay evidencias para rechazar el supuesto de distribución normal de los 
residuos, ya que obtuvimos un p-valor = 0,8936 > 0,05. 
o Homogeneidad de la varianza 
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
-9,08 -4,33 0,42 5,17 9,92
Cuantiles de una Normal(2,8422E-016,20,627)
-9,08
-4,33
0,42
5,17
9,92
C
u
a
n
ti
le
s
 o
b
s
e
rv
a
d
o
s
(R
D
U
O
 R
e
n
d
im
ie
n
to
) n= 25 r= 0,991 (RDUO Rendimiento)
Puede verse en la Figura 3 que los 
puntos están distribuidos de forma 
uniforme alrededor de la recta y = x, 
lo que indicaría una aparente 
normalidad en la distribución de los 
residuos. 
Figura 3: Gráfico Q-Q plot (normal) de los residuos. 
 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
 
 
o Independencia 
En general, un buen proceso de aleatorización asegura el cumplimiento del supuesto de 
independencia. 
 
8. Realizar la comparación de medias. 
No se justifica la realización de la comparación de medias, ya que no se rechazó la hipótesis nula de 
igualdad de medias. 
9. Emitir una conclusión final. 
A partir del análisis de los datos obtenidos, se puede decir que no hay diferencia en el rendimiento 
medio parcelario de ajo al momento de la cosecha en los 5 tratamientos con nematicida. 
Ejercicio 3 
Se analizaron seis muestras de cada uno de cuatro tipos de cereal producidos en cierta región para 
determinar el contenido de tiamina, resultando los siguientes datos (µg/g) 
Tabla 3. Datos de contenido de tiamina (µg/g) 
Muestras 
Tipos de cereal 
Trigo Cebada Maíz Avena 
1 5.2 6.5 5.8 8.3 
2 4.5 8.0 4.7 6.1 
3 6.0 6.1 6.4 7.8 
4 6.1 7.5 4.9 7.0 
5 6.7 5.9 6.0 5.5 
6 5.8 5.6 5.2 7.2 
Fuente: Ejemplo extraído del libro Probabilidad y estadística para ingeniería y ciencias. Devore,J 
 
RESOLUCIÓN: 
 
1. Determinar cuál es la variable respuesta (variable aleatoria), definir y determinar si los datos para 
dicha variable son observacionales o experimentales. 
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
8,64 11,06 13,48 15,90 18,32
PRED Rendimiento
-2,25
-1,08
0,09
1,27
2,44
R
E
 R
e
n
d
im
ie
n
to
Figura 4: Gráfico de dispersión para los valores predichos y los 
residuos estandarizados. 
 
 
 
 
 
 
 
 
 
s estandarizados del modelo analizado. 
GráficoQ-Q plot (normal)…. 
 
Puede verse en la Figura 4 por la 
dispersión de los puntos que no se 
cumple el supuesto de Homogeneidad 
de varianzas. Se debería entonces 
transformar la variable, pero a los 
efectos del aprendizaje de este 
método de ADEVA, no vamos a 
realizar la transformación para este 
ejercicio. 
 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
• La variable respuesta es Y: “Contenido de tiamina en cuatro tipos de cereales producidos en 
cierta región, en 𝜇𝑔/𝑔”. 
 
• En este caso, los datos son observacionales. 
 
2. Determinar las poblaciones o grupos que se quieren comparar y el número de unidades de 
análisis o unidades experimentales, según sea el caso. 
 
• Grupo T: Contenido de tiamina en Trigo producido en cierta región, en 𝜇𝑔/𝑔. 
 
• Grupo C: Contenido de tiamina en Cebada producido en cierta región, en 𝜇𝑔/𝑔. 
 
• Grupo M: Contenido de tiamina en Maíz producido en cierta región, en 𝜇𝑔/𝑔.• Grupo A: Contenido de tiamina en Avena producido en cierta región, en 𝜇𝑔/𝑔 
 
 𝑛𝑇 = 𝑛𝐶 = 𝑛𝑀 = 𝑛𝐴 = 6 En total tenemos 24 unidades de análisis 
 
3. Realizar un análisis exploratorio de los datos. 
Para realizar el análisis exploratorio de los datos, obtenemos las medidas resumen y el diagrama de 
cajas: 
 
Medidas resumen 
Tipo Cereal Variable n Media D.E. Mín Máx 
Avena Cont Tiamina 6 6,98 1,04 5,50 8,30 
Cebada Cont Tiamina 6 6,60 0,95 5,60 8,00 
Maíz Cont Tiamina 6 5,50 0,67 4,70 6,40 
Trigo Cont Tiamina 6 5,72 0,77 4,50 6,70 
 
 
 
 
 
Del análisis exploratorio, podemos decir que a priori hay una diferencia entre las medias del 
contenido de tiamina en los distintos tipos de cereal. En particular pareciera que la media del 
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Trigo Cebada Maíz Avena
Tipo Cereal
4,3
5,4
6,4
7,4
8,5
C
o
n
t 
T
ia
m
in
a
Figura 1: Diagrama de cajas del contenido de tiamina (𝜇𝑔/𝑔) 
según tipo de cereal. 
 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
contenido de tiamina en Cebada y Avena es mayor a la media del contenido de tiamina en Trigo y 
Maíz. 
 
4. Comprobar los supuestos sobre la variable respuesta. 
 
• Supuesto de Normalidad: 
Dado que los errores 𝜀𝑖𝑗 ~𝑁(0, 𝜎
2) , suponemos que 𝑌~𝑁(𝑦; 𝜇𝑗 , 𝜎
2) o sea la variable contenido de 
tiamina en distintos tipos de cereal tiene una distribución Normal con media µ y varianza 𝜎2 
Analizamos el cumplimiento de este supuesto a través de la gráfica de probabilidad normal (QQ plot): 
 
 
 
 
Puede verse en la Figura 2 que los puntos están distribuidos de forma uniforme alrededor de la recta, 
por lo que es razonable suponer que se cumple que la variable respuesta Y tiene distribución normal. 
También se puede probar el cumplimiento de este supuesto a través de una prueba de hipótesis. En 
el test de Shapiro Wilks las hipótesis que se someten a prueba son: 
H0: Y tienen distribución normal. 
H1: Y no tienen distribución normal. 
Los resultados obtenidos a través de Infostat son: 
Shapiro-Wilks (modificado) 
 Variable n Media D.E. W* p(Unilateral D) 
Cont Tiamina 24 6,20 1,02 0,94 0,4183 
 
En este caso no hay evidencias para rechazar el supuesto de distribución normal del contenido de 
tiamina en diferentes tipos de cereal, ya que el p-valor obtenido es p = 0,4183 > 0,05. 
• Supuesto de homogeneidad de varianza: 
 
𝜎𝑇
2 = 𝜎𝐶
2 = 𝜎𝑀
2 = 𝜎𝐴
2 = 𝜎2 
Las varianzas de las 4 poblaciones son iguales y además son iguales a la varianza debido al error 
aleatorio: 
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
4,21 5,23 6,25 7,28 8,30
Cuantiles de una Normal(6,2,1,0487)
4,21
5,23
6,25
7,28
8,30
C
u
a
n
ti
le
s
 o
b
s
e
rv
a
d
o
s
(C
o
n
t 
T
ia
m
in
a
)
n= 24 r= 0,985 (Cont Tiamina)
Figura 2: Gráfico Q-Q plot de cuantiles observados con 
respecto a los cuantiles de una Normal. 
 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
𝜎𝑇
2 = 𝜎𝐶
2 = 𝜎𝑀
2 = 𝜎𝐴
2 = 𝜎2 = 𝜎𝜀
2 
 En la práctica se puede analizar el cumplimiento del supuesto a través de un análisis empírico 
realizando el cociente entre la desviación típica mayor y la desviación típica menor, en nuestro caso: 
𝑠𝐴
𝑠𝑀
=
1,04
0,67
= 1,55. 
Si el supuesto se cumple, este análisis empírico debería tener como resultado un número menor o 
igual a 2. Por lo que podemos considerar varianzas homogéneas. 
• Supuesto de independencia: Debe suponerse independencia entre las observaciones. Si la toma 
de muestras se realiza al azar se asegura la independencia entre los errores aleatorios de las 
observaciones. 
 
5. Plantear el modelo. 
 
Modelo de medias 
𝑌𝑖𝑗 = 𝜇𝑗 + 𝜀𝑖𝑗 𝑗 = 𝑇, 𝐶, 𝑀, 𝐴 𝜀𝑖𝑗 ~𝑁(0, 𝜎
2) 
𝑖 = 1, 2, 3, 4, 5, 6 
Donde: 
𝑌𝑖𝑗: i-ésimo contenido de tiamina en el j-ésimo tipo de cereal. 
𝜇𝑗: media del j-ésimo tipo de cereal. 
𝜀𝑖𝑗: es el error experimental para el i-ésimo contenido de tiamina en el j-ésimotipo de cereal. 
6. Realizar la prueba de hipótesis en forma completa. 
• Hipótesis científica: El contenido medio de tiamina es diferente según el tipo de cereal. 
• 𝐻0: µ𝑇 = µ𝐶 = µ𝑀 = 𝜇𝐴 
• 𝐻1= al menos una media es distinta. 
• Nivel de significancia: α = 0,05 
• Estadígrafo de prueba: 
𝐹 =
𝐶𝑀𝑇 
𝐶𝑀𝐸
 = 
𝑆𝐶𝑇/𝑣𝑇
𝑆𝐶𝐸/𝑣𝐸
~𝐹 (𝑣𝑇; 𝑣𝐸) 
siendo: 
𝑣𝑇 = 𝑘 − 1 = 4 − 1 = 3 
𝑣𝐸 = 𝑛𝑘 − 𝑘 = 6 ∗ 4 − 4 = 20 
 
• Regla de decisión: 
 
1) Criterio de los puntos críticos 
Si 𝐹𝑚 > 𝐹𝑐 se rechaza la hipótesis nula 
 
 
2) Criterio del p-valor 
Si el p-valor es menor que el nivel de significancia, se rechaza la hipótesis nula. 
 
Si calculamos 𝐹𝑚, 𝐹𝑐 y el p-valor utilizando Infostat: 
 
 
 
𝐹𝑐 = 3,098 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
• Cálculo del estadígrafo de prueba 
 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 8,98 3 2,99 3,96 0,0229 
Tipo Cereal 8,98 3 2,99 3,96 0,0229 
Error 15,14 20 0,76 
Total 24,12 23 
 
 
 
• Toma de decisión: 
 
o Si utilizamos el Criterio de los puntos críticos, como 𝐹𝑚 = 3,96 > 3,098 = 𝐹𝑐 se rechaza H0 
para un nivel de significancia de α=0,05. 
 
o Si utilizamos el Criterio del p-valor, como el p-valor = 0,0229 < 0,05 se rechaza H0. 
 
• Interpretación: 
Se tiene evidencia muestral suficiente para decir que existe diferencia en el contenido medio de 
tiamina en los cuatro tipos de cereal considerados, para un nivel de significancia de 0,05. 
 
• Conclusión: 
El contenido medio de tiamina difiere según el tipo de cereal que se considera. 
 
 
7. Comprobar los supuestos sobre los residuos. 
 
o Normalidad de los residuos 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Puede verse en la Figura 3 que los 
puntos están distribuidos de forma 
uniforme alrededor de la recta lo que 
indicaría una aparente normalidad en 
la distribución de los residuos. 
Figura 3: Gráfico Q-Q plot (normal) de los residuos. 
 
𝐹𝑚 = 3,96 
p-valor = 0,0229 
𝐹𝑐 = 3,098 
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
-1,58 -0,79 0,00 0,79 1,58
Cuantiles de una Normal(9,2519E-017,0,65812)
-1,58
-0,79
0,00
0,79
1,58
C
u
a
n
ti
le
s
 o
b
s
e
rv
a
d
o
s
(R
D
U
O
 C
o
n
t 
T
ia
m
in
a
) n= 24 r= 0,992 (RDUO Cont Tiamina)
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
Si realizamos la prueba de Shapiro-Wilks: 
 
Las hipótesis que se someten a prueba son: 
 
H0: Los residuos tienen distribución normal. 
H1: Los residuos no tienen distribución normal. 
 
Utilizando Infostat para realizar este test de hipótesis, obtenemos los siguientes resultados: 
Shapiro-Wilks (modificado) 
 Variable n Media D.E. W* p(Unilateral D) 
RDUO ContTiamina 24 0,00 0,81 0,94 0,4714 
 
Podemos concluir que no hay evidencias para rechazar el supuesto de distribución normal de los 
residuos, ya que obtuvimos un p-valor = 0,4714 > 0,05. 
o Homogeneidad de la varianza 
 
 
 
o Independencia 
En general, un buen proceso de aleatorización asegura el cumplimiento del supuesto de 
independencia. 
 
8. Realizar la comparación de medias. 
En este caso, tiene sentido realizar la comparación de medias ya que se rechazó la hipótesis nula de 
igualdad de medias. 
Utilizaremos el procedimiento de Tukey para realizar las comparaciones de a pares. Los resultados 
obtenidos a través de Infostat se encuentran a continuación: 
Test:Tukey Alfa=0,05 DMS=1,40583 
 
Error: 0,7568 gl: 20 
Tipo Cereal Medias n E.E. 
Maíz 5,50 6 0,36 A 
Trigo 5,72 6 0,36 A B 
Cebada 6,60 6 0,36 A B 
Avena 6,98 6 0,36 B 
Medias con una letra común no son significativamente diferentes (p > 0,05) 
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
5,43 5,83 6,24 6,65 7,06
PRED Cont Tiamina
-2,05
-1,05
-0,05
0,95
1,94
R
E
 C
o
n
t 
T
ia
m
in
a
Figura 4: Gráfico de dispersión para los valores predichos y los 
residuos estandarizados.s estandarizados del modelo analizado. 
GráficoQ-Q plot (normal)…. 
 
Puede verse en la Figura 4 por la 
dispersión de los puntos que no se 
observa ningún patrón que indique 
alguna desviación del supuesto de 
Homogeneidad de varianzas. 
 
Cuadernillo de Aplicación Unidad III – 2020 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
En la tabla anterior, Infostat indica con letras iguales las medias que NO son significativamente 
distintas y con diferente letra las medias que son significativamente distintas. Así, podemos obtener 
la siguiente conclusión: 
o No se observan diferencias significativas, a un nivel de significancia de 0,05, entre: 
✓ Los contenidos medios de tiamina en Maíz, Trigo y Cebada. 
✓ Los contenidos medios de tiamina en Trigo, Cebada y Avena. 
 
o Se observan diferencias significativas, a un nivel de significancia de 0,05, entre: 
✓ Los contenidos medios de tiamina en Maíz y Avena 
 
9. Emitir una conclusión final. 
A partir del análisis de los datos obtenidos, se puede decir que existe diferencia significativa en el 
contenido medio de tiamina en cuatro tipos cereal. Más precisamente, se observan diferencias 
significativas entre el contenido medio de tiamina en Maíz y en Avena.

Continuar navegando