Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría. Facultad de Ciencias Agrarias. UNCuyo. Año 2020 ANÁLISIS DE VARIANZA PROTOCOLO DE RESOLUCIÓN DE CASOS 1- Determinar cuál es la variable respuesta (variable aleatoria), definir y determinar si los datos para dicha variable son observacionales o experimentales 2- Determinar las poblaciones o grupos que se quieren comparar y el número de unidades de análisis o experimentales, según sea el caso. 3- Realizar un análisis exploratorio de los datos. 4- Comprobar los supuestos sobre la variable respuesta. 5- Plantear el modelo. 6- Realizar la prueba de hipótesis en forma completa 7- Comprobar los supuestos sobre los residuos. 8- Realizar la comparación de medias 9- Emitir una conclusión final para cada caso. SE HA ELIMINADO EL EJERCICIO 3 DEL PRÁCTICO (porque para su resolución se necesitan conocimientos que no están dentro del programa de grado) Y SE HA TRABAJADO CON TRES EJERCICIOS. Ejercicio 1 Se han utilizado tres métodos analíticos (1, 2 y 3) para determinar el contenido de oxígeno disuelto en el agua de un lago. Cada uno de los métodos se ha aplicado seis veces. Compruebe si los métodos arrojan diferentes resultados. Método O2 en mg/l 1 10,96 10,77 10,90 10,69 10,87 10,60 2 10,88 10,75 10,80 10,81 10,70 10,82 3 10,73 10,79 10,78 10,82 10,88 10,81 Fuente: Ejemplo extraído del libro Biostatistical Analysis de J.H. Zar RESOLUCIÓN: 1. Determinar cuál es la variable respuesta (variable aleatoria), definir y determinar si los datos para dicha variable son observacionales o experimentales. • La variable respuesta es Y: “Contenido de oxígeno disuelto en el agua de un lago en mg/L”. • Los datos de la variable son de tipo observacionales. 2. Determinar las poblaciones o grupos que se quieren comparar y el número de unidades de análisis o unidades experimentales, según sea el caso. • Grupo 1: Contenido de oxígeno disuelto en el agua de un lago, en mg/L, utilizando el método 1. • Grupo 2: Contenido de oxígeno disuelto en el agua de un lago, en mg/L, utilizando el método 2. Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 • Grupo 3: Contenido de oxígeno disuelto en el agua de un lago, en mg/L, utilizando el método 3. 𝑛1 = 6; 𝑛2 = 6; 𝑛3 = 6 En total tenemos 18 unidades de análisis 3. Realizar un análisis exploratorio de los datos. 4. Comprobar los supuestos sobre la variable respuesta. • Supuesto de Normalidad: Dado que los errores tienen una distribución normal con media 0 y varianza 𝜎2 (𝜀𝑖𝑗 ~𝑁(0, 𝜎 2)) , suponemos que 𝑌~𝑁(𝑦; 𝜇𝑗 , 𝜎 2) o sea la variable cantidad de oxígeno disuelta (mg/L) tiene una distribución Normal con media µ y varianza 𝜎2 A su vez, debe suponerse que los efetos debidos al azar, así como los factores no comparados, están distribuidos de forma normal. En la práctica se utiliza la gráfica de probabilidad normal (QQ- plot) para comprobar el cumplimiento de este supuesto. Figura 1: Diagrama de cajas de la cantidad de oxígeno disuelta (en mg/L) según el método analítico utilizado Figura 2: Gráfico Q-Q plot de cuantiles observados con respecto a los cuantiles de una Normal. Es razonable suponer por la Figura 2 que se cumple el supuesto de normalidad, por la tendencia lineal del patrón de datos que se ajusta bien a una recta trazada a 45°. Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 ➔ Pasos para la obtención de gráficos utilizando Infostat. 1°. Cargar los datos en una misma columna y clasificarlos según los métodos. 2° En la parte superior seleccionar sobre el botón de gráficos, y posteriormente indicar como tipo de gráfico el QQ-plot. Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 3° Seleccionar la variable e indicarle al software el tipo de distribución que tiene dicha variable. En este caso es Normal. 4° Presionar el botón de aceptar y ya tendrán el gráfico QQ-Plot listo. • Supuesto de homogeneidad de varianza: 𝜎1 2 = 𝜎1 2 = 𝜎3 2 = 𝜎2 Las varianzas de las k poblaciones son iguales y además son iguales a la varianza debido al error aleatorio: 𝜎1 2 = 𝜎1 2 = 𝜎3 2 = 𝜎2 = 𝜎𝜀 2. En la práctica se puede analizar el cumplimiento del supuesto a través de un análisis empírico realizando el cociente entre la desviación típica mayor y la desviación típica menor, en nuestro caso: s1 / s3 = 0,14/0,05 = 2,8 Si el supuesto se cumple, este análisis empírico debería tener como resultado un número menor o igual a 2. El cociente es mayor a 2, ¿debemos entonces considerar que no se cumple el supuesto? Los aspectos a tener en cuenta para continuar con el análisis son que la variable es cuantitativa continua y sólo se tienen 6 repeticiones de cada grupo. Por el momento vamos a continuar con el análisis. (1) Supuesto de independencia: Debe suponerse independencia entre las observaciones. Si la toma de muestras se realiza al azar se asegura la independencia entre los errores aleatorios de las observaciones. 5. Plantear el modelo. Bajo hipótesis nula cierta, el modelo que explica el comportamiento de la variable a observar es: ijijY += ; j = 1,2, ..., k e i = 1,2, ..., nj Este modelo se conoce como modelo de media. Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 Si la hipótesis nula se rechaza, el modelo es otro. En este caso en que los datos son observacionales se plantea el modelo de medias: Modelo de medias 𝑌𝑖𝑗 = 𝜇𝑗 + 𝜀𝑖𝑗 𝑗 = 1, 2, 3 𝜀𝑖𝑗 ~𝑁(0, 𝜎 2) 𝑖 = 1, 2, 3, … ,6 Donde: 𝑌𝑖𝑗: i-ésima observación del j-ésimo grupo. 𝜇𝑗: media del j-ésimo grupo 𝜀𝑖𝑗: es el error experimental para la i-ésima observación del j-ésimo grupo 6. Realizar la prueba de hipótesis en forma completa. • Hipótesis científica: El contenido de oxígeno disuelto en el agua de un lago es diferente según el método analítico que se haya utilizado para su determinación. • 𝐻0: µ1 = µ2 = µ3 • 𝐻1= al menos una media es distinta. • Nivel de significancia: α = 0,05 • Estadígrafo de prueba: 𝐹 = 𝐶𝑀𝑇 𝐶𝑀𝐸 = 𝑆𝐶𝑇/𝑣𝑇 𝑆𝐶𝐸/𝑣𝐸 ~𝐹 (𝑣𝑇; 𝑣𝐸) • Regla de decisión: Rechazar H0 si 𝐹(𝛼, 𝑣𝑇 , 𝑣𝐸) < 𝐶𝑀𝑇 𝐶𝑀𝐸 o dicho de otra forma si Fm > Fc 𝑣𝑇 = 𝑘 − 1 = 3 − 1 = 2 𝑣𝐸 = 𝑛𝑘 − 𝑘 = 6 ∗ 3 − 3 = 15 → Cálculo de 𝐹𝑐 utilizando Infostat Fc= 3,68 0,05 0,095 1) Criterio de los puntos críticos Si Fm > Fc se rechaza la hipótesis nula 2) Criterio del p-valor Si el p-valor es menor que el nivel de significancia, se rechaza la hipótesis nula. p-valor(probabilidad) <α(probabilidad) Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 → Cálculo de 𝐹𝑐 utilizando Excel =INV.F(probabilidad acumulada;gl de los tratamientos;gl del error) =INV.F(0,95;2;15) = 3,68 • Cálculo de la tabla de ADEVA Tabla 1. Contenido de oxígeno disuelto en agua de un lago (mg/L) medido con 3 métodos analíticos Método 1 2 3 10,96 10,88 10,73 10,77 10,75 10,79 10,90 10,80 10,78 10,69 10,81 10,82 10,87 10,70 10,88 10,60 10,82 10,81 𝑦.𝑗 64,79 64,76 64,81 �̅�.𝑗 10,7983 10,7933 10,8017 𝑦.. 194,36 �̅�.. 10,7978 Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de CienciasAgrarias – UNCuyo- Año 2020 Tabla 2. Análisis de la Varianza. Cálculo del estadígrafo de prueba muestral (Fm) Fuente de variación SC Gl CM Estadígrafo F Total SCG= ∑ ∑ (𝑦𝑖𝑗 − �̅�..) 2𝑛𝑗 𝑖=1 𝑘 𝑗=1 nk-1 CMT/CME Grupos SCT= ∑ 𝑛𝑗(�̅�.𝑗̅̅ ̅ − 𝑦..̅) 2𝑘 𝑗=1 k-1 SCT/(k-1) Error SCE= ∑ ∑ (𝑦𝑖𝑗 − �̅�.𝑗) 2𝑛𝑗 𝑖=1 𝑘 𝑗=1 nk-k SCE/(nk-1) SCG= (10,962 + 10,772 + ⋯ 10,812) − 194,362 18 =0,1251 SCT = 64,792+64,792+64,812 6 − 194,362 18 = 0,00021 SCE= SCG- SCT = 0,1251 – 0,00021 = 0,1249 𝐶𝑀𝑇 = 𝑆𝐶𝑇/𝑣𝑇 = 0,00021/2 = 0,000105 𝐶𝑀𝐸 = 𝑆𝐶𝐸/𝑣𝐸 = 0,1249/15 = 0,00833 F = CMT/ CME = 0,0126 Tabla resumen: Fuente de variación SC Gl CM Estadígrafo F Total 0,1251 17 0,0126 Grupos 0,00021 2 0,000105 Error 0,1249 15 0,00833 Cálculo usando Infostat (ver pasos en video subido al campus): • Toma de decisión: o Como Fm (0,0126) es menor que Fc (3,68) no se rechaza o se acepta la H0 para un nivel de significancia de α=0,05. o El p-valor (0,9874) es mayor al nivel de significancia α (0,05) por lo tanto, no se rechaza o se acepta la H0. • Interpretación: Se tiene evidencia muestral suficiente para decir que no existe diferencia en la medición de oxígeno disuelto en agua de un lago, realizado por tres métodos distintos, para un nivel de significancia de 0,05. Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 • Conclusión: El contenido medio de oxígeno en el lago es el mismo con cualquiera de los tres métodos utilizados para su determinación. 7. Comprobar los supuestos sobre los residuos. • Normalidad de los residuos Infostat permite también la comprobación del supuesto de normalidad realizando la prueba de hipótesis de Shapiro-Wilks con el valor de los residuos (RDUO). Las hipótesis que se someten a prueba son: H0: Los residuos tienen distribución normal. H1: Los residuos no tienen distribución normal. En este caso no hay evidencias para rechazar el supuesto de distribución normal (p=0,9780). • Homogeneidad de la varianza Puede verse en la Figura 3 que los puntos están distribuidos de forma uniforme alrededor de una línea recta, lo que indicaría una aparente normalidad en la distribución de los residuos. Figura 3: Gráfico Q-Q plot (normal) de los residuos estandarizados. Figura 4: Gráfico de dispersión para los valores predichos y los residuos Puede verse en la Figura 4 por la dispersión de los puntos que no se observa ningún patrón que indique alguna desviación del supuesto de Homogeneidad de varianzas. Por esto es que fue importante al inicio del práctico seguir con el análisis (Ver 1) Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 • Independencia En general, un buen proceso de aleatorización asegura el cumplimiento del supuesto de independencia. 8. Realizar la comparación de medias. No se realiza comparación de medias, ya que se aceptó la hipótesis nula de igualdad de medias. 9. Emitir una conclusión final. A partir del análisis de los datos obtenidos, se puede decir que no hay diferencia en los contenidos medios de oxígeno disuelto en agua de un lago medido con los distintos métodos. Ejercicio 2 Se ha realizado un experimento a campo utilizando ajo “semilla” tratado previo a la siembra, con cuatro nematicidas diferentes (A, B, C y D) y sin aplicación de nematicida (E). Cada tratamiento se ha aplicado 5 veces. A continuación, se dan los rendimientos parcelarios al momento de cosecha (kg/parcela). A B C D E 13.7 9.6 11.6 7.5 4.8 17.4 16.1 11.9 19.6 9.8 10.9 21.0 19.4 16.7 8.8 24.4 20.4 14.2 12.6 10.5 12,5 22,3 13,8 26,5 11,5 RESOLUCIÓN: 1. Determinar cuál es la variable respuesta (variable aleatoria), definir y determinar si los datos para dicha variable son observacionales o experimentales. • La variable respuesta es Y: “Rendimiento de ajo al momento de cosecha en kg/parcela”. • En este caso, los datos son experimentales. 2. Determinar las poblaciones o grupos que se quieren comparar y el número de unidades de análisis o unidades experimentales, según sea el caso. • Grupo A: Rendimiento parcelario de ajo, en kg/parcela, tratado con el nematicida A al momento de cosecha. • Grupo B: Rendimiento parcelario de ajo, en kg/parcela, tratado con el nematicida B al momento de cosecha. • Grupo C: Rendimiento parcelario de ajo, en kg/parcela, tratado con el nematicida C al momento de cosecha. • Grupo D: Rendimiento parcelario de ajo, en kg/parcela, tratado con el nematicida D al momento de cosecha. • Grupo E: Rendimiento parcelario de ajo, en kg/parcela, sin aplicación de nematicida al momento de cosecha. 𝑛𝐴 = 𝑛𝐵 = 𝑛𝐶 = 𝑛𝐷 = 𝑛𝐸 = 5 En total tenemos 25 unidades de análisis Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 3. Realizar un análisis exploratorio de los datos. Para realizar el análisis exploratorio de los datos, obtenemos las medidas resumen mediante el software InfoStat (puede realizarse también con Excel): Medidas resumen Nematicida Variable n Media D.E. Mín Máx A Rendimiento 5 15,78 5,38 10,90 24,40 B Rendimiento 5 17,88 5,18 9,60 22,30 C Rendimiento 5 14,18 3,13 11,60 19,40 D Rendimiento 5 16,58 7,17 7,50 26,50 E Rendimiento 5 9,08 2,59 4,80 11,50 También podemos realizar el diagrama de cajas: Del análisis exploratorio, podemos decir que aparentemente hay una diferencia entre las medias del rendimiento parcelario de ajo al momento de la cosecha, es notable la diferencia entre los grupos tratados con el nematicida y el grupo testigo (E). 4. Comprobar los supuestos sobre la variable respuesta. • Supuesto de Normalidad: Dado que los errores 𝜀𝑖𝑗 ~𝑁(0, 𝜎 2) , suponemos que 𝑌~𝑁(𝑦; 𝜇𝑗 , 𝜎 2) o sea la variable rendimiento de ajo (kg/parcela) al momento de la cosecha tiene una distribución Normal con media µ y varianza 𝜎2 Analizamos el cumplimiento de este supuesto a través de la gráfica de probabilidad normal (QQ plot): Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil VersiónEstudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil A B C D E Nematicida 3,71 9,68 15,65 21,62 27,59 R e n d im ie n to Figura 1: Diagrama de cajas del rendimiento parcelario de ajo (en kg/parcela) según el nematicida utilizado Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 Puede verse en la Figura 2 que los puntos están distribuidos de forma uniforme alrededor de la recta, por lo que es razonable suponer que se cumple que la variable respuesta Y tiene distribución normal. También se puede probar el cumplimiento de este supuesto a través de una prueba de hipótesis. En el test de Shapiro Wilks las hipótesis que se someten a prueba son: H0: Y tiene distribución normal. H1: Y no tiene distribución normal. Los resultados obtenidos a través de Infostat son: Shapiro-Wilks (modificado) Variable n Media D.E. W* p (Unilateral D) Rendimiento 25 14,70 5,51 0,95 0,5544 En este caso no hay evidencias para rechazar el supuesto de distribución normal del rendimiento parcelario de ajo al momento de la cosecha, ya que el p-valor obtenido es p = 0,5544 > 0,05. • Supuesto de homogeneidad de varianza: 𝜎𝐴 2 = 𝜎𝐵 2 = 𝜎𝐶 2 = 𝜎𝐷 2 = 𝜎𝐸 2 = 𝜎2 Las varianzas de las 5 poblaciones son iguales y además son iguales a la varianza debido al error aleatorio: 𝜎𝐴 2 = 𝜎𝐵 2 = 𝜎𝐶 2 = 𝜎𝐷 2 = 𝜎𝐸 2 = 𝜎2 = 𝜎𝜀 2 En la práctica se puede analizar el cumplimiento del supuesto a través de un análisis empírico realizando el cociente entre la desviación típica mayor y la desviación típica menor, en nuestro caso: 𝑠𝐷 𝑠𝐸 = 7,17 2,59 = 2,77. Si el supuesto se cumple, este análisis empírico debería tener como resultado un número menor o igual a 2, esto no se cumple. Pero también es válido considerar que la variable es cuantitativa continua y sólo se tienen 5 repeticiones de cada grupo. Por el momento vamos a considerar varianzas homogéneas y continuar con el análisis. Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil 3,88 9,53 15,19 20,84 26,50 Cuantiles de una Normal(14,7,30,349) 3,88 9,53 15,19 20,84 26,50 C u a n ti le s o b s e rv a d o s (R e n d im ie n to ) n= 25 r= 0,985 (Rendimiento) Figura 2: Gráfico Q-Q plot de cuantiles observados con respecto a los cuantiles de una Normal. Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 • Supuesto de independencia: Debe suponerse independencia entre las observaciones. Si la toma de muestras se realiza al azar se asegura la independencia entre los errores aleatorios de las observaciones. 5. Plantear el modelo. Como ya dijimos en el ejercicio 1, bajo hipótesis nula cierta, el modelo que explica el comportamiento de la variable a observar es: ijijY += ; j = 1,2, ..., k e i = 1,2, ..., nj Este modelo se conoce como modelo de media. Si la hipótesis nula se rechaza, y los datos son experimentales el modelo es otro. Existirá una diferencia entre la media de la j-ésima población o grupo (j) y la media general () que se puede atribuir a lo que se llama un efecto del grupo o muestra. A este efecto lo denotaremos por j ( es la letra griega tau), de modo que: −= jj o bien += jj para j = 1,2, ..., k. Con base a esto y, puede formularse el modelo ADEVA ijjijY ++= ; j = 1,2, ..., k e i = 1,2, ..., nj Donde: 𝑌𝑖𝑗: i-ésimo rendimiento parcelario de ajo al momento de la cosecha del j-ésimo grupo. : es la media sobre todas las k poblaciones, j : es el efecto sobre la respuesta debido al j-ésimo nematicida y i : es el error experimental para la i-ésimo rendimiento de ajo al momento de la cosecha bajo el j- ésimo nematicida Según este modelo, el valor de yij está formado por la suma de tres componentes o efectos: un efecto común (), un efecto del j-ésimo grupo ( j ) y un efecto aleatorio (ij). 6. Realizar la prueba de hipótesis en forma completa. • Hipótesis científica: El rendimiento medio de ajo, en kg/parcela, al momento de la cosecha es diferente según el nematicida con el que fue tratado. • 𝐻0: j = 0 para todo j; j = A, B, C, D, E • 𝐻1= j ǂ 0 al menos para algún j • Nivel de significancia: α = 0,05 • Estadígrafo de prueba: 𝐹 = 𝐶𝑀𝑇 𝐶𝑀𝐸 = 𝑆𝐶𝑇/𝑣𝑇 𝑆𝐶𝐸/𝑣𝐸 ~𝐹 (𝑣𝑇; 𝑣𝐸) siendo: 𝑣𝑇 = 𝑘 − 1 = 5 − 1 = 4 𝑣𝐸 = 𝑛𝑘 − 𝑘 = 5 ∗ 5 − 5 = 20 Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 o Regla de decisión: 1) Criterio de los puntos críticos Si 𝐹𝑚 > 𝐹𝑐 se rechaza la hipótesis nula 2) Criterio del p-valor Si el p-valor es menor que el nivel de significancia, se rechaza la hipótesis nula. Si calculamos 𝐹𝑚, 𝐹𝑐 y el p-valor utilizando Infostat: Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 233,34 4 58,34 2,36 0,0884 Nematicida 233,34 4 58,34 2,36 0,0884 Error 495,04 20 24,75 Total 728,38 24 • Toma de decisión: o Si utilizamos el Criterio de los puntos críticos, como 𝐹𝑚 = 2,36 < 2,87 = 𝐹𝑐 no se rechaza H0 para un nivel de significancia de α=0,05. o Si utilizamos el Criterio del p-valor, como el p-valor = 0,0884 > 0,05 no se rechaza H0. 𝐹𝑚 = 2,36 p-valor = 0,0884 𝐹𝑐 = 2,87 𝐹𝑐 = 2,87 Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 • Interpretación:Se tiene evidencia muestral suficiente para decir que no existe diferencia en el rendimiento medio de ajo al momento de la cosecha, según el nematicida aplicados, para un nivel de significancia de 0,05. • Conclusión: Los rendimientos medios de ajo al momento de cosecha son iguales, cualquiera sea el nematicida aplicado, incluso para el testigo. 7. Comprobar los supuestos sobre los residuos. o Normalidad de los residuos Si realizamos la prueba de Shapiro-Wilks: Las hipótesis que se someten a prueba son: H0: Los residuos tienen distribución normal. H1: Los residuos no tienen distribución normal. Utilizando Infostat para realizar este test de hipótesis, obtenemos los siguientes resultados: Shapiro-Wilks (modificado) Variable n Media D.E. W* p(Unilateral D) RDUO Rendimiento 25 0,00 4,54 0,97 0,8936 Podemos concluir que no hay evidencias para rechazar el supuesto de distribución normal de los residuos, ya que obtuvimos un p-valor = 0,8936 > 0,05. o Homogeneidad de la varianza Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil -9,08 -4,33 0,42 5,17 9,92 Cuantiles de una Normal(2,8422E-016,20,627) -9,08 -4,33 0,42 5,17 9,92 C u a n ti le s o b s e rv a d o s (R D U O R e n d im ie n to ) n= 25 r= 0,991 (RDUO Rendimiento) Puede verse en la Figura 3 que los puntos están distribuidos de forma uniforme alrededor de la recta y = x, lo que indicaría una aparente normalidad en la distribución de los residuos. Figura 3: Gráfico Q-Q plot (normal) de los residuos. Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 o Independencia En general, un buen proceso de aleatorización asegura el cumplimiento del supuesto de independencia. 8. Realizar la comparación de medias. No se justifica la realización de la comparación de medias, ya que no se rechazó la hipótesis nula de igualdad de medias. 9. Emitir una conclusión final. A partir del análisis de los datos obtenidos, se puede decir que no hay diferencia en el rendimiento medio parcelario de ajo al momento de la cosecha en los 5 tratamientos con nematicida. Ejercicio 3 Se analizaron seis muestras de cada uno de cuatro tipos de cereal producidos en cierta región para determinar el contenido de tiamina, resultando los siguientes datos (µg/g) Tabla 3. Datos de contenido de tiamina (µg/g) Muestras Tipos de cereal Trigo Cebada Maíz Avena 1 5.2 6.5 5.8 8.3 2 4.5 8.0 4.7 6.1 3 6.0 6.1 6.4 7.8 4 6.1 7.5 4.9 7.0 5 6.7 5.9 6.0 5.5 6 5.8 5.6 5.2 7.2 Fuente: Ejemplo extraído del libro Probabilidad y estadística para ingeniería y ciencias. Devore,J RESOLUCIÓN: 1. Determinar cuál es la variable respuesta (variable aleatoria), definir y determinar si los datos para dicha variable son observacionales o experimentales. Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil 8,64 11,06 13,48 15,90 18,32 PRED Rendimiento -2,25 -1,08 0,09 1,27 2,44 R E R e n d im ie n to Figura 4: Gráfico de dispersión para los valores predichos y los residuos estandarizados. s estandarizados del modelo analizado. GráficoQ-Q plot (normal)…. Puede verse en la Figura 4 por la dispersión de los puntos que no se cumple el supuesto de Homogeneidad de varianzas. Se debería entonces transformar la variable, pero a los efectos del aprendizaje de este método de ADEVA, no vamos a realizar la transformación para este ejercicio. Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 • La variable respuesta es Y: “Contenido de tiamina en cuatro tipos de cereales producidos en cierta región, en 𝜇𝑔/𝑔”. • En este caso, los datos son observacionales. 2. Determinar las poblaciones o grupos que se quieren comparar y el número de unidades de análisis o unidades experimentales, según sea el caso. • Grupo T: Contenido de tiamina en Trigo producido en cierta región, en 𝜇𝑔/𝑔. • Grupo C: Contenido de tiamina en Cebada producido en cierta región, en 𝜇𝑔/𝑔. • Grupo M: Contenido de tiamina en Maíz producido en cierta región, en 𝜇𝑔/𝑔.• Grupo A: Contenido de tiamina en Avena producido en cierta región, en 𝜇𝑔/𝑔 𝑛𝑇 = 𝑛𝐶 = 𝑛𝑀 = 𝑛𝐴 = 6 En total tenemos 24 unidades de análisis 3. Realizar un análisis exploratorio de los datos. Para realizar el análisis exploratorio de los datos, obtenemos las medidas resumen y el diagrama de cajas: Medidas resumen Tipo Cereal Variable n Media D.E. Mín Máx Avena Cont Tiamina 6 6,98 1,04 5,50 8,30 Cebada Cont Tiamina 6 6,60 0,95 5,60 8,00 Maíz Cont Tiamina 6 5,50 0,67 4,70 6,40 Trigo Cont Tiamina 6 5,72 0,77 4,50 6,70 Del análisis exploratorio, podemos decir que a priori hay una diferencia entre las medias del contenido de tiamina en los distintos tipos de cereal. En particular pareciera que la media del Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Trigo Cebada Maíz Avena Tipo Cereal 4,3 5,4 6,4 7,4 8,5 C o n t T ia m in a Figura 1: Diagrama de cajas del contenido de tiamina (𝜇𝑔/𝑔) según tipo de cereal. Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 contenido de tiamina en Cebada y Avena es mayor a la media del contenido de tiamina en Trigo y Maíz. 4. Comprobar los supuestos sobre la variable respuesta. • Supuesto de Normalidad: Dado que los errores 𝜀𝑖𝑗 ~𝑁(0, 𝜎 2) , suponemos que 𝑌~𝑁(𝑦; 𝜇𝑗 , 𝜎 2) o sea la variable contenido de tiamina en distintos tipos de cereal tiene una distribución Normal con media µ y varianza 𝜎2 Analizamos el cumplimiento de este supuesto a través de la gráfica de probabilidad normal (QQ plot): Puede verse en la Figura 2 que los puntos están distribuidos de forma uniforme alrededor de la recta, por lo que es razonable suponer que se cumple que la variable respuesta Y tiene distribución normal. También se puede probar el cumplimiento de este supuesto a través de una prueba de hipótesis. En el test de Shapiro Wilks las hipótesis que se someten a prueba son: H0: Y tienen distribución normal. H1: Y no tienen distribución normal. Los resultados obtenidos a través de Infostat son: Shapiro-Wilks (modificado) Variable n Media D.E. W* p(Unilateral D) Cont Tiamina 24 6,20 1,02 0,94 0,4183 En este caso no hay evidencias para rechazar el supuesto de distribución normal del contenido de tiamina en diferentes tipos de cereal, ya que el p-valor obtenido es p = 0,4183 > 0,05. • Supuesto de homogeneidad de varianza: 𝜎𝑇 2 = 𝜎𝐶 2 = 𝜎𝑀 2 = 𝜎𝐴 2 = 𝜎2 Las varianzas de las 4 poblaciones son iguales y además son iguales a la varianza debido al error aleatorio: Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil 4,21 5,23 6,25 7,28 8,30 Cuantiles de una Normal(6,2,1,0487) 4,21 5,23 6,25 7,28 8,30 C u a n ti le s o b s e rv a d o s (C o n t T ia m in a ) n= 24 r= 0,985 (Cont Tiamina) Figura 2: Gráfico Q-Q plot de cuantiles observados con respecto a los cuantiles de una Normal. Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 𝜎𝑇 2 = 𝜎𝐶 2 = 𝜎𝑀 2 = 𝜎𝐴 2 = 𝜎2 = 𝜎𝜀 2 En la práctica se puede analizar el cumplimiento del supuesto a través de un análisis empírico realizando el cociente entre la desviación típica mayor y la desviación típica menor, en nuestro caso: 𝑠𝐴 𝑠𝑀 = 1,04 0,67 = 1,55. Si el supuesto se cumple, este análisis empírico debería tener como resultado un número menor o igual a 2. Por lo que podemos considerar varianzas homogéneas. • Supuesto de independencia: Debe suponerse independencia entre las observaciones. Si la toma de muestras se realiza al azar se asegura la independencia entre los errores aleatorios de las observaciones. 5. Plantear el modelo. Modelo de medias 𝑌𝑖𝑗 = 𝜇𝑗 + 𝜀𝑖𝑗 𝑗 = 𝑇, 𝐶, 𝑀, 𝐴 𝜀𝑖𝑗 ~𝑁(0, 𝜎 2) 𝑖 = 1, 2, 3, 4, 5, 6 Donde: 𝑌𝑖𝑗: i-ésimo contenido de tiamina en el j-ésimo tipo de cereal. 𝜇𝑗: media del j-ésimo tipo de cereal. 𝜀𝑖𝑗: es el error experimental para el i-ésimo contenido de tiamina en el j-ésimotipo de cereal. 6. Realizar la prueba de hipótesis en forma completa. • Hipótesis científica: El contenido medio de tiamina es diferente según el tipo de cereal. • 𝐻0: µ𝑇 = µ𝐶 = µ𝑀 = 𝜇𝐴 • 𝐻1= al menos una media es distinta. • Nivel de significancia: α = 0,05 • Estadígrafo de prueba: 𝐹 = 𝐶𝑀𝑇 𝐶𝑀𝐸 = 𝑆𝐶𝑇/𝑣𝑇 𝑆𝐶𝐸/𝑣𝐸 ~𝐹 (𝑣𝑇; 𝑣𝐸) siendo: 𝑣𝑇 = 𝑘 − 1 = 4 − 1 = 3 𝑣𝐸 = 𝑛𝑘 − 𝑘 = 6 ∗ 4 − 4 = 20 • Regla de decisión: 1) Criterio de los puntos críticos Si 𝐹𝑚 > 𝐹𝑐 se rechaza la hipótesis nula 2) Criterio del p-valor Si el p-valor es menor que el nivel de significancia, se rechaza la hipótesis nula. Si calculamos 𝐹𝑚, 𝐹𝑐 y el p-valor utilizando Infostat: 𝐹𝑐 = 3,098 Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 • Cálculo del estadígrafo de prueba Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 8,98 3 2,99 3,96 0,0229 Tipo Cereal 8,98 3 2,99 3,96 0,0229 Error 15,14 20 0,76 Total 24,12 23 • Toma de decisión: o Si utilizamos el Criterio de los puntos críticos, como 𝐹𝑚 = 3,96 > 3,098 = 𝐹𝑐 se rechaza H0 para un nivel de significancia de α=0,05. o Si utilizamos el Criterio del p-valor, como el p-valor = 0,0229 < 0,05 se rechaza H0. • Interpretación: Se tiene evidencia muestral suficiente para decir que existe diferencia en el contenido medio de tiamina en los cuatro tipos de cereal considerados, para un nivel de significancia de 0,05. • Conclusión: El contenido medio de tiamina difiere según el tipo de cereal que se considera. 7. Comprobar los supuestos sobre los residuos. o Normalidad de los residuos Puede verse en la Figura 3 que los puntos están distribuidos de forma uniforme alrededor de la recta lo que indicaría una aparente normalidad en la distribución de los residuos. Figura 3: Gráfico Q-Q plot (normal) de los residuos. 𝐹𝑚 = 3,96 p-valor = 0,0229 𝐹𝑐 = 3,098 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil -1,58 -0,79 0,00 0,79 1,58 Cuantiles de una Normal(9,2519E-017,0,65812) -1,58 -0,79 0,00 0,79 1,58 C u a n ti le s o b s e rv a d o s (R D U O C o n t T ia m in a ) n= 24 r= 0,992 (RDUO Cont Tiamina) Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 Si realizamos la prueba de Shapiro-Wilks: Las hipótesis que se someten a prueba son: H0: Los residuos tienen distribución normal. H1: Los residuos no tienen distribución normal. Utilizando Infostat para realizar este test de hipótesis, obtenemos los siguientes resultados: Shapiro-Wilks (modificado) Variable n Media D.E. W* p(Unilateral D) RDUO ContTiamina 24 0,00 0,81 0,94 0,4714 Podemos concluir que no hay evidencias para rechazar el supuesto de distribución normal de los residuos, ya que obtuvimos un p-valor = 0,4714 > 0,05. o Homogeneidad de la varianza o Independencia En general, un buen proceso de aleatorización asegura el cumplimiento del supuesto de independencia. 8. Realizar la comparación de medias. En este caso, tiene sentido realizar la comparación de medias ya que se rechazó la hipótesis nula de igualdad de medias. Utilizaremos el procedimiento de Tukey para realizar las comparaciones de a pares. Los resultados obtenidos a través de Infostat se encuentran a continuación: Test:Tukey Alfa=0,05 DMS=1,40583 Error: 0,7568 gl: 20 Tipo Cereal Medias n E.E. Maíz 5,50 6 0,36 A Trigo 5,72 6 0,36 A B Cebada 6,60 6 0,36 A B Avena 6,98 6 0,36 B Medias con una letra común no son significativamente diferentes (p > 0,05) Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil 5,43 5,83 6,24 6,65 7,06 PRED Cont Tiamina -2,05 -1,05 -0,05 0,95 1,94 R E C o n t T ia m in a Figura 4: Gráfico de dispersión para los valores predichos y los residuos estandarizados.s estandarizados del modelo analizado. GráficoQ-Q plot (normal)…. Puede verse en la Figura 4 por la dispersión de los puntos que no se observa ningún patrón que indique alguna desviación del supuesto de Homogeneidad de varianzas. Cuadernillo de Aplicación Unidad III – 2020 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 En la tabla anterior, Infostat indica con letras iguales las medias que NO son significativamente distintas y con diferente letra las medias que son significativamente distintas. Así, podemos obtener la siguiente conclusión: o No se observan diferencias significativas, a un nivel de significancia de 0,05, entre: ✓ Los contenidos medios de tiamina en Maíz, Trigo y Cebada. ✓ Los contenidos medios de tiamina en Trigo, Cebada y Avena. o Se observan diferencias significativas, a un nivel de significancia de 0,05, entre: ✓ Los contenidos medios de tiamina en Maíz y Avena 9. Emitir una conclusión final. A partir del análisis de los datos obtenidos, se puede decir que existe diferencia significativa en el contenido medio de tiamina en cuatro tipos cereal. Más precisamente, se observan diferencias significativas entre el contenido medio de tiamina en Maíz y en Avena.
Compartir