Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Cuadernillo Unidad III _ Pruebas de Hipótesis Cátedra de Cálculo Estadístico y Biometría. Facultad de Ciencias Agrarias. UNCuyo. Año 2020 RESOLUCIÓN PRUEBAS DE HIPÓTESIS Ejercicio 1 Teniendo en cuenta el caso del peso (g) por racimo de uvas del cuartel variedadMalbec de la Finca San Antonio de la Facultad de Ciencias Agrarias de la UNCuyo (caso 6 cuadernillo I), determine si el peso promedio por racimo ha disminuido para un nivel de significancia de 0,05. Para ello tenga en cuenta que 𝑋~𝑁(𝑥; 61 𝑔, 13,8𝑔). 1. Indique qué tipo de inferencia estadística realizará. El tipo de Inferencia estadística a realizar es una prueba de Hipótesis 2. Identifique qué estadígrafo está involucrado y cuál es su distribución en el muestreo. El estadígrafo involucrado es la media muestral �̅� Su distribución en el muestreo es Normal �̅�~ 𝑵(�̅�; 𝝁�̅�, 𝝈�̅�), siendo 𝝈�̅� = 𝝈𝑿 √𝒏 (error típico de la media) 3. Realice la inferencia indicada en el punto 1, deje constancia de los pasos de la prueba y fundamente la elección del estadígrafo de prueba. 1) Hipótesis científica: El peso (g) por racimo de uva del cuartel Malbec de la Finca San Antonio de la Facultad de Ciencias Agrarias de la UNCuyo ha disminuido H0: µ = 61 g H1: µ< 61 g 2) Nivel de significancia α = 0,05 3) Estadígrafo de Prueba Fundamento de la elección: la población es normal y n≥ 𝟑𝟎 𝒑𝒐𝒓 𝒍𝒐 𝒕𝒂𝒏𝒕𝒐 𝒍𝒂 media muestral �̅� tiene una distribución en el muestreo Normal, una E[�̅�⦌= 𝜇�̅� y una VAR [�̅�⦌= 𝝈 𝟐 𝒏⁄ . Su transformación es Z, el desvío Normal Tipificado: Z = �̅�−𝜇�̅� 𝜎�̅� ~ N (z; 0,1) 4) Regla de decisión Como la hipótesis alternativa nos dice que el promedio ha disminuido, la prueba de hipótesis es de una cola a la izquierda. Pasos de una prueba de hipótesis 1º) Identificar el problema y plantear las hipótesis 2º) Fijar nivel de significancia 3º) Elegir el estadígrafo de prueba (fundamento, fórmula y distribución) 4º) Establecer la regla de decisión (formal y gráfica) 5º) Calcular el valor, según la muestra, del estadígrafo elegido 6º) Tomar la decisión 7º) Interpretar estadísticamente 8º) Concluir en términos del problema TENGA EN CUENTA QUE PARA EL USO DE LOS SOFTWARE DEBE CONTAR CON LOS DATOS CRUDOS. EL ESTUDIANTE VERÁ QUE PODEMOS CALCULAR LOS VALORES CRÍTICOS DE LOS ESTADÍGRAFOS DE PRUEBA Y EL VALOR DE P (PROBABILIDAD) TANTO CON EXCEL COMO CON INFOSTAT. Cuadernillo de Aplicación Unidad III - 2 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 Figura 1. Función de densidad para la variable aleatoria Z (DNT) 5) Cálculo del estadígrafo de prueba CÁLCULO CON EXCEL ¿CÓMO OBTUVIMOS LOS VALORES QUE SE ENCUENTRAN EN LAS CELDAS DE ESTA PLANILLA? La media poblacional: µ es un dato de la consigna n = 123 es el tamaño de la muestra. Es un dato que traemos del Caso 6, Unidad I �̅�: media muestraly DE (desviación estándar)se calculancon los datos del caso 6,Unidad I. Se utilizan las fórmulas vistas en ese momento Alfa (α): es el nivel de significancia y es un dato dentro de la consigna 𝒛𝟎,𝟎𝟓es el z crítico (es un valor de la variable z que arrastra una probabilidad de 0,05. Su aplicación se vio en el práctico de Variable Aleatoria Continua) 𝒛 𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒍, se obtiene reemplazando en el Estadígrafo de Prueba, los valores correspondientes. La fórmula para su cálculo es Zm= �̅�−𝜇�̅� 𝜎�̅� . En la celda B10 está la fórmula con sus reemplazos. 𝒑 − 𝒗𝒂𝒍𝒐𝒓 = 𝑷(𝒁 < 𝒛𝒎)=F(zm). Su aplicación se dio en el práctico de Variable Aleatoria Continua 6) Toma de decisión α =0,05 1) Criterio de los puntos críticos Si zm<-z0,05se rechaza la hipótesis nula 2) Criterio del p-valor Si el p-valor es menor que el nivel de significancia, se rechaza la hipótesis nula. p-valor(probabilidad) <α(probabilidad) zc =- 1,65 Cuadernillo de Aplicación Unidad III - 3 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 Para un nivel de significancia de 0,05 no se acepta (o se rechaza) la hipótesis nula de que la media poblacional es igual a 61 gramos (µ = 61 g). 7) Interpretación Se tiene suficiente evidencia muestral, con un α = 0,05 para decir que la media del peso en gramos por racimo del cuartel variedad Malbec de la Finca San Antonio de la Facultad de Ciencias Agrarias de la UNCuyo ha disminuido 8) Conclusión La media del peso en gramos por racimo del cuartel Malbec de la Finca San Antonio de la Facultad de Ciencias Agrarias de la UNCuyo es menor a 61 gramos. DE AQUÍ EN ADELANTE USTED RESUELVA DE ACUERDO CON LA CORRESPONDIENTE TEORÍA Y CONSIGNAS Ejercicio 2 Un vivero compró 400 bulbos de tulipán a un productor de la zona, que aseguró que la proporción de bulbos que no florecen es de 0,1. De los 400 bulbos no florecieron 48. ¿Puede decirse, para un nivel de significancia del 0,05, que la proporción obtenida es diferente a la indicada por el productor? 1. Indique qué estadígrafo está involucrado y cuál es su distribución en el muestreo El estadígrafo involucrado es �̂� Su distribución en el muestreo es: �̂�~ N(�̂�; π, 𝝈�̂�), siendo 𝝈�̂� = √ 𝝅∗(𝟏−𝝅) 𝒄 2. Realice la inferencia, dejando constancia de todos los pasos y de los supuestos que deben cumplirse. Supuestos:La distribución en el muestreo de la proporción muestral�̂� es normal con una media igual a π y un error típico igual a 𝝈�̂� = √ 𝝅∗(𝟏−𝝅) 𝒄 Cuando n → ∞ el estadígrafo de prueba es 𝑧 = �̂� − 𝜋 √ 𝜋(1−𝜋) 𝑐 1) Planteo de las hipótesis a. Hipótesis científica:“La proporción de bulbos de tulipán que florecieron es diferente que la indicada por el productor”. b. 𝐻0: 𝜋 = 0,1 c. 𝐻1: 𝜋 ≠ 0,1 2) Nivel de significancia:𝛼 = 0,05 3) Estadígrafo de prueba: 𝑧 = �̂�−𝜋 √ 𝜋(1−𝜋) 𝑐 4) Regla de decisión: Se rechaza la hipótesis nula si 𝑧𝑚 < −1,96 𝑜 𝑠𝑖 𝑧𝑚 > 1,96 𝑓(𝑧) -1,96 1,96 Figura 2. Función de densidad de la Variable Aleatoria Z (DNT). Cuadernillo de Aplicación Unidad III - 4 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 5) Cálculos: �̂� = 𝑥 𝑐 = 48 400 = 0,12 𝑧 = �̂�−𝜋 √ 𝜋(1−𝜋) 𝑐 = 0,12−0,1 √ 0,1∗0,90 400 =1,33 6) Toma de decisión: Como zm(1,33)es menor que z0,975(1,96) y mayor que z0,025(-1,96) no se puede rechazar la hipótesis nula para un nivel de significancia α = 0,05. 7) Interpretación: Se tiene evidencia muestral suficiente para decir que la proporción de bulbos de tulipán que no florecen es de 0,1 para un nivel de significancia de 0,05. 8) Conclusión: El porcentaje de bulbos de tulipán que no florecen es del 10% tal como afirma el productor. Ejercicio 3 Un departamento de inspección de cauces realizó un estudio para determinar si la concentración de microorganismos, en dos estaciones colectoras de un río, es significativamente diferente. Se supone que la densidad de microorganismos de ambas estaciones tiene distribución normal y las varianzas son iguales. Los resultados fueron los siguientes: 1. Defina las Variables Aleatorias para cada estación y dé su distribución con los parámetros correspondientes Variable aleatoriaX1: “densidad de microorganismos en estación colectora 1 expresada en número de microorganismos por metro cuadrado” Variable aleatoria X2: “densidad de microorganismos en estación colectora 2 expresada en número de microorganismos por metro cuadrado” La distribución de la variable aleatoria es normal: • Estación 1: 𝑿𝟏~𝑵(𝒙𝟏; 𝝁𝟏; 𝝈𝟏 𝟐) • Estación 2: 𝑿𝟐~𝑵(𝒙𝟐; 𝝁𝟐; 𝝈𝟐 𝟐) Número de microorganismos por metro cuadrado Estación 1 Estación 2 5030 4980 2800 1330 13700 11900 4670 3320 10730 8130 6890 1230 11400 26850 7720 2130 860 17660 7030 2190 2200 22800 7330 42501130 2810 15040 1690 Cuadernillo de Aplicación Unidad III - 5 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 2. ¿Conoce los parámetros de estas distribuciones? No, se desconocen 𝝁𝟏; 𝝁𝟐; 𝝈𝟏 𝟐 𝒚 𝝈𝟐 𝟐 3. Si desconoce los parámetros¿Cómo los estimaría? Especifique fórmula/s y valor/es �̂� = �̂� 𝑿�̂� = ∑ 𝑿𝒊 𝒏 = 𝟏𝟓𝟖𝟑𝟓𝟎 𝟏𝟔 = 𝟗𝟖𝟗𝟔, 𝟗 𝒎𝒊𝒄𝒓𝒐𝒐𝒓𝒈𝒂𝒏𝒊𝒔𝒎𝒐𝒔 𝑿�̂� = ∑ 𝑿𝒊 𝒏 = 𝟒𝟗𝟒𝟓𝟎 𝟏𝟐 = 𝟒𝟏𝟐𝟎, 𝟖 𝒎𝒊𝒄𝒓𝒐𝒐𝒓𝒈𝒂𝒏𝒊𝒔𝒎𝒐𝒔 �̂�𝒙 𝟐 = 𝒔 ̂𝒙 𝟐 �̂�𝟏 𝟐 = 𝟔𝟐𝟎𝟎𝟐𝟑𝟖𝟐, 𝟗 �̂�𝟐 𝟐 = 𝟔𝟏𝟒𝟕𝟗𝟑𝟓, 𝟔 𝑺𝒙 = √�̂�𝑿 𝟐 𝑺𝟏 = √�̂�𝟏 𝟐 = √𝟔𝟐𝟎𝟎𝟐𝟑𝟖𝟐, 𝟗 = 7874,16 𝑺𝟐 = √�̂�𝟐 𝟐 =√𝟔𝟏𝟒𝟕𝟗𝟑𝟓, 𝟔 = 2479,50 Cálculo utilizando Infostat→ 4. Realice una estimaciónpor intervalo para la densidad media de microorganismos por metro cuadrado de la estación 1. (1- α=0,95) 𝑷 (�̄� − 𝒕𝜶 𝟐⁄ 𝒔 √𝒏 < 𝝁 < �̄� + 𝒕𝜶 𝟐⁄ 𝒔 √𝒏 ) = 𝟏 − 𝜶 𝑷 (𝟗𝟖𝟗𝟔, 𝟗 − 𝒕𝜶 𝟐⁄ 𝟕𝟖𝟕𝟒, 𝟐 √𝟏𝟔 < 𝝁 < 𝟗𝟖𝟗𝟔, 𝟗 + 𝒕𝜶 𝟐⁄ 𝟕𝟖𝟕𝟒, 𝟐 √𝟏𝟔 ) = 𝟏 − 𝟎, 𝟎𝟓 (𝟗𝟖𝟗𝟔, 𝟗 − 𝟐, 𝟏𝟑 ∗ 𝟏𝟗𝟔𝟖, 𝟔 < 𝝁 < 𝟗𝟖𝟗𝟔, 𝟗 + 𝟐, 𝟏𝟑 ∗ 𝟏𝟗𝟔𝟖, 𝟔) = 𝟎, 𝟗𝟓 (𝟓𝟕𝟎𝟐, 𝟖𝟖 < 𝝁 < 𝟏𝟒𝟎𝟖𝟗, 𝟏𝟐) = 𝟎, 𝟗𝟓 IC95% (7928,4; 1409,02)µ Interpretación: Con una confianza del 95% el intervalo [5702,88; 14089,12] contiene la media poblacional de la densidad de microorganismos por metro cuadrado de la estación 1. Cuadernillo de Aplicación Unidad III - 6 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 5. Se quiere realizar una prueba de hipótesis para probar que la densidad media de microorganismos es diferente en ambas estaciones. 5.1.Indique qué estadígrafo de prueba está involucrado y cuál es su distribución en el muestreo La diferencia de medias: (�̅�𝟏 − �̅�𝟐) tiene una distribución de probabilidades Normal con media 𝝁(�̅�𝟏−�̅�𝟐)= (𝝁𝟏 − 𝝁𝟐) y error típico 𝝈(�̅�𝟏−�̅�𝟐) = √ 𝝈𝟏 𝟐 𝒏𝟏 + 𝝈𝟐 𝟐 𝒏𝟐 cuando n →∞. En este caso: 1.- Suponiendo que las densidades de microorganismos en ambas estaciones tienen una distribución Normal, 2.- Que las muestras provienen de poblaciones independientes 3.- que las varianzas poblacionales de ambas estaciones son desconocidas y se las supone iguales, 4.- y siendo el tamaño de las muestras de ambas estaciones menores a 30, el estadígrafo de prueba esT: 𝑻 = (�̅�𝟏 − �̅�𝟐) − (𝝁𝟏 − 𝝁𝟐) 𝒔𝒄√ 𝟏 𝒏𝟏 + 𝟏 𝒏𝟐 = (�̅�𝟏 − �̅�𝟐) − 𝟎 𝒔𝒄√ 𝟏 𝒏𝟏 + 𝟏 𝒏𝟐 ~𝒕(𝒏𝟏 + 𝒏𝟐 − 𝟐) 𝒔𝒄 = √ (𝒏𝟏−𝟏)𝒔𝟏 𝟐+(𝒏𝟐−𝟏)𝒔𝟐 𝟐 𝒏𝟏+𝒏𝟐−𝟐 , desviación típica conjunta 5.2.Pruebe, con un 𝛼 = 0,05, que la densidad media de microorganismos es diferente en ambas estaciones. 1) Planteo de la hipótesis a. Hipótesis científica: “La densidad media de microorganismos es diferente en ambas estaciones colectoras” b. 𝑯𝟎: (𝜇1 − 𝜇2) = 0 c. 𝑯𝟏: ( 𝜇1 − 𝜇2 ) ≠ 0 (prueba de dos colas) 2) Nivel de significancia: α= 0,05 3) Estadígrafo de prueba: 𝑇 = (�̅�1 − �̅�2) − (𝝁𝟏 − 𝝁𝟐) 𝑠𝑐√ 1 𝑛1 + 1 𝑛2 = (�̅�1 − �̅�2) − 0 𝑠𝑐√ 1 𝑛1 + 1 𝑛2 ~𝑡(𝑛1 + 𝑛2 − 2) 𝑠𝑐 = √ (𝑛1 − 1)𝑠1 2 + (𝑛2 − 1)𝑠2 2 𝑛1 + 𝑛2 − 2 4) Regla de decisión: Rechazo la H0 si 𝑡 > 𝑡0,025 o bien t < −𝑡0,975 Valor crítico de t para 𝛼 2⁄ = 0,025 y 𝜐 = 16 + 12 − 2 = 26 𝑡0,025 = −2,056 y 𝑡0,975 = 2,056 𝑓(𝑡) -2,056 2,056 Figura 3. Función de densidad de la Variable Aleatoria t de Student. Cuadernillo de Aplicación Unidad III - 7 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 5) Cálculos: Reemplazando en el estadígrafo de prueba obtenemos el valor muestral de T 𝑠𝑐 = √ (𝑛1−1)𝑠1 2+(𝑛2−1)𝑠2 2 𝑛1+𝑛2−2 = 𝑠𝑐 = √ (16−1)62002382,9+(12−1)6147935,6 16+12−2 =6194,5 𝑇 = (9896,9 − 4120,8) − 0 6194,5√ 1 16 + 1 12 = 2,44 6) Toma de decisión: Como tm (2,44) es mayor a tα/2 (2,056), se debe rechazar la hipótesis nula para un nivel de significancia de 0,05. 7) Interpretación: Se tiene evidencia muestral suficiente para decir que la densidad media de microorganismos es diferente en ambas estaciones para un nivel de significancia de 0,05. 8) Conclusión: La densidad media de microorganismos por metro cuadrado es diferente en ambas estaciones colectoras. RESOLUCIÓN CON EXCEL 1.- Cargar los datos en una hoja de Excel. En columnas 2.- Buscar en Datos → Análisis de Datos → Funciones para Análisis→Prueba t para dos muestras suponiendo varianzas iguales Cuadernillo de Aplicación Unidad III - 8 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 Salida Prueba t para dos muestras suponiendo varianzas iguales Estación 1 Estación 2 Media 9896,875 4120,833333 Varianza 62002382,92 6147935,606 Observaciones 16 12 Varianza agrupada 38371655,21 Diferencia hipotética de las medias 0 Grados de libertad 26 Estadístico t 2,441724435 P(T<=t) una cola 0,010864824 Valor crítico de t (una cola) 1,70561792 P(T<=t) dos colas 0,021729647 Excel nos devuelve la descriptiva junto con la prueba de hipótesis. También nos indica el valor de p, la P(T >tm) = 0,02172. Podemos usar este valor para tomar la decisión comparándolo con el nivel de significancia: p-valor< α o sea 0,02172 < 0,05, entonces se rechaza H0. Al comparar ambas probabilidades vemos que la decisión es rechazar la H0. RESOLUCIÓN CON INFOSTAT Prueba T para muestras independientes Menú → ESTADÍSTICAS → INFERENCIA BASADA EN DOS MUESTRAS →PRUEBA T (MUESTRAS INDEPENDIENTES) Cuadernillo de Aplicación Unidad III - 9 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 RESULTADOS INFOSTAT Prueba T para muestras Independientes Grupo 1 Grupo 2 n(1) n(2) Media(1) Media(2) T p-valor prueba {Estación 1} {Estación 2} 16 12 9896,88 4120,83 2,76 0,0125 Bilateral Ejercicio 4 Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre un análisis químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro. Cada muestra se divide en dos submuestras y se aplican los dos tipos de análisis, ya que se desea conocer si los dos métodos arrojan el mismo resultado. Se supone que las mediciones tienen una distribución normal. Los datos figuran a continuación: Muestra Análisis 1 2 3 4 5 Rayos X 2,0 2,0 2,3 2,1 2,4 Químico 2,2 1,9 2,5 2,3 2,4 1. Indique qué estadígrafo está involucrado y cuál es su distribución en el muestreo �̅�: promedio de la diferencia en el contenido de hierro El Estadígrafo tiene una distribución en el muestro t de Student porque: 1.- Se supone que la muestra proviene de una población con distribución Normal 2.- La varianza poblacional es desconocida 3.- La muestra es pequeña 4.- Ambos análisis se realizan sobre una misma muestra que está dividida en dos, por eso las muestras se denominan “pareadas” o “emparejadas” 𝑇 = �̅� − 𝜇𝐷 𝑠�̅� = �̅� − 𝜇𝐷 𝑠𝐷 √𝑛 ⁄ = �̅� 𝑠𝐷 √𝑛 ⁄ ~ 𝑡(𝑛 − 1) 2. Pruebe si hay diferencia entre ambos métodos (𝛼 = 0,01). 1) Planteo de las hipótesis a. Hipótesis científica:“Existe diferencia entre los dos tipos de análisis, rayos X y químico, en el contenido de hierro de una sustancia” b. 𝑯𝟎: 𝜇𝐷 = 0 c. 𝑯𝟏: 𝜇𝐷 ≠ 0 (prueba de dos colas) 2) Nivel de significancia: α= 0,01 3) Estadígrafo de prueba: 𝑇 = �̅� − 𝜇𝐷 𝑠�̅� = �̅� − 𝜇𝐷 𝑠𝐷 √𝑛 ⁄ = �̅� 𝑠𝐷 √𝑛 ⁄ 4) Regla de decisión: Rechazo la H0 si 𝑡 > 𝑡0,005 o bien t < 𝑡0,995 Elvalor crítico de t para 𝛼 2⁄ = 0,005 y 𝜐 = 5 − 1 = 4 𝑡0,005 = −4,604 y 𝑡0,995 = 4,604 𝑓(𝑡)-4,604 4,604 Fig4. Función de densidad de la Variable Aleatoria t de Student. Cuadernillo de Aplicación Unidad III - 10 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 5) Cálculos: Tabla auxiliar de cálculo Muestra Rayos X Químico d (d - d̅)^2 1 2 2,2 -0,2 0,01 2 2 1,9 0,1 0,04 3 2,3 2,5 -0,2 0,01 4 2,1 2,3 -0,2 0,01 5 2,4 2,4 0 0,01 SUMA -0,5 0,08 Reemplazando en el estadígrafo de prueba obtenemos el valor muestral de t �̅� = ∑ 𝑑𝑖 𝑛 = −0,5 5 = −0,1 𝑠𝑑 = √ ∑(−0,2 − (−0,1))2 + (0,1 − (−0,1))2(−0,2 − (−0,1))2(−0,2 − (−0,1))2(0 − (−0,1))2 5 − 1 = √0,02 = 0,141 𝑠𝑑 = √ ∑(𝑑𝑖−�̅�) 2 𝑛−1 = √ 0,08 4 = 0,141 𝑠�̅� = 𝑠𝑑 √𝑛 ⁄ = 0,141/√5 = 0,0630 El estadígrafo de prueba resulta 𝑇 = �̅� − 𝜇𝐷 𝑠�̅� = −0,1 − 0 0,0630 = −1,587 6) Toma de decisión: Como tm=-1,587 no es mayor a t0,995 (4,604) y no es menor a t0,005 (-4,604), se acepta la hipótesis nula para un nivel de significancia de 0,01. 7) Interpretación: No se tiene evidencia muestral suficiente para decir que hay una diferencia entre un análisis químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro de una sustancia para un nivel de significancia de 0,01. 8) Conclusión: La cantidad de hierro en la muestra analizada de una sustancia ferrosa no es diferente tanto si la determinación de hierro se realiza mediante análisis por rayos X como por análisis químico. Cuadernillo de Aplicación Unidad III - 11 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 CÁLCULOS CON EXCEL Si comparamos el valor de p (0,189) con el nivel de significancia nos lleva al mismo resultado, el valor de p es mayor que el α = 0,05 utilizado en la prueba. Con InfoStat Prueba de dos colas. 𝑡𝑐=±4,604; 𝑡𝑚=−1,58 Ejercicio 5 Dos grupos de 200 cerdos cada uno afectados por una enfermedad (A y B), son usados para probar la eficacia de un nuevo tratamiento sobre la base de un suero. Ambos grupos son tratados idénticamente, excepto que al grupo A se le da el suero y al B no. Se encuentra que 140 y 120 de los enfermos del grupo A y B, respectivamente, se recuperan de la enfermedad. ¿Puede concluirse que el nuevo tratamiento ayuda a curar la enfermedad a un nivel de significancia de 0,01? 1) Planteo de la hipótesis a. Hipótesis científica:“El nuevo tratamientono ayuda a curar la enfermedad de los cerdos luego de la aplicación del suero” b. 𝑯𝟎: 𝜋1 = 𝜋2 c. 𝑯𝟏: 𝜋1 > 𝜋2 (prueba de una cola) 2) Nivel de significancia: α= 0,01 3) Estadígrafo de prueba: Las muestras se seleccionaron de forma aleatoria e independiente en las dos poblaciones binomiales, y c1 y c2 son lo suficientemente grandes para que la distribución de muestreo de (�̂�1 − �̂�2) pueda ser aproximada mediante una distribución normal. Prueba t para medias de dos muestras emparejadas Rayos X Químico Media 2,16 2,26 Varianza 0,033 0,053 Observaciones 5 5 Diferencia hipotética de las medias 0 Grados de libertad 4 Estadístico t -1,58113883 P(T<=t) una cola 0,094501829 Valor crítico de t (una cola) 3,746947388 P(T<=t) dos colas 0,189003658 Valor crítico de t (dos colas) 4,604094871 Cuadernillo de Aplicación Unidad III - 12 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 𝑍 = (�̂�1 − �̂�2) √ �̂�1(1−�̂�1) 𝑐1 + �̂�2(1−�̂�2) 𝑐2 = 𝑋1 𝑐1 − 𝑋2 𝑐2 √ �̂�(1−�̂�) 𝑐1 + �̂�(1−�̂�)1 𝑐2 = 𝑋1 𝑐1 − 𝑋2 𝑐2 √�̂�(1 − �̂�) ( 1 𝑐1 + 1 𝑐2 ) ~𝑁(0,1) Puesto que no se conoce el valor común de == 21 (utilizado en el error estándar), se estima por �̂� = 𝑋1 + 𝑋2 𝑐1 + 𝑐2 4) Regla de decisión:rechazo la H0 cuando zm> zc 5) Cálculos: Al sustituir en la fórmula �̂� = 𝑥1+𝑥2 𝑐1+𝑐2 los valores correspondientes se obtiene �̂� = 140+120 200+200 = 0,65 Reemplazando en el estadígrafo de prueba obtenemos el valor muestral de z 𝑧 = 𝑥1 𝑐1 − 𝑥2 𝑐2 √�̂�(1 − �̂�) ( 1 𝑐1 + 1 𝑐2 ) = 140 200 − 120 200 √(0,65)(0,35) ( 1 200 + 1 200 ) = 2,097 6) Toma de decisión: Como zm (2,097) es menor a z0,01 (2,33), no se puede rechazar la hipótesis nula para un nivel significancia de 0,01. 7) Interpretación: No se tiene evidencia muestral suficiente para decir que existe diferencia en el tratamiento de los cerdos afectados por la misma enfermedad frente al efecto de los sueros aplicados. 8) Conclusión: El nuevo tratamiento no ayuda a curar la enfermedad en los cerdos. 0,01 zα= 2,33 𝑓(𝑧) Fig5. Función de densidad de la Variable Aleatoria Z (DNT). Cuadernillo de Aplicación Unidad III - 13 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 Ejercicio 6 Un fabricante de alimento balanceado para ganado asegura que la ración que él vende genera un aumento mayor a 1,07 kg/cabeza/día con una varianza de 0,0144 (kg/cabeza/día)2. Para poner a prueba la conjetura del fabricante se realizó un ensayo de alimentación en un lote de 16 animales. Del mismo se obtuvo una media de 1,04 kg/cabeza/día y un desvío estándar de 0,04 kg/cabeza/día. 1. Indique qué estadígrafo está involucrado, cuál es su distribución en el muestreo y los supuestos que deben cumplirse. La población es normal, n es menor a 30 y la varianza poblacional es conocida por lo que la media muestral �̅� tiene una distribución en el muestreo Normal. Su transformación es Z, el desvío Normal Tipificado: 𝒁 = �̅�−𝛍 𝝈�̅� ~𝑵(𝟎, 𝟏) siendo 𝝈�̅� = 𝝈𝑿 √𝒏⁄ Supuestos: La población original tiene una distribución normal, la muestra se selecciona al azar y la 𝜎�̅� 2 (varianza poblacional) es conocida. 2. Considerando un nivel de significancia de 0,05, ¿se puede probar la conjetura de que el alimento produce ese aumento promedio en el peso del ganado? 1) Planteo de las hipótesis a. Hipótesis científica: “El nuevo alimento balanceado genera un aumento de peso en el ganado mayor al que dice el fabricante.” b. 𝑯𝟎: 𝜇 = 𝜇0 c. 𝑯𝟏: 𝜇 > 𝜇0 2) Nivel de significancia: α= 0,05 3) Estadígrafo de prueba: 𝑍 = �̅� − μ 𝜎𝑋 √𝑛⁄ ~ 𝑁 (𝑧; 0, 1) 4) Regla de decisión Se rechaza la hipótesis nula si 𝑧𝑚 > 1,645 5) Cálculos 𝒁 = �̅�−𝛍 𝝈𝑿 √𝒏⁄ = 𝟏,𝟎𝟒 −𝟏,𝟎𝟕 𝟎,𝟏𝟐 √𝟏𝟔⁄ = −𝟏 Figura 6. Función de densidad de la Variable Aleatoria Z (DNT). 0,05 zα= 1,645 𝑓(𝑧) Cuadernillo de Aplicación Unidad III - 14 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 6) Toma de decisión Como zm (-1) es menor a z0,95(1,645) se debe aceptar la hipótesis nula para un nivel de significancia de 0,05. 7) Interpretación No se tiene evidencia muestral suficiente para decir que el aumento de peso del ganado es diferente a 1,07 kg/cabeza/día para un nivel de significancia de 0,05. 8) Conclusión El aumento promedio de peso del ganado luego del consumo de cierto alimento balanceado es como afirma el fabricante. Ejercicio 7 De acuerdo con un estudio dietético una ingesta alta de sodio se puede relacionar con úlceras, cáncer de estómago y migraña. El requerimiento humano de sal es de sólo 2200 mg por día, el cual se rebasa en la mayoría de las porciones individuales de cereales listos para consumir. Si una muestra aleatoria de 40 porciones de una determinada marca de cereal tiene un contenido medio de 2440 mg de sodio y una desviación típica de 240,5 mg, ¿se puede decir que el contenido promedio de sodio para porciones individuales de dicha marca de cereal supera el requerimiento por día? 1. Identifique que tipo de inferencia estadística requiere utilizar Prueba de hipótesis 2. Indique qué estadígrafo está involucrado y cuál es su distribución en el muestreo. Fundamentode la elección: la población es normal y n≥ 𝟑𝟎 por lo tanto, la media muestral �̅� tiene una distribución en el muestreo Normal, una E[�̅�⦌= 𝜇�̅� y una VAR [�̅�⦌= 𝝈𝟐 𝒏⁄ . Su transformación es Z, el desvío Normal Tipificado: Z = �̅�−𝜇�̅� 𝜎�̅� ~ N (z; 0,1) 3. Realice la inferencia para un 𝛼 = 0,01, dejando constancia de todos los pasos. 1) Planteo de la hipótesis a. Hipótesis científica: “El contenido promedio de sodio de los cereales de una determinada marca supera el valor de requerimiento diario”. b. 𝐻0: µ = 2200 mg c. 𝐻1: µ > 2200 mg 2) Nivel de significancia: α= 0,01 3) Estadígrafo de prueba: 𝑍 = �̅� − µ 𝝈𝑿 √𝒏 ~𝑁(0,1) 4) Regla de decisión: rechazo la H0 cuando si zm> zα 0,01 zα= 2,33 𝑓(𝑧) Figura 7. Función de densidad de la Variable Aleatoria Z (DNT). Cuadernillo de Aplicación Unidad III - 15 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 5) Cálculos: Reemplazando en el estadígrafo de prueba obtenemos el valor muestral de z 𝑍 = �̅� − µ 𝑆𝑋 √𝑛 = 2440 − 2200 240,5 √40 = 6,311 6) Toma de decisión: Como zm(6,311) es mayor a zc (2,33), se debe rechazar la hipótesis nula para un nivel de significancia de 0,01. 7) Interpretación: Se tiene evidencia muestral suficiente para decir que el contenido de sodio en las muestras de cereal supera los 2200 mg. 8) Conclusión: El contenido promedio de sodio en una porción de cereal supera el requerimiento diario de este mineral. Ejercicio 8. DE RESOLUCIÓN INDIVIDUAL La forma más práctica para expresar la calidad de un forraje es a través de la carne, leche o lana producidos por el animal que consume dicho forraje. La predicción del valor nutritivo del mismo a través de un análisis químico puede llegar a ser bastante buena, pero en condiciones de pastoreo surgen problemas debido a la complejidad que generan los factores ambientales, culturales y genéticos. Existen varios métodos para determinar el porcentaje de pared celular (fibra), que es un elemento importante en la nutrición. Se quiere saber si existe diferencia entre dos de ellos: Fibra Detergente Neutro (FDN) y Fibra Detergente Ácido (FDA), suponiendo que ambos tienen distribución normal. Los valores obtenidos de % de pared celular contenidos en un forraje figuran a continuación: FDN FDA FDN FDA FDN FDA 53,20 46,50 54,80 45,60 43,80 32,20 54,60 47,60 45,00 35,90 29,70 38,00 47,40 41,70 57,50 40,50 47,20 34,80 49,00 42,40 46,20 38,50 49,40 41,30 40,20 36,60 54,10 40,60 50,10 36,70 40,10 34,50 53,80 41,50 49,80 38,20 46,70 42,70 59,60 44,40 49,40 40,50 43,60 36,80 50,40 36,20 49,30 39,80 43,40 35,60 52,60 38,10 49,90 40,10 36,50 29,60 44,70 32,70 50,10 39,20 53,20 37,30 55,90 39,30 43,20 40,40 48,10 40,30 45,90 36,80 43,60 31,20 46,60 35,30 51,20 46,90 37,60 32,50 35,80 29,00 48,70 37,50 43,70 28,30 36,90 30,40 49,30 37,00 37,80 33,20 34,20 27,20 45,30 37,10 34,10 30,00 31,20 26,20 45,80 34,70 41,40 26,10 44,20 35,40 41,20 32,90 41,90 33,40 45,60 35,20 45,20 35,80 41,70 33,70 37,50 32,10 37,60 31,60 41,50 34,50 37,60 28,50 37,10 29,20 49,60 36,30 Cuadernillo de Aplicación Unidad III - 16 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 39,00 34,10 40,60 30,60 48,90 35,50 39,60 33,20 47,90 35,40 47,50 34,00 1. Identifique la variable y la unidad de análisis. 2. Se realizó la corrida de datos en los softwaresInfoStat y Excel, obteniéndose los siguientes resultados: Tabla 1. Distribución de muestras de forraje según % de pared celular obtenida por el método FDN Variable Clase LI LS MC FA FR FAA FRA FDN 1 29,70 35,68 32,69 4 0,06 4 0,06 FDN 2 35,68 41,66 38,67 17 0,25 21 0,30 FDN 3 41,66 47,64 44,65 22 0,32 43 0,62 FDN 4 47,64 53,62 50,63 19 0,28 62 0,90 FDN 5 53,62 59,60 56,61 7 0,10 69 1,00 Tabla 2. Distribución de muestras de forraje según % de pared celular obtenida por el método FDA Variable Clase LI LS MC FA FR FAA FRA FDA 1 26,10 30,40 28,25 10 0,14 10 0,14 FDA 2 30,40 34,70 32,55 17 0,25 27 0,39 FDA 3 34,70 39,00 36,85 23 0,33 50 0,72 FDA 4 39,00 43,30 41,15 14 0,20 64 0,93 FDA 5 43,30 47,60 45,45 5 0,07 69 1,00 ESTADÌSTICA DESCRIPTIVA Resumen FDN FDA n 69,00 69,00 Media 45,16 36,04 D.E. 6,42 4,93 Var(n-1) 41,20 24,30 E.E. 0,77 0,59 CV 14,22 13,68 Mín 29,70 26,10 Máx 59,60 47,60 Mediana 45,60 35,80 Q1 40,60 32,90 Q3 49,40 39,30 Suma 3115,80 2486,90 Asimetría -0,15 0,20 Kurtosis -0,35 -0,16 P(10) 36,90 29,20 P(90) 53,80 42,40 Cuadernillo de Aplicación Unidad III - 17 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 Figura 9: Distribución de la proporción de muestras de forraje según % de pared celular obtenida por el método FDN Prueba z para medias de dos muestras FDN FDA Media 45,157 36,042 Varianza (conocida) 41,200 24,300 Observaciones 69,000 69,000 Diferencia hipotética de las medias 0,000 z 9,355 P(Z<=z) una cola 0,000 Valor crítico de z (una cola) 1,645 Valor crítico de z (dos colas) 0,000 Valor crítico de z (dos colas) 1,960 3. Extraiga conclusiones de la descripción estadística de ambas muestras. 4. Realice el planteo de la prueba que corresponda para determinar si hay diferencia entre ambos métodos. Interprete. 26,71 32,69 38,67 44,65 50,63 56,61 62,59 FDN 0,00 0,08 0,17 0,25 0,33 fr e cu e n ci a r e la tiv a 23,95 28,25 32,55 36,85 41,15 45,45 49,75 FDA 0,00 0,09 0,17 0,26 0,35 fre cu en ci a re la tiv a Figuras 8: Distribución de la proporción de muestras de forraje según % de pared celular obtenida por el método FDA
Compartir