Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Cuadernillo de Aplicación III - 27 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 JI CUADRADO Pruebas de hipótesis para frecuencias Ejercicio 1 Se supone que en una reserva las especies de flora A, B, C y V (varias) se presentan en una relación 5:2:1:1. Luego de una contingencia climática se obtiene una muestra de campo y se encuentra que hay 269 unidades de la especie A; 112 de la especie B; 74 de la especie C y 45 de V. Pruebe la hipótesis de que luego de la contingencia climática, la relación se mantuvo en 5:2:1:1, para un α = 0,05. 1) Hipótesis científica: La relación de las especias de flora A, B, C y V, en una reserva, se presentan en la proporción5:2:1:1 { 9 9 9 Aclaración: En este caso, prueba de bondad de ajuste con datos que provienen de una población con distribución específica (también pueden ser datos que provienen de una población con una distribución conocida) la hipótesis científica concuerda con la nula. Es una excepción. En las demás pruebas de hipótesis siempre la H. científica concuerda con la alternativa. 2) Nivel de significancia α = 0,05 3) Estadígrafo de Prueba ∑ ( ̂ ) ̂ ( ); i:1,2,3,4 4) Regla de decisión Para obtener el valor crítico del estadígrafo de prueba puede hacerse por: A) Excel: función =INV.CHICUAD.CD (probablidad; grados de libertad). Para nuestro caso =INV.CHICUAD. CD(0,05;3). B) Infostat: >EstadísticasProbabilidades y CuantilesModelo ChiCuadradoGrados de libertad (No colocar nada en lambda)P(X>x)=α. Para nuestro caso Cuadernillo de Aplicación III - 28 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 Figura 1. Función de densidad de ( ) 5) Cálculo del estadígrafo de prueba CÁLCULO CON EXCEL ¿CÓMO OBTUVIMOS LOS VALORES QUE SE ENCUENTRAN EN LAS CELDAS DE ESTA PLANILLA? El armado de la tabla auxiliar nos permite hacer los cálculos de forma rápida y ordenada. Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil 0,00 3,81 7,62 11,44 15,25 X^2 0,00 0,06 0,12 0,18 0,24 D e n s id a d Chi cuadrado(3): p(evento)=0,0500 1) Criterio de los puntos críticos Si 𝜒𝑚 > 𝜒𝑐 se rechaza la hipótesis nula. 2) Criterio del p-valor Si 𝑃(𝜒 > 𝜒𝑚 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐 ) 𝛼, entonces se rechaza la hipótesis nula α =0,05 𝜒𝑐 7 8 Cuadernillo de Aplicación III - 28 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 a) La primera columna corresponde a las diferentes categorías que toma la variable en estudio. La segunda son las frecuencias observadas ( ), datos que da el enunciado. b) La tercera son las proporciones que nos da la hipótesis nula ( ). Dado que la relación es que se pone a prueba es 5:2:1:1, quiere decir que de 9 especímenes 5 pertenecen a la especie A, 2 a la B, 1 a la C y 1 a V (varios). Entonces, podemos escribir esta relación como proporciones 5/9=0,56; 2/9=0,22 y 1/9=0,11 (estas cuentas se realizan directamente en la celda colocando =5/9, etc.) Recuerde utilizar el aproximador decimal (barra de herramientas 0,00). c) La cuarta columna son las frecuencias esperadas ( ̂ ) que se obtienen del producto entre la proporción teórica y el total de la muestra ( ̂ ). Puede realizar éste cálculo colocando =C6*$B$10 para la primera frecuencia esperada y copiar la fórmula hacia abajo para no tipear los números. Recuerde que de esta forma se ahorra tiempo y se puede utilizar la misma tabla para cálculos futuros sólo cambiando las frecuencias observadas. d) La quinta columna corresponde al término del estadígrafo de prueba que queremos calcular. En la celda se calcula ( ̂ ) ̂ Para ese cálculo puede utilizarse la ecuación =(B6-D6)^2/D6, refiriéndose a las celdas correspondientes para la primera categoría y luego copiarla para el resto. Al pie de la columna se utiliza la función =SUMA(rango) y se obtiene así el valor del estadígrafo de prueba muestral. e) Para calcular el p-valor se utiliza la función =DISTR.CHICUAD (valor; grados de libertad) y devuelve el valor de probabilidad acumulada por derecha ( ( > )). En nuestro caso, =DISTR.CHICUAD (8,41;3). En conclusión, obtuvimos: 8 8 CÁLCULO CON INFOSTAT a) ESTADÍSTICASInferencia con una muestraPrueba de Bondad de Ajuste (Multinomial)Frecuencias Esperadas. b) Es necesario contar con las frecuencias observadas y las frecuencias esperadas. Al clickear “Calcular” saldrá un aviso de que los totales no son iguales y que puede ser un error. La diferencia es decimal porlo que se hace caso omiso al aviso. Clickear “Aceptar” luego de revisar que las diferencias no sea muy grande. Y se obtiene: Cuadernillo de Aplicación III - 29 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 6) Toma de decisión Criterio de puntos críticos: 8 > 7 8 entonces, se rechaza Criterio del p-valor p-valor=0,0382 < 0,05 entonces se rechaza 7) Interpretación Se tiene suficiente evidencia muestral, con un α = 0,05 para decir que las especies de flora de la reserva no mantiene la relación de 5:2:1:1 luego de la contingencia climática. 8) Conclusión Luego de la contingencia climática en la reserva, las especies de flora A, B, C y V (otros) han perdido la relación de 5:2:1:1. DE AQUÍ EN ADELANTE USTED RESUELVA DE ACUERDO CON LA CORRESPONDIENTE TEORÍA Y CONSIGNAS. TENGA EN CUENTA LO SIGUIENTE: - DETERMINAR QUÉ TIPO DE PRUEBA ES LAQUE TIENE QUE REALIZAR (BONDAD DE AJUSTE, INDEPENDENCIA U HOMOGENEIDAD) - TENER EN CLARO EL CÁLCULO DE LOS GRADOS DE LIBERTAD. - AL MOMENTO DE CALCULAR LAS FRECUENCIAS ESPERADAS, EN LAS DE BONDAD DE AJUSTE, RECORDAR QUE DEBEN SER MAYORES O IGUALES A 5. SI NO SE CUMPLE ESTA CONDICIÓN, SE DEBE RECATEGORIZAR LA VARIABLE. - SI LOS GRADOSDE LIBERTAD SON IGUALES A 1, EN LAS DE INDEPENDENCIA Y HOMOGENEIDAD, APLICAR LA CORRECCIÓN DE YATES (SE TRABAJA CON TABLAS DE CONTINGENCIA). 𝜒𝑚 𝑝 𝑣𝑎𝑙𝑜𝑟 Verificar los totales. Cuadernillo de Aplicación III - 30 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 Ejercicio 2 Retome el ajustamiento de la Distribución Normal para la variable peso (g) por racimo del caso 6 del cuadernillo I y pruebe la hipótesis (α = 0,01) de que la variable sigue una distribución normal. 1) Hipótesis científica: El peso de racimos de uva de plantas de vid del cuartel de variedad Malbec de la Finca San Antonio de la Facultad de Ciencias Agrarias se distribuye normalmente ( ) 2) Nivel de significancia α = 0,01 3) Estadígrafo de Prueba ∑ ( ̂ ) ̂ ( ); i=1,…,k 4) Regla de decisión 5) Cálculo del estadígrafo de prueba CÁLCULO CON EXCEL En el ejercicio 6 del trabajo práctico de VAC armamos la siguiente tabla de ajustamiento LI(xi) LS(xs) F(xs) P(xi<X<xs)=F(xs)-F(xs) ni ni^ menor a 14,5 0,015945 0,015945 0 2,0 14,5 28,5 0,079026 0,063082 10 7,8 28,5 42,5 0,249042 0,170015 19 20,9 42,5 56,5 0,522582 0,273540 40 33,6 56,5 70,5 0,785463 0,262881 29 32,3 70,5 84,5 0,936360 0,150898 14 18,6 84,5 98,5 0,988060 0,051700 10 6,4 98,5 112,5 0,998620 0,010559 1 1,3 112,5 o mayor 1,000000 0,001380 0 0,2 1,0000 123 123,0 Con los datos de la tabla anterior armamos la tabla de cálculos auxiliares. Criterio de los puntos críticos Si 𝜒𝑚 > 𝜒𝑐 se rechaza la hipótesis nula. Criterio del p-valor Si 𝑃(𝜒 > 𝜒𝑚 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐 ) 𝛼, entonces se rechaza la hipótesis nula. Cuadernillo de Aplicación III - 31 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 Debido a que las frecuencias son menores a 5 agrupamos conforme a lo que se observa en la tabla de Excel. De esta manera cambian los grados de libertad ( – – ) y también cambia el valor de chi cuadrado crítico siendo el nuevo valor 11,344 Cálculo en Excel =INV.CHICUAD.CD(0,01;3)=11,344 En conclusión, obtuvimos: 7 También podemos calcularlo por Infostat como se explica en el ejercicio 1 Es importante destacar que al realizar el cálculo en Infostat hay que corregir los grados de libertad ya que por defecto Infostat considera que los parámetros son conocidos. Cuadernillo de Aplicación III - 32 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 6) Toma de decisión Criterio de puntos críticos: < entonces, se acepta Criterio del p-valor p-valor=0,2475 > 0,01 entonces se acepta 7) Interpretación Se tiene suficiente evidencia muestral, con un α = 0,01 para decir el peso de los racimos de uva de plantas de vid del cuartel de variedad Malbec de la Finca San Antonio de la Facultad de Ciencias Agrarias se distribuye normalmente. 8) Conclusión Es correcto el ajustamiento que se realizó en el ejercicio 6 del TP de VAC Ejercicio 3 Se realizó una experiencia en trigo a fin de determinar si existe asociación entre los caracteres largo de semilla y susceptibilidad a “roya”. Se obtuvieron los siguientes resultados: Susceptibilidad a la roya Largo de la semilla Corto Mediano Largo Resistente 15 30 40 Susceptible 8 12 10 Pruebe, para un α = 0,01, que la susceptibilidad a la roya está asociada al largo de la semilla. 1) Hipótesis científica: La susceptibilidad del trigo a la roya está asociada al largo de semilla que presenta. { ( ) ( ) 2) Nivel de significancia α = 0,01 3) Estadígrafo de Prueba ∑∑ ( ̂ ) ̂ ( ( ) ( ) ) 4) Regla de decisión Criterio de los puntos críticos Si 𝜒𝑚 > 𝜒𝑐 se rechaza la hipótesis nula. Criterio del p-valor Si 𝑃(𝜒 > 𝜒𝑚 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐 ) 𝛼, entonces se rechaza la hipótesis nula . Cuadernillo de Aplicación III - 33 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 Figura2. Función de densidad de ( ) 5) Cálculo del estadígrafo de prueba CÁLCULO CON EXCEL ¿CÓMO OBTUVIMOS LOS VALORES QUE SE ENCUENTRAN EN LAS CELDAS DE ESTA PLANILLA? El armado de la tabla auxiliar permite hacer los cálculos de forma rápida y ordenada. a) La primera columna corresponde a las diferentes categorías que son las celdas combinadas. La segunda son las frecuencias observadas ( ), datos que da el enunciado. b) La tercera columna son las frecuencias esperadas ( ̂ ) que se obtienen de multiplicar el total de la fila y la columna y dividirlo por el total ̂ Puede realizarse este cálculo colocando =E9*B11/E11 para la primera frecuencia esperada y hacer lo mismo para el resto y no tipear los números. De esta forma se ahorra tiempo y puede utilizarse la misma tabla para cálculos futuros sólo cambiando las frecuencias observadas. Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión EstudiantilVersión Estudiantil Versión Estudiantil Versión Estudiantil 0,00 3,00 6,00 9,00 12,00 X^2 0,00 0,12 0,24 0,36 0,48 D e n s id a d Chi cuadrado(2): p(evento)=0,0100 α =0,01 𝜒𝑐 9 Cuadernillo de Aplicación III - 34 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 c) La cuarta columna corresponde al término del estadígrafo de prueba que se va a calcular. En la celda se calcula ( ̂ ) ̂ Para ese cálculo puede utilizarse la ecuación =(B15-C15)^2/C15, refiriéndose a las celdas correspondientes para la primera categoría y luego copiarla para el resto. Al pie de la columna se utiliza la función =SUMA(rango) y se obtiene así el valor del estadígrafo de prueba muestral. d) Para calcular el p-valor se utiliza la función =DISTR.CHICUAD (valor; grados de libertad) y devuelve el valor de probabilidad acumulada ( ( > )). En nuestro caso, =DISTR.CHICUAD(2,00;2). En conclusión, obtuvimos: 8 CÁLCULO CON INFOSTAT a) Se modifica el formato de la tabla de contingencia para pegarla en Infostat Susceptibilidad Largo Frecuencia resistente corto 15 resistente mediano 30 resistente largo 40 susceptibles corto 8 susceptibles mediano 12 susceptibles largo 10 b) Luego se importa la tabla en Infostat. ARCHIVO Nueva tabla. Luego se selecciona la tabla en Excel y se pega en Infostat. c) ESTADÍSTICAS Datos categorizados Tablas de contingencias Cuadernillo de Aplicación III - 35 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 d) En criterios de clasificación se seleccionan las columnas "susceptibillidad" y "Largo" y en criterio de clasificación se selecciona "frecuencia". e) Luego se hace "click" en el botón aceptar y aparecerá la siguiente pantalla. Cuadernillo de Aplicación III - 36 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 f) En nuestro caso, se selecciona "Largo" como columnas y "susceptibilidad" como fila de acuerdo a la tabla de contingencias original. g) Finalmente se selecciona “aceptar” y se obtiene la siguiente salida. En los rectángulos en rojo se puede observar los mismos resultados que cuando realizamos el cálculo en Excel. 6) Toma de decisión Criterio de puntos críticos: < 9 entonces, se acepta Criterio del p-valor p-valor=0,3684 > 0,01 entonces se acepta 7) Interpretación No se tiene suficiente evidencia muestral, con un α = 0,01 para decir que la susceptibilidad del trigo a la roya depende del largo de la semilla. 8) Conclusión El trigo puede o no ser susceptible a la roya independientemente del largo de semilla que presente. O: el largo de semilla de trigo no influye en la susceptibilidad que tiene a la roya. Cuadernillo de Aplicación III - 37 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 Ejercicio 4 En un estudio sobre contaminación atmosférica en dos comunidades (I y II), se seleccionó una muestra aleatoria de 300 familias de cada comunidad. Se le preguntó, a uno de los miembros de cada familia, si alguien de la misma se sentía afectado por la contaminación atmosférica. Las respuestas se presentan a continuación: Comunidad Algún miembro de la familia ha sido afectado por la contaminación SI NO TOTAL I 63 237 300 II 121 179 300 TOTAL 184 416 600 ¿Puede concluirse que las dos comunidades difieren con respecto a la variable en estudio? 1) Hipótesis científica: La proporción de enfermos afectados por la contaminación ambiental no es la misma para ambas comunidades ; ; :H1 las poblaciones no son homogéneas 2) Nivel de significancia α = 0,05 3) Estadígrafo de Prueba Se utiliza la corrección de Yates porque se trata de una tabla de contingencias de 2x2 ∑∑ (|( ̂ ) |) ̂ ( ( ) ( ) ) 4) Regla de decisión Criterio de los puntos críticos Si 𝜒𝑚 > 𝜒𝑐 se rechaza la hipótesis nula. Criterio del p-valor Si 𝑃(𝜒 > 𝜒𝑚 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐 ) 𝛼, entonces se rechaza la hipótesis nula. Cuadernillo de Aplicación III - 38 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 No se ha resuelto con Infostat porque es una tabla de contingencia de 2x2 y se debe realizar la corrección de Yates. 5) Toma de decisión Criterio de los puntos críticos 25,47 > 8 se rechaza la hipótesis nula. Criterio del p-valor Si < 0,05 entonces se rechaza la hipótesis nula. 6) Interpretación No se tiene suficiente evidencia muestral, con un α = 0,05 para decir que la proporción de enfermos en ambas comunidades es la misma 7) Conclusión La proporción de enfermos por contaminación ambiental no difieren en las dos comunidades. Ejercicio 5 Un investigador está estudiando la presencia de un parásito intestinal específico en guanacos de diferente sexo. Su hipótesis es que uno de los sexos es más propenso a este parasitismo. Toma una muestra a campo de 49 animales y registra a partir de sus heces cuántos de ellos están infectados: Macho parasitado 18; Macho no parasitado: 6; Hembra parasitada: 10; Hembra no parasitada: 15. ¿Puede sostenerse la hipótesis de que ese tipo de parasitismo está asociado al sexo, utilizando un nivel de significancia de 0,05? Primeramente, armamos la tabla de contingencias en base a los datos del enunciado: Género Parasitado SI NO TOTAL M 18 6 24 H 10 15 25 TOTAL 28 21 49 Cuadernillo de Aplicación III - 39 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 1) Hipótesis científica: El parasitismo en guanacos se encuentra asociado al sexo de los mismos. 2) { ( ) ( ) 3) Nivel de significancia α = 0,05 4) Estadígrafo de Prueba Se utiliza la corrección de Yates debido a que se trata de una tabla de contingencias de 2x2 ∑∑ (|( ̂ ) |) ̂ ( ( ) ( ) ) 5) Regla de decisión 6) Cálculo del estadígrafo de prueba CÁLCULO CON EXCEL Criterio de los puntos críticos Si 𝜒𝑚 > 𝜒𝑐 se rechaza la hipótesis nula. Criterio del p-valor Si 𝑃(𝜒 > 𝜒𝑚 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐 ) 𝛼, entonces se rechaza la hipótesis nula Cuadernillo de Aplicación III - 40 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 Acá está mal el nivel de significancia, es 0,05 No se ha resuelto con Infostat porque es una tabla de contingencia de 2x2 y se debe realizar la corrección de Yates. 7) Toma de decisión Criterio de los puntos críticos 78 > 8 se rechaza la hipótesis nula. 8) Criterio del p-valor 9 < =0,05, entonces se rechaza la hipótesis nula 9) Interpretación Se tiene suficiente evidencia muestral, con un α = 0,05 para decir que el parasitismo en guanacos es dependiente del sexo de los mismos. 10) Conclusión El parasitismo en guanacos se encuentra asociado al sexo. Cuadernillo de Aplicación III - 41 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 Ejercicio 6 Retome los ejercicios de variable aleatoria discreta, referidos al ajustamiento de una distribución binomial a los datos obtenidos de la variable y pruebe si las variables siguen dicha distribución, para un nivel de significancia del 0,05. Caso 1 del trabajo práctico de variable aleatoria discreta 1) Hipótesis científica: El número de análisis de Salmonella spp positivos realizados en helados decrema por día sigue una distribución binomial. ( ) 2) Nivel de significancia α = 0,05 3) Estadígrafo de Prueba ∑ ( ̂ ) ̂ ( ) 4) Regla de decisión 5) Cálculo del estadígrafo de prueba CÁLCULO CON EXCEL En el ejercicio 1 del trabajo práctico de VAD armamos la siguiente tabla de ajustamiento Criterio de los puntos críticos Si 𝜒𝑚 > 𝜒𝑐 se rechaza la hipótesis nula. Criterio del p-valor Si 𝑃(𝜒 > 𝜒𝑚 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐 ) 𝛼, entonces se rechaza la hipótesis nula Cuadernillo de Aplicación III - 42 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 Debido a que las frecuencias teóricas son menores a 5 agrupamos los casos para los valores 2,3 y 4 De esta manera cambian los grados de libertad ( – – ) y también cambia el valor de chi cuadrado crítico siendo el nuevo valor 3,84 Cálculo en Excel =INV.CHICUAD.CD(0,05;1)=3,84. En conclusión, obtuvimos: 8 También podemos calcularlo por Infostat como se explica en el ejercicio 1 5) Toma de decisión Criterio de los puntos críticos Cuadernillo de Aplicación III - 43 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 8 > 8 se rechaza la hipótesis nula. 6) Criterio del p-valor =0,0000< =0,05 entonces se rechaza la hipótesis nula 7) Interpretación No se tiene suficiente evidencia muestral, con un α = 0,05 para decir que el número de análisis de Salmonella spp positivos realizados en helados de crema por día sigue una distribución binomial 8) Conclusión El número de análisis de Salmonella spp positivos realizados en helados de crema por día no sigue una distribución binomial. Se deberá ajustar otro modelo de probabilidad. Caso 2 del trabajo práctico de variable aleatoria discreta 1) Hipótesis científica: El número de envases abollados por cuarteto de envase sigue una distribución binomial. ( ) 2) Nivel de significancia α = 0,05 3) Estadígrafo de Prueba ∑ ( ̂ ) ̂ ( ) 4) Regla de decisión CÁLCULO CON EXCEL En el ejercicio 2 del trabajo práctico de VAD armamos la siguiente tabla de ajustamiento Criterio de los puntos críticos Si 𝜒𝑚 > 𝜒𝑐 se rechaza la hipótesis nula. Criterio del p-valor Si 𝑃(𝜒 > 𝜒𝑚 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐 ) 𝛼, entonces se rechaza la hipótesis nula Cuadernillo de Aplicación III - 44 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 Debido a que las frecuencias teóricas son menores a 5 agrupamos los casos para los valores 3 y 4. De esta manera cambian los grados de libertad( ) y también cambia el valor de chi cuadrado crítico siendo el nuevo valor 7,81 Cálculo en Excel =INV.CHICUAD.CD(0,05;3)=7,81 En conclusión, obtuvimos: 7 También podemos calcularlo por Infostat como se explica en el ejercicio 1 Cuadernillo de Aplicación III - 45 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 5) Toma de decisión Criterio de los puntos críticos 7 7 8 se acepta hipótesis nula. 6) Criterio del p-valor > entonces se acepta la hipótesis nula 7) Interpretación Se tiene suficiente evidencia muestral, con un α = 0,05 para de que de que el número de envases abollados por cuarteto de envases sigue una distribución binomial 8) Conclusión Es correcto el ajustamiento que se realizó en el caso 2 del TP de VA. Ejercicio 7 La siguiente tabla presenta información sobre la distribución de plantas de jarilla (Larrea divaricata) encontrada en 48 cuadrantes sorteados en un campo. Tabla auxiliar: Distribución de plantas de jarilla por cuadrante xi: Cantidad de plantas de jarilla 0 1 2 3 4 5 6 ni: Cantidad de cuadrantes 9 9 10 14 2 2 2 1.- Complete las líneas punteadas, según corresponda. 2.- Realice el ajustamiento con el modelo que corresponda y a continuación desarrolle la prueba de bondad de ajuste con un nivel de significancia de 0,05. Extraiga conclusiones en términos estadísticos y del problema. Cuadernillo de Aplicación III - 46 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 2. Como no conocemos el parámetro ( ) lo estimamos a través de los datos muestrales (media ponderada). Para ello construimos una tabla auxiliar en Excel: Tabla auxiliar para calcular lambda (media ponderada) xi frecuencias frecuencias relativas (fi ) xi fi 0 9 0,19 0 1 9 0,19 0,19 2 10 0,21 0,42 3 14 0,29 0,88 4 2 0,04 0,17 5 2 0,04 0,21 6 2 0,04 0,25 48 1,000 2,12 El valor estimado de es 2,12 Luego realizamos la tabla de ajustamiento como se realizó en el trabajo práctico de VAD xi frecuencias P(X=xi) P(Xxi) Frecuencias teóricas 0 9 0,12 0,12 5,76 1 9 0,25 0,38 12,21 2 10 0,27 0,65 12,95 3 14 0,19 0,84 9,15 4 2 0,10 0,94 4,85 5 2 0,04 0,98 2,06 6 2 0,02 1,00 0,73 48 1,00000 47,70 Prueba de bondad del ajuste 1) Hipótesis científica: la distribución de plantas de jarilla (Larrea divaricata) encontrada en 48 cuadrantes sorteados en un campo sigue una distribución de Poisson. ( ) 2) Nivel de significancia α = 0,05 3) Estadígrafo de Prueba Cuadernillo de Aplicación III - 47 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 ∑ ( ̂ ) ̂ ( ) 4) Regla de decisión 5) Cálculo del estadígrafo de prueba Debido a que las frecuencias teóricas son menores a 5 agrupamos los casos para los valores 4, 5 y 6. De esta manera cambian los grados de libertad ( ) y también cambia el valor de chi cuadrado crítico siendo el nuevo valor 7,81 Cálculo en Excel =INV.CHICUAD.CD(0,05;3)=7,81 En conclusión, obtuvimos: 8 997 También podemos realizar el cálculo en Infostat como es explicó en el ejercicio 1 Criterio de los puntos críticos Si 𝜒𝑚 > 𝜒𝑐 se rechaza la hipótesis nula. Criterio del p-valor Si 𝑃(𝜒 > 𝜒𝑚 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐 ) 𝛼, entonces se rechaza la hipótesis nula Cuadernillo de Aplicación III - 48 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 6) Toma de decisión Criterio de los puntos críticos 8 7 8 se acepta la hipótesis nula. Criterio del p-valor 997 > , entonces se acepta la hipótesis nula 7) Interpretación Se tiene suficiente evidencia muestral, con un α = 0,05 de que las plantas de jarilla (Larrea divaricata) encontrada en 48 siguen una distribución de Poisson. 8) Conclusión Podemos afirmar que las plantas de jarilla por cuadrante siguen una distribución de Poisson por lo tanto el modelo ajustado es correcto. Ejercicio 8 Con el fin de determinar si existe asociación entre los tipos de defectos (M: machucado; Q: quemado; P: podrido) en duraznos que se reciben en una fábrica y la época de cosecha (T: cosecha temprana; R: cosecha tardía). Los resultados han sido: n(MT) = 15 ; n(QT) = 19 ; n(MR) = 21 ; n(QR) = 13 ; n(PT) = 26 ; n(PR) = 18 1. Construya la tabla de contingencia que corresponda 2. Aplique una prueba de hipótesis que considere apropiada (α = 0,01). Extraiga conclusiones en términos estadísticos y del problema. 3. Dé el fundamento probabilístico aplicado para obtener las frecuencias conjuntasteóricas. Cuadernillo de Aplicación III - 49 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 1. Época de cosecha Defectos Machucado Quemado Podrido Total Temprana 15 19 26 60 Tardía 21 13 18 52 Total 36 32 44 112 2. 1) Hipótesis científica: El tipo de defecto en duraznos que se reciben en una fábrica depende de la época de cosecha de los mismos. { ( ) ( ) 2) Nivel de significancia α = 0,01 3) Estadígrafo de Prueba ∑∑ ( ̂ ) ̂ ( ( ) ( ) ) 4) Regla de decisión 5) Cálculo del estadígrafo de prueba CÁLCULO CON EXCEL Criterio de los puntos críticos Si 𝜒𝑚 > 𝜒𝑐 se rechaza la hipótesis nula. Criterio del p-valor Si 𝑃(𝜒 > 𝜒𝑚 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐 ) 𝛼, entonces se rechaza la hipótesis nula Cuadernillo de Aplicación III - 50 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 En conclusión, obtuvimos: Cálculo en Excel =INV.CHICUAD.CD(0,01;2)=9,21 También podemos calcularlo por Infostat como se explica en el ejercicio 3. Para ello debemos editar la tabla de contingencias para pegarla en Infostat. La tabla debe tener el siguiente formato. Luego seguimos los mismos pasos que en ejercicio 3. época defecto frecuencia T M 15 T Q 19 T P 26 R M 21 R Q 13 R P 18 5) Toma de decisión Criterio de los puntos críticos 9 se acepta la hipótesis nula. Criterio del p-valor =0,2205> , entonces se acepta la hipótesis nula 6) Interpretación No se tiene suficiente evidencia muestral, con un α = 0,01 para decir que el tipo de defecto en duraznos está asociado a la época de cosecha de los mismos. 7) Conclusión El defecto del durazno es independiente de la época de cosecha. Cuadernillo de Aplicación III - 51 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 3. La igualdad, ( ) ( ) ( ), es utilizada para encontrar eventos independientes, y se deduce de la expresión de la probabilidad condicionada P(A│B)=P(A∩B)/P(B), si P(B)≠0 (1) Entonces si los eventos son independientes, la ocurrencia de B no influye en A, P(A│B)=P(A) (2). Luego, reemplazando la expresión (2) en la expresión (1), resulta: P(A)=P(A∩B)/P(B) y, despejando, la P(A∩B)=P(A)*P(B) Ejercicio 9 En una agroindustria se ha implantado la evaluación de proveedores. Los envases utilizados son provistos por 3 proveedores. Con el objetivo de la evaluación se han tomado los registros del control de calidad realizado a las compras de un período anual. Para cada distribuidor se han sorteado 100 compras. La siguiente tabla muestra los correspondientes resultados Proveedor Calidad No cumple Si cumple A 16 94 B 24 76 C 9 81 ¿Puede considerarse que los tres proveedores suministran envases con una calidad homogénea? 1) Hipótesis científica: La proporción de envases provistos por los distintos proveedores provienen de poblaciones homogeneas. = :H1 las poblaciones no son homogéneas 2) Nivel de significancia α = 0,05 3) Estadígrafo de Prueba Se utiliza la corrección de Yates debido a que se trata de una tabla de contingencias de 2x2 ∑∑ ( ̂ ) ̂ ( ( ) ( ) ) 4) Regla de decisión Criterio de los puntos críticos Si 𝜒𝑚 > 𝜒𝑐 se rechaza la hipótesis nula. Criterio del p-valor Si 𝑃(𝜒 > 𝜒𝑚 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐 ) 𝛼, entonces se rechaza la hipótesis nula Cuadernillo de Aplicación III - 52 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 5) Cálculo del estadígrafo de prueba CÁLCULO CON EXCEL Cálculo en Excel =INV.CHICUAD.CD(0,05;2)=5,99 En conclusión, obtuvimos: 7 7 También podemos calcularlo por Infostat como se explica en el ejercicio 3. Para ello debemos editar la tabla de contingencias para pegarla en Infostat. La tabla debe tener el siguiente formato. Luego seguimos los mismos pasos que en el ejercicio 3. Proveedor calidad frecuencia A no cumple 16 A si cumple 94 B no cumple 24 B si cumple 76 C no cumple 9 C si cumple 81 Cuadernillo de Aplicación III - 53 Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 6) Toma de decisión Criterio de los puntos críticos 7 > 99 se rechaza la hipótesis nula. 7) Criterio del p-valor 7 , entonces se rechaza la hipótesis nula 7) Interpretación Se tiene suficiente evidencia muestral, con un α = 0,05 para afirmar que la proporción de envases provistos por los distintos proveedores no provienen de la misma población 8) Conclusión La calidad de los envases provistos por las distintas empresas no es homogénea.
Compartir