Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA Dpto. de Estadística e Informática Semana 15. Prueba de hipótesis de dos poblaciones 2 Inicio • Motivación • Logros • Saberes previos Desarrollo • Prueba de hipótesis para la razón de variancias • Prueba de hipótesis para la diferencia de medias • Prueba de hipótesis para la diferencia de proporciones • Ejercicios resueltos Cierre • Ejercicios propuestos • Autoevaluación (Moodle) 3 Para identificar la mejor variedad de papa: El rendimiento promedio Kgs/parcela de la variedad Canchán es mayor a la Perricholi. La proporción de parcelas con menos plagas es con la variedad Canchán que con la Perricholi La variabilidad de tamaño de para son similares para ambas variedades. ¿Cómo se podría comprobar estas afirmaciones? ¿Hay un método estadístico para rechazar o aceptar dichas afirmaciones? Una institución dedicada a la investigación agropecuaria, ha realizado un experimento en papa con la finalidad de mejorar el rendimiento de los productores de la sierra central. Se han sembrado en un grupo de parcelas de agricultores la variedad Canchán y en otro Perricholi. 4 Al término de la sesión, el estudiante estará en capacidad de: Formular las hipótesis para los parámetros de dos poblaciones para apoyar la toma de decisiones. Aplicar el procedimiento de prueba de hipótesis para la razón de variancias, diferencia de medias y diferencia de proporciones. Resolver ejercicios propuestos. ¿Cómo se formula la prueba de hipótesis para dos poblaciones? ¿Cómo se realiza la prueba de hipótesis para una diferencia de medias, una proporción de variancias o una diferencia de proporciones? 5 Autoevaluación (Aula virtual) Ejemplos, ejercicios resueltos y propuestos Prueba de hipótesis para la diferencia de proporciones Prueba de hipótesis para la diferencia de medias Prueba de hipótesis para la razón de variancias 6 Para la prueba de hipótesis de la diferencia de medias (µ1-µ2), la razón de variancias (σ 2 1/σ 2 2) y la diferencia de proporciones (1-2) de dos poblaciones. Supuestos para realizar la prueba de hipótesis: 1. Las muestras son aleatorias. 2. Las muestras provienen de poblaciones normales. 3. Las muestras son independientes 7 Ejemplo Para los siguientes enunciados formule la hipótesis nula y la alterna. Enunciado Formulación del tipo de hipótesis La variancia de los diámetros de todos los árboles de una zona Norte es similar a la Sur. El peso promedio de los cuyes de la raza Inti es mayor que la raza Andina. El rendimiento promedio de fréjol Canario es mayor a Percal en más de 15 krg./parcela La proporción de artículo defectuosos de la máquina A es menor a la máquina B. La proporción de clientes morosos hombres es mayor que las mujeres en más de 8%. 𝑯𝟎: 𝝁𝟏 ≤ 𝝁𝟐 𝑯𝟏: 𝝁𝟏 > 𝝁𝟐 𝑯𝟎: 𝝈𝟏 𝟐 = 𝝈𝟐 𝟐 𝑯𝟏: 𝝈𝟏 𝟐 ≠ 𝝈𝟐 𝟐 𝑯𝟎: 𝝁𝟏 − 𝝁𝟐 ≤ 𝟏𝟓 𝑯𝟏: 𝝁𝟏 − 𝝁𝟐 > 𝟏𝟓 𝑯𝟎: 𝝅𝟏 ≥ 𝝅𝟐 𝑯𝟏: 𝝅𝟏 < 𝝅𝟐 𝑯𝟎: 𝝅𝟏 −𝝅𝟐 ≤ 𝟎.𝟎𝟖 𝑯𝟏: 𝝅𝟏 −𝝅𝟐 > 𝟎.𝟎𝟖 8 Parámetros Prueba Estadística 21/ 2 2 1-2 Caso 1. Si 21 y 2 2son desconocida, pero similares Caso 2. Si 21 y 2 2son desconocida, pero diferentes Pruebas estadísticas (Ec): 𝐅𝐜 = 𝐒𝟏 𝟐 𝐒𝟐 𝟐 𝐱 𝛔𝟐 𝟐 𝛔𝟏 𝟐 ~𝐅(𝐧𝟏−𝟏,𝐧𝟐−𝟏) 𝐭𝐜 = 𝐗 𝟏 − 𝐗 𝟐 − 𝛍𝟎 𝐒𝐩 𝟐 𝟏 𝐧𝟏 + 𝟏 𝐧𝟐 ~𝐭(𝐧𝟏+𝐧𝟐−𝟐) 𝐒𝐩 𝟐 = 𝐧𝟏 − 𝟏 𝐒𝟏 𝟐 + (𝐧𝟐 − 𝟏)𝐒𝟐 𝟐 (𝐧𝟏 + 𝐧𝟐 − 𝟐) 𝐇 = 𝐒𝟏 𝟐 𝐧𝟏 + 𝐒𝟐 𝟐 𝐧𝟐 𝟐 𝐒𝟏 𝟐 𝐧𝟏 𝟐 𝐧𝟏 − 𝟏 + 𝐒𝟐 𝟐 𝐧𝟐 𝟐 𝐧𝟐 − 𝟏 𝐭𝐜 = 𝐗 𝟏 − 𝐗 𝟐 − 𝛍𝟎 𝐒𝟏 𝟐 𝐧𝟏 + 𝐒𝟐 𝟐 𝐧𝟐 ~𝐭(𝐇) 9 Parámetros Prueba Estadística 1-2 Caso 1. Si 1-2=0 Caso 2. Si 1-2=0 Pruebas estadísticas (Ec): 𝐙𝐜 = 𝐩𝟏 − 𝐩𝟐 − 𝛑𝟎 𝐩𝟏(𝟏 − 𝐩𝟏) 𝐧𝟏 + 𝐩𝟐(𝟏 − 𝐩𝟐) 𝐧𝟐 ~𝐙 𝐙𝐜 = 𝐩𝟏 − 𝐩𝟐 𝐩 𝟏 − 𝐩 𝟏 𝐧𝟏 + 𝟏 𝐧𝟐 ~𝐙 𝐩 = 𝐧𝟏𝐩𝟏 + 𝐧𝟐𝐩𝟐 𝐧𝟏 + 𝐧𝟐 10 Regiones criticas para prueba de hipótesis de la diferencia de medias: Hipótesis unilateral con cola a la derecha Hipótesis bilateral o de dos colas Hipótesis unilateral con cola a la izquierda La zona de rechazo está al lado derecho. La zona de rechazo está a ambos lados. La zona de rechazo está al lado izquierdo. 0211 0210 : : H H 0211 0210 : : H H 0211 0210 : : H H 2,1 21 nn t 2, 21 nnt2,2 21 nn t 2, 2 1 21 nn t Zona de rechazo Ho Zona de no rechazo Ho Zona de no rechazo Ho Zona de rechazo Ho Zona de rechazo Ho Zona de rechazo Ho 11 Ejemplo En un programa de asistencia técnica se desea evaluar la eficacia de dos concentraciones de plaguicidas en el cultivo de frijol canario. Con esta finalidad se siembra en parcelas de comprobación de agricultores frijol canario y se aplican los plaguicidas (A y B). Luego de la cosecha se obtuvo los siguientes resultados del rendimiento en Kg/parcela y el número de parcelas infectadas con Pythium (ataca a la raíz y plántula del frijol). Plaguicida A B Tamaño de muestra 16 12 Rendimiento promedio en Kg/parcela 210.0 195.0 Desviación estándar 5.5 5.2 Número de plantas infectadas 2 4 1) Formulación de hipótesis 2) Nivel de significación. =0.10 3) Prueba estadística 12 a) Se puede afirmar que la variabilidad del rendimiento, usando los plaguicidas A y B son similares. Use = 0.10. 𝑯𝟎: 𝝈𝟏 𝟐 = 𝝈𝟐 𝟐 𝑯𝟏: 𝝈𝟏 𝟐 ≠ 𝝈𝟐 𝟐 F1=0.398 F2=2.72 𝑭𝟏 = 𝟏 𝑭 𝟏− 𝜶 𝟐 ;𝒏𝟐−𝟏,𝒏𝟏−𝟏 = 𝟏 𝑭𝟎.𝟗𝟓;𝟏𝟏,𝟏𝟓 = 𝟏 𝟐.𝟓𝟏 = 𝟎.𝟑𝟗𝟖 𝑭𝟐 = 𝑭𝟏−𝜶 𝟐 ;𝒏𝟏−𝟏,𝒏𝟐−𝟏 = 𝑭𝟎.𝟗𝟓;𝟏𝟓,𝟏𝟏 = 𝟐.𝟕𝟐 4) Regiones críticas 5) Decisión estadística. No se rechaza Ho. 6) Conclusión. Con nivel de significación de 0.10, las variancias del rendimiento con el plaguicida A y B son similares. Zona de no rechazo Ho Zona de rechazo Ho 𝐧𝟏 = 𝟏𝟔, 𝐗 𝟏 = 𝟐𝟏𝟎.𝟎, 𝐒𝟏 = 𝟓.𝟓; 𝐧𝟐 = 𝟏𝟐, 𝐗 𝟐 = 𝟏𝟗𝟓.𝟎, 𝐒𝟐 = 𝟓.𝟐 𝐅𝐜 = 𝐒𝟏 𝟐 𝐒𝟐 𝟐 = 𝟓.𝟓𝟐 𝟓.𝟐𝟐 = 𝟏.𝟏𝟏𝟗 1) Formulación de hipótesis 2) Nivel de significación. =0.10 3) Prueba estadística (Caso 1). 13 b) El fabricante del plaguicida A manifiesta que es más productivo su producto. Comprobar la afirmación del fabricante, probando si el rendimiento promedio usando el plaguicida A es superior que con el B. Use =0.10. (Usar los resultados de a). 𝑯𝟎: 𝝁𝟏 ≤ 𝝁𝟐 𝑯𝟏: 𝝁𝟏 > 𝝁𝟐 𝐭𝐜 = 𝟐𝟏𝟎.𝟎 − 𝟏𝟗𝟓.𝟎 − 𝟎 𝟐𝟖.𝟖𝟗 𝟏 𝟏𝟔 + 𝟏 𝟏𝟐 = 𝟕.𝟑𝟏 𝐭 𝟏−𝛂,𝐧𝟏+𝐧𝟐−𝟐 = 𝐭 𝟎.𝟗𝟎,𝟐𝟔 = 𝟏.𝟑𝟏𝟓 𝐭 𝟏−𝛂,𝐧𝟏+𝐧𝟐−𝟐 = 𝐭 𝟎.𝟗𝟎,𝟐𝟔 = 𝟏.𝟑𝟏𝟓 4) Regiones críticas 5) Decisión estadística. Se rechaza Ho. 6) Conclusión. Con nivel de significación de 0.10, el rendimiento promedio con el plaguicida A es mayor que con el B. La afirmación del fabricante es cierta. Zona de no rechazo Ho Zona de rechazo Ho 𝐒𝐩 𝟐 = 𝐧𝟏 − 𝟏 𝐒𝟏 𝟐 + (𝐧𝟐 − 𝟏)𝐒𝟐 𝟐 (𝐧𝟏 + 𝐧𝟐 − 𝟐) = 𝟏𝟔 − 𝟏 𝟓.𝟓𝟐 + 𝟏𝟐 − 𝟏 𝟓.𝟐𝟐 𝟏𝟔 + 𝟏𝟐 − 𝟐 = 𝟐𝟖.𝟖𝟗 𝐭𝐜 = 𝐗 𝟏 − 𝐗 𝟐 − 𝛍𝟎 𝐒𝐩 𝟐 𝟏 𝐧𝟏 + 𝟏 𝐧𝟐 = 𝟐𝟏𝟎.𝟎 − 𝟏𝟗𝟓.𝟎 − 𝟎 𝟐𝟖.𝟖𝟗 𝟏 𝟏𝟔 + 𝟏 𝟏𝟐 = 𝟕.𝟑𝟏 1) Formulación de hipótesis 2) Nivel de significación. =0.04 3) Prueba estadística (Caso 1). 14 c) El fabricante del plaguicida A, afirma que su plaguicida es más eficaz que el B. Pruebe la afirmación del fabricante, si la proporción de parcelas infectadas usando el plaguicida A es menor que el plaguicida B. Usar un nivel de significación 4%. 5) Decisión estadística. No se rechaza Ho. 6) Conclusión. Con nivel de significación de 0.04, la proporción de parcelas infectadas usando el plaguicida A no es menor que con el B. La afirmación del fabricante es falsa. H0: π1 ≥ π2 H1: π1 < π2 4) Regionescríticas p = n1p1 + n2p2 n1 + n2 = 16 2 16 + 12 4 12 16 + 12 = 0.214 𝒁𝟎.𝟎𝟒 = −𝟏.𝟕𝟓 Zona de no rechazo Ho Zona de rechazo Ho 𝐩𝟏 = 𝟐 𝟏𝟔 = 𝟎.𝟏𝟐𝟓,𝐩𝟐 = 𝟒 𝟏𝟐 = 𝟎.𝟑𝟑𝟑 ⇒ 𝐙𝐜 = 𝟎.𝟏𝟐𝟓 − 𝟎.𝟑𝟑𝟑 𝟎.𝟐𝟏𝟒𝐱𝟎.𝟕𝟖𝟔 𝟏 𝟏𝟔 + 𝟏 𝟏𝟐 = −𝟏.𝟑𝟑 15 Nitrato (1) 12.7 19.3 20.5 10.5 14.0 10.8 16.6 14.0 17.2 Control (2) 18.2 32.9 10.0 14.3 16.2 27.6 15.7 Ejercicio En un experimento para medir el porcentaje de aumento de peso para ratones jóvenes, se administró una dieta estándar (control) y a otro grupo se les dio 2000 partes por millón (ppm) de nitrato bebiendo agua. Suponiendo que el porcentaje de aumento de peso con nitrato y del control tienen distribución normal. a. Probar si las variancias del porcentaje de aumento de peso con nitrato y control, son homogéneas. Use =0.10. b. Se puede afirmar que el porcentaje de aumento de peso de los ratones con la dieta estándar fue mayor que con el nitrato. Use =0.01. 1) Formulación de hipótesis 2) Nivel de significación. =0.10 3) Prueba estadística 16 a. Probar si las variancias del porcentaje de aumento de peso con nitrato y control, son homogéneas. Use =0.10. 𝑯𝟎: 𝝈𝟏 𝟐 = 𝝈𝟐 𝟐 𝑯𝟏: 𝝈𝟏 𝟐 ≠ 𝝈𝟐 𝟐 F1=0.279 F2=4.15 4) Regiones críticas 5) Decisión estadística. Se rechaza Ho. 6) Conclusión. Con nivel de significación de 0.10, las variancias del porcentaje de aumento de peso con nitrato y control son diferentes. Existe heterogeneidad de variancias. Solución: F1 = 1 F 1− α 2 ;n2−1,n1−1 = 1 F0.95;6,8 = 1 3.58 = 0.279 F2 = F1−α 2 ;n1−1,n2−1 = F0.95;8,6 = 4.15 Zona de no rechazo Ho Zona de rechazo Ho 𝐧𝟏 = 𝟗, 𝐗 𝟏 = 𝟏𝟓.𝟎𝟕, 𝐒𝟏 = 𝟑.𝟓𝟔; 𝐧𝟐 = 𝟕, 𝐗 𝟐 = 𝟏𝟗.𝟐𝟕, 𝐒𝟐 = 𝟖.𝟎𝟓 𝐅𝐜 = 𝐒𝟏 𝟐 𝐒𝟐 𝟐 = 𝟑.𝟓𝟔𝟐 𝟖.𝟎𝟓𝟐 = 𝟎.𝟏𝟗𝟔 17 b. Se puede afirmar que el porcentaje de aumento de peso de los ratones con la dieta estándar (control) fue mayor que con el nitrato. Use =0.01. 1) Formulación de hipótesis 2) Nivel de significación. =0.01 3) Prueba estadística (Caso 2). 5) Decisión estadística. No se rechaza Ho. 6) Conclusión. Con nivel de significación de 0.01, el porcentaje promedio de aumento de peso con la dieta estándar no es mayor que con el control. 4) Regiones críticas 𝐇𝟎: 𝛍𝟏 ≥ 𝛍𝟐 𝐇𝟏: 𝛍𝟏 < 𝛍𝟐 𝐭𝐜 = 𝐗 𝟏 − 𝐗 𝟐 − 𝛍𝟎 𝐒𝟏 𝟐 𝐧𝟏 + 𝐒𝟐 𝟐 𝐧𝟐 = 𝟏𝟓.𝟎𝟕 − 𝟏𝟗.𝟐𝟕 − 𝟎 𝟑.𝟓𝟔 𝟐 𝟗 + 𝟖.𝟎𝟓𝟐 𝟕 = −𝟏.𝟐𝟗 𝐇 = 𝐒𝟏 𝟐 𝐧𝟏 + 𝐒𝟐 𝟐 𝐧𝟐 𝟐 𝐒𝟏 𝟐 𝐧𝟏 𝟐 𝐧𝟏 − 𝟏 + 𝐒𝟐 𝟐 𝐧𝟐 𝟐 𝐧𝟐 − 𝟏 = 𝟑.𝟓𝟔𝟐 𝟗 + 𝟖.𝟎𝟓𝟐 𝟕 𝟐 𝟑.𝟓𝟔𝟐 𝟗 𝟐 𝟖 + 𝟖.𝟎𝟓𝟐 𝟕 𝟐 𝟔 = 𝟕.𝟖𝟑 ≅ 𝟖 𝐭 𝛂,𝐇 = 𝐭 𝟎.𝟎𝟏,𝟖 = −𝟐.𝟖𝟗𝟔 Zona de no rechazo Ho Zona de rechazo Ho 1) Formulación de hipótesis 2) Nivel de significación. =0.05 3) Prueba estadística (Caso 2). 18 c) En el experimento se desea evaluar el efecto de la dieta estándar entre ratones machos y hembras. Si en una muestra de 50 machos el 30% y 60 hembras el 10% aumentaron su peso. Probar si el porcentaje de ratones machos que aumentaron de peso es mayor a las hembras en más de 5%. Use =0.05. 5) Decisión estadística. Se rechaza Ho. 6) Conclusión. Con nivel de significación de 0.05, la proporción de ratones machos que aumentaron su peso es mayor a las hembras en más de 5%. 4) Regiones críticas 𝐇𝟎: 𝛑𝟏 − 𝛑𝟐 ≤ 𝟎.𝟎𝟓 𝐇𝟏: 𝛑𝟏 − 𝛑𝟐 > 𝟎.𝟎𝟓 𝒏𝟏 = 𝟓𝟎,𝒑𝟏 = 𝟎.𝟑; 𝒏𝟐 = 𝟔𝟎,𝒑𝟐 = 𝟎.𝟏 𝐙𝐜 = 𝐩𝟏 − 𝐩𝟐 − 𝛑𝟎 𝐩𝟏(𝟏 − 𝐩𝟏) 𝐧𝟏 + 𝐩𝟐(𝟏 − 𝐩𝟐) 𝐧𝟐 = 𝟎.𝟑 − 𝟎.𝟏 − 𝟎.𝟎𝟓 𝟎.𝟑𝐱𝟎.𝟕 𝟓𝟎 + 𝟎.𝟏𝐱𝟎.𝟗 𝟔𝟎 = 𝟏.𝟗𝟗 𝒁𝟏−𝜶 = 𝒁𝟎.𝟗𝟓 = 𝟏.𝟔𝟓 Zona de no rechazo Ho Zona de rechazo Ho 19 Ejercicios propuestos. 1. Se ha realizado un estudio sobre los residuos orgánicos en dos ciudades (A y B). Con esta finalidad se obtuvieron el peso de residuos orgánicos producidos para una muestra de casas durante un día en las ciudades A y B. Los datos resumidos para muestras de tamaños 17 y 22 casas para las ciudades A y B respectivamente son: Ciudad A Ciudad B Promedio 3.18 1.12 s 0.72 0.65 n 17 22 ¿Hay evidencias muestrales para establecer que el promedio de los residuos orgánicos de la ciudad A excede al de la ciudad B en más de 1 Kg? Use =0.10. 20 2. Un fabricante de microprocesadores compra los microcircuitos de sus productos a dos proveedores: una muestra de 300 microcircuitos del proveedor A contuvo 50 defectuosos, mientras que una muestra de 400 piezas del proveedor B presentó 70 con fallas. Pruebe a un nivel de significación del 5% si hay diferencias entre la proporción de circuitos defectuosos de los dos proveedores. Referencias bibliográficas Anderson D., Sweendy D., Williams T. (2016) Estadística para Administración y Economía. 12ª. Edición. México. Cengage Learning Editores. Capítulos 9, 10, 11. Newbold, P. y Carlson, W. y Thorne, B. (2008). Estadística para Administración y Economía (6ta. ed.) Madrid: Pearson Education. Prentice Hall
Compartir