EG_2021_I_Semana 15_Prueba de Hipotesis dos Poblaciones (1)

Estadística

•

FAMED

0

Carlos Daniel Cardenas Clemente

25/7/2023

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Estadística

5643 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA 
Dpto. de Estadística e Informática 
Semana 15. Prueba de hipótesis de dos poblaciones 
2 
Inicio 
• Motivación 
• Logros 
• Saberes previos 
Desarrollo 
• Prueba de hipótesis para la razón de variancias 
• Prueba de hipótesis para la diferencia de medias 
• Prueba de hipótesis para la diferencia de proporciones 
• Ejercicios resueltos 
Cierre 
• Ejercicios propuestos 
• Autoevaluación (Moodle) 
3 
Para identificar la mejor variedad de papa: 
 El rendimiento promedio Kgs/parcela de la variedad Canchán es mayor a la 
Perricholi. 
 La proporción de parcelas con menos plagas es con la variedad Canchán que 
con la Perricholi 
 La variabilidad de tamaño de para son similares para ambas variedades. 
¿Cómo se podría comprobar estas afirmaciones? 
¿Hay un método estadístico para rechazar o aceptar dichas 
afirmaciones? 
Una institución dedicada a la 
investigación agropecuaria, ha 
realizado un experimento en papa 
con la finalidad de mejorar el 
rendimiento de los productores de 
la sierra central. Se han sembrado 
en un grupo de parcelas de 
agricultores la variedad Canchán y 
en otro Perricholi. 
4 
Al término de la sesión, el estudiante estará en capacidad de: 
 
 Formular las hipótesis para los parámetros de dos poblaciones 
para apoyar la toma de decisiones. 
Aplicar el procedimiento de prueba de hipótesis para la razón 
de variancias, diferencia de medias y diferencia de 
proporciones. 
Resolver ejercicios propuestos. 
¿Cómo se formula la prueba de hipótesis para dos 
poblaciones? 
¿Cómo se realiza la prueba de hipótesis para una diferencia 
de medias, una proporción de variancias o una diferencia de 
proporciones? 
 
5 
Autoevaluación (Aula virtual) 
Ejemplos, ejercicios resueltos y propuestos 
Prueba de hipótesis para la diferencia de proporciones 
Prueba de hipótesis para la diferencia de medias 
Prueba de hipótesis para la razón de variancias 
6 
Para la prueba de hipótesis de la diferencia de medias 
(µ1-µ2), la razón de variancias (σ
2
1/σ
2
2) y la diferencia de 
proporciones (1-2) de dos poblaciones. 
Supuestos para realizar la prueba de hipótesis: 
1. Las muestras son aleatorias. 
2. Las muestras provienen de poblaciones normales. 
3. Las muestras son independientes 
7 
 
 
 
 
Ejemplo 
Para los siguientes enunciados formule la hipótesis nula y 
la alterna. 
Enunciado Formulación del 
tipo de hipótesis 
La variancia de los diámetros de todos los 
árboles de una zona Norte es similar a la Sur. 
El peso promedio de los cuyes de la raza Inti 
es mayor que la raza Andina. 
El rendimiento promedio de fréjol Canario es 
mayor a Percal en más de 15 krg./parcela 
La proporción de artículo defectuosos de la 
máquina A es menor a la máquina B. 
La proporción de clientes morosos hombres 
es mayor que las mujeres en más de 8%. 
𝑯𝟎: 𝝁𝟏 ≤ 𝝁𝟐 
𝑯𝟏: 𝝁𝟏 > 𝝁𝟐 
𝑯𝟎: 𝝈𝟏
𝟐 = 𝝈𝟐
𝟐 
𝑯𝟏: 𝝈𝟏
𝟐 ≠ 𝝈𝟐
𝟐 
𝑯𝟎: 𝝁𝟏 − 𝝁𝟐 ≤ 𝟏𝟓 
𝑯𝟏: 𝝁𝟏 − 𝝁𝟐 > 𝟏𝟓 
𝑯𝟎: 𝝅𝟏 ≥ 𝝅𝟐 
𝑯𝟏: 𝝅𝟏 < 𝝅𝟐 
𝑯𝟎: 𝝅𝟏 −𝝅𝟐 ≤ 𝟎.𝟎𝟖 
𝑯𝟏: 𝝅𝟏 −𝝅𝟐 > 𝟎.𝟎𝟖 
8 
Parámetros Prueba Estadística 
 
21/
2
2 
 
 
 
 
1-2 
 
Caso 1. Si 21 y 
2
2son desconocida, pero similares 
 
 
 
Caso 2. Si 21 y 
2
2son desconocida, pero diferentes 
Pruebas estadísticas (Ec): 
𝐅𝐜 =
𝐒𝟏
𝟐
𝐒𝟐
𝟐
𝐱
𝛔𝟐
𝟐
𝛔𝟏
𝟐
~𝐅(𝐧𝟏−𝟏,𝐧𝟐−𝟏) 
𝐭𝐜 =
 𝐗 𝟏 − 𝐗 𝟐 − 𝛍𝟎
 𝐒𝐩
𝟐 
𝟏
𝐧𝟏
+
𝟏
𝐧𝟐
 
~𝐭(𝐧𝟏+𝐧𝟐−𝟐) 
𝐒𝐩
𝟐 =
 𝐧𝟏 − 𝟏 𝐒𝟏
𝟐 + (𝐧𝟐 − 𝟏)𝐒𝟐
𝟐
(𝐧𝟏 + 𝐧𝟐 − 𝟐)
 
𝐇 =
 
𝐒𝟏
𝟐
𝐧𝟏
+
𝐒𝟐
𝟐
𝐧𝟐
 
𝟐
 
𝐒𝟏
𝟐
𝐧𝟏
 
𝟐
𝐧𝟏 − 𝟏
+
 
𝐒𝟐
𝟐
𝐧𝟐
 
𝟐
𝐧𝟐 − 𝟏
 𝐭𝐜 =
 𝐗 𝟏 − 𝐗 𝟐 − 𝛍𝟎
 
𝐒𝟏
𝟐
𝐧𝟏
+
𝐒𝟐
𝟐
𝐧𝟐
~𝐭(𝐇) 
9 
Parámetros Prueba Estadística 
 
 
 
1-2 
 
Caso 1. Si 1-2=0 
 
 
 
Caso 2. Si 1-2=0 
 
Pruebas estadísticas (Ec): 
𝐙𝐜 =
 𝐩𝟏 − 𝐩𝟐 − 𝛑𝟎
 
𝐩𝟏(𝟏 − 𝐩𝟏)
𝐧𝟏
+
𝐩𝟐(𝟏 − 𝐩𝟐)
𝐧𝟐
~𝐙 
𝐙𝐜 =
 𝐩𝟏 − 𝐩𝟐 
 𝐩 𝟏 − 𝐩 
𝟏
𝐧𝟏
+
𝟏
𝐧𝟐
 
~𝐙 
𝐩 =
𝐧𝟏𝐩𝟏 + 𝐧𝟐𝐩𝟐
𝐧𝟏 + 𝐧𝟐
 
10 
Regiones criticas para prueba de hipótesis de la diferencia 
de medias: 
Hipótesis unilateral 
con cola a la derecha 
Hipótesis bilateral o 
de dos colas 
Hipótesis unilateral con 
cola a la izquierda 
 
 
La zona de rechazo 
está al lado derecho. 
La zona de rechazo 
está a ambos lados. 
La zona de rechazo está 
al lado izquierdo. 
0211
0210
:
:




H
H
0211
0210
:
:




H
H
0211
0210
:
:




H
H
2,1 21  nn
t  2, 21 nnt2,2 21 nn
t
2,
2
1 21  nn
t 
Zona de 
rechazo Ho 
Zona de no 
rechazo Ho 
Zona de no 
rechazo Ho 
Zona de 
rechazo Ho Zona de 
rechazo Ho 
Zona de 
rechazo Ho 
11 
Ejemplo 
En un programa de asistencia técnica se desea evaluar la eficacia 
de dos concentraciones de plaguicidas en el cultivo de frijol 
canario. Con esta finalidad se siembra en parcelas de 
comprobación de agricultores frijol canario y se aplican los 
plaguicidas (A y B). Luego de la cosecha se obtuvo los siguientes 
resultados del rendimiento en Kg/parcela y el número de parcelas 
infectadas con Pythium (ataca a la raíz y plántula del frijol). 
Plaguicida A B 
Tamaño de muestra 16 12 
Rendimiento promedio en Kg/parcela 210.0 195.0 
Desviación estándar 5.5 5.2 
Número de plantas infectadas 2 4 
1) Formulación de hipótesis 
 
 
2) Nivel de significación. =0.10 
3) Prueba estadística 
 
12 
a) Se puede afirmar que la variabilidad del rendimiento, usando 
los plaguicidas A y B son similares. Use = 0.10. 
𝑯𝟎: 𝝈𝟏
𝟐 = 𝝈𝟐
𝟐 
𝑯𝟏: 𝝈𝟏
𝟐 ≠ 𝝈𝟐
𝟐 
F1=0.398 F2=2.72 
𝑭𝟏 =
𝟏
𝑭
𝟏−
𝜶
𝟐
;𝒏𝟐−𝟏,𝒏𝟏−𝟏
=
𝟏
𝑭𝟎.𝟗𝟓;𝟏𝟏,𝟏𝟓
=
𝟏
𝟐.𝟓𝟏
= 𝟎.𝟑𝟗𝟖 
𝑭𝟐 = 𝑭𝟏−𝜶
𝟐
;𝒏𝟏−𝟏,𝒏𝟐−𝟏
= 𝑭𝟎.𝟗𝟓;𝟏𝟓,𝟏𝟏 = 𝟐.𝟕𝟐 
4) Regiones críticas 
5) Decisión estadística. No se rechaza Ho. 
6) Conclusión. Con nivel de significación de 0.10, las variancias 
del rendimiento con el plaguicida A y B son similares. 
Zona de no 
rechazo Ho Zona de 
rechazo Ho 
𝐧𝟏 = 𝟏𝟔, 𝐗 𝟏 = 𝟐𝟏𝟎.𝟎, 𝐒𝟏 = 𝟓.𝟓; 𝐧𝟐 = 𝟏𝟐, 𝐗 𝟐 = 𝟏𝟗𝟓.𝟎, 𝐒𝟐 = 𝟓.𝟐 
𝐅𝐜 =
𝐒𝟏
𝟐
𝐒𝟐
𝟐
=
𝟓.𝟓𝟐
𝟓.𝟐𝟐
= 𝟏.𝟏𝟏𝟗 
1) Formulación de hipótesis 
 
 
2) Nivel de significación. =0.10 
3) Prueba estadística (Caso 1). 
 
13 
b) El fabricante del plaguicida A manifiesta que es más productivo 
su producto. Comprobar la afirmación del fabricante, probando 
si el rendimiento promedio usando el plaguicida A es superior 
que con el B. Use =0.10. (Usar los resultados de a). 
𝑯𝟎: 𝝁𝟏 ≤ 𝝁𝟐 
𝑯𝟏: 𝝁𝟏 > 𝝁𝟐 
𝐭𝐜 =
 𝟐𝟏𝟎.𝟎 − 𝟏𝟗𝟓.𝟎 − 𝟎
 𝟐𝟖.𝟖𝟗 
𝟏
𝟏𝟔
+
𝟏
𝟏𝟐
 
= 𝟕.𝟑𝟏 
𝐭 𝟏−𝛂,𝐧𝟏+𝐧𝟐−𝟐 = 𝐭 𝟎.𝟗𝟎,𝟐𝟔 = 𝟏.𝟑𝟏𝟓 
𝐭 𝟏−𝛂,𝐧𝟏+𝐧𝟐−𝟐 = 𝐭 𝟎.𝟗𝟎,𝟐𝟔 = 𝟏.𝟑𝟏𝟓 
4) Regiones críticas 
5) Decisión estadística. Se rechaza Ho. 
6) Conclusión. Con nivel de significación de 0.10, el rendimiento 
promedio con el plaguicida A es mayor que con el B. La 
afirmación del fabricante es cierta. 
Zona de no 
rechazo Ho 
Zona de 
rechazo Ho 
𝐒𝐩
𝟐 =
 𝐧𝟏 − 𝟏 𝐒𝟏
𝟐 + (𝐧𝟐 − 𝟏)𝐒𝟐
𝟐
(𝐧𝟏 + 𝐧𝟐 − 𝟐)
=
 𝟏𝟔 − 𝟏 𝟓.𝟓𝟐 + 𝟏𝟐 − 𝟏 𝟓.𝟐𝟐
𝟏𝟔 + 𝟏𝟐 − 𝟐
= 𝟐𝟖.𝟖𝟗 
𝐭𝐜 =
 𝐗 𝟏 − 𝐗 𝟐 − 𝛍𝟎
 𝐒𝐩
𝟐 
𝟏
𝐧𝟏
+
𝟏
𝐧𝟐
 
=
 𝟐𝟏𝟎.𝟎 − 𝟏𝟗𝟓.𝟎 − 𝟎
 𝟐𝟖.𝟖𝟗 
𝟏
𝟏𝟔
+
𝟏
𝟏𝟐
 
= 𝟕.𝟑𝟏 
1) Formulación de hipótesis 
 
 
2) Nivel de significación. =0.04 
3) Prueba estadística (Caso 1). 
 
14 
c) El fabricante del plaguicida A, afirma que su plaguicida es más 
eficaz que el B. Pruebe la afirmación del fabricante, si la 
proporción de parcelas infectadas usando el plaguicida A es 
menor que el plaguicida B. Usar un nivel de significación 4%. 
5) Decisión estadística. No se rechaza Ho. 
6) Conclusión. Con nivel de significación de 0.04, la proporción 
de parcelas infectadas usando el plaguicida A no es menor que 
con el B. La afirmación del fabricante es falsa. 
H0: π1 ≥ π2 
H1: π1 < π2 
4) Regionescríticas 
p =
n1p1 + n2p2
n1 + n2
=
16 2 16 + 12 
4
12 
16 + 12
= 0.214 
𝒁𝟎.𝟎𝟒 = −𝟏.𝟕𝟓 
Zona de no 
rechazo Ho Zona de 
rechazo Ho 
𝐩𝟏 =
𝟐
𝟏𝟔
= 𝟎.𝟏𝟐𝟓,𝐩𝟐 =
𝟒
𝟏𝟐
= 𝟎.𝟑𝟑𝟑 ⇒ 𝐙𝐜 =
 𝟎.𝟏𝟐𝟓 − 𝟎.𝟑𝟑𝟑 
 𝟎.𝟐𝟏𝟒𝐱𝟎.𝟕𝟖𝟔 
𝟏
𝟏𝟔 +
𝟏
𝟏𝟐 
= −𝟏.𝟑𝟑 
15 
Nitrato (1) 12.7 19.3 20.5 10.5 14.0 10.8 16.6 14.0 17.2 
Control (2) 18.2 32.9 10.0 14.3 16.2 27.6 15.7 
Ejercicio 
En un experimento para medir el 
porcentaje de aumento de peso 
para ratones jóvenes, se 
administró una dieta estándar 
(control) y a otro grupo se les dio 
2000 partes por millón (ppm) de 
nitrato bebiendo agua. 
Suponiendo que el porcentaje de 
aumento de peso con nitrato y del 
control tienen distribución normal. 
a. Probar si las variancias del porcentaje de aumento de peso 
con nitrato y control, son homogéneas. Use =0.10. 
b. Se puede afirmar que el porcentaje de aumento de peso de 
los ratones con la dieta estándar fue mayor que con el nitrato. 
Use =0.01. 
1) Formulación de hipótesis 
 
 
2) Nivel de significación. =0.10 
3) Prueba estadística 
 
16 
a. Probar si las variancias del porcentaje de aumento de peso con 
nitrato y control, son homogéneas. Use =0.10. 
𝑯𝟎: 𝝈𝟏
𝟐 = 𝝈𝟐
𝟐 
𝑯𝟏: 𝝈𝟏
𝟐 ≠ 𝝈𝟐
𝟐 
F1=0.279 F2=4.15 
4) Regiones críticas 
5) Decisión estadística. Se rechaza Ho. 
6) Conclusión. Con nivel de significación de 0.10, las variancias 
del porcentaje de aumento de peso con nitrato y control son 
diferentes. Existe heterogeneidad de variancias. 
Solución: 
F1 =
1
F
1−
α
2
;n2−1,n1−1
=
1
F0.95;6,8
=
1
3.58
= 0.279 
F2 = F1−α
2
;n1−1,n2−1
= F0.95;8,6 = 4.15 
Zona de no 
rechazo Ho Zona de 
rechazo Ho 
𝐧𝟏 = 𝟗, 𝐗 𝟏 = 𝟏𝟓.𝟎𝟕, 𝐒𝟏 = 𝟑.𝟓𝟔; 𝐧𝟐 = 𝟕, 𝐗 𝟐 = 𝟏𝟗.𝟐𝟕, 𝐒𝟐 = 𝟖.𝟎𝟓 
𝐅𝐜 =
𝐒𝟏
𝟐
𝐒𝟐
𝟐
=
𝟑.𝟓𝟔𝟐
𝟖.𝟎𝟓𝟐
= 𝟎.𝟏𝟗𝟔 
17 
b. Se puede afirmar que el porcentaje de aumento de peso de los 
ratones con la dieta estándar (control) fue mayor que con el 
nitrato. Use =0.01. 
1) Formulación de hipótesis 
 
 
2) Nivel de significación. =0.01 
3) Prueba estadística (Caso 2). 
 
5) Decisión estadística. No se rechaza Ho. 
6) Conclusión. Con nivel de significación de 0.01, el porcentaje 
promedio de aumento de peso con la dieta estándar no es 
mayor que con el control. 
4) Regiones críticas 
𝐇𝟎: 𝛍𝟏 ≥ 𝛍𝟐 
𝐇𝟏: 𝛍𝟏 < 𝛍𝟐 
𝐭𝐜 =
 𝐗 𝟏 − 𝐗 𝟐 − 𝛍𝟎
 
𝐒𝟏
𝟐
𝐧𝟏
+
𝐒𝟐
𝟐
𝐧𝟐
=
 𝟏𝟓.𝟎𝟕 − 𝟏𝟗.𝟐𝟕 − 𝟎
 𝟑.𝟓𝟔
𝟐
𝟗
+
𝟖.𝟎𝟓𝟐
𝟕
= −𝟏.𝟐𝟗 
𝐇 =
 
𝐒𝟏
𝟐
𝐧𝟏
+
𝐒𝟐
𝟐
𝐧𝟐
 
𝟐
 
𝐒𝟏
𝟐
𝐧𝟏
 
𝟐
𝐧𝟏 − 𝟏
+
 
𝐒𝟐
𝟐
𝐧𝟐
 
𝟐
𝐧𝟐 − 𝟏
=
 
𝟑.𝟓𝟔𝟐
𝟗
+
𝟖.𝟎𝟓𝟐
𝟕
 
𝟐
 
𝟑.𝟓𝟔𝟐
𝟗
 
𝟐
𝟖
+
 
𝟖.𝟎𝟓𝟐
𝟕
 
𝟐
𝟔
= 𝟕.𝟖𝟑 ≅ 𝟖 
𝐭 𝛂,𝐇 = 𝐭 𝟎.𝟎𝟏,𝟖 = −𝟐.𝟖𝟗𝟔 
Zona de no 
rechazo Ho Zona de 
rechazo Ho 
1) Formulación de hipótesis 
 
 
2) Nivel de significación. =0.05 
3) Prueba estadística (Caso 2). 
 
18 
c) En el experimento se desea evaluar el efecto de la dieta estándar 
entre ratones machos y hembras. Si en una muestra de 50 
machos el 30% y 60 hembras el 10% aumentaron su peso. Probar 
si el porcentaje de ratones machos que aumentaron de peso es 
mayor a las hembras en más de 5%. Use =0.05. 
5) Decisión estadística. Se rechaza Ho. 
6) Conclusión. Con nivel de significación de 0.05, la proporción 
de ratones machos que aumentaron su peso es mayor a las 
hembras en más de 5%. 
4) Regiones críticas 
𝐇𝟎: 𝛑𝟏 − 𝛑𝟐 ≤ 𝟎.𝟎𝟓 
𝐇𝟏: 𝛑𝟏 − 𝛑𝟐 > 𝟎.𝟎𝟓 
 
𝒏𝟏 = 𝟓𝟎,𝒑𝟏 = 𝟎.𝟑; 𝒏𝟐 = 𝟔𝟎,𝒑𝟐 = 𝟎.𝟏 
𝐙𝐜 =
 𝐩𝟏 − 𝐩𝟐 − 𝛑𝟎
 
𝐩𝟏(𝟏 − 𝐩𝟏)
𝐧𝟏
+
𝐩𝟐(𝟏 − 𝐩𝟐)
𝐧𝟐
=
 𝟎.𝟑 − 𝟎.𝟏 − 𝟎.𝟎𝟓
 𝟎.𝟑𝐱𝟎.𝟕
𝟓𝟎
+
𝟎.𝟏𝐱𝟎.𝟗
𝟔𝟎
= 𝟏.𝟗𝟗 
𝒁𝟏−𝜶 = 𝒁𝟎.𝟗𝟓 = 𝟏.𝟔𝟓 
Zona de no 
rechazo Ho Zona de 
rechazo Ho 
19 
Ejercicios propuestos. 
1. Se ha realizado un estudio sobre los residuos orgánicos en dos 
ciudades (A y B). Con esta finalidad se obtuvieron el peso de 
residuos orgánicos producidos para una muestra de casas 
durante un día en las ciudades A y B. Los datos resumidos para 
muestras de tamaños 17 y 22 casas para las ciudades A y B 
respectivamente son: 
Ciudad A Ciudad B 
Promedio 3.18 1.12 
s 0.72 0.65 
n 17 22 
¿Hay evidencias muestrales para establecer que el promedio de los 
residuos orgánicos de la ciudad A excede al de la ciudad B en más 
de 1 Kg? Use =0.10. 
20 
2. Un fabricante de microprocesadores compra los microcircuitos 
de sus productos a dos proveedores: una muestra de 300 
microcircuitos del proveedor A contuvo 50 defectuosos, 
mientras que una muestra de 400 piezas del proveedor B 
presentó 70 con fallas. Pruebe a un nivel de significación del 
5% si hay diferencias entre la proporción de circuitos 
defectuosos de los dos proveedores. 
Referencias bibliográficas 
 Anderson D., Sweendy D., Williams T. (2016) Estadística para 
Administración y Economía. 12ª. Edición. México. Cengage 
Learning Editores. Capítulos 9, 10, 11. 
 Newbold, P. y Carlson, W. y Thorne, B. (2008). Estadística para 
Administración y Economía (6ta. ed.) Madrid: Pearson 
Education. Prentice Hall