Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
10.4 INFERENCIAS DE MUESTRA PEQUEÑA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES: MUESTRAS ALEATORIAS INDEPENDIENTES ❍ 409 Marca genérica Sunmaid 25 26 25 28 25 29 24 24 26 28 28 27 28 24 28 22 26 27 24 25 25 28 30 27 26 26 28 24 a. Aun cuando las cantidades tienen una distribución normal, ¿estos datos tienen distribuciones aproximadamente normales? (SUGERENCIA: Use un histograma o gráfica de tallo y hoja.) b. ¿Está usted dispuesto a suponer que las varianzas poblacionales originales son iguales? ¿Por qué? c. Use el método del valor p para determinar si hay una diferencia significativa en los números medios de pasitas por minicaja. ¿Cuáles son las implicaciones de su conclusión? 10.30 Contenido de O2 disuelto, continúa Consulte el ejercicio 10.7, en el que medimos el contenido de oxígeno disuelto en agua de río para determinar si un arroyo tenía sufi ciente oxígeno para soportar vida acuática. Un inspector de control de contaminación sospechaba que la comunidad de un río estaba vertiendo cantidades de aguas negras poco tratadas al río. Para comprobar su teoría, sacó cinco especímenes de agua de río escogidos al azar en un lugar aguas arriba del pueblo, y otros cinco de aguas abajo. Las lecturas de oxígeno disuelto (en partes por millón) son como sigue: Aguas arriba 4.8 5.2 5.0 4.9 5.1 Aguas abajo 5.0 4.7 4.9 4.8 4.9 a. ¿Los datos dan suficiente evidencia para indicar que el contenido medio de oxígeno aguas abajo del pueblo es menor que el contenido medio de oxígeno aguas arriba? Pruebe usando a � .05. b. Supongamos que usted prefiere la estimación como método de inferencia. Estime la diferencia en los contenidos medios de oxígeno disuelto para lugares aguas arriba y abajo del pueblo. Use un intervalo de confianza de 95%. 10.31 Nadadores de estilo libre En un esfuerzo por comparar los tiempos promedio de natación para dos nadadores, a cada nadador se le pidió nadar en estilo libre una distancia de 100 yardas en tiempos seleccionados al azar. Los nadadores descansaron por completo entre vueltas y no corrieron uno contra otro, de modo que cada muestra de tiempos era una muestra aleatoria independiente. Se muestran los tiempos para cada una de las pruebas para los dos nadadores. Nadador 1 Nadador 2 59.62 59.74 59.81 59.41 59.48 59.43 59.32 59.63 59.65 59.72 59.76 59.50 59.50 59.63 59.64 59.83 60.01 59.68 59.86 59.51 DATOSMISMIS EX1031 DATOSMISMIS EX1034 DATOSMISMIS EX1033 Suponga que el nadador 2 fue el ganador del año pasado cuando los dos nadadores compitieron. ¿Le parece que el tiempo promedio para el nadador 2 es todavía más rápido que el tiempo promedio para el nadador 1 en el estilo libre de 100 yardas? Encuentre el valor p aproximado para la prueba e interprete los resultados. 10.32 Nadadores de estilo libre, continúa Consulte el ejercicio 10.31. Construya un límite inferior de confi anza de una cola y 95% para la diferencia en los tiempos promedio para los dos nadadores. ¿Este intervalo confi rma sus conclusiones en el ejercicio 10.31? 10.33 Comparación de mariscales de campo de la NFL ¿Cómo se compara Brett Favre, mariscal de campo de los empacadores de Green Bay, con Peyton Manning, mariscal de campo de los Potros de Indianápolis? La tabla siguiente muestra el número de pases completos para cada atleta durante la temporada de fútbol de 2006 de la NFL:3 Brett Favre Peyton Manning 15 17 22 25 32 25 31 28 20 26 30 29 25 24 26 14 27 21 22 5 21 21 20 22 22 22 20 14 19 24 25 21 a. ¿Los datos indican que hay una diferencia en el número promedio de pases completos para los dos mariscales de campo? Pruebe usando a � .05. b. Construya un intervalo de confianza de 95% para la diferencia en el número promedio de pases completos para los dos mariscales de campo. ¿El intervalo de confianza confirma su conclusión del inciso a)? Explique. 10.34 Un hallazgo arqueológico Un artículo en Archaeometry involucraba un análisis de 26 muestras de cerámica romano-inglesa, halladas en hornos de cuatro sitios diferentes en el Reino Unido.9 Las muestras se analizaron para determinar su composición química y el porcentaje de óxido de aluminio en cada una de 10 muestras en dos lugares se muestra a continuación. Island Thorns Ashley Rails 18.3 17.7 15.8 18.3 18.0 16.7 18.0 14.8 20.8 19.1 ¿Los datos dan sufi ciente información para indicar que hay una diferencia en el promedio de porcentaje de óxido de aluminio en los dos lugares? Pruebe al nivel de signifi cancia de 5%. Probabilidad_Mendenhall_10.indd 409Probabilidad_Mendenhall_10.indd 409 5/14/10 8:51:10 AM5/14/10 8:51:10 AM www.FreeLibros.me 410 ❍ CAPÍTULO 10 INFERENCIA A PARTIR DE MUESTRAS PEQUEÑAS INFERENCIAS DE MUESTRA PEQUEÑA PARA LA DIFERENCIA ENTRE DOS MEDIAS: UNA PRUEBA DE DIFERENCIA PAREADA Para comparar las cualidades de desgaste de dos tipos de llantas de automóvil, A y B, una llanta de tipo A y una de tipo B se asignaron al azar y se montaron en las ruedas traseras de cada uno de cinco automóviles. Éstos se hicieron correr un número especi- ficado de millas y se registró la cantidad de desgaste para cada llanta. Estas mediciones aparecen en la tabla 10.3. ¿Los datos presentan suficiente evidencia para indicar una diferencia en el promedio de desgaste para los dos tipos de llantas? 10.5 La tabla 10.3 muestra una diferencia de (x�1 � x�2) � (10.24 � 9.76) � .48 entre las dos medias muestrales, en tanto que las desviaciones estándar de ambas muestras son aproximadamente 1.3. Dada la variabilidad de los datos y el pequeño número de medi- ciones, ésta es más bien una diferencia pequeña y es probable que no se sospeche una diferencia en el desgaste promedio para los dos tipos de llantas. Veamos las sospechas usando los métodos de la sección 10.4. Vea el análisis MINITAB de la figura 10.14. La prueba t agrupada de dos muestras se usa para probar la diferencia en las medias basada en dos muestras aleatorias indepen- dientes. El valor calculado de t usado para probar la hipótesis nula H0 : m1 � m2 es t � .57 con valor p � .582, valor que no es casi suficientemente pequeño para indicar una diferencia significativa en las dos medias poblacionales. El correspondiente intervalo de confianza de 95%, dado como �1.448 � (m1 � m2) � 2.408 es bastante ancho y no indica una diferencia significativa en las medias poblacionales. TABLA 10.3 ● Promedio de desgaste para dos tipos de llantas Automóvil Tipo A Tipo B 1 10.6 10.2 2 9.8 9.4 3 12.3 11.8 4 9.7 9.1 5 8.8 8.3 x�1 � 10.24 x�2 � 9.76 s1 � 1.316 s2 � 1.328 Prueba T de dos muestras y CI: llanta A, llanta B Two-sample T for Tire A vs Tire B N Mean StDev SE Mean Tire A 5 10.24 1.32 0.59 Tire B 5 9.76 1.33 0.59 Difference = mu (Tire A) - mu (Tire B) Estimate for difference: 0.480 95% CI for difference: (-1.448, 2.408) T-Test of difference = 0 (vs not =): T-Value = 0.57 P-Value = 0.582 DF = 8 Both use Pooled StDev = 1.3221 FIGURA 10.14 Salida impresa MINITAB usando prueba t para muestras independientes para los datos de llantas ● Probabilidad_Mendenhall_10.indd 410Probabilidad_Mendenhall_10.indd 410 5/14/10 8:51:10 AM5/14/10 8:51:10 AM www.FreeLibros.me 10.5 INFERENCIAS DE MUESTRA PEQUEÑA PARA LA DIFERENCIA ENTRE DOS MEDIAS: UNA PRUEBA DE DIFERENCIA PAREADA ❍ 411 Veamos de nuevo los datos y se observará que la medición del desgaste para el tipo A es mayor que el correspondiente valor para el tipo B, para cada uno de los cinco auto- móviles. ¿No sería esto probable, si en realidad no hay diferencia entre los dos tipos de llantas? Considere una prueba intuitiva sencilla, basada en la distribución binomial del capí- tulo 5. Si no hay diferencia en el desgaste medio para los dos tipos de llantas, enton- ces es igualmente probable o no probable que la llanta A muestre más desgaste que la llanta B. Los cinco automóviles entonces corresponden a cinco intentos binomiales con p � P(llanta A muestra más desgaste que la llantaB) � .5. ¿Es poco común el valor observado de x � 5 diferencias positivas mostradas en la tabla 10.4? La probabilidad de observar x � 5 o el igualmente probable valor de x � 0 se puede hallar en la tabla 1 del apéndice I que son 2(.031) � .062, que es bastante pequeño en comparación con la probabilidad de la más potente prueba t, que tenía un valor p de .58. ¿No es peculiar que la prueba t, que usa más información (las mediciones muestrales reales) que la prueba binomial, no dé suficiente información para rechazar la hipótesis nula? Hay una explicación para esta inconsistencia. La prueba t descrita en la sección 10.4 no es la prueba estadística propia a usar para nuestro ejemplo. El procedimiento de prueba estadística de la sección 10.4 requiere que las dos muestras sean independientes y aleatorias. Ciertamente, el requisito de independencia es violado por la forma en la que se realizó el experimento. El par de mediciones, en las llantas A y B, para un auto- móvil particular están definitivamente relacionadas. Una mirada a los datos muestra que las lecturas tienen más o menos la misma magnitud para un automóvil particular pero varían en forma marcada de un automóvil a otro. Esto, por supuesto, es exactamente lo que podría esperarse. El desgaste de llantas está determinado en su mayor parte por hábitos de manejo, el balanceo de las ruedas y la superficie del pavimento. Como cada automóvil tiene un conductor diferente, es de esperarse una gran cantidad de variabili- dad en los datos de un automóvil a otro. Al diseñar el experimento de desgaste de llantas, el experimentador vio que las medi- ciones variarían en gran medida de un automóvil a otro. Si las llantas (cinco del tipo A y cinco del tipo B) se asignaran al azar a las 10 ruedas, resultando en muestras aleatorias independientes, esta variabilidad resultaría en un gran error estándar y hacer difícil de detectar una diferencia en las medias. En cambio, el experimentador escogió “parear” las mediciones, comparando el desgaste para llantas tipo A y tipo B en cada uno de los cinco automóviles. Este diseño experimental, a veces llamado diseño de diferencia pareada o pares acoplados, nos permite eliminar la variabilidad de un auto a otro al ver sólo las cinco mediciones de diferencia mostradas en la tabla 10.4. Estas cinco diferen- cias forman una sola muestra aleatoria de tamaño n � 5. Observe que en la tabla 10.4 la media muestral de las diferencias, d � A � B, se calcula como d� � � S n di � � .48 TABLA 10.4 ● Diferencias en desgaste de llantas, usando los datos de la tabla 10.3 Automóvil A B d � A � B 1 10.6 10.2 .4 2 9.8 9.4 .4 3 12.3 11.8 .5 4 9.7 9.1 .6 5 8.8 8.3 .5 d� � .48 Probabilidad_Mendenhall_10.indd 411Probabilidad_Mendenhall_10.indd 411 5/14/10 8:51:10 AM5/14/10 8:51:10 AM www.FreeLibros.me 10 INFERENCIA A PARTIR DE MUESTRAS PEQUEÑAS 10.5 Inferencias de muestra pequeña para la diferencia entre dos medias: una prueba de diferencia pareada
Compartir