Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
598 ❍ CAPÍTULO 14 ANÁLISIS DE DATOS CATEGÓRICOS Para este ejemplo, el estadístico de prueba tiene (k � 1) � 2 grados de libertad porque la única restricción lineal en las probabilidades de celda es que deben sumar 1. En conse- cuencia, se puede usar la tabla 5 del apéndice I para hallar límites para el valor p de cola derecha. Como el valor observado, X2 � 6.607, se encuentra entre x 2.050 � 5.99 y x 2 .025 � 7.38, el valor p está entre .025 y .050. El investigador debe informar los resultados como signifi cativos al nivel de 5% (P � .05), lo cual signifi ca que la hipótesis nula de no preferencia es rechazada. Hay sufi ciente evidencia para indicar que la rata tiene una preferencia por una de las tres puertas. ¿Qué más se puede decir acerca del experimento, una vez que se haya determinado estadísticamente que la rata tiene una preferencia? Veamos los datos para observar dónde están las diferencias. El applet The Goodness-of-Fit Test (Prueba de bondad del ajuste), que se muestra en la fi gura 14.1, ayudará. Se puede ver el valor de X2 y su valor p exacto (.0482) en la parte baja del applet. Un poco más arriba, la barra sombreada muestra la distribución de las frecuencias obser- vadas. Las barras azules representan categorías que tienen un exceso de observaciones con respecto a lo esperado y las celdas rojas (grises en la fi gura 14.1) indican un défi cit de observaciones con respecto a lo esperado. La intensidad del color refl eja la magni- tud de la discrepancia. Para este ejemplo, la rata escogió las puertas roja y azul con más frecuencia de lo esperado y la puerta verde con menos frecuencia. La puerta azul se escogió sólo un poco más de un tercio del tiempo: � 3 9 1 0 � � .344 No obstante, las proporciones muestrales para las otras dos puertas son muy diferentes a un tercio. La rata escoge la puerta verde con menos frecuencia, sólo 22% del tiempo: � 2 9 0 0 � � .222 La rata escoge la puerta roja con más frecuencia, 43% del tiempo: � 3 9 9 0 � � .433 Se pueden resumir los resultados del experimento si se dice que la rata tiene preferen- cia por la puerta roja. ¿Se puede concluir que la preferencia es causada por el color de la puerta? La respuesta es negativa; la causa podría ser algún otro factor fi siológico o psicológico que todavía no se haya explorado. ¡Evite declarar una relación causal entre color y preferencia! FIGURA 14.1 Applet Goodness-of-Fit ● Probabilidad_Mendenhall_14.indd 598Probabilidad_Mendenhall_14.indd 598 5/14/10 8:44:26 AM5/14/10 8:44:26 AM www.FreeLibros.me 14.3 PRUEBA DE PROBABILIDADES DE CELDA ESPECIFICADA: LA PRUEBA DE BONDAD DEL AJUSTE ❍ 599 Las proporciones de tipos de sangre A, B, AB y O en la población de todos los cauca- sianos en Estados Unidos son .41, .10, .04 y .45, respectivamente. Para determinar si las proporciones poblacionales reales se ajustan o no se ajustan a este conjunto de probabi- lidades reportadas, se seleccionó una muestra de 200 estadounidenses y se registraron sus fenotipos sanguíneos. Las cantidades de celda observadas y esperadas se muestran en la tabla 14.2. Las cantidades de celda esperadas se calculan como Ei � 200pi. Prueba la bondad de ajuste de estas proporciones de fenotipo sanguíneas. E J E M P L O 14.2 Solución La hipótesis a probar está determinada por las probabilidades del modelo: H0 : p1 � .41; p2 � .10; p3 � .04; p4 � .45 contra Ha : Al menos una de las cuatro probabilidades es diferente del valor esperado Entonces X2 � S (Oi � Ei) 2 _________ Ei � (89 � 82)2 _________ 82 � � � � � (81 � 90)2 _________ 90 � 3.70 De la tabla 5 del apéndice I, indizando df � (k � 1) � 3, se puede hallar que el valor observado del estadístico de prueba es menor a x 2.100 � 6.25, de modo que el valor p es mayor a .10. No es necesario tener evidencia para rechazar H0; esto es, no se puede de- clarar que los fenotipos sanguíneos de caucasianos estadounidenses sean diferentes de los reportados ya antes. Los resultados son no signifi cativos. Se pueden hallar instrucciones en la sección “Mi MINITAB ” al fi nal de este capítulo para efectuar la prueba de bondad del ajuste ji cuadrada y generar los resultados. Este procedimiento es nuevo en el MINITAB 15. Si se usa una versión previa del MINITAB, todavía se pueden generar resultados usando la función de calculadora. Observe la diferencia en la hipótesis de bondad de ajuste comparada con otras hipó- tesis que se hayan probado. En la prueba de bondad de ajuste, el investigador usa la hipótesis nula para especifi car el modelo que crea ser verdadero, más que un modelo que espera demostrar que sea falso. Cuando no pueda rechazar H0 en el ejemplo del tipo de sangre, los resultados fueron como se esperaba. Es necesario tener cuidado, no obstante, cuando se reporten resultados para pruebas de bondad de ajuste. No se puede declarar con confi anza que el modelo sea absolutamente correcto sin reportar el valor de b para algunas alternativas prácticas. TABLA 14.2 ● Cantidades de fenotipos sanguíneos A B AB O Observadas (Oi) 89 18 12 81 Esperadas (Ei) 82 20 8 90 TÉCNICAS BÁSICAS 14.1 Haga una lista de las características de un experimento multinomial. EJERCICIOS14.3 14.2 Use la tabla 5 del apéndice I para hallar el valor de x2 con la siguiente área a a su derecha: a. a � .05, df � 3 b. a � .01, df � 8 Grados de libertad para un ajuste simple de una prueba de bondad: df � k � 1. CONSEJOMIMI Probabilidad_Mendenhall_14.indd 599Probabilidad_Mendenhall_14.indd 599 5/14/10 8:44:26 AM5/14/10 8:44:26 AM www.FreeLibros.me 600 ❍ CAPÍTULO 14 ANÁLISIS DE DATOS CATEGÓRICOS 14.3 Dé la región de rechazo para una prueba ji cuadrada de probabilidades si el experimento contiene k categorías en estos casos: a. k � 7, a � .05 b. k � 10, a � .01 14.4 Use la tabla 5 del apéndice I para limitar el valor p para una prueba ji cuadrada: a. X2 � 4.29, df � 5 b. X2 � 20.62, df � 6 14.5 Suponga que una respuesta puede caer en una de k � 5 categorías con probabilidades p1, p2, …, p5 y que n � 300 respuestas produjeron estas cantidades de categoría: Categoría 1 2 3 4 5 Cantidad observada 47 63 74 51 65 a. ¿Es igualmente probable que ocurran las cinco categorías? ¿Cómo se probaría esta hipótesis? b. Si se fuera a probar esta hipótesis usando la estadística ji cuadrada, ¿cuántos grados de libertad tendría la prueba? c. Encuentre el valor crítico de x 2 que defi na la región de rechazo con a � .05. d. Calcule el valor observado del estadístico de prueba. e. Efectúe la prueba y exprese sus conclusiones. 14.6 Suponga que una respuesta puede caer en una de k � 3 categorías con probabilidades p1 � .4, p2 � .3 y p3 � .3 y n � 300 respuestas produjo estas cantidades de categoría: Categoría 1 2 3 Cantidad observada 130 98 72 ¿Los datos dan sufi ciente evidencia para indicar que las probabilidades de celda son diferentes respecto de las especifi cadas para las tres categorías? Encuentre el valor p aproximado y úselo para tomar su decisión. APLICACIONES 14.7 Su carril preferido Una autopista de cuatro carriles en cada dirección fue estudiada para ver si los automovilistas prefi eren ir en los carriles interiores. Se observaron un total de mil automóviles, durante un intenso tránsito matutino y se registró el número de autos en cada carril: Carril 1 2 3 4 Cantidad observada 294 276 238 192 ¿Los datos presentan sufi ciente evidencia para indicar que algunos carriles son preferidos sobre otros? Pruebe usando a � .05. Si hay algunas diferencias, analice la naturaleza de los diferencias. 14.8 Peonias Una peonia con pétalos rojos fue cruzada con otra planta con pétalos de franjas. Un genetista dice que 75% de los descendientes de esta cruza tendrán fl ores rojas. Para probar esta afi rmación, cien semillas de esta cruza se recolectaron y germinaron, y 58 plantas tenían pétalos rojos. Use la prueba de bondad del ajuste ji cuadrada para determinar si los datos muestralesconfi rman la predicción del genetista. 14.9 Ataques al corazón los lunes ¿Odia usted los lunes? Investigadores de Alemania han dado otra razón: concluyeron que el riesgo de un ataque al corazón para un trabajador puede ser hasta 50% mayor los lunes que en cualquier otro día.1 Los investigadores dieron seguimiento a ataques al corazón y paros coronarios en un periodo de 5 años entre 330 mil personas que vivían cerca de Augsburg, Alemania. En un intento por verifi car este dicho, se hizo un estudio de 200 trabajadores que habían tenido recientemente ataques al corazón y se registró el día en que ocurrieron estos ataques al corazón: Día Cantidad observada Domingo 24 Lunes 36 Martes 27 Miércoles 26 Jueves 32 Viernes 26 Sábado 29 ¿Los datos presentan sufi ciente evidencia para indicar que hay diferencia en la incidencia de ataques al corazón, dependiendo del día de la semana? Pruebe usando a � .05. 14.10 Estadísticas de mortalidad Unas estadísticas médicas muestran que los fallecimientos debidos a cuatro enfermedades principales, llamadas A, B, C y D, constituyen 15%, 21%, 18% y 14%, respectivamente, de todos los fallecimientos no accidentales. Un estudio de las causas de 308 fallecimientos no accidentales en un hospital dieron las siguientes cantidades: Enfermedad A B C D Otro Fallecimientos 43 76 85 21 83 ¿Estos datos dan sufi ciente evidencia para indicar que las proporciones de personas, que fallecen de enfermedades A, B, C y D en este hospital, a la larga difi eren de las proporciones acumuladas para la población? 14.11 Esquizofrenia Investigaciones realizadas han sugerido que hay un vínculo entre la prevalencia de esquizofrenia y el nacimiento durante meses particulares del año en que prevalecen infecciones virales. Supongamos que estamos trabajando en un problema similar y sospechamos que hay un vínculo Probabilidad_Mendenhall_14.indd 600Probabilidad_Mendenhall_14.indd 600 5/14/10 8:44:27 AM5/14/10 8:44:27 AM www.FreeLibros.me 14 ANÁLISIS DE DATOS CATEGÓRICOS 14.3 Prueba de probabilidades de celda especificada: la prueba de bondad del ajuste Ejercicios
Compartir