Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
14.3 PRUEBA DE PROBABILIDADES DE CELDA ESPECIFICADA: LA PRUEBA DE BONDAD DEL AJUSTE ❍ 601 entre una enfermedad observada en la etapa fi nal de la vida y el mes de nacimiento. Tenemos registros de 400 casos de la enfermedad, y las clasifi camos de acuerdo al mes de nacimiento. Los datos aparecen en la tabla. ¿Los datos presentan sufi ciente evidencia para indicar que la proporción de casos de la enfermedad por mes varía de un mes a otro? Pruebe con a � .05. Mes Enero Febrero Marzo Abril Mayo Junio Nacimientos 38 31 42 46 28 31 Mes Julio Agosto Sept. Oct. Nov. Dic. Nacimientos 24 29 33 36 27 35 14.12 Chícharos Supongamos que usted está interesado en seguir dos características de chícharos: textura de la semilla (S � lisa, s � arrugada) y color de la semilla (Y � amarillo, y � verde) en una cruza de segunda generación de padres heterocigotos. La teoría de Mendel dice que el número de chícharos clasifi cados como lisos y amarillos, arrugados y amarillos, lisos y verdes, y arrugados y verdes debe estar en la relación 9:3:3:1. Suponga que cien chícharos seleccionados al azar tienen 56, 19, 17 y 8 en estas categorías respectivas. ¿Estos datos indican que el modelo 9:3:3:1 es correcto? Pruebe usando a � .01. 14.12 M&M’S El sitio web Mars, Incorporated publica los siguientes porcentajes de los diversos colores en sus dulces M&M’S para la variedad “chocolate con leche”:2 ¿Qué colores vienen en una bolsa? m m m mm mm mm Café 13% Amarillo 14% Rojo 13% Azul 24% Anaranjado 20% Verde 16% Una bolsa de 14 onzas (400 gramos) de dulces M&M’S de chocolate con leche se selecciona al azar y contiene 70 dulces cafés, 72 amarillos, 61 rojos, 118 azules, 108 anaranjados y 85 verdes. ¿Los datos justifi can los porcentajes informados por Mars, Incorporated? Use la prueba apropiada y describa la naturaleza de las diferencias, si hay alguna. 14.14 M&M’S de cacahuate Los porcentajes de diversos colores son diferentes para la variedad de “cacahuate” de dulces M&M’S, como se publica en el sitio web Mars, Incorporated:3 ¿Qué colores vienen en una bolsa? m m m mm mm m Café 12% Amarillo 15% Rojo 12% Azul 23% Anaranjado 23% Verde 15% Una bolsa de 14 onzas (400 gramos) de dulces M&M’S de chocolate con leche se selecciona al azar y contiene 70 dulces cafés, 87 amarillos, 64 rojos, 115 azules, 106 anaranjados y 85 verdes. ¿Los datos justifi can los porcentajes informados por Mars, Incorporated? Use la prueba apropiada y describa la naturaleza de las diferencias, si hay alguna. 14.15 Estándares de inscripción Los registros previos de inscripción en una gran universidad indican que del número total de personas que solicitaron inscripción, 60% son inscritos incondicionalmente, 5% son inscritos a condición de pasar una prueba y el resto son rechazados. De 500 solicitudes a la fecha para el año entrante, 329 solicitantes han sido inscritos incondicionalmente, 43 han sido inscritos a condición de pasar una prueba y el resto han sido rechazados. ¿Estos datos indican una desviación respecto a los porcentajes de inscripción? Pruebe usando a � .05. Probabilidad_Mendenhall_14.indd 601Probabilidad_Mendenhall_14.indd 601 5/14/10 8:44:27 AM5/14/10 8:44:27 AM www.FreeLibros.me 602 ❍ CAPÍTULO 14 ANÁLISIS DE DATOS CATEGÓRICOS TABLAS DE CONTINGENCIA: UNA CLASIFICACIÓN DE DOS VÍAS En algunas situaciones, el investigador clasifi ca una unidad experimental de acuerdo con dos variables cualitativas para generar datos bivariados, que discutimos en el capí- tulo 3. • Una pieza defectuosa de mueble se clasifi ca según el tipo de defecto y el turno de producción durante el que se hizo. • Una profesora es clasifi cada por su rango profesional y el tipo de universidad (pública o privada) en la que trabaje. • Un paciente es clasifi cado de acuerdo al tipo de tratamiento preventivo contra la gripe que ha recibido y si ha contraído o no la gripe durante el invierno. Cuando se registran dos variables categóricas, se puede resumir la información al contar el número observado de unidades que caen en cada una de las diversas intersecciones de niveles de categoría. Las cantidades resultantes se exhiben en un conjunto ordenado llamado tabla de contingencia. Un total de n � 309 defectos en muebles fueron registrados y los defectos fueron cla- sifi cados en cuatro tipos: A, B, C o D. Al mismo tiempo, cada pieza de mueble fue identifi cado por el turno de producción en el que se manufacturó. Estas cantidades están presentadas en una tabla de contingencia en la tabla 14.3. 14.4 E J E M P L O 14.3 Cuando se estudia información que contiene dos variables, una consideración importante es la relación entre las dos variables. ¿La proporción de mediciones en las diversas cate- gorías para el factor 1 depende de cuál categoría del factor 2 se observe? Para el ejem- plo de muebles, ¿las proporciones de los diversos defectos varía de turno a turno, o son iguales estas proporciones, independientemente de cuál turno se observe? Recordemos un fenómeno similar llamado interacción en el experimento factorial a � b del capí- tulo 11. En el análisis de una tabla de contingencia, el objetivo es determinar si un método de clasifi cación es o no es contingente o dependiente del otro método de clasifi cación. Si no lo es, se dice que los dos métodos de clasifi cación son independientes. La prueba de independencia ji cuadrada La cuestión de independencia de los dos métodos de clasifi cación se puede investigar usando una prueba de hipótesis basada en la estadística ji cuadrada. Éstas son las hipó- tesis: H0 : Los dos métodos de clasifi cación son independientes Ha : Los dos métodos de clasifi cación son dependientes TABLA 14.3 ● Tabla de contingencia Turno Tipo de defectos 1 2 3 Total A 15 26 33 74 B 21 31 17 69 C 45 34 49 128 D 13 5 20 38 Total 94 96 119 309 Con clasifi caciones de dos vías, no probamos hipótesis acerca de probabilidades específi cas. Probamos si los dos métodos de clasifi cación son independientes. CONSEJOMIMI Probabilidad_Mendenhall_14.indd 602Probabilidad_Mendenhall_14.indd 602 5/14/10 8:44:27 AM5/14/10 8:44:27 AM www.FreeLibros.me 14.4 TABLAS DE CONTINGENCIA: UNA CLASIFICACIÓN DE DOS VÍAS ❍ 603 Suponga que denotamos la cantidad observada de celdas en la fi la i de la tabla de contin- gencia como Oij. Si se conocieran las cantidades observadas de celda (Eij � npij) bajo la hipótesis nula de independencia, entonces se podría usar la estadística ji cuadrada para comparar las cantidades observadas y esperadas. No obstante, los valores esperados no están especifi cados en H0, como estaban en los ejemplos previos. Para explicar cómo estimar estas cantidades esperadas de celda, debemos repasar el concepto de eventos independientes del capítulo 4. Considere pij, la probabilidad de que una observación caída en la fi la i y la columna j de la tabla de contingencia. Si los renglones y columnas son independientes, entonces pij � P(observación cae en el renglón i y columna j) � P(observación cae en el renglón i) � P(observación cae en la columna j) � pipj donde pi y pj son las probabilidades incondicional o marginal de caer en la fi la i o columna j, respectivamente. Si se pudiera obtener estimaciones apropiadas de estas probabilidades marginales, se podrían usar en lugar de pij en la fórmula para la cantidad esperada de celda. Por fortuna, existen estas estimaciones. De hecho, son exactamente lo que en forma intuitiva se escogería: • Para estimar la probabilidad de un renglón, use p̂i � Total de observaciones en renglón i _____________________________ Número total de observaciones � ri __ n • Para estimar la probabilidad de una columna, use p̂j � Total de observaciones en la columna j ________________________________ Número total de observaciones � ci __ n La estimación de la cantidad esperada de celda para el renglón i y la columna j se siguede la suposición de independencia. CANTIDAD ESTIMADA ESPERADA DE CELDA Êij � n� ri __ n �� cj __ n � � rjcj ___ n donde ri es el total para el renglón i y cj es el total para la columna j. El estadístico de prueba ji cuadrada para una tabla de contingencia con r renglones y c columnas se calcula como X2 � S (Oij �Êij) 2 _________ Êij y puede mostrarse que tiene una distribución ji cuadrada aproximada con df � (r � 1)(c � 1) Si el valor observado de X2 es demasiado grande, entonces la hipótesis nula de indepen- dencia es rechazada. Grados de libertad para una tabla de contingencia r � c: df � (r � 1)(c � 1). CONSEJOMIMI Probabilidad_Mendenhall_14.indd 603Probabilidad_Mendenhall_14.indd 603 5/14/10 8:44:27 AM5/14/10 8:44:27 AM www.FreeLibros.me 14 ANÁLISIS DE DATOS CATEGÓRICOS 14.4 Tablas de contingencia: una clasificación de dos vías La prueba de independencia ji cuadrada
Compartir