Logo Studenta

introduccion a la probabilidad y estadistica ejercicios-209

¡Estudia con miles de materiales!

Vista previa del material en texto

14.3 PRUEBA DE PROBABILIDADES DE CELDA ESPECIFICADA: LA PRUEBA DE BONDAD DEL AJUSTE ❍ 601
entre una enfermedad observada en la etapa fi nal de la 
vida y el mes de nacimiento. Tenemos registros de 400 
casos de la enfermedad, y las clasifi camos de acuerdo al 
mes de nacimiento. Los datos aparecen en la tabla. ¿Los 
datos presentan sufi ciente evidencia para indicar que la 
proporción de casos de la enfermedad por mes varía de 
un mes a otro? Pruebe con a � .05.
Mes Enero Febrero Marzo Abril Mayo Junio
Nacimientos 38 31 42 46 28 31
Mes Julio Agosto Sept. Oct. Nov. Dic.
Nacimientos 24 29 33 36 27 35
14.12 Chícharos Supongamos que usted está 
interesado en seguir dos características de chícharos: 
textura de la semilla (S � lisa, s � arrugada) y color 
de la semilla (Y � amarillo, y � verde) en una cruza de 
segunda generación de padres heterocigotos. La teoría 
de Mendel dice que el número de chícharos clasifi cados 
como lisos y amarillos, arrugados y amarillos, lisos y 
verdes, y arrugados y verdes debe estar en la relación 
9:3:3:1. Suponga que cien chícharos seleccionados al 
azar tienen 56, 19, 17 y 8 en estas categorías respectivas. 
¿Estos datos indican que el modelo 9:3:3:1 es correcto? 
Pruebe usando a � .01.
14.12 M&M’S El sitio web Mars, Incorporated 
publica los siguientes porcentajes de los diversos colores 
en sus dulces M&M’S para la variedad “chocolate con 
leche”:2
¿Qué colores vienen 
en una bolsa?
m
m
m
mm
mm
mm
Café 13%
Amarillo 14%
Rojo 13%
Azul 24%
Anaranjado 20%
Verde 16%
Una bolsa de 14 onzas (400 gramos) de dulces M&M’S 
de chocolate con leche se selecciona al azar y contiene 
70 dulces cafés, 72 amarillos, 61 rojos, 118 azules, 
108 anaranjados y 85 verdes. ¿Los datos justifi can los 
porcentajes informados por Mars, Incorporated? Use 
la prueba apropiada y describa la naturaleza de las 
diferencias, si hay alguna.
14.14 M&M’S de cacahuate Los porcentajes de 
diversos colores son diferentes para la variedad de 
“cacahuate” de dulces M&M’S, como se publica en el 
sitio web Mars, Incorporated:3
¿Qué colores vienen 
en una bolsa?
m
m
m
mm
mm
m
Café 12%
Amarillo 15%
Rojo 12%
Azul 23%
Anaranjado 23%
Verde 15%
Una bolsa de 14 onzas (400 gramos) de dulces M&M’S 
de chocolate con leche se selecciona al azar y contiene 
70 dulces cafés, 87 amarillos, 64 rojos, 115 azules, 
106 anaranjados y 85 verdes. ¿Los datos justifi can los 
porcentajes informados por Mars, Incorporated? Use 
la prueba apropiada y describa la naturaleza de las 
diferencias, si hay alguna.
14.15 Estándares de inscripción Los registros 
previos de inscripción en una gran universidad indican 
que del número total de personas que solicitaron 
inscripción, 60% son inscritos incondicionalmente, 
5% son inscritos a condición de pasar una prueba 
y el resto son rechazados. De 500 solicitudes a la 
fecha para el año entrante, 329 solicitantes han sido 
inscritos incondicionalmente, 43 han sido inscritos 
a condición de pasar una prueba y el resto han sido 
rechazados. ¿Estos datos indican una desviación respecto 
a los porcentajes de inscripción? Pruebe usando a � .05.
Probabilidad_Mendenhall_14.indd 601Probabilidad_Mendenhall_14.indd 601 5/14/10 8:44:27 AM5/14/10 8:44:27 AM
 www.FreeLibros.me
602 ❍ CAPÍTULO 14 ANÁLISIS DE DATOS CATEGÓRICOS
TABLAS DE CONTINGENCIA: 
UNA CLASIFICACIÓN DE DOS VÍAS
En algunas situaciones, el investigador clasifi ca una unidad experimental de acuerdo 
con dos variables cualitativas para generar datos bivariados, que discutimos en el capí-
tulo 3.
• Una pieza defectuosa de mueble se clasifi ca según el tipo de defecto y el turno 
de producción durante el que se hizo.
• Una profesora es clasifi cada por su rango profesional y el tipo de universidad 
(pública o privada) en la que trabaje.
• Un paciente es clasifi cado de acuerdo al tipo de tratamiento preventivo contra 
la gripe que ha recibido y si ha contraído o no la gripe durante el invierno.
Cuando se registran dos variables categóricas, se puede resumir la información al contar 
el número observado de unidades que caen en cada una de las diversas intersecciones 
de niveles de categoría. Las cantidades resultantes se exhiben en un conjunto ordenado 
llamado tabla de contingencia.
Un total de n � 309 defectos en muebles fueron registrados y los defectos fueron cla-
sifi cados en cuatro tipos: A, B, C o D. Al mismo tiempo, cada pieza de mueble fue 
identifi cado por el turno de producción en el que se manufacturó. Estas cantidades están 
presentadas en una tabla de contingencia en la tabla 14.3.
14.4
E J E M P L O 14.3
Cuando se estudia información que contiene dos variables, una consideración importante 
es la relación entre las dos variables. ¿La proporción de mediciones en las diversas cate-
gorías para el factor 1 depende de cuál categoría del factor 2 se observe? Para el ejem-
plo de muebles, ¿las proporciones de los diversos defectos varía de turno a turno, o son 
iguales estas proporciones, independientemente de cuál turno se observe? Recordemos 
un fenómeno similar llamado interacción en el experimento factorial a � b del capí-
tulo 11. En el análisis de una tabla de contingencia, el objetivo es determinar si un método 
de clasifi cación es o no es contingente o dependiente del otro método de clasifi cación. 
Si no lo es, se dice que los dos métodos de clasifi cación son independientes.
La prueba de independencia ji cuadrada
La cuestión de independencia de los dos métodos de clasifi cación se puede investigar 
usando una prueba de hipótesis basada en la estadística ji cuadrada. Éstas son las hipó-
tesis:
H0 : Los dos métodos de clasifi cación son independientes
Ha : Los dos métodos de clasifi cación son dependientes
TABLA 14.3 
●
 Tabla de contingencia
 Turno
Tipo de defectos 1 2 3 Total
A 15 26 33 74
B 21 31 17 69
C 45 34 49 128
D 13 5 20 38
Total 94 96 119 309
Con clasifi caciones de dos 
vías, no probamos hipótesis 
acerca de probabilidades 
específi cas. Probamos si los 
dos métodos de clasifi cación 
son independientes.
CONSEJOMIMI
Probabilidad_Mendenhall_14.indd 602Probabilidad_Mendenhall_14.indd 602 5/14/10 8:44:27 AM5/14/10 8:44:27 AM
 www.FreeLibros.me
 14.4 TABLAS DE CONTINGENCIA: UNA CLASIFICACIÓN DE DOS VÍAS ❍ 603
Suponga que denotamos la cantidad observada de celdas en la fi la i de la tabla de contin-
gencia como Oij. Si se conocieran las cantidades observadas de celda (Eij � npij) bajo la 
hipótesis nula de independencia, entonces se podría usar la estadística ji cuadrada para 
comparar las cantidades observadas y esperadas. No obstante, los valores esperados no 
están especifi cados en H0, como estaban en los ejemplos previos.
Para explicar cómo estimar estas cantidades esperadas de celda, debemos repasar 
el concepto de eventos independientes del capítulo 4. Considere pij, la probabilidad de 
que una observación caída en la fi la i y la columna j de la tabla de contingencia. Si los 
renglones y columnas son independientes, entonces
pij � P(observación cae en el renglón i y columna j)
 � P(observación cae en el renglón i) � P(observación cae en la columna j)
 � pipj
donde pi y pj son las probabilidades incondicional o marginal de caer en la fi la i 
o columna j, respectivamente. Si se pudiera obtener estimaciones apropiadas de estas 
probabilidades marginales, se podrían usar en lugar de pij en la fórmula para la cantidad 
esperada de celda.
Por fortuna, existen estas estimaciones. De hecho, son exactamente lo que en forma 
intuitiva se escogería:
• Para estimar la probabilidad de un renglón, use
 p̂i � 
Total de observaciones en renglón i
 _____________________________ 
 Número total de observaciones
 � 
ri __ n 
• Para estimar la probabilidad de una columna, use
 p̂j � 
Total de observaciones en la columna j ________________________________ 
Número total de observaciones
 � 
ci __ 
n
 
La estimación de la cantidad esperada de celda para el renglón i y la columna j se siguede la suposición de independencia.
CANTIDAD ESTIMADA ESPERADA DE CELDA
Êij � n� ri __ n �� cj __ n � � rjcj ___ n 
donde ri es el total para el renglón i y cj es el total para la columna j.
El estadístico de prueba ji cuadrada para una tabla de contingencia con r renglones y 
c columnas se calcula como
X2 � S 
(Oij �Êij)
2
 _________ 
Êij
 
y puede mostrarse que tiene una distribución ji cuadrada aproximada con
df � (r � 1)(c � 1)
Si el valor observado de X2 es demasiado grande, entonces la hipótesis nula de indepen-
dencia es rechazada.
Grados de libertad para una 
tabla de contingencia r � c: 
df � (r � 1)(c � 1).
CONSEJOMIMI
Probabilidad_Mendenhall_14.indd 603Probabilidad_Mendenhall_14.indd 603 5/14/10 8:44:27 AM5/14/10 8:44:27 AM
 www.FreeLibros.me
	14 ANÁLISIS DE DATOS CATEGÓRICOS
	14.4 Tablas de contingencia: una clasificación de dos vías
	La prueba de independencia ji cuadrada

Continuar navegando