Logo Studenta

introduccion a la probabilidad y estadistica ejercicios-212

¡Estudia con miles de materiales!

Vista previa del material en texto

610 ❍ CAPÍTULO 14 ANÁLISIS DE DATOS CATEGÓRICOS
14.26 Trabajo a distancia II Un artículo 
en American Demographics abordó el mismo 
problema de teletrabajo (ejercicio 14.25) en una forma 
un poco diferente. Concluyeron que “las personas que 
trabajan exclusivamente en casa tienden a ser de mayor 
edad y con más educación que quienes tienen que salir 
de casa a trabajar”,8 Use los datos siguientes basados en 
muestras aleatorias de 300 trabajadores, cada uno de los 
cuales apoyan o refutan sus conclusiones. Use la prueba 
de hipótesis apropiada y explique por qué está de acuerdo 
o en desacuerdo con las conclusiones del American 
Demographics. Observe que los trabajadores “mixtos” 
son aquellos que informan de trabajar en casa al menos 
todo un día en una semana típica.
 Trabajadores
Edad No en casa Mixto En casa
15-34 73 23 12
35-54 85 40 23
55 y más 22 12 10
 Trabajadores
Educación No en casa Mixto En casa
Menos de preparatoria 23 3 5
Graduado de preparatoria 54 12 11
Algún grado de colegio/universidad 53 24 14
Licenciatura o más 41 42 18
DATOSMISMIS
EX1426
COMPARACIÓN DE VARIAS 
POBLACIONES MULTINOMIALES: 
UNA CLASIFICACIÓN DE DOS VÍAS 
CON TOTALES DE RENGLÓN 
O COLUMNA FIJOS 
Una tabla de contingencia r � c resulta cuando cada una de las n unidades experi-
mentales se cuenta como si cayera en una de las rc celdas de un experimento multino-
mial. Cada celda representa un par de niveles de categoría, nivel de renglón i y nivel de 
columna j. A veces, sin embargo, no es aconsejable usar este tipo de diseño experimen-
tal, es decir, hacer que n observaciones caigan donde puedan. Por ejemplo, supongamos 
que se desea estudiar las opiniones de familias estadounidenses acerca de sus niveles de 
ingreso, es decir, bajos, regulares y altos. Si al azar se seleccionan n � 1200 familias 
para ese estudio, puede que no se encuentre ninguna que se clasifi que a sí misma como 
de bajos ingresos. Podría ser mejor decidir por anticipado hacer un estudio de 400 fami-
lias de cada nivel de ingreso. Los datos resultantes aparecerán todavía como clasifi cación 
de dos vías, pero los totales de columna son fi jos por anticipado.
En otro experimento de prevención de gripe como el del ejemplo 14.5, el experimenta-
dor decide buscar en registros clínicos los 300 pacientes de cada una de las tres cate-
gorías de tratamiento: sin vacuna, una vacuna y dos vacunas. Los n � 900 pacientes 
se encuestarán entonces respecto a su historial de gripe en invierno. El experimento 
resulta en una tabla de 2 � 3 con los totales de columna fi jos en 300, como se ve en la 
tabla 14.8. Al fi jar los totales de columna, el experimentador ya no tiene un experimento 
multinomial con 2 � 3 celdas. En cambio, hay tres experimentos binomiales separados, 
llamémoslos 1, 2 y 3, cada uno con una probabilidad pj determinada de contraer la gripe 
y qj de no contraer la gripe. (Recuerde que para una población binomial, pj � qj � 1.)
14.5
E J E M P L O 14.6
TABLA 14.8 
●
 Casos de gripe para tres tratamientos
 Sin vacuna Una vacuna Dos vacunas Total
Gripe r1
Sin gripe r2
Total 300 300 300 n
Probabilidad_Mendenhall_14.indd 610Probabilidad_Mendenhall_14.indd 610 5/14/10 8:44:28 AM5/14/10 8:44:28 AM
 www.FreeLibros.me
14.5 COMPARACIÓN DE VARIAS POBLACIONES MULTINOMIALES: UNA CLASIFICACIÓN DE DOS VÍAS CON TOTALES DE RENGLÓN O COLUMNA FIJOS ❍ 611
Supongamos que se utilizó la prueba ji cuadrada para la independencia de clasifi ca-
ciones de renglón y columna. Si un tratamiento particular (nivel de columna) no afecta la 
incidencia de gripe, entonces cada una de las tres poblaciones binomiales debería tener 
la misma incidencia de gripe para que p1 � p2 � p3 y q1 � q2 � q3.
La clasifi cación de 2 � 3 del ejemplo 14.6 describe una situación en la que la prueba 
de ji cuadrada de independencia es equivalente a una prueba de la igualdad de c � 3 
proporciones binomiales. Pruebas de este tipo se llaman pruebas de homogeneidad y 
se usan para comparar diversas poblaciones binomiales. Si hay más de dos categorías de 
renglón con totales fi jos de columna, entonces la prueba de independencia es equivalente 
a una prueba de la igualdad de c conjuntos de proporciones multinomiales.
No es necesario preocuparse de la equivalencia teórica de las pruebas ji cuadrada 
para estos dos diseños experimentales. Si las columnas (o renglones) son fi jos o no, la 
estadística de prueba se calcula como
X2 � S 
(Oij � Êij)
2
 _________ 
Êij
 donde Êij � 
ricj ___ n 
que tiene una distribución ji cuadrada aproximada en muestreo repetido con df � 
(r � 1)(c � 1).
¿Cómo determino el número apropiado de grados 
de libertad?
Recuerde el procedimiento general para determinar grados de libertad:
1. Empiece con las rc celdas en la tabla de dos vías.
2. Reste un grado de libertad por cada una de las c poblaciones multinomiales, cuyas 
probabilidades de columna deben totalizar uno, un total de c grados de libertad.
3. Tuvo que estimar (r � 1) probabilidades de renglón, pero las probabilidades de 
columna se fi jan por anticipado y no necesitaban ser estimadas. Reste (r � 1) df.
El total de grados de libertad para la tabla r � c (columna fi ja) es
 rc � c � (r � 1) � rc � c � r � 1 � (r � 1)(c � 1) 
ENTRENADOR PERSONALMIMI
Una encuesta de conceptos de votantes fue realizada en cuatro distritos políticos del cen-
tro de una ciudad, para comparar las fracciones de votantes que están a favor del candi-
dato A. Muestras aleatorias de 200 votantes se encuestaron en cada uno de los cuatro 
distritos con los resultados que se ven en la tabla 14.9. Los valores en paréntesis de la 
tabla son las cantidades esperadas de celda. ¿Los datos presentan sufi ciente evidencia 
para indicar que las fracciones de votantes que están a favor del candidato A difi eren en 
los cuatro distritos?
E J E M P L O 14.7
TABLA 14.9 
●
 Opiniones de votantes en cuatro distritos
 Distrito
 1 2 3 4 Total
A favor de A 76 (59) 53 (59) 59 (59) 48 (59) 236
No a favor de A 124 (141) 147 (141) 141 (141) 152 (141) 564
Total 200 200 200 200 800
Probabilidad_Mendenhall_14.indd 611Probabilidad_Mendenhall_14.indd 611 5/14/10 8:44:28 AM5/14/10 8:44:28 AM
 www.FreeLibros.me
612 ❍ CAPÍTULO 14 ANÁLISIS DE DATOS CATEGÓRICOS
Solución Como los totales de columna están fi jos en 200, el diseño comprende cuatro 
experimentos binomiales, cada uno de los cuales contiene las respuestas de 200 votantes 
para cada uno de los cuatro distritos. Para probar la igualdad de las proporciones que 
están a favor del candidato A en los cuatro distritos, la hipótesis nula
H0 : p1 � p2 � p3 � p4
es equivalente a la hipótesis nula
H0 : La proporción a favor del candidato A es independiente del distrito
y será rechazada si la estadística de prueba X2 es demasiado grande. El valor observado 
del estadístico de prueba, X2 � 10.722, y su valor p asociado, .013, se muestran en la 
fi gura 14.5. Los resultados son signifi cativos (P � .025); esto es, H0 es rechazada y se 
puede concluir que hay diferencia en las proporciones de votantes que están a favor del 
candidato A entre los cuatro distritos.
Prueba ji cuadrada: distrito 1, distrito 2, distrito 3, distrito 4
Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts
 Ward 1 Ward 2 Ward 3 Ward 4 Total
 1 76 53 59 48 236
 59.00 59.00 59.00 59.00
 4.898 0.610 0.000 2.051
 2 124 147 141 152 564
 141.00 141.00 141.00 141.00
 2.050 0.255 0.000 0.858
Total 200 200 200 200 800
Chi-Sq = 10.722 DF = 3, P-Value = 0.013
FIGURA 14.5
Salida impresa MINITAB 
para el ejemplo 14.7
●
¿Cuál es la naturaleza de las diferencias descubiertas por la prueba ji cuadrada? Para 
contestar esta pregunta, véase la tabla 14.10, que muestra las proporciones muestrales 
que están a favor del candidato A en cadauno de los cuatro distritos. Parece que el 
candidato A está haciéndolo mejor en el primer distrito y peor en el cuarto distrito. ¿Es 
esto de alguna signifi cancia práctica para el candidato? Posiblemente una observación 
más importante es que el candidato no tiene una pluralidad de votantes en ninguno de 
los cuatro distritos. Si ésta es una carrera de dos candidatos, el candidato A necesita 
aumentar su campaña.
TABLA 14.10 
●
 Proporciones a favor del candidato A en cuatro distritos
Distrito 1 Distrito 2 Distrito 3 Distrito 4
76/200 � .38 53/200 � .27 59/200 � .30 48/200 � .24
Probabilidad_Mendenhall_14.indd 612Probabilidad_Mendenhall_14.indd 612 5/14/10 8:44:28 AM5/14/10 8:44:28 AM
 www.FreeLibros.me
	14 ANÁLISIS DE DATOS CATEGÓRICOS
	14.5 Comparación de varias poblaciones multinomiales: una clasificación de dos vías con totales de renglón o columna fijos

Continuar navegando