Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
610 ❍ CAPÍTULO 14 ANÁLISIS DE DATOS CATEGÓRICOS 14.26 Trabajo a distancia II Un artículo en American Demographics abordó el mismo problema de teletrabajo (ejercicio 14.25) en una forma un poco diferente. Concluyeron que “las personas que trabajan exclusivamente en casa tienden a ser de mayor edad y con más educación que quienes tienen que salir de casa a trabajar”,8 Use los datos siguientes basados en muestras aleatorias de 300 trabajadores, cada uno de los cuales apoyan o refutan sus conclusiones. Use la prueba de hipótesis apropiada y explique por qué está de acuerdo o en desacuerdo con las conclusiones del American Demographics. Observe que los trabajadores “mixtos” son aquellos que informan de trabajar en casa al menos todo un día en una semana típica. Trabajadores Edad No en casa Mixto En casa 15-34 73 23 12 35-54 85 40 23 55 y más 22 12 10 Trabajadores Educación No en casa Mixto En casa Menos de preparatoria 23 3 5 Graduado de preparatoria 54 12 11 Algún grado de colegio/universidad 53 24 14 Licenciatura o más 41 42 18 DATOSMISMIS EX1426 COMPARACIÓN DE VARIAS POBLACIONES MULTINOMIALES: UNA CLASIFICACIÓN DE DOS VÍAS CON TOTALES DE RENGLÓN O COLUMNA FIJOS Una tabla de contingencia r � c resulta cuando cada una de las n unidades experi- mentales se cuenta como si cayera en una de las rc celdas de un experimento multino- mial. Cada celda representa un par de niveles de categoría, nivel de renglón i y nivel de columna j. A veces, sin embargo, no es aconsejable usar este tipo de diseño experimen- tal, es decir, hacer que n observaciones caigan donde puedan. Por ejemplo, supongamos que se desea estudiar las opiniones de familias estadounidenses acerca de sus niveles de ingreso, es decir, bajos, regulares y altos. Si al azar se seleccionan n � 1200 familias para ese estudio, puede que no se encuentre ninguna que se clasifi que a sí misma como de bajos ingresos. Podría ser mejor decidir por anticipado hacer un estudio de 400 fami- lias de cada nivel de ingreso. Los datos resultantes aparecerán todavía como clasifi cación de dos vías, pero los totales de columna son fi jos por anticipado. En otro experimento de prevención de gripe como el del ejemplo 14.5, el experimenta- dor decide buscar en registros clínicos los 300 pacientes de cada una de las tres cate- gorías de tratamiento: sin vacuna, una vacuna y dos vacunas. Los n � 900 pacientes se encuestarán entonces respecto a su historial de gripe en invierno. El experimento resulta en una tabla de 2 � 3 con los totales de columna fi jos en 300, como se ve en la tabla 14.8. Al fi jar los totales de columna, el experimentador ya no tiene un experimento multinomial con 2 � 3 celdas. En cambio, hay tres experimentos binomiales separados, llamémoslos 1, 2 y 3, cada uno con una probabilidad pj determinada de contraer la gripe y qj de no contraer la gripe. (Recuerde que para una población binomial, pj � qj � 1.) 14.5 E J E M P L O 14.6 TABLA 14.8 ● Casos de gripe para tres tratamientos Sin vacuna Una vacuna Dos vacunas Total Gripe r1 Sin gripe r2 Total 300 300 300 n Probabilidad_Mendenhall_14.indd 610Probabilidad_Mendenhall_14.indd 610 5/14/10 8:44:28 AM5/14/10 8:44:28 AM www.FreeLibros.me 14.5 COMPARACIÓN DE VARIAS POBLACIONES MULTINOMIALES: UNA CLASIFICACIÓN DE DOS VÍAS CON TOTALES DE RENGLÓN O COLUMNA FIJOS ❍ 611 Supongamos que se utilizó la prueba ji cuadrada para la independencia de clasifi ca- ciones de renglón y columna. Si un tratamiento particular (nivel de columna) no afecta la incidencia de gripe, entonces cada una de las tres poblaciones binomiales debería tener la misma incidencia de gripe para que p1 � p2 � p3 y q1 � q2 � q3. La clasifi cación de 2 � 3 del ejemplo 14.6 describe una situación en la que la prueba de ji cuadrada de independencia es equivalente a una prueba de la igualdad de c � 3 proporciones binomiales. Pruebas de este tipo se llaman pruebas de homogeneidad y se usan para comparar diversas poblaciones binomiales. Si hay más de dos categorías de renglón con totales fi jos de columna, entonces la prueba de independencia es equivalente a una prueba de la igualdad de c conjuntos de proporciones multinomiales. No es necesario preocuparse de la equivalencia teórica de las pruebas ji cuadrada para estos dos diseños experimentales. Si las columnas (o renglones) son fi jos o no, la estadística de prueba se calcula como X2 � S (Oij � Êij) 2 _________ Êij donde Êij � ricj ___ n que tiene una distribución ji cuadrada aproximada en muestreo repetido con df � (r � 1)(c � 1). ¿Cómo determino el número apropiado de grados de libertad? Recuerde el procedimiento general para determinar grados de libertad: 1. Empiece con las rc celdas en la tabla de dos vías. 2. Reste un grado de libertad por cada una de las c poblaciones multinomiales, cuyas probabilidades de columna deben totalizar uno, un total de c grados de libertad. 3. Tuvo que estimar (r � 1) probabilidades de renglón, pero las probabilidades de columna se fi jan por anticipado y no necesitaban ser estimadas. Reste (r � 1) df. El total de grados de libertad para la tabla r � c (columna fi ja) es rc � c � (r � 1) � rc � c � r � 1 � (r � 1)(c � 1) ENTRENADOR PERSONALMIMI Una encuesta de conceptos de votantes fue realizada en cuatro distritos políticos del cen- tro de una ciudad, para comparar las fracciones de votantes que están a favor del candi- dato A. Muestras aleatorias de 200 votantes se encuestaron en cada uno de los cuatro distritos con los resultados que se ven en la tabla 14.9. Los valores en paréntesis de la tabla son las cantidades esperadas de celda. ¿Los datos presentan sufi ciente evidencia para indicar que las fracciones de votantes que están a favor del candidato A difi eren en los cuatro distritos? E J E M P L O 14.7 TABLA 14.9 ● Opiniones de votantes en cuatro distritos Distrito 1 2 3 4 Total A favor de A 76 (59) 53 (59) 59 (59) 48 (59) 236 No a favor de A 124 (141) 147 (141) 141 (141) 152 (141) 564 Total 200 200 200 200 800 Probabilidad_Mendenhall_14.indd 611Probabilidad_Mendenhall_14.indd 611 5/14/10 8:44:28 AM5/14/10 8:44:28 AM www.FreeLibros.me 612 ❍ CAPÍTULO 14 ANÁLISIS DE DATOS CATEGÓRICOS Solución Como los totales de columna están fi jos en 200, el diseño comprende cuatro experimentos binomiales, cada uno de los cuales contiene las respuestas de 200 votantes para cada uno de los cuatro distritos. Para probar la igualdad de las proporciones que están a favor del candidato A en los cuatro distritos, la hipótesis nula H0 : p1 � p2 � p3 � p4 es equivalente a la hipótesis nula H0 : La proporción a favor del candidato A es independiente del distrito y será rechazada si la estadística de prueba X2 es demasiado grande. El valor observado del estadístico de prueba, X2 � 10.722, y su valor p asociado, .013, se muestran en la fi gura 14.5. Los resultados son signifi cativos (P � .025); esto es, H0 es rechazada y se puede concluir que hay diferencia en las proporciones de votantes que están a favor del candidato A entre los cuatro distritos. Prueba ji cuadrada: distrito 1, distrito 2, distrito 3, distrito 4 Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts Ward 1 Ward 2 Ward 3 Ward 4 Total 1 76 53 59 48 236 59.00 59.00 59.00 59.00 4.898 0.610 0.000 2.051 2 124 147 141 152 564 141.00 141.00 141.00 141.00 2.050 0.255 0.000 0.858 Total 200 200 200 200 800 Chi-Sq = 10.722 DF = 3, P-Value = 0.013 FIGURA 14.5 Salida impresa MINITAB para el ejemplo 14.7 ● ¿Cuál es la naturaleza de las diferencias descubiertas por la prueba ji cuadrada? Para contestar esta pregunta, véase la tabla 14.10, que muestra las proporciones muestrales que están a favor del candidato A en cadauno de los cuatro distritos. Parece que el candidato A está haciéndolo mejor en el primer distrito y peor en el cuarto distrito. ¿Es esto de alguna signifi cancia práctica para el candidato? Posiblemente una observación más importante es que el candidato no tiene una pluralidad de votantes en ninguno de los cuatro distritos. Si ésta es una carrera de dos candidatos, el candidato A necesita aumentar su campaña. TABLA 14.10 ● Proporciones a favor del candidato A en cuatro distritos Distrito 1 Distrito 2 Distrito 3 Distrito 4 76/200 � .38 53/200 � .27 59/200 � .30 48/200 � .24 Probabilidad_Mendenhall_14.indd 612Probabilidad_Mendenhall_14.indd 612 5/14/10 8:44:28 AM5/14/10 8:44:28 AM www.FreeLibros.me 14 ANÁLISIS DE DATOS CATEGÓRICOS 14.5 Comparación de varias poblaciones multinomiales: una clasificación de dos vías con totales de renglón o columna fijos
Compartir