Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
14.1 UNA DESCRIPCIÓN DEL EXPERIMENTO ❍ 595 UNA DESCRIPCIÓN DEL EXPERIMENTO Numerosos experimentos resultan en mediciones que son cualitativas o categóricas en lugar de cuantitativas; esto es, una cualidad o característica (más que un valor numé- rico) se mide para cada unidad experimental. Se puede resumir este tipo de datos al crear una lista de las categorías o características e informar de una cantidad del número de mediciones que caen en cada categoría. A continuación veamos algunos ejemplos: • Las personas se pueden clasifi car en cinco categorías de ingreso. • Un ratón puede responder en una de tres formas a un estímulo. • Un dulce M&M’S puede tener uno de seis colores. • Un proceso industrial manufactura artículos que pueden ser clasifi cados como “aceptables”, “de segunda categoría” o “defectuosos”. Éstas son algunas de las muchas situaciones en las que el conjunto de datos tiene carac- terísticas apropiadas para el experimento multinomial. EL EXPERIMENTO MULTINOMIAL • El experimento consta de n intentos idénticos. • El resultado de cada intento cae en una de k categorías. • La probabilidad de que el resultado de un solo intento caiga en una categoría particular, por ejemplo i, es pi y permanece constante de un intento a otro. Esta probabilidad debe ser entre 0 y 1, para cada una de las k categorías y la suma de todas las k probabilidades es Spi � 1. • Los intentos son independientes. • El experimentador cuenta el número observado de resultados en cada categoría, escrito como O1, O2, …, Ok, con O1 � O2 � � � � � Ok � n. Se puede visualizar el experimento multinomial si se considera un número k de cajas o celdas en las que n pelotas se lanzan. Los n tiros son independientes y en cada tiro la probabilidad de hacer blanco en la i caja es la misma. Pero, esta probabilidad puede variar de una caja a otra; podría ser más fácil hacer blanco en la caja 1 que en la caja 3 en cada tiro. Una vez que todas las n pelotas se hayan tirado, se cuenta el número de cada ca- ja o celda, O1, O2, …, Ok. Es probable que haya notado la similitud entre el experimento multinomial y el experi- mento binomial introducido en el capítulo 5. De hecho, cuando hay k � 2 categorías, los dos experimentos son idénticos, excepto por la notación. En lugar de p y q, escribimos p1 y p2 para representar las probabilidades para las dos categorías, “éxito” y “fracaso”. En lugar de x y (n � x), escribimos O1 y O2 para representar el número observado de “éxi- tos” y “fracasos”. Cuando presentamos la variable aleatoria binomio, hicimos inferencias acerca del parámetro binomial p (y por default, q � 1 � p) usando métodos de muestra grande basados en la estadística z. En este capítulo, extendemos esta idea para hacer inferencias acerca de los parámetros multinomiales, p1, p2, …, pk, usando un tipo diferente de esta- dística. Esta estadística, cuya distribución de muestreo aproximada fue derivada por un estadístico inglés llamado Karl Pearson en 1900, se llama estadística ji cuadrada (o a veces ji cuadrada de Pearson). 14.1 El experimento multinomial es una extensión del experimento binomial. Para un experimento binomio, k � 2. CONSEJOMIMI Probabilidad_Mendenhall_14.indd 595Probabilidad_Mendenhall_14.indd 595 5/14/10 8:44:26 AM5/14/10 8:44:26 AM www.FreeLibros.me 596 ❍ CAPÍTULO 14 ANÁLISIS DE DATOS CATEGÓRICOS ESTADÍSTICA JI CUADRADA DE PEARSON Suponga que n � 100 pelotas se lanzan a las celdas (cajas) y que sabemos que la proba- bilidad que una pelota caiga en la primera caja es p1 � .1. ¿Cuántas pelotas esperaría- mos que caigan en la primera caja? De manera intuitiva, se esperaría ver 100(.1) � 10 pelotas en la primera caja. Esto debe recordarnos del promedio o número esperado de éxitos, m � np, en el experimento binomial. En general, el número esperado de pelotas que caigan en la celda i, escrito como Ei, se puede calcular usando la fórmula Ei � npi para cualquiera de las celdas i � 1, 2, …, k. Ahora suponga que hacemos una hipótesis de valores para cada una de las probabi- lidades p1, p2, …, pk y calculamos el número esperado para cada categoría o celda. Si nuestra hipótesis es correcta, las cantidades observadas de celda reales, Oi, no deben ser demasiado diferentes de las cantidades esperadas de celda, Ei � npi. Cuanto más gran- des sean las diferencias, más probable será que la hipótesis sea incorrecta. La esta- dística ji cuadrada de Pearson utiliza las diferencias (Oi � Ei) al elevar al cuadrado primeramente estas diferencias para eliminar contribuciones negativas y luego forma un promedio ponderado de las diferencias cuadradas. ESTADÍSTICA DE PRUEBA JI CUADRADA DE PEARSON X2 � S (Oi � Ei) 2 _________ Ei sumadas en todas las k celdas, con Ei � npi. Aun cuando la prueba matemática está fuera del propósito de este libro, se puede demostrar que cuando n es grande, X2 tiene una distribución ji cuadrada de probabili- dad aproximada en muestreo repetido. Si las cuentas de celda esperadas hipotéticas son correctas, las diferencias (Oi � Ei) son pequeñas y X 2 es cercana a 0. Pero, si las pro- babilidades hipotéticas son incorrectas, grandes diferencias (Oi � Ei) resultan en un valor grande de X2. Debe usarse una prueba estadística de cola derecha y buscar un valor inusualmente grande del estadístico de prueba. La distribución ji cuadrada se utilizó en el capítulo 10 para hacer inferencias acerca de una varianza poblacional s2. Al igual que la distribución F, su forma no es simé- trica y depende de un número específi co de grados de libertad. Una vez especifi cados estos grados de libertad, se puede usar la tabla 5 del apéndice I para hallar valores críti- cos o para limitar el valor p para una estadística ji cuadrada particular. Como alterna- tiva, se puede usar el applet Chi-Square Probabilities (Probabilidades ji cuadrada) para hallar valores críticos o valores p exactos para la prueba. Los grados de libertad apropiados para la estadística ji cuadrada varían dependiendo de la aplicación particular que se utilice. Aun cuando especifi caremos los grados de libertad apropiados para las aplicaciones presentadas en este capítulo, se debe usar la regla general dada a continuación para determinar grados de libertad para la estadística ji cuadrada. 14.2 ENTRENADOR PERSONALMIMI ¿Cómo determino el número apropiado de grados de libertad? 1. Empiece con el número de categorías o celdas en el experimento. 2. Reste un grado de libertad por cada restricción lineal en las probabilidades de celda. Siempre se pierde un df (grado de libertad) porque p1 � p2 � � � � � pk � 1. Las pruebas ji cuadrada de Pearson siempre son pruebas de cola superior. CONSEJOMIMI Probabilidad_Mendenhall_14.indd 596Probabilidad_Mendenhall_14.indd 596 5/14/10 8:44:26 AM5/14/10 8:44:26 AM www.FreeLibros.me 14.3 PRUEBA DE PROBABILIDADES DE CELDA ESPECIFICADA: LA PRUEBA DE BONDAD DEL AJUSTE ❍ 597 Empezamos con las aplicaciones más sencillas de la estadística de prueba ji cuadrada, la prueba de bondad de ajuste. PRUEBA DE PROBABILIDADES DE CELDA ESPECIFICADA: LA PRUEBA DE BONDAD DEL AJUSTE La hipótesis más sencilla respecto a las probabilidades de celda especifi ca un valor numé- rico para cada celda. Las cantidades de celda esperadas se calculan fácilmente usando las probabilidades hipotéticas, Ei � npi y se usan para calcular el valor observado de la estadística de prueba X2. Para un experimento multinomial formado por k categorías o celdas, la estadística de prueba tiene una distribución x 2 aproximada con df � (k � 1). Un investigador diseña un experimento en el que una rata es atraída al fi nal de una rampa que se divide, llevando a puertas de tres colores diferentes. El investigador hace que la rata baje por la rampa n � 90 veces y observa las elecciones citadas en la tabla 14.1. ¿La rata tiene (o ha adquirido) preferencia por una de las tres puertas? 3. A veces las cantidades de celda esperadas no se pueden calcular directamentesino que deben estimarse usando los datos muestrales. Reste un grado de libertad por cada parámetro poblacional independiente que deba ser estimado, para obtener los valores estimados de Ei. 14.3 E J E M P L O 14.1 Solución Si la rata no tiene preferencia en la elección de una puerta, a la larga debe esperarse que la rata escogiera cada puerta en igual número de veces. Esto es, la hipó- tesis nula es H0 : p1 � p2 � p3 � 1 __ 3 contra la hipótesis alternativa Ha : Al menos una pi es diferente de 1 __ 3 donde pi es la probabilidad de que la rata escoja la puerta i, para i � 1, 2 y 3. Las canti- dades de celda esperadas son las mismas para cada una de las tres categorías, es decir, npi � 90(1/3) � 30. La estadística de prueba ji cuadrada puede ahora calcularse como X2 � S (Oi � Ei) 2 _________ Ei � (20 � 30)2 _________ 30 � (39 � 30)2 _________ 30 � (31 � 30)2 _________ 30 � 6.067 TABLA 14.1 ● Elecciones de puerta de la rata Puerta Verde Roja Azul Cantidad observada (Oi) 20 39 31 La región de rechazo y valor p están en la cola superior de la distribución ji cuadrada. CONSEJOMIMI Probabilidad_Mendenhall_14.indd 597Probabilidad_Mendenhall_14.indd 597 5/14/10 8:44:26 AM5/14/10 8:44:26 AM www.FreeLibros.me 14 ANÁLISIS DE DATOS CATEGÓRICOS 14.1 Una descripción del experimento 14.2 Estadística ji cuadrada de Pearson 14.3 Prueba de probabilidades de celda especificada: la prueba de bondad del ajuste
Compartir