Logo Studenta

introduccion a la probabilidad y estadistica ejercicios-207

¡Estudia con miles de materiales!

Vista previa del material en texto

14.1 UNA DESCRIPCIÓN DEL EXPERIMENTO ❍ 595
UNA DESCRIPCIÓN DEL EXPERIMENTO
Numerosos experimentos resultan en mediciones que son cualitativas o categóricas en 
lugar de cuantitativas; esto es, una cualidad o característica (más que un valor numé-
rico) se mide para cada unidad experimental. Se puede resumir este tipo de datos al crear 
una lista de las categorías o características e informar de una cantidad del número de 
mediciones que caen en cada categoría. A continuación veamos algunos ejemplos:
• Las personas se pueden clasifi car en cinco categorías de ingreso.
• Un ratón puede responder en una de tres formas a un estímulo.
• Un dulce M&M’S puede tener uno de seis colores.
• Un proceso industrial manufactura artículos que pueden ser clasifi cados como 
“aceptables”, “de segunda categoría” o “defectuosos”.
Éstas son algunas de las muchas situaciones en las que el conjunto de datos tiene carac-
terísticas apropiadas para el experimento multinomial.
EL EXPERIMENTO MULTINOMIAL
• El experimento consta de n intentos idénticos.
• El resultado de cada intento cae en una de k categorías.
• La probabilidad de que el resultado de un solo intento caiga en una categoría 
particular, por ejemplo i, es pi y permanece constante de un intento a otro. Esta 
probabilidad debe ser entre 0 y 1, para cada una de las k categorías y la suma de 
todas las k probabilidades es Spi � 1.
• Los intentos son independientes.
• El experimentador cuenta el número observado de resultados en cada categoría, 
escrito como O1, O2, …, Ok, con O1 � O2 � � � � � Ok � n.
Se puede visualizar el experimento multinomial si se considera un número k de cajas 
o celdas en las que n pelotas se lanzan. Los n tiros son independientes y en cada tiro 
la probabilidad de hacer blanco en la i caja es la misma. Pero, esta probabilidad puede 
variar de una caja a otra; podría ser más fácil hacer blanco en la caja 1 que en la caja 3 en 
cada tiro. Una vez que todas las n pelotas se hayan tirado, se cuenta el número de cada ca-
ja o celda, O1, O2, …, Ok.
Es probable que haya notado la similitud entre el experimento multinomial y el experi-
mento binomial introducido en el capítulo 5. De hecho, cuando hay k � 2 categorías, los 
dos experimentos son idénticos, excepto por la notación. En lugar de p y q, escribimos p1 
y p2 para representar las probabilidades para las dos categorías, “éxito” y “fracaso”. En 
lugar de x y (n � x), escribimos O1 y O2 para representar el número observado de “éxi-
tos” y “fracasos”.
Cuando presentamos la variable aleatoria binomio, hicimos inferencias acerca del 
parámetro binomial p (y por default, q � 1 � p) usando métodos de muestra grande 
basados en la estadística z. En este capítulo, extendemos esta idea para hacer inferencias 
acerca de los parámetros multinomiales, p1, p2, …, pk, usando un tipo diferente de esta-
dística. Esta estadística, cuya distribución de muestreo aproximada fue derivada por un 
estadístico inglés llamado Karl Pearson en 1900, se llama estadística ji cuadrada (o a 
veces ji cuadrada de Pearson).
14.1
El experimento multinomial 
es una extensión del 
experimento binomial. Para 
un experimento binomio, 
k � 2.
CONSEJOMIMI
Probabilidad_Mendenhall_14.indd 595Probabilidad_Mendenhall_14.indd 595 5/14/10 8:44:26 AM5/14/10 8:44:26 AM
 www.FreeLibros.me
596 ❍ CAPÍTULO 14 ANÁLISIS DE DATOS CATEGÓRICOS
ESTADÍSTICA JI CUADRADA DE PEARSON
Suponga que n � 100 pelotas se lanzan a las celdas (cajas) y que sabemos que la proba-
bilidad que una pelota caiga en la primera caja es p1 � .1. ¿Cuántas pelotas esperaría-
mos que caigan en la primera caja? De manera intuitiva, se esperaría ver 100(.1) � 10 
pelotas en la primera caja. Esto debe recordarnos del promedio o número esperado de 
éxitos, m � np, en el experimento binomial. En general, el número esperado de pelotas 
que caigan en la celda i, escrito como Ei, se puede calcular usando la fórmula
Ei � npi
para cualquiera de las celdas i � 1, 2, …, k.
Ahora suponga que hacemos una hipótesis de valores para cada una de las probabi-
lidades p1, p2, …, pk y calculamos el número esperado para cada categoría o celda. Si 
nuestra hipótesis es correcta, las cantidades observadas de celda reales, Oi, no deben ser 
demasiado diferentes de las cantidades esperadas de celda, Ei � npi. Cuanto más gran-
des sean las diferencias, más probable será que la hipótesis sea incorrecta. La esta-
dística ji cuadrada de Pearson utiliza las diferencias (Oi � Ei) al elevar al cuadrado 
primeramente estas diferencias para eliminar contribuciones negativas y luego forma 
un promedio ponderado de las diferencias cuadradas.
ESTADÍSTICA DE PRUEBA JI CUADRADA DE PEARSON
X2 � S 
(Oi � Ei)
2
 _________ Ei
 
sumadas en todas las k celdas, con Ei � npi.
Aun cuando la prueba matemática está fuera del propósito de este libro, se puede 
demostrar que cuando n es grande, X2 tiene una distribución ji cuadrada de probabili-
dad aproximada en muestreo repetido. Si las cuentas de celda esperadas hipotéticas son 
correctas, las diferencias (Oi � Ei) son pequeñas y X
2 es cercana a 0. Pero, si las pro-
babilidades hipotéticas son incorrectas, grandes diferencias (Oi � Ei) resultan en un 
valor grande de X2. Debe usarse una prueba estadística de cola derecha y buscar 
un valor inusualmente grande del estadístico de prueba.
La distribución ji cuadrada se utilizó en el capítulo 10 para hacer inferencias acerca 
de una varianza poblacional s2. Al igual que la distribución F, su forma no es simé-
trica y depende de un número específi co de grados de libertad. Una vez especifi cados 
estos grados de libertad, se puede usar la tabla 5 del apéndice I para hallar valores críti-
cos o para limitar el valor p para una estadística ji cuadrada particular. Como alterna-
tiva, se puede usar el applet Chi-Square Probabilities (Probabilidades ji cuadrada) para 
hallar valores críticos o valores p exactos para la prueba.
Los grados de libertad apropiados para la estadística ji cuadrada varían dependiendo 
de la aplicación particular que se utilice. Aun cuando especifi caremos los grados de 
libertad apropiados para las aplicaciones presentadas en este capítulo, se debe usar la 
regla general dada a continuación para determinar grados de libertad para la estadística 
ji cuadrada.
14.2
ENTRENADOR PERSONALMIMI
¿Cómo determino el número apropiado de grados 
de libertad?
1. Empiece con el número de categorías o celdas en el experimento.
2. Reste un grado de libertad por cada restricción lineal en las probabilidades de 
celda. Siempre se pierde un df (grado de libertad) porque p1 � p2 � � � � � pk � 1.
Las pruebas ji cuadrada de 
Pearson siempre son pruebas 
de cola superior.
CONSEJOMIMI
Probabilidad_Mendenhall_14.indd 596Probabilidad_Mendenhall_14.indd 596 5/14/10 8:44:26 AM5/14/10 8:44:26 AM
 www.FreeLibros.me
 14.3 PRUEBA DE PROBABILIDADES DE CELDA ESPECIFICADA: LA PRUEBA DE BONDAD DEL AJUSTE ❍ 597
Empezamos con las aplicaciones más sencillas de la estadística de prueba ji cuadrada, 
la prueba de bondad de ajuste.
PRUEBA DE PROBABILIDADES DE CELDA 
ESPECIFICADA: LA PRUEBA DE BONDAD 
DEL AJUSTE
La hipótesis más sencilla respecto a las probabilidades de celda especifi ca un valor numé-
rico para cada celda. Las cantidades de celda esperadas se calculan fácilmente usando 
las probabilidades hipotéticas, Ei � npi y se usan para calcular el valor observado de la 
estadística de prueba X2. Para un experimento multinomial formado por k categorías o 
celdas, la estadística de prueba tiene una distribución x 2 aproximada con df � (k � 1).
Un investigador diseña un experimento en el que una rata es atraída al fi nal de una rampa 
que se divide, llevando a puertas de tres colores diferentes. El investigador hace que 
la rata baje por la rampa n � 90 veces y observa las elecciones citadas en la tabla 14.1. 
¿La rata tiene (o ha adquirido) preferencia por una de las tres puertas?
3. A veces las cantidades de celda esperadas no se pueden calcular directamentesino 
que deben estimarse usando los datos muestrales. Reste un grado de libertad por 
cada parámetro poblacional independiente que deba ser estimado, para obtener los 
valores estimados de Ei.
14.3
E J E M P L O 14.1
Solución Si la rata no tiene preferencia en la elección de una puerta, a la larga debe 
esperarse que la rata escogiera cada puerta en igual número de veces. Esto es, la hipó-
tesis nula es
H0 : p1 � p2 � p3 � 
1 __ 
3
 
contra la hipótesis alternativa
Ha : Al menos una pi es diferente de 
1 __ 
3
 
donde pi es la probabilidad de que la rata escoja la puerta i, para i � 1, 2 y 3. Las canti-
dades de celda esperadas son las mismas para cada una de las tres categorías, es decir, 
npi � 90(1/3) � 30. La estadística de prueba ji cuadrada puede ahora calcularse como
X2 � S 
(Oi � Ei)
2
 _________ Ei
 
 � 
(20 � 30)2
 _________ 
30
 � 
(39 � 30)2
 _________ 
30
 � 
(31 � 30)2
 _________ 
30
 � 6.067
TABLA 14.1 
●
 Elecciones de puerta de la rata
 Puerta
 Verde Roja Azul
Cantidad observada (Oi) 20 39 31
La región de rechazo y valor 
p están en la cola superior de 
la distribución ji cuadrada.
CONSEJOMIMI
Probabilidad_Mendenhall_14.indd 597Probabilidad_Mendenhall_14.indd 597 5/14/10 8:44:26 AM5/14/10 8:44:26 AM
 www.FreeLibros.me
	14 ANÁLISIS DE DATOS CATEGÓRICOS
	14.1 Una descripción del experimento
	14.2 Estadística ji cuadrada de Pearson
	14.3 Prueba de probabilidades de celda especificada: la prueba de bondad del ajuste

Continuar navegando