introduccion a la probabilidad y estadistica ejercicios-207

Probabilidad y Estadística Aplicada

•

27 De Septiembre

EDUARDO GONZALEZ GARCIA

26/7/2023

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Probabilidad y Estadística Aplicada

1948 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

14.1 UNA DESCRIPCIÓN DEL EXPERIMENTO ❍ 595
UNA DESCRIPCIÓN DEL EXPERIMENTO
Numerosos experimentos resultan en mediciones que son cualitativas o categóricas en
lugar de cuantitativas; esto es, una cualidad o característica (más que un valor numé-
rico) se mide para cada unidad experimental. Se puede resumir este tipo de datos al crear
una lista de las categorías o características e informar de una cantidad del número de
mediciones que caen en cada categoría. A continuación veamos algunos ejemplos:
• Las personas se pueden clasifi car en cinco categorías de ingreso.
• Un ratón puede responder en una de tres formas a un estímulo.
• Un dulce M&M’S puede tener uno de seis colores.
• Un proceso industrial manufactura artículos que pueden ser clasifi cados como
“aceptables”, “de segunda categoría” o “defectuosos”.
Éstas son algunas de las muchas situaciones en las que el conjunto de datos tiene carac-
terísticas apropiadas para el experimento multinomial.
EL EXPERIMENTO MULTINOMIAL
• El experimento consta de n intentos idénticos.
• El resultado de cada intento cae en una de k categorías.
• La probabilidad de que el resultado de un solo intento caiga en una categoría
particular, por ejemplo i, es pi y permanece constante de un intento a otro. Esta
probabilidad debe ser entre 0 y 1, para cada una de las k categorías y la suma de
todas las k probabilidades es Spi � 1.
• Los intentos son independientes.
• El experimentador cuenta el número observado de resultados en cada categoría,
escrito como O1, O2, …, Ok, con O1 � O2 � � � � � Ok � n.
Se puede visualizar el experimento multinomial si se considera un número k de cajas
o celdas en las que n pelotas se lanzan. Los n tiros son independientes y en cada tiro
la probabilidad de hacer blanco en la i caja es la misma. Pero, esta probabilidad puede
variar de una caja a otra; podría ser más fácil hacer blanco en la caja 1 que en la caja 3 en
cada tiro. Una vez que todas las n pelotas se hayan tirado, se cuenta el número de cada ca-
ja o celda, O1, O2, …, Ok.
Es probable que haya notado la similitud entre el experimento multinomial y el experi-
mento binomial introducido en el capítulo 5. De hecho, cuando hay k � 2 categorías, los
dos experimentos son idénticos, excepto por la notación. En lugar de p y q, escribimos p1
y p2 para representar las probabilidades para las dos categorías, “éxito” y “fracaso”. En
lugar de x y (n � x), escribimos O1 y O2 para representar el número observado de “éxi-
tos” y “fracasos”.
Cuando presentamos la variable aleatoria binomio, hicimos inferencias acerca del
parámetro binomial p (y por default, q � 1 � p) usando métodos de muestra grande
basados en la estadística z. En este capítulo, extendemos esta idea para hacer inferencias
acerca de los parámetros multinomiales, p1, p2, …, pk, usando un tipo diferente de esta-
dística. Esta estadística, cuya distribución de muestreo aproximada fue derivada por un
estadístico inglés llamado Karl Pearson en 1900, se llama estadística ji cuadrada (o a
veces ji cuadrada de Pearson).
14.1
El experimento multinomial
es una extensión del
experimento binomial. Para
un experimento binomio,
k � 2.
CONSEJOMIMI
Probabilidad_Mendenhall_14.indd 595Probabilidad_Mendenhall_14.indd 595 5/14/10 8:44:26 AM5/14/10 8:44:26 AM
www.FreeLibros.me
596 ❍ CAPÍTULO 14 ANÁLISIS DE DATOS CATEGÓRICOS
ESTADÍSTICA JI CUADRADA DE PEARSON
Suponga que n � 100 pelotas se lanzan a las celdas (cajas) y que sabemos que la proba-
bilidad que una pelota caiga en la primera caja es p1 � .1. ¿Cuántas pelotas esperaría-
mos que caigan en la primera caja? De manera intuitiva, se esperaría ver 100(.1) � 10
pelotas en la primera caja. Esto debe recordarnos del promedio o número esperado de
éxitos, m � np, en el experimento binomial. En general, el número esperado de pelotas
que caigan en la celda i, escrito como Ei, se puede calcular usando la fórmula
Ei � npi
para cualquiera de las celdas i � 1, 2, …, k.
Ahora suponga que hacemos una hipótesis de valores para cada una de las probabi-
lidades p1, p2, …, pk y calculamos el número esperado para cada categoría o celda. Si
nuestra hipótesis es correcta, las cantidades observadas de celda reales, Oi, no deben ser
demasiado diferentes de las cantidades esperadas de celda, Ei � npi. Cuanto más gran-
des sean las diferencias, más probable será que la hipótesis sea incorrecta. La esta-
dística ji cuadrada de Pearson utiliza las diferencias (Oi � Ei) al elevar al cuadrado
primeramente estas diferencias para eliminar contribuciones negativas y luego forma
un promedio ponderado de las diferencias cuadradas.
ESTADÍSTICA DE PRUEBA JI CUADRADA DE PEARSON
X2 � S
(Oi � Ei)
2
_________ Ei

sumadas en todas las k celdas, con Ei � npi.
Aun cuando la prueba matemática está fuera del propósito de este libro, se puede
demostrar que cuando n es grande, X2 tiene una distribución ji cuadrada de probabili-
dad aproximada en muestreo repetido. Si las cuentas de celda esperadas hipotéticas son
correctas, las diferencias (Oi � Ei) son pequeñas y X
2 es cercana a 0. Pero, si las pro-
babilidades hipotéticas son incorrectas, grandes diferencias (Oi � Ei) resultan en un
valor grande de X2. Debe usarse una prueba estadística de cola derecha y buscar
un valor inusualmente grande del estadístico de prueba.
La distribución ji cuadrada se utilizó en el capítulo 10 para hacer inferencias acerca
de una varianza poblacional s2. Al igual que la distribución F, su forma no es simé-
trica y depende de un número específi co de grados de libertad. Una vez especifi cados
estos grados de libertad, se puede usar la tabla 5 del apéndice I para hallar valores críti-
cos o para limitar el valor p para una estadística ji cuadrada particular. Como alterna-
tiva, se puede usar el applet Chi-Square Probabilities (Probabilidades ji cuadrada) para
hallar valores críticos o valores p exactos para la prueba.
Los grados de libertad apropiados para la estadística ji cuadrada varían dependiendo
de la aplicación particular que se utilice. Aun cuando especifi caremos los grados de
libertad apropiados para las aplicaciones presentadas en este capítulo, se debe usar la
regla general dada a continuación para determinar grados de libertad para la estadística
ji cuadrada.
14.2
ENTRENADOR PERSONALMIMI
¿Cómo determino el número apropiado de grados
de libertad?
1. Empiece con el número de categorías o celdas en el experimento.
2. Reste un grado de libertad por cada restricción lineal en las probabilidades de
celda. Siempre se pierde un df (grado de libertad) porque p1 � p2 � � � � � pk � 1.
Las pruebas ji cuadrada de
Pearson siempre son pruebas
de cola superior.
CONSEJOMIMI
Probabilidad_Mendenhall_14.indd 596Probabilidad_Mendenhall_14.indd 596 5/14/10 8:44:26 AM5/14/10 8:44:26 AM
www.FreeLibros.me
14.3 PRUEBA DE PROBABILIDADES DE CELDA ESPECIFICADA: LA PRUEBA DE BONDAD DEL AJUSTE ❍ 597
Empezamos con las aplicaciones más sencillas de la estadística de prueba ji cuadrada,
la prueba de bondad de ajuste.
PRUEBA DE PROBABILIDADES DE CELDA
ESPECIFICADA: LA PRUEBA DE BONDAD
DEL AJUSTE
La hipótesis más sencilla respecto a las probabilidades de celda especifi ca un valor numé-
rico para cada celda. Las cantidades de celda esperadas se calculan fácilmente usando
las probabilidades hipotéticas, Ei � npi y se usan para calcular el valor observado de la
estadística de prueba X2. Para un experimento multinomial formado por k categorías o
celdas, la estadística de prueba tiene una distribución x 2 aproximada con df � (k � 1).
Un investigador diseña un experimento en el que una rata es atraída al fi nal de una rampa
que se divide, llevando a puertas de tres colores diferentes. El investigador hace que
la rata baje por la rampa n � 90 veces y observa las elecciones citadas en la tabla 14.1.
¿La rata tiene (o ha adquirido) preferencia por una de las tres puertas?
3. A veces las cantidades de celda esperadas no se pueden calcular directamentesino
que deben estimarse usando los datos muestrales. Reste un grado de libertad por
cada parámetro poblacional independiente que deba ser estimado, para obtener los
valores estimados de Ei.
14.3
E J E M P L O 14.1
Solución Si la rata no tiene preferencia en la elección de una puerta, a la larga debe
esperarse que la rata escogiera cada puerta en igual número de veces. Esto es, la hipó-
tesis nula es
H0 : p1 � p2 � p3 �
1 __
3

contra la hipótesis alternativa
Ha : Al menos una pi es diferente de
1 __
3

donde pi es la probabilidad de que la rata escoja la puerta i, para i � 1, 2 y 3. Las canti-
dades de celda esperadas son las mismas para cada una de las tres categorías, es decir,
npi � 90(1/3) � 30. La estadística de prueba ji cuadrada puede ahora calcularse como
X2 � S
(Oi � Ei)
2
_________ Ei

�
(20 � 30)2
_________
30
�
(39 � 30)2
_________
30
�
(31 � 30)2
_________
30
� 6.067
TABLA 14.1
●
Elecciones de puerta de la rata
Puerta
Verde Roja Azul
Cantidad observada (Oi) 20 39 31
La región de rechazo y valor
p están en la cola superior de
la distribución ji cuadrada.
CONSEJOMIMI
Probabilidad_Mendenhall_14.indd 597Probabilidad_Mendenhall_14.indd 597 5/14/10 8:44:26 AM5/14/10 8:44:26 AM
www.FreeLibros.me
14 ANÁLISIS DE DATOS CATEGÓRICOS
14.1 Una descripción del experimento
14.2 Estadística ji cuadrada de Pearson
14.3 Prueba de probabilidades de celda especificada: la prueba de bondad del ajuste