Logo Studenta

introduccion a la probabilidad y estadistica ejercicios-214

¡Estudia con miles de materiales!

Vista previa del material en texto

616 ❍ CAPÍTULO 14 ANÁLISIS DE DATOS CATEGÓRICOS
entonces repite el examen en cada una de las siguientes 4 semanas. ¿La propor-
ción de respuestas correctas aumenta con el tiempo? ¿Está teniendo lugar un 
aprendizaje? En un proceso monitoreado por un plan de control de calidad, ¿hay 
una tendencia positiva en la proporción de artículos defectuosos como función 
del tiempo?
• Tablas de contingencia multidimensionales: En lugar de sólo dos métodos 
de clasifi cación, se puede investigar una dependencia entre tres o más clasifi -
caciones. La tabla de contingencia de dos vías se extiende a una tabla en más 
de dos dimensiones. La metodología es similar a la que se emplea para la 
tabla de contingencia de r � c, pero el análisis es un poco más complejo.
• Modelos log-lineales: Modelos complejos se pueden crear en donde el 
logaritmo de la probabilidad de celda (ln pij) es alguna función lineal de las 
probabilidades de renglón y columna.
Casi todas estas aplicaciones son más bien complejas y podrían requerir el consejo de un 
estadístico profesional antes de realizar un experimento.
En todas las aplicaciones estadísticas que usen estadística ji cuadrada de Pearson, las 
suposiciones deben estar satisfechas para que el estadístico de prueba tenga una distribu-
ción de probabilidad ji cuadrada aproximada.
SUPOSICIONES
• Las cantidades de celda O1, O2, …, Ok deben satisfacer las condiciones de un 
experimento multinomial, o un conjunto de experimentos multinomiales creados 
al fi jar ya sea los totales de renglón o de columna.
• Las cantidades de celda esperadas E1, E2, …, Ek deben ser iguales o mayores a 5.
Por lo general se puede estar razonablemente seguro de haber satisfecho la primera 
suposición si con todo cuidado se prepara o diseña un experimento o encuesta muestral. 
Cuando calcule las cantidades de celda esperadas, si encuentra que una o más es menor 
a 5, existen estas opciones:
• Escoja un tamaño n muestral más grande. Cuanto más grande sea el tamaño 
muestral, más cerca se aproximará la distribución cuadrada a la distribución 
de su estadístico de prueba X2.
• Puede ser posible combinar una o más de las celdas con pequeñas cantidades 
de celda esperadas, con lo cual se satisface la suposición.
Por último, asegúrese de estar calculando los grados de libertad correctamente y 
que con todo cuidado se evalúan las conclusiones estadísticas y prácticas que se pueden 
sacar de la prueba.
Conceptos y fórmulas clave
I. El experimento multinomial
1. Hay n intentos idénticos y cada resultado cae en 
una de k categorías.
2. La probabilidad de caer en la categoría i es pi y 
permanece constante de un intento a otro.
3. Los intentos son independientes, Spi � 1, y medi-
mos Oi, el número de observaciones que caen en 
cada una de k categorías.
REPASO DEL CAPÍTULO
Probabilidad_Mendenhall_14.indd 616Probabilidad_Mendenhall_14.indd 616 5/14/10 8:44:28 AM5/14/10 8:44:28 AM
 www.FreeLibros.me
 MI MINITAB ❍ 617
II. Estadísticas ji cuadrada de Pearson
X2 � S 
(Oi � Ei)
2
 _________ Ei
 donde Ei � npi
que es una distribución ji cuadrada aproximada con 
grados de libertad determinados por la aplicación.
III. La prueba de bondad del ajuste
1. Ésta es una clasifi cación de una vía con probabili-
dades de celda especifi cadas en H0.
2. Use el estadístico ji cuadrada con Ei � npi calcu-
lada con las probabilidades hipotéticas.
3. df � k � 1 � (Número de parámetros estimados 
para hallar Ei)
4. Si H0 es rechazada, investigue la naturaleza de las 
diferencias usando las proporciones muestrales.
IV. Tablas de contingencia
1. Una clasifi cación de dos vías con n observaciones 
en categorías de r � c celdas de una tabla de dos 
vías, que usa dos métodos diferentes de clasifi ca-
ción, se denomina tabla de contingencia.
2. La prueba de independencia de métodos de clasi-
fi cación usa el estadístico ji cuadrada
X2 � S 
(Oij � Êij)
2
 ________ 
Êij
 
con Êij � 
ricj
 ___ n y df � (r � 1)(c � 1)
3. Si la hipótesis nula de independencia de clasifi ca-
ciones se rechaza, investigue la naturaleza de 
la dependencia usando proporciones condicio-
nales dentro de ya sea renglones o columnas de la 
tabla de contingencia.
V. Fijar totales de renglón o columna
1. Cuando sea que los totales de renglón o los de 
columna sean fi jos, la prueba de independencia 
de clasifi caciones se convierte en una prueba de 
la homogeneidad de probabilidades de celda para 
varios experimentos multinominales.
2. Use el mismo estadístico ji cuadrada que para 
tablas de contingencia.
3. Las pruebas Z de muestra grande para uno y dos 
proporciones binomiales son casos especiales de 
la estadística ji cuadrada.
VI. Suposiciones
1. Las cantidades de celda satisfacen las condiciones 
de un experimento multinomial o un conjunto de 
experimentos con tamaños muestrales fi jos.
2. Todas las cantidades de celda esperadas deben ser 
iguales o mayores a cinco para que la aproxima-
ción ji cuadrada sea válida.
MINITABMIMI
La prueba ji cuadrada
Existen varios procedimientos en el paquete MINITAB para analizar datos categóricos. 
El procedimiento apropiado depende de si los datos representan una clasifi cación de 
una vía (un solo experimento multinomial) o una clasifi cación de dos vías o tabla 
de contingencia. Si los datos categóricos sin elaborar se han guardado en la hoja de tra-
bajo MINITAB más que las cantidades de celda observadas, puede ser necesario totalizar 
o clasifi car en cruz los datos para obtener las cantidades de celda antes de continuar.
Por ejemplo, supongamos que se ha registrado el género (M o F) y el estatus universi-
tario (1er año, 2o. año, no graduado, de último año, egresado) para 100 estudiantes de es-
tadística. La hoja de trabajo MINITAB contendría dos columnas de 100 observaciones 
cada una. Cada renglón contendría el género de una persona en la columna 1 y el esta-
tus universitario en la columna 2. Para obtener las cantidades de celda observadas (Oij) 
para la tabla de contingencia 2 � 5, use Stat � Tables � Cross Tabulation and Chi-
Square para generar el cuadro de diálogo que se ve en la fi gura 14.6.
Bajo “Categorical Variables”, seleccione “Gender” para la variable de renglón y 
“Status” para la variable de columna. Deje las cajas marcadas “For Layers” y “Frequen-
C
I
I
I
Probabilidad_Mendenhall_14.indd 617Probabilidad_Mendenhall_14.indd 617 5/14/10 8:44:28 AM5/14/10 8:44:28 AM
 www.FreeLibros.me
618 ❍ CAPÍTULO 14 ANÁLISIS DE DATOS CATEGÓRICOS
cies are in:” en blanco. Asegúrese que el cuadro con leyenda “Display Counts” tenga 
marca de activado. Dé un clic en el botón Chi-Square… para exhibir el cuadro de diálo-
go de la fi gura 14.6. Seleccione las cajas para “Chi-Square Analysis” y “Expected Cell 
Counts”. Dé doble clic en OK. Esta secuencia de comandos no sólo tabula la tabla de 
contingencia, sino que también realiza la prueba ji cuadrada de independencia y exhibe 
los resultados en la ventana Session que se ve en la fi gura 14.7. Para los datos del estatus 
género/universidad, el valor p grande (P � .153) indica un resultado no signifi cativo. 
Hay sufi ciente evidencia para indicar que el género de un estudiante depende del estatus 
de clase.
Si las cantidades de celda observadas en la tabla de contingencia ya han sido tabula-
das, simplemente introduzca las cantidades en las columnas c de la hoja de trabajo MINI-
TAB, use Stat � Tables � Chi-Square Test (Two-Way Table in Worksheet) y selec-
cione las columnas apropiadas antes de dar clic en OK. Para los datos del estatus género/
universidad, se pueden introducir las cantidades en las columnas C3-C7 como se ve 
en la fi gura 14.8. La salida impresa resultante tendrá una leyenda diferente pero se verá 
exactamente como la salida impresa de la fi gura 14.7.
Una prueba sencilla de un solo experimento multinomial se puede iniciar al conside-
rar si las proporciones de estudiantes de estadística hombres y mujeres son iguales, es 
decir, p1 � .5 y p2 � .5.En MINITAB 15, use Stat � Tables � Chi-Square Goodness-of-Fit Test (One Va-
riable) para exhibir el cuadro de diálogo de la fi gura 14.9. Si usted tiene datos categóri-
cos sin elaborar en una columna, dé un clic en el botón “Categorical data:” e introduzca 
la columna “Gender” en la celda. Si tiene valores de resumen de cantidades observadas 
para cada categoría, escoja “Observed counts”. A continuación introduzca las cantida-
des observadas o teclee las cantidades observadas para cada categoría.
Para esta prueba, podemos seleccionar “Equal proportions” para probar H0 : p1 � 
p2 � .5. Cuando tenga proporciones diferentes para cada categoría, use “Specifi c propor-
FIGURA 14.6
●
Probabilidad_Mendenhall_14.indd 618Probabilidad_Mendenhall_14.indd 618 5/14/10 8:44:28 AM5/14/10 8:44:28 AM
 www.FreeLibros.me
	14 ANÁLISIS DE DATOS CATEGÓRICOS
	Repaso del capítulo

Continuar navegando