Logo Studenta

Unidad 5 - Chi Cuadrado - Pruebas No Paramétricas

¡Este material tiene más páginas!

Vista previa del material en texto

TEMA
“Aplicaciones de la distribución Chi Cuadrado:
Prueba de Hipótesis No Paramétricas”
Distribución de Probabilidad
■ Una distribución o densidad de probabilidad de una 
variable aleatoria x es la función de distribución de la 
probabilidad de dicha variable
■ Distribuciones probabilidad se identifican como discretas 
o continuas, de acuerdo al tipo de variable.
■ Existen infinitas distribuciones de probabilidad: una por 
cada población, pero hay ciertas distribuciones “modelo”:
◆ Binomial
◆ Hipergeométrica
◆ Multinomial
◆ Poisson
◆ Normal
◆ Chi-cuadrado
◆ t de Student, 
◆ F de Fisher o Snedecor
Variable Continua
Variable Discreta
Teoría del Muestreo Exacto
Distribución “t” de Student
APLICACIONES
•Paramétrica:
• Inferencia por Test de Hipótesis e Intervalos de 
Confianza de Media poblacional (con Varianza 
poblacional desconocida).
• Comparación de dos Medias Poblacionales con 
Desvíos estándar iguales o desiguales. Otros casos.
• Comparación de más de dos Medias Poblacionales, 
en un análisis de la Varianza (ANOVA). 
Pendiente
Distribución "F” de Snedecor o Fisher
APLICACIONES
•Paramétrica:
• Inferencia por Test de Hipótesis e Intervalos de 
Confianza de la diferencia de Varianzas 
poblacionales.
• Comparación de más de dos Medias poblacionales en 
el Análisis de la Varianza (ANOVA).
Pendiente
Distribución Chi-cuadrado
APLICACIONES
• Paramétrica:
• Inferencia por Test de Hipótesis e Intervalos de 
Confianza de Varianza poblacional.
• No paramétrica:
• Bondad de Ajuste - a probabilidades teóricas.
- a distribuciones de probabilidad.
• Pruebas de Independencia.
• Pruebas de Homogeneidad.
HOY
Distribución Chi-cuadrado
■ Una Variable con distribución Chi-cuadrado se 
define como la suma de n variables normales 
estandarizadas elevadas al cuadrado.
Tabla Distribución χ2
■ Presenta algunos valores 
χ2 para varios δ,
■ Área a su derecha = α.
■ 1ª columna = δ 
■ 1ª fila: áreas en la cola a 
la derecha de χ2 
■ Cuerpo tabla son los 
valores de χ2
PRUEBA DE BONDAD DE AJUSTE 
A PROBABILIDADES TEÓRICAS
(frecuencias esperadas iguales o desiguales)
ESTADÍSTICO DE PRUEBA CHI CUADRADO
χ2 = ∑ { (fo – fe)
2 / fe }
Con k – 1 = δ (grados de libertad)
En la Hipótesis Nula se formula la relación en que teóricamente 
debieran presentarse las frecuencias observadas: “los datos 
observados se ajustan a la relación…”
PRUEBA DE BONDAD DE AJUSTE 
A DISTRIBUCIONES DE PROBABILIDAD
ESTADÍSTICO DE PRUEBA CHI CUADRADO
χ2 = ∑ { (fo – fe)
2 / fe }
Con k – 1 – m = δ (grados de libertad)
donde m = cantidad de parámetros a estimar
En la Hipótesis Nula se menciona la distribución de probabilidad a 
la que se supone se ajustan los datos observados: “los datos 
observados tienen una distribución aproximadamente 
Normal/Poisson/Binomial…”
PRUEBA DE INDEPENDENCIA
(análisis de tablas de contingencia)
ESTADÍSTICO DE PRUEBA CHI CUADRADO
χ2 = ∑ { (fo – fe)
2 / fe }
Con (c-1).(r-1) = δ (grados de libertad)
r = número de filas.
c = número de columnas.
FRECUENCIA ESPERADA 
fe = Total Fila * Total Columnas / Total Fila Columna
PRUEBA DE HOMOGENEIDAD
(extensión de una prueba de independencia)
ESTADÍSTICO DE PRUEBA CHI CUADRADO
χ2 = ∑ { (fo – fe)
2 / fe } Con (c-1).(r-1) = δ
Se diferencia de la Prueba de Independencia conceptualmente:
• Se usan para determinar si diferentes muestras provienen de la 
misma población.
• Se realizan con 2 o más muestras independientes, de 
poblaciones homogéneas o no.
• Los totales de filas y columnas son generalmente tamaños 
diseñados por el investigador.
Pruebas para confirmar Normalidad
• Test de Kolmogorov Smirnov.
 
•Test de Anderson Darling.
• Shapiro Wilks.
• Otros…
Bubba Pasta es una cadena de restaurantes ubicados a lo largo de la 
costa del Golfo de Florida. Bubba, el propietario, desea añadir 
filete a su menú. Antes de hacerlo, decide llevar a cabo una 
encuesta entre personas adultas para saber cuál es su platillo 
favorito cuando comen fuera de casa. Se seleccionó una muestra de 
120 adultos y les pidió que indicaran su comida favorita cuando 
salen a cenar. Los resultados se reportan en la siguiente tabla.
Plato favorito Frecuencia
Pollo 32
Pescado 24
Carne 35
Pasta 29
Total 120
¿Es razonable concluir que no hay preferencia entre los cuatro platillos?
Utilizar un Nivel de Significación de 0,05
Caso Práctico: Bondad de Ajuste a Probabilidades Teóricas
PRUEBA DE BONDAD DE AJUSTE 
A PROBABILIDADES TEÓRICAS
(frecuencias esperadas iguales o desiguales)
ESTADÍSTICO DE PRUEBA CHI CUADRADO
χ2 = ∑ { (fo – fe)
2 / fe }
Con k – 1 = δ (grados de libertad)
En la Hipótesis Nula se formula la relación en que teóricamente 
debieran presentarse las frecuencias observadas: “los datos 
observados se ajustan a la relación…”
El Ministerio de Salud de una comunidad, reporta la siguiente información 
respecto del número de veces que los adultos mayores son admitidos en un 
hospital durante un periodo de un año. Cuarenta por ciento no es admitido, 30% 
es admitido una vez, 20% son admitidos dos veces y 10% restante es admitido 
tres o más veces.
Una encuesta que abarcó a 150 residentes de esa comunidad con una población 
predominante de adultos mayores activos, reveló que 55 residentes no ingresaron 
durante el año pasado, 50 fueron admitidos en un hospital una vez, 32 fueron 
admitidos dos veces, y el resto fueron admitidos tres o más veces. 
N° admisión fo fe
0 55 60 (40%)
1 50 45 (30%)
2 32 30 (20%)
3 o + 13 15 (10%)
Total 150 150
¿Es posible concluir que la encuesta es consistente con la información sugerida por el 
Ministerio? Utilizar el nivel de significancia 0,05
Caso Práctico: Bondad de Ajuste a Probabilidades Teóricas
La razón Costo-Beneficio de 25 acciones en el mercado de valores 
presenta la siguiente distribución de frecuencias. 
Caso Práctico: Bondad de Ajuste a Distribuciones
Intervalo Frecuencia
De 5 a 9 3
De 9 a 13 5
De 13 a 17 7
De 17 a 21 6
De 21 a 25 3
De 25 a 29 1
Total 25
¿Puede afirmarse que dicha relación se ajusta a una distribución 
Normal de probabilidad con un Nivel de Significación de 0,01?
PRUEBA DE BONDAD DE AJUSTE 
A DISTRIBUCIONES DE PROBABILIDAD
ESTADÍSTICO DE PRUEBA CHI CUADRADO
χ2 = ∑ { (fo – fe)
2 / fe }
Con k – 1 – m = δ (grados de libertad)
donde m = cantidad de parámetros a estimar
En la Hipótesis Nula se menciona la distribución de probabilidad a 
la que se supone se ajustan los datos observados: “los datos 
observados se tienen una distribución aproximadamente 
Normal/Poisson/Binomial…”
Intervalo Fo Intervalos en z Probabilidad Fe F´o F´e (Fo-Fe)2/Fe
De 5 a 9 3 .- ∞ -1,24 0,1075 2,6875 
De 9 a 13 5 -1,24 -0,49 0,2046 5,115 8 7,8025 0,005
De 13 a 17 7 -0,49 0,25 0,2866 7,165 7 7,165 0,0038
De 17 a 21 6 0,25 1,00 0,2426 6,065 6 6,065 0,0007
De 21 a 25 3 1,00 1,74 0,1178 2,945 4 3,9675 0,0003
De 25 a 29 1 1,74 ∞ 0,0409 1,0225 
Total 25 1 25 25 25 0,0098
x = 15,64
S = 5,3765
Los alumnos del curso de Estadística Inferencial para Licenciados 
en Economía Política fueron clasificados según la calificación final 
en: Insuficiente, Regular o Promovido, por sexo. Los resultados del 
curso se resumen en la siguiente tabla de contingencia:
Caso Práctico: Prueba de Independencia
Sexo
Calificación
Hombre Mujer Total
Insuficiente 22 14 36
Regular 9 6 15
Promovido 12 32 44
Total 43 52 95
Con un Nivel de Significación del 0,05 ¿es el sexo de los 
alumnos independiente de la calificación final obtenida?
PRUEBA DE INDEPENDENCIA
(análisis de tablas de contingencia)
ESTADÍSTICO DE PRUEBA CHI CUADRADO
χ2 = ∑ { (fo – fe)
2 / fe }
Con (c-1).(r-1) = δ (grados de libertad)
r = número de filas.
c = número de columnas.
FRECUENCIA ESPERADA 
fe = Total Fila * Total Columnas / Total Fila Columna
Un grupo de investigación está estudiando las opiniones de (a favor 
o en contra) de algunas políticas en materia turística 
implementadas por el gobierno provincial. Relevamientos en tres 
ciudades de la Provinciaarrojan los siguientes resultados, al 
respecto:
Caso Práctico: Prueba de Homogeneidad
Sexo
Opinión
Humahuaca Purmamarca La Quiaca Total
A favor 103 47 53 208
En contra 47 28 22 92
Total 150 75 75 300
Con un Nivel de Significación del 0,05 ¿las opiniones respecto 
de las políticas en materia turística, son homogéneas en las tres 
ciudades (provienen de una misma población?) ?
PRUEBA DE HOMOGENEIDAD
(extensión de una prueba de independencia)
ESTADÍSTICO DE PRUEBA CHI CUADRADO
χ2 = ∑ { (fo – fe)
2 / fe } Con (c-1).(r-1) = δ
Se diferencia de la Prueba de Independencia conceptualmente:
• Se usan para determinar si diferentes muestras provienen de la 
misma población.
• Se realizan con 2 o más muestras independientes, de 
poblaciones homogéneas o no.
• Los totales de filas y columnas son generalmente tamaños 
diseñados por el investigador.

Otros materiales