Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
TEMA “Aplicaciones de la distribución Chi Cuadrado: Prueba de Hipótesis No Paramétricas” Distribución de Probabilidad ■ Una distribución o densidad de probabilidad de una variable aleatoria x es la función de distribución de la probabilidad de dicha variable ■ Distribuciones probabilidad se identifican como discretas o continuas, de acuerdo al tipo de variable. ■ Existen infinitas distribuciones de probabilidad: una por cada población, pero hay ciertas distribuciones “modelo”: ◆ Binomial ◆ Hipergeométrica ◆ Multinomial ◆ Poisson ◆ Normal ◆ Chi-cuadrado ◆ t de Student, ◆ F de Fisher o Snedecor Variable Continua Variable Discreta Teoría del Muestreo Exacto Distribución “t” de Student APLICACIONES •Paramétrica: • Inferencia por Test de Hipótesis e Intervalos de Confianza de Media poblacional (con Varianza poblacional desconocida). • Comparación de dos Medias Poblacionales con Desvíos estándar iguales o desiguales. Otros casos. • Comparación de más de dos Medias Poblacionales, en un análisis de la Varianza (ANOVA). Pendiente Distribución "F” de Snedecor o Fisher APLICACIONES •Paramétrica: • Inferencia por Test de Hipótesis e Intervalos de Confianza de la diferencia de Varianzas poblacionales. • Comparación de más de dos Medias poblacionales en el Análisis de la Varianza (ANOVA). Pendiente Distribución Chi-cuadrado APLICACIONES • Paramétrica: • Inferencia por Test de Hipótesis e Intervalos de Confianza de Varianza poblacional. • No paramétrica: • Bondad de Ajuste - a probabilidades teóricas. - a distribuciones de probabilidad. • Pruebas de Independencia. • Pruebas de Homogeneidad. HOY Distribución Chi-cuadrado ■ Una Variable con distribución Chi-cuadrado se define como la suma de n variables normales estandarizadas elevadas al cuadrado. Tabla Distribución χ2 ■ Presenta algunos valores χ2 para varios δ, ■ Área a su derecha = α. ■ 1ª columna = δ ■ 1ª fila: áreas en la cola a la derecha de χ2 ■ Cuerpo tabla son los valores de χ2 PRUEBA DE BONDAD DE AJUSTE A PROBABILIDADES TEÓRICAS (frecuencias esperadas iguales o desiguales) ESTADÍSTICO DE PRUEBA CHI CUADRADO χ2 = ∑ { (fo – fe) 2 / fe } Con k – 1 = δ (grados de libertad) En la Hipótesis Nula se formula la relación en que teóricamente debieran presentarse las frecuencias observadas: “los datos observados se ajustan a la relación…” PRUEBA DE BONDAD DE AJUSTE A DISTRIBUCIONES DE PROBABILIDAD ESTADÍSTICO DE PRUEBA CHI CUADRADO χ2 = ∑ { (fo – fe) 2 / fe } Con k – 1 – m = δ (grados de libertad) donde m = cantidad de parámetros a estimar En la Hipótesis Nula se menciona la distribución de probabilidad a la que se supone se ajustan los datos observados: “los datos observados tienen una distribución aproximadamente Normal/Poisson/Binomial…” PRUEBA DE INDEPENDENCIA (análisis de tablas de contingencia) ESTADÍSTICO DE PRUEBA CHI CUADRADO χ2 = ∑ { (fo – fe) 2 / fe } Con (c-1).(r-1) = δ (grados de libertad) r = número de filas. c = número de columnas. FRECUENCIA ESPERADA fe = Total Fila * Total Columnas / Total Fila Columna PRUEBA DE HOMOGENEIDAD (extensión de una prueba de independencia) ESTADÍSTICO DE PRUEBA CHI CUADRADO χ2 = ∑ { (fo – fe) 2 / fe } Con (c-1).(r-1) = δ Se diferencia de la Prueba de Independencia conceptualmente: • Se usan para determinar si diferentes muestras provienen de la misma población. • Se realizan con 2 o más muestras independientes, de poblaciones homogéneas o no. • Los totales de filas y columnas son generalmente tamaños diseñados por el investigador. Pruebas para confirmar Normalidad • Test de Kolmogorov Smirnov. •Test de Anderson Darling. • Shapiro Wilks. • Otros… Bubba Pasta es una cadena de restaurantes ubicados a lo largo de la costa del Golfo de Florida. Bubba, el propietario, desea añadir filete a su menú. Antes de hacerlo, decide llevar a cabo una encuesta entre personas adultas para saber cuál es su platillo favorito cuando comen fuera de casa. Se seleccionó una muestra de 120 adultos y les pidió que indicaran su comida favorita cuando salen a cenar. Los resultados se reportan en la siguiente tabla. Plato favorito Frecuencia Pollo 32 Pescado 24 Carne 35 Pasta 29 Total 120 ¿Es razonable concluir que no hay preferencia entre los cuatro platillos? Utilizar un Nivel de Significación de 0,05 Caso Práctico: Bondad de Ajuste a Probabilidades Teóricas PRUEBA DE BONDAD DE AJUSTE A PROBABILIDADES TEÓRICAS (frecuencias esperadas iguales o desiguales) ESTADÍSTICO DE PRUEBA CHI CUADRADO χ2 = ∑ { (fo – fe) 2 / fe } Con k – 1 = δ (grados de libertad) En la Hipótesis Nula se formula la relación en que teóricamente debieran presentarse las frecuencias observadas: “los datos observados se ajustan a la relación…” El Ministerio de Salud de una comunidad, reporta la siguiente información respecto del número de veces que los adultos mayores son admitidos en un hospital durante un periodo de un año. Cuarenta por ciento no es admitido, 30% es admitido una vez, 20% son admitidos dos veces y 10% restante es admitido tres o más veces. Una encuesta que abarcó a 150 residentes de esa comunidad con una población predominante de adultos mayores activos, reveló que 55 residentes no ingresaron durante el año pasado, 50 fueron admitidos en un hospital una vez, 32 fueron admitidos dos veces, y el resto fueron admitidos tres o más veces. N° admisión fo fe 0 55 60 (40%) 1 50 45 (30%) 2 32 30 (20%) 3 o + 13 15 (10%) Total 150 150 ¿Es posible concluir que la encuesta es consistente con la información sugerida por el Ministerio? Utilizar el nivel de significancia 0,05 Caso Práctico: Bondad de Ajuste a Probabilidades Teóricas La razón Costo-Beneficio de 25 acciones en el mercado de valores presenta la siguiente distribución de frecuencias. Caso Práctico: Bondad de Ajuste a Distribuciones Intervalo Frecuencia De 5 a 9 3 De 9 a 13 5 De 13 a 17 7 De 17 a 21 6 De 21 a 25 3 De 25 a 29 1 Total 25 ¿Puede afirmarse que dicha relación se ajusta a una distribución Normal de probabilidad con un Nivel de Significación de 0,01? PRUEBA DE BONDAD DE AJUSTE A DISTRIBUCIONES DE PROBABILIDAD ESTADÍSTICO DE PRUEBA CHI CUADRADO χ2 = ∑ { (fo – fe) 2 / fe } Con k – 1 – m = δ (grados de libertad) donde m = cantidad de parámetros a estimar En la Hipótesis Nula se menciona la distribución de probabilidad a la que se supone se ajustan los datos observados: “los datos observados se tienen una distribución aproximadamente Normal/Poisson/Binomial…” Intervalo Fo Intervalos en z Probabilidad Fe F´o F´e (Fo-Fe)2/Fe De 5 a 9 3 .- ∞ -1,24 0,1075 2,6875 De 9 a 13 5 -1,24 -0,49 0,2046 5,115 8 7,8025 0,005 De 13 a 17 7 -0,49 0,25 0,2866 7,165 7 7,165 0,0038 De 17 a 21 6 0,25 1,00 0,2426 6,065 6 6,065 0,0007 De 21 a 25 3 1,00 1,74 0,1178 2,945 4 3,9675 0,0003 De 25 a 29 1 1,74 ∞ 0,0409 1,0225 Total 25 1 25 25 25 0,0098 x = 15,64 S = 5,3765 Los alumnos del curso de Estadística Inferencial para Licenciados en Economía Política fueron clasificados según la calificación final en: Insuficiente, Regular o Promovido, por sexo. Los resultados del curso se resumen en la siguiente tabla de contingencia: Caso Práctico: Prueba de Independencia Sexo Calificación Hombre Mujer Total Insuficiente 22 14 36 Regular 9 6 15 Promovido 12 32 44 Total 43 52 95 Con un Nivel de Significación del 0,05 ¿es el sexo de los alumnos independiente de la calificación final obtenida? PRUEBA DE INDEPENDENCIA (análisis de tablas de contingencia) ESTADÍSTICO DE PRUEBA CHI CUADRADO χ2 = ∑ { (fo – fe) 2 / fe } Con (c-1).(r-1) = δ (grados de libertad) r = número de filas. c = número de columnas. FRECUENCIA ESPERADA fe = Total Fila * Total Columnas / Total Fila Columna Un grupo de investigación está estudiando las opiniones de (a favor o en contra) de algunas políticas en materia turística implementadas por el gobierno provincial. Relevamientos en tres ciudades de la Provinciaarrojan los siguientes resultados, al respecto: Caso Práctico: Prueba de Homogeneidad Sexo Opinión Humahuaca Purmamarca La Quiaca Total A favor 103 47 53 208 En contra 47 28 22 92 Total 150 75 75 300 Con un Nivel de Significación del 0,05 ¿las opiniones respecto de las políticas en materia turística, son homogéneas en las tres ciudades (provienen de una misma población?) ? PRUEBA DE HOMOGENEIDAD (extensión de una prueba de independencia) ESTADÍSTICO DE PRUEBA CHI CUADRADO χ2 = ∑ { (fo – fe) 2 / fe } Con (c-1).(r-1) = δ Se diferencia de la Prueba de Independencia conceptualmente: • Se usan para determinar si diferentes muestras provienen de la misma población. • Se realizan con 2 o más muestras independientes, de poblaciones homogéneas o no. • Los totales de filas y columnas son generalmente tamaños diseñados por el investigador.
Compartir