Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
¿Alguno de ellos nos proporcionara mayor blancura? ¿Todos los detergentes serán iguales? ¿Se podrá determinar si existe diferencia significativa entre los tipos de detergentes? SITUACIÓN PROBLEMA: Supongamos una empresa que tiene cuatro tiendas ubicadas en cuatro zonas de Lima, el gerente de la empresa conoce que la distribución del porcentaje de sus clientes es 20%, 30%, 40% y 10% en sus tiendas respectivamente; pero sospecha que debido a un cambio de imagen se ha producido una modificación en la distribución porcentual de sus clientes, ¿como podríamos verificar si se produjo este cambio o no?. Este es un típico caso donde es útil usar la prueba de bondad de ajuste. APLICACIONES DE LA DISTRIBUCIÓN CHI-CUADRADO LOGRO DE SESIÓN: o Al término de la sesión, el estudiante resuelve ejercicios de pruebas de hipótesis de Chi-Cuadrado, aplicando los diferentes casos hipotéticos según el tipo de variables y su relación entre las variables, demostrando dominio de tema y la presentación de ejercicios en el tiempo establecido. USOS DE LA CHI-CUADRADO: Para hacer inferencias acerca de la varianza poblacional. Es decir, para calcular Intervalos de Confianza y Prueba de hipótesis para la varianza poblacional. Para hacer pruebas de Bondad de Ajuste. O sea, para probar si un conjunto de datos sigue una distribución pre-determinada. Para hacer análisis de tablas de contingencia. TEMAS RELACIONADOS: Ajuste de distribuciones: Es un contraste de significación para saber si los datos de una muestra son conformes a una ley de distribución teórica que sospechamos que es la correcta. Homogeneidad de varias muestras cualitativas: Sirve para contrastar la igualdad de procedencia de un conjunto de muestras de tipo cualitativo. Tablas de contingencia: Es un contraste para determinar la dependencia o independencia de caracteres cualitativos. PRUEBA DE BONDAD DE AJUSTE: Esta prueba se usa cuando se quiere probar la hipótesis de que unos datos muéstrales provienen de una determinada distribución. Para esta prueba es necesario agrupar o distribuir las observaciones de la muestra en intervalos de clase, preferiblemente del mismo tamaño. PRUEBA DE BONDAD DE AJUSTE: El estadístico de prueba es: K i i ii E EO X 1 2 2 )( Donde: Oi = Total de valores que caen en el intervalo i. Ei = Número esperado de valores en el intervalo i. k = Número de intervalos de clase en que se distribuyen las observaciones. El número esperado de observaciones para ese intervalo está dado por: Ei =nPi Donde: Pi es la probabilidad de que una observación quede en el intervalo i, de acuerdo con la función de densidad que se esté analizando, y n es el número total de observaciones. PRUEBA DE BONDAD DE AJUSTE: Las pruebas de hipótesis son: H0: La forma de la distribución es una distribución … H1: La forma de la distribución no es una distribución … Debe de rechazarse H0 si: Donde: k es el número de intervalos de clase. p es el número de parámetros de la distribución que se va analizar. α: nivel de significancia. Si la frecuencia esperada en una celda es menor que 5, se combina esta celda con la celda anterior o con las que sea necesario para ser mayor o igual a 5. …CONTINUACIÓN: Si la hipótesis nula es cierta entonces: tiene una distribución X2 con k-p-1 grados de libertad. k i i ii E EO 1 2 2 )( (son k-p-1 grados de libertad, porque si sabemos k-1 de las pi, también sabemos la k-ésima, pues su suma es 1 y los “p” parámetros es cero). Finalmente, para hacer la prueba se compara el valor computado de X2 con el valor X2 k-p-1, α obtenido de la tabla de la distribución Ji Cuadrado con k-p-1 grados de libertad. Se Rechazo la hipótesis nula al nivel de significancia α(100)% si observamos que X2 > X2 k-p-1, α CHI-CUADRADO: REGIÓN DE RECHAZO HO EJEMPLO: El número de defectos por unidad observada en una muestra de 100 radios dio la siguiente distribución de frecuencias: Número de defectos 0 1 2 3 4 5 6 7 Número de radios 28 32 15 10 6 4 3 2 Verificar si la distribución de estos datos se aproxima a la distribución Poisson con un nivel de significancia de 5% SOLUCIÓN: 1. Ho: La distribución de los datos es Poisson. 2. H1: La distribución de los datos no es Poisson. 3. Nivel de significancia: α = 0.05 4. Estadístico de prueba: Donde: Los esperados iij nPE 5. Regla de decisión: Rechazar H0 si: X2 > X2 k-p-1, α Cálculos: Valor crítico: K = 5, p =1, luego: X2 k-p-1, α = X2 5-1-1, 0.05 = X2 3, 0.05 = 7.815 Estadístico de Prueba: El parámetro de la distribución Poisson es la media, que es desconocida y debe estimarse a través de los datos: 𝑥 = 1.68 k i i ii E EO 1 2 2 )( TABLA DE PROBABILIDAD DE LA DISTRIBUCIÓN CHI CUADRADO Grados de Libertad: gl = 3 Nivel de significancia: = 0.05 χ2 = 7.8147 χ2 = 7.8147 Región de Rechazo de H0 SOLUCIÓN: CONTINUACIÓN … Número de defectos: x pi = P[X = x] Ei = npi Oi i ii E EO 2)( 0 1 2 3 4 5 6 7 0.18637 0.31311 0.26301 0.14729 0.06186 0.02079 0.08986 0.00582 0.00140 18.6374 31.31083 26.3011 14.72861 8.986175 28 32 15 10 6 4 = 15 3 2 4.703356 0.015169 4.855872 1.518119 4.024636 Total 15.11715 Luego, el valor estadístico es: X2 = 15.11715 = 7.815 15.117 Conclusión: Se rechaza Ho, es decir, los datos no se ajustan a una distribución Poisson, con un nivel de significancia del 5% La Pasta Italiana es una cadena de restaurantes ubicados a lo largo de la costa peruana, el propietario, desea añadir filete a su menú. Antes de hacerlo, decide contratar a Mognolia, para que lleve a cabo una encuesta entre personas adultas para saber cual es su platillo favorito cuando comen fuera de casa. Magnolia seleccionó una muestra de 120 adultos y les pidió que indicaran su comida favorita cuando salen a cenar. ¿Es razonable concluir que no hay preferencia entre los cuatro platillos? EJEMPLO Plato favorito Frecuencia Pollo 32 Pescado 24 Carne 35 Pasta 29 Total 120 Paso1. Formule las hipótesis nula y alterna. Ho: No hay diferencia entre las proporciones de adultos que eligen cada platillo. H1: Existe diferencia entre las proporciones de adultos que eligen cada platillo. Continue … SOLUCIÓN: PRUEBA DE INDEPENDENCIA DE DOS VARIABLES: Las Hipótesis nula y alternativa: H0: Las variables son independientes entre sí H1: Las variables no son independientes entre sí Los datos se refieren a dos variables de escala nominal Cada variable tiene dos o más categorías Se debe usar la prueba chi cuadrada para poner a prueba si existe o no una relación entre las variables En la Prueba de Independencia de dos variables: PRUEBA DE INDEPENDENCIA DE DOS VARIABLES: O un agente de seguros tal vez quiera determinar si diferentes grupos ocupacionales tienden a sufrir diferentes tipos de lesiones en el trabajo Al director de una campaña le puede interesar si la afiliación a un partido se relaciona con el nivel educativo Por ejemplo: David Plouffe, director de la campaña presidencial de Barack Obama Venta de seguros, una profesión y una carrera con proyección de futuro. PRUEBA DE INDEPENDENCIA DE DOS VARIABLES: El propósito de la prueba chi cuadrada en tales aplicaciones no es identificar la naturaleza exacta de una relación entre las variables nominales; La meta de esta técnica es simplemente probar si las variables son o no independientes entre sí. PRUEBA DE INDEPENDENCIA DE DOS VARIABLES: PROCEDIMIENTO DE LA PRUEBA Crear la tabla de contingencias Una tabla de contingencias tiene r filas y k columnas. Comparar las tablas de frecuencias observadas y de frecuencias esperadas Medir la diferenciaentre estas tablas mediante el estadístico de prueba χ2 Las frecuencias observadas reflejarán una clasificación cruzada de los integrantes de una sola muestra La tabla de frecuencias esperadas se construye suponiendo que la hipótesis nula es verdadera ESTADISTICO DE PRUEBA: o r: Número de filas en la tabla de contingencia o c: Número de columnas en la tabla de contingencia o Oij: Frecuencia observada en la fila i, columna j o Eij: Frecuencia esperada en la fila i, columna j o gl = (r – 1) (c – 1) (gl = df) r 1i c 1j ij 2 ijij2 0 E EO χ El estadístico chi cuadrado ( χ2) de la prueba se calcula: Las frecuencias esperadas cuando se pone a prueba la independencia de las variables: La frecuencia esperada en la fila i, columna j es: Eij = Ri(Cj)/n Donde: Ri: total de la fila i. Cj: total de la columna j. n : El número total de observaciones ESTADISTICO DE PRUEBA: EJEMPLO: El tipo de vehículo (auto, camioneta, camión de carga) El comportamiento del conductor frente a la señal de alto (alto total, casi detenido, no respeta la señal) Una investigadora de seguridad de tránsito observó 500 vehículos en una señal de alto en un vecindario suburbano y registró: Conducta en la señal de alto Total Detenido Avanza sin motor No respeta la señal Tipo de vehículo Sedán 183 107 60 350 Camioneta 54 27 19 100 Camión de carga 14 20 16 50 Total 251 154 95 500 Con un nivel de confianza de 0.05, ¿puede haber alguna relación entre el comportamiento del conductor y el tipo de vehículo que conduce? SOLUCIÓN: Formulamos las hipótesis nula y alternativa: H0: La conducta del conductor y el tipo de vehículos son independientes. H1: Existe una relación entre las variables anteriores. La tabla de las frecuencias observadas refleja las intersecciones de las diversas categorías de las dos variables. Por ejemplo: se observaron 183 personas que conducían sedán y estaban detenidos en la señal de alto. La tabla de contingencia tiene r = 3 filas y c = 3 columnas SOLUCIÓN: Fila i = 1, columna j = 1: Fila i = 2, columna j = 1: Fila i = 3, columna j = 1: 175.7 500 350(251)CR E 1111 n 50.2 500 100(251)CR E 221 n 1 5.1 500 50(251) E31 2 13 n CR Conducta en la señal de alto Total Detenido Avanza sin motor No respeta la señal Tipo de vehículo Sedán 183 107 60 350 Camioneta 54 27 19 100 Camión de carga 14 20 16 50 Total 251 154 95 500 Fila i = 1, columna j = 2: Fila i = 2, columna j = 2: Fila i = 3, columna j = 2: 8.1072112 500 350(154) E n CR 8.302222 500 100(154) E n CR 4.152332 500 50(154) E n CR Fila i = 1, columna j = 3: Fila i = 2, columna j = 3: Fila i = 3, columna j = 3: 5.663113 500 350(95) E n CR 193223 500 100(95) E n CR 5.93333 500 50(95) E n CR SOLUCIÓN: ESPERADO Conducta en la señal de alto Total Detenido Avanza sin motor No respeta la señal Tipo de vehículo Sedán 175.7 107.8 66.5 350 Camioneta 50.2 30.8 19 100 Camión de carga 25.1 15.4 9.5 50 Total 251 154 95 500 OBSERVADO Conducta en la señal de alto Total Detenido Avanza sin motor No respeta la señal Tipo de vehículo Sedán 183 107 60 350 Camioneta 54 27 19 100 Camión de carga 14 20 16 50 Total 251 154 95 500 SOLUCIÓN: Determinamos el valor del estadístico de prueba χ2: 431.12 5.9 5.916 4.15 4.1520 1.25 1.2514 19 1919 8.30 2.50 2.5054 5.66 5.6660 8.107 8.107107 7.175 7.175183 22222 2222 2 0 r 1i c 1j ij 2 ijij2 0 χ 30.8-27 E EO χ Para determinar el valor crítico de la prueba χ2, tomamos el nivel de significancia de 0.05 y calculamos los grados de libertad: df = (r – 1) (c – 1) = (3 – 1) (3 – 1) = 2 x 2 = 4 → df = 4 TABLA DE PROBABILIDAD DE LA DISTRIBUCIÓN CHI CUADRADO Grados de Libertad: gl = 4 Nivel de significancia: = 0.05 χ2 = 9.49 χ2 = 9.49 Región de Rechazo de H0 SOLUCIÓN: R.A. R.C. α = 0.05 Χ2 = 9.49 Χ0 2 = 12.431 El valor crítico de χ2 es 9.49 Observamos que el valor calculado de χ2 cae en la región crítica, por lo tanto: La hipótesis nula se rechaza con un nivel de significancia de 0.05. Concluimos que existe una relación entre las variables. ¿CÓMO RESOLVER PROBLEMAS APLICANDO LA DISTRIBUCIÓN CHI- CUADRADO CON RESPECTO A LA SITUACIÓN PROBLEMA, CON UN NIVEL DE SIGNIFICACIÓN DEL 5%, ¿SE HABRÁ PRODUCIDO UNA MODIFICACIÓN EN LA DISTRIBUCIÓN PORCENTUAL DE SUS CLIENTES O NO?. ¿ QUÉ HEMOS APRENDIDO HOY? BIBLIOGRAFÍA BÁSICA: Nro. CÓDIGO AUTOR TÍTULO AÑO 1 519.2 SCHE SCHEAFFER Mc. CLAVE PROBABILIDAD Y ESTADÍSTICA PARA INGENIERÍA 2005 2 519.5 LEVI/P LEVINE- KREHBIEL- BERENSON ESTADÍSTICA PARA ADMINISTRACIÓN. 2006 3 519.2 HINE WILLIAM W. HINES DOUGLAS C. MONTGOMERY DAVID M. GOLDSMAN CONNIE M. BORROR PROBABILIDAD Y ESTADÍSTICA PARA INGENÍERIA 2011 Estimado estudiante, puedes revisar los siguientes textos que se encuentran en tu biblioteca:
Compartir