Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA FACULTAD DE ECONOMÍA Y PLANIFICACIÓN DEPARTAMENTO DE ESTADÍSTICA E INFORMÁTICA CURSO: MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN TAREA 1: APLICACIONES CHI-CUADRADO Tema: Aplicaciones Chi-Cuadrado Profesora: Ing. Denise Rosalyn Chalan Llajaruna Integrantes: - Custodio Jaimes, Rosa María 20181002 - Omonte Vargas, Jhon Antony 20190180 - Rojas Espinoza, José Miguel 20181022 - Ruiz Anchelia, Fernanda Elizabeth 20190188 - Ruiz Rodriguez, Jesus Omar 20190137 Grupo: 7 Ciclo: 2021-I La Molina, 2021 1. Problemas y soluciones A continuación, se mostrarán los problemas con su respectiva solución correspondiente al presente grupo de estudiantes del curso de Métodos Estadísticos para la Investigación. 1.1. Problema N°2 Un investigador realiza un estudio para determinar la opinión de los ingenieros de industrias alimentarias sobre un nuevo conservante de alimentos. Tomó una muestra aleatoria de 350 ingenieros, y obtuvo los siguientes resultados: Opinión Muy bueno Bueno Regular Malo Total Frecuencia 50 75 130 95 350 Pruebe si la opinión de los ingenieros de industrias alimentarias respecto al nuevo conservante no se distribuye en la proporción: 3:4:6:5. Use = 0.04.α 1.1.1. Solución del problema N°2 P1) Planteamiento de la hipótesis: Ho: La opinión de los ingenieros de industrias alimentarias respecto al nuevo conservante se distribuye en la proporción: 3:4:6:5. H1: La opinión de los ingenieros de industrias alimentarias respecto al nuevo conservante no se distribuye en la proporción: 3:4:6:5. P2) Nivel de significación: = 0.04α P3) Cálculo del estadístico de Prueba 𝑥2 𝑐 = 𝑖=1 𝑘 ∑ (𝑜 𝑖 −𝑒 𝑖 )2 𝑒 𝑖 ∼ 𝑥 (4−1) 2 N° Categoría de la variable cualitativa (Opinión) Frecuencia observada (𝑂 𝑖 ) Frecuencia teórica (π 𝑖 ) Frecuencia esperada (𝑒 𝑖 = 𝑛 π 𝑖 ) 𝑋 𝑐 2 1 Muy bueno 50 0.167 58.333 1.191 2 Bueno 75 0.222 77.778 0.099 3 Regular 130 0.333 116.667 1.524 4 Malo 95 0.278 97.222 0.051 Total 350 1 350 2.864 P4) Criterio de Decisión Como el: 𝑥 𝑐𝑟𝑖𝑡 2 = 𝑥 𝑡𝑎𝑏 2 = 𝑥 (0.096,3) = 8. 311 Luego: 𝑥 𝑐 2 = 2. 864 ≤ 8. 311 A un nivel de 0.04 de significación no existe evidencia estadística para rechazar Ho. P5) Conclusión Aún nivel de significancia 0.04 no existe evidencia estadística suficiente para rechazar la opinión de los ingenieros de industrias alimentarias respecto al nuevo conservante no se distribuye en la proporción: 3:4:6:5. 1.2. Problema N° 4 El jefe de control de calidad de una fábrica de piezas de automóviles, analiza el número de piezas defectuosas al tomar muestras de 4 piezas que salen de una línea de ensamblaje. Luego de seleccionar 120 muestras de 4 piezas cada una, se obtienen los resultados que se presentan a continuación: Número de piezas defectuosas 0 1 2 3 4 Número de muestras 3 5 17 5 3 En los registros históricos se conoce que el 9% de las piezas de automóviles tienen defectos. Utilice estos datos para realizar la prueba respectiva a fin de determinar la distribución de la variable en estudio al 5% de significación. 1.2.1. Solución del problema N°4 P1) Planteamiento de la hipótesis: Ho= Los datos provenientes del número de piezas defectuosas encontradas en las muestras se ajustan a una distribución binomial. H1= Los datos provenientes del número de piezas defectuosas encontradas en las muestras no se ajustan a una distribución binomial. P2) Nivel de significación: = 0.05α P3) Cálculo del estadístico de Prueba. 𝑥2 𝑐 = 𝑖=1 𝑘 ∑ (𝑜 𝑖 −𝑒 𝑖 )2 𝑒 𝑖 ∼ 𝑥 (𝑘−𝑚−1) 2 𝑟 = 4; 𝑝 = 0. 09; 𝑘 = 5; 𝑚 = 0 ℼ1 = 0.68575= 𝑃(𝑋 = 0) =𝐶 0 4 (0, 09) 0 (1 − 0, 09) 4−0 ℼ2 = 0.27129= 𝑃(𝑋 = 1) =𝐶 1 4 (0, 09) 1 (1 − 0, 09) 4−1 ℼ3 = 0.04025= 𝑃(𝑋 = 2) =𝐶 2 4 (0, 09) 2 (1 − 0, 09) 4−2 ℼ4 = 0.00265= 𝑃(𝑋 = 3) =𝐶 3 4 (0, 09) 3 (1 − 0, 09) 4−3 ℼ5 = 0.00006= 𝑃(𝑋 = 4) =𝐶 4 4 (0, 09) 4 (1 − 0, 09) 4−4 N° Número de piezas defectuosas (𝑋 𝑖 ) Número de muestras (𝑂 𝑖 ) 𝑋 𝑖 𝑂 𝑖 (π 𝑖 ) (𝑒 𝑖 = 𝑛 π 𝑖 ) (𝑜 𝑖 −𝑒 𝑖 )2 𝑒 𝑖 1 0 65 0 0.68575 82.28995 3.63279 2 1 30 30 0.27129 32.55427 0.20041 3 2 17 34 0.04025 4.82948 30.67029 4 3 5 15 0.00265 0.31843 68.82931 5 4 3 12 0.00006 0.00787 1137.12630 Total 120 91 1 120 1294.03183 Cuando los valores de la frecuencia esperada son menores a 5, la Chi-Cuadrado calculada es errónea. En este caso, las filas 3, 4 y 5 son las que presentan valores menores a 5 en la ; por ello la resulta en un valor muy alto. Para solucionar𝑒 𝑖 𝑥2 𝑐 esto es necesario reagrupar la tabla, uniendo las filas de tal manera que todas tengan frecuencias esperadas mayores a 5. Agrupando los valores de las filas 3, 4 y 5, salvo la columna de contribuciones a la Chi-Cuadrado se obtiene la tabla final. N° Número de piezas defectuosas (𝑋 𝑖 ) Número de muestras (𝑂 𝑖 ) 𝑋 𝑖 𝑂 𝑖 (π 𝑖 ) (𝑒 𝑖 = 𝑛 π 𝑖 ) (𝑜 𝑖 −𝑒 𝑖 )2 𝑒 𝑖 1 0 65 0 0.68575 82.28995 3.63279 2 1 30 30 0.27129 32.55427 0.20041 3 2,3 y 4 25 61 0.04296 5.15578 76.37896 Total 120 91 1 120 80.21217 𝑘: 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑡𝑒𝑔𝑜𝑟í𝑎𝑠; 𝑦𝑎 𝑛𝑜 𝑠𝑒𝑟í𝑎 5; 𝑠𝑒𝑟í𝑎 3. P4) Criterio de Decisión Tenemos 3-0-1 grados de libertad para la estadística de prueba Chi-Cuadrado y con , el valor crítico es 5.991α = 0. 05 𝑥2 𝑐 = 80. 21217 5.991𝑥2 (0.950; 2) = 𝑥2 𝑡𝑎𝑏 = No se rechaza si𝐻 0 𝑥2 𝑐 ≤ 5, 991 Se rechaza si𝐻 0 𝑥2 𝑐 > 5, 991 → A un nivel de 0.05 de significación existe evidencia estadística para rechazar 𝐻 0 P5) Conclusión No se puede afirmar que la variable “número de piezas defectuosas encontradas” tenga una distribución binomial. 1.3. Problema N° 5 En un centro de estudios se ofrecen tutorías a los alumnos en las áreas de ciencias. Un profesor anotó el número de estudiantes por día que hacen uso de sus tutorías a lo largo del semestre, obteniendo la siguiente distribución de frecuencias. Se desea determinar el tipo de distribución que tiene el número de estudiantes que hacen uso de las tutorías diariamente. Número de estudiantes 0 1 2 3 4 5 Número de días 9 11 14 18 5 7 Utilice estos datos para realizar la prueba respectiva a fin de determinar la distribución de la variable en estudio al 5% de significación. 1.3.1. Solución del problema N°5 P1) Planteamiento de la hipótesis: H0: Los datos provenientes del número de estudiantes que hacen uso de las tutorías diariamente corresponden a una distribución Poisson. H1: Los datos provenientes del número de estudiantes que hacen uso de las tutorías diariamente no corresponden a una distribución Poisson. P2) Nivel de significancia: = 0.05α P3) Cálculo del estadístico de prueba: 𝑥2 𝑐 = 𝑖=1 𝑘 ∑ (𝑜 𝑖 −𝑒 𝑖 )2 𝑒 𝑖 ∼ 𝑥 (𝑘−𝑚−1) 2 𝑘 = 6; 𝑚 = 1 N° N° de estudiantes que usan tutorías (𝑋 𝑖 ) Número de días (𝑂 𝑖 ) 𝑋 𝑖 𝑂 𝑖 (π 𝑖 ) (𝑒 𝑖 = 𝑛 π 𝑖 ) (𝑜 𝑖 −𝑒 𝑖 )2 𝑒 𝑖 1 0 9 0 0.09901 6.33686 1.11922 2 1 11 11 0.22897 14.65398 0.91112 3 2 14 28 0.26474 16.94367 0.51141 4 3 18 54 0.20407 13.06075 1.86791 5 4 5 20 0.11798 7.55074 0.86168 6 5 7 35 0.08523 5.45400 0.43823 Total 64 148 1 64 5.70957 = 148/64= 2.3125λ ℼ1 = 𝑃(𝑋 = 0) = 𝑒 −λ (λ) 0 0! =0. 09901 ℼ2 = 0.22897= 𝑃(𝑋 = 1) = 𝑒 −λ (λ) 1 1! ℼ3 = 0.26474= 𝑃(𝑋 = 2) = 𝑒 −λ (λ) 2 2! ℼ4 = 0.20407= 𝑃(𝑋 = 3) = 𝑒 −λ (λ) 3 3! ℼ5 = 0.11798= 𝑃(𝑋 = 4) = 𝑒 −λ (λ) 4 4! ℼ6 = 0.08523= 𝑃(𝑋 = 5) = 𝑒 −λ (λ) 5 5! P4) Criterio de decisión: Tenemos 6-1-1 grados de libertad para la estadística de prueba Chi-Cuadrado y con , el valor crítico es 9.488α = 0. 05 𝑥2 𝑐 = 5. 70957 9.488𝑥2 (0.950; 4) = 𝑥2 𝑡𝑎𝑏 = No se rechaza si𝐻 0 𝑥2 𝑐 ≤ 9. 488 Se rechaza si𝐻 0 𝑥2 𝑐 > 9. 488 - A un nivel de 0.05 de significación no existe evidencia estadística para rechazar 𝐻 0 - P5) Conclusión: Se puede afirmar que la variable “número de estudiantes que usan tutorías” tiene una distribución Poisson. 1.4. Problema N° 7 Un prestamista quiere analizar el número de clientes quetiene problemas para realizar el pago que corresponde. Para esto, durante 220 días, selecciona al azar 5 clientes que deben pagar hasta ese día y anota el número de clientes que tiene problemas para realizar el pago. Número de clientes con problemas 0 1 2 3 4 5 Número de días 20 32 56 62 28 22 Utilice estos datos para realizar la prueba respectiva a fin de determinar la distribución de la variable en estudio al 4% de significación. 1.4.1. Solución del problema N°7 Utilizando la prueba estadística P1) Planteamiento de la hipótesis: Ho=Los datos provenientes del número de clientes con problemas para realizar el pago analizado por el prestamista se ajustan a una distribución binomial. H1= Los datos provenientes del número de clientes con problemas para realizar el pago analizado por el prestamista no se ajustan a una distribución binomial. P2) Nivel de significación: = 0.04α P3) Cálculo del estadístico de Prueba: 𝑥2 𝑐 = 𝑖=1 𝑘 ∑ (𝑜 𝑖 −𝑒 𝑖 )2 𝑒 𝑖 ∼ 𝑥 (𝑘−𝑚−1) 2 0𝑟 = 5; 𝑝 = ?; 𝑘 = 6; 𝑚 = N° Número de clientes con problemas (𝑋 𝑖 ) Número de días (𝑂 𝑖 ) .𝑋 𝑖 𝑂 𝑖 1 0 20 0 2 1 32 32 3 2 56 112 4 3 62 186 5 4 28 112 6 5 22 110 Total 220 552 E(x) = rp = =2.509 = 0.5018552220 → 𝑝 = 2.509 5 Esta probabilidad de éxito será utiliza para calcular las probabilidades teóricas que a la vez servirán para calcular las frecuencias esperadas: 𝑟 =; 5 𝑝 = 0. 5018 ℼ1 = 0.030685= 𝑃(𝑋 = 0) =𝐶 0 5 (0. 5018) 0 (1 − 0. 5018) 5−0 ℼ2 =0.154549= 𝑃(𝑋 = 1) =𝐶 1 5 (0. 5018) 1 (1 − 0. 5018) 5−1 ℼ3 = 0.311355= 𝑃(𝑋 = 2) =𝐶 2 5 (0. 5018) 2 (1 − 0. 5018) 5−2 ℼ4 = 0.313628= 𝑃(𝑋 = 3) =𝐶 3 5 (0. 5018) 3 (1 − 0. 5018) 5−3 ℼ5 = 0.157958= 𝑃(𝑋 = 4) =𝐶 4 5 (0. 5018) 4 (1 − 0. 5018) 5−4 ℼ6 = 0.031822= 𝑃(𝑋 = 5) =𝐶 5 5 (0. 5018) 4 (1 − 0. 5018) 5−5 N° Número de clientes con problemas (𝑋 𝑖 ) Número de días (𝑂 𝑖 ) .𝑋 𝑖 𝑂 𝑖 (π 𝑖 ) (𝑒 𝑖 = 𝑛 π 𝑖 ) (𝑜 𝑖 −𝑒 𝑖 )2 𝑒 𝑖 1 0 20 0 0.030685 6.7509 26.002214 2 1 32 32 0.154549 34.0009 0.1177512 3 2 56 112 0.311355 68.4981 2.280421 4 3 62 186 0.313628 68.9981 0.7097935 5 4 28 112 0.157958 34.7509 1.3114687 6 5 22 110 0.031822 7.0009 32.134758 Total 220 552 1 220 62.556407 P4) Criterio de Decisión Tenemos 6-0-1= 5 grados de libertad para la estadística de prueba Chi-Cuadrado y con , el valor crítico es 11.644α = 0. 04 𝑥2 𝑐 = 62. 556 11.64𝑥2 (0.96; 5) = 𝑥2 𝑡𝑎𝑏 = No se rechaza si𝐻 0 𝑥2 𝑐 ≤ 11. 64 Se rechaza si𝐻 0 𝑥2 𝑐 > 11. 64 P5) Conclusión A un nivel de 0.04 de significación existe evidencia estadística para rechazar .𝐻 0 Por lo tanto no se puede afirmar que la variable “número de clientes con problemas para realizar los pagos” tenga una distribución binomial. 1.5. Problema N° 18 Un investigador en cultivos de papa está evaluando la cantidad de hongos encontrados en las plantas que afectan el peso (g.) de la papa. Para ello registra la siguiente información de los pesos de la papa según variedad: A B C 45.5 45.2 45.2 55.1 45.1 45.4 44.9 44.8 45.6 44.2 44.9 45.8 44.1 54.1 45.5 43.5 44.8 Asumiendo la normalidad en las muestras, pruebe el supuesto de homogeneidad de varianzas. Use α=0.05. 1.5.1. Solución del problema N° 18 Utilizando la prueba de homogeneidad de varianzas. P1) Planteamiento de la hipótesis: H0: σ12=σ22=σ32=σ2 H1: Al menos una σi2 es diferente i = 1,2,3 P2) Nivel de significación: α=0.05 P3) Cálculo del estadístico de Prueba: A B C Σ ni-1 5 4 5 14 Si2 19.418 16.587 0.122 - Ln(Si2) 2.966 2.809 -2.106 - (ni-1)*Ln(Si2) 14.831 11.234 -10.532 15.533 1/(ni-1) 0.2 0.25 0.2 0.65 Sp2 11.717 Ln(Sp2) 2.461 t=3 G.L.=2 Q= Q= 17.258 P4) Criterio de Decisión Q > Xtab2= X2(0.95;2)= 5.991 17.258 > 5.991 Se rechaza la hipótesis nula con un nivel de significancia α=0.05. P5) Conclusión Con un nivel de significancia de 0.05 se rechaza Ho. Por lo tanto, se puede afirmar que las varianzas son heterogéneas. No se cumple el supuesto de homogeneidad de varianzas.
Compartir