Logo Studenta

APLICACIONES CHI-CUADRADO

Vista previa del material en texto

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
FACULTAD DE ECONOMÍA Y PLANIFICACIÓN
DEPARTAMENTO DE ESTADÍSTICA E INFORMÁTICA
CURSO: MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN
TAREA 1: APLICACIONES CHI-CUADRADO
Tema: Aplicaciones Chi-Cuadrado
Profesora: Ing. Denise Rosalyn Chalan Llajaruna
Integrantes:
- Custodio Jaimes, Rosa María 20181002
- Omonte Vargas, Jhon Antony 20190180
- Rojas Espinoza, José Miguel 20181022
- Ruiz Anchelia, Fernanda Elizabeth 20190188
- Ruiz Rodriguez, Jesus Omar 20190137
Grupo: 7
Ciclo: 2021-I
La Molina, 2021
1. Problemas y soluciones
A continuación, se mostrarán los problemas con su respectiva solución
correspondiente al presente grupo de estudiantes del curso de Métodos Estadísticos
para la Investigación.
1.1. Problema N°2
Un investigador realiza un estudio para determinar la opinión de los ingenieros de
industrias alimentarias sobre un nuevo conservante de alimentos. Tomó una muestra
aleatoria de 350 ingenieros, y obtuvo los siguientes resultados:
Opinión Muy bueno Bueno Regular Malo Total
Frecuencia 50 75 130 95 350
Pruebe si la opinión de los ingenieros de industrias alimentarias respecto al nuevo
conservante no se distribuye en la proporción: 3:4:6:5. Use = 0.04.α
1.1.1. Solución del problema N°2
P1) Planteamiento de la hipótesis:
Ho: La opinión de los ingenieros de industrias alimentarias respecto al nuevo
conservante se distribuye en la proporción: 3:4:6:5.
H1: La opinión de los ingenieros de industrias alimentarias respecto al nuevo
conservante no se distribuye en la proporción: 3:4:6:5.
P2) Nivel de significación:
= 0.04α
P3) Cálculo del estadístico de Prueba
𝑥2
𝑐 =
𝑖=1
𝑘
∑
(𝑜
𝑖
−𝑒
𝑖
)2
𝑒
𝑖
∼ 𝑥
(4−1)
2
N°
Categoría
de la
variable
cualitativa
(Opinión)
Frecuencia
observada
(𝑂
𝑖
)
Frecuencia
teórica
(π
𝑖
)
Frecuencia
esperada
(𝑒
𝑖
= 𝑛 π
𝑖
)
𝑋
𝑐
2
1 Muy bueno 50 0.167 58.333 1.191
2 Bueno 75 0.222 77.778 0.099
3 Regular 130 0.333 116.667 1.524
4 Malo 95 0.278 97.222 0.051
Total 350 1 350 2.864
P4) Criterio de Decisión
Como el:
𝑥
𝑐𝑟𝑖𝑡
2 = 𝑥
𝑡𝑎𝑏
2 = 𝑥
(0.096,3)
= 8. 311
Luego:
𝑥
𝑐 
2 = 2. 864 ≤ 8. 311
A un nivel de 0.04 de significación no existe evidencia estadística para rechazar Ho.
P5) Conclusión
Aún nivel de significancia 0.04 no existe evidencia estadística suficiente para rechazar
la opinión de los ingenieros de industrias alimentarias respecto al nuevo conservante
no se distribuye en la proporción: 3:4:6:5.
1.2. Problema N° 4
El jefe de control de calidad de una fábrica de piezas de automóviles, analiza el
número de piezas defectuosas al tomar muestras de 4 piezas que salen de una línea de
ensamblaje. Luego de seleccionar 120 muestras de 4 piezas cada una, se obtienen los
resultados que se presentan a continuación:
Número de piezas defectuosas 0 1 2 3 4
Número de muestras 3 5 17 5 3
En los registros históricos se conoce que el 9% de las piezas de automóviles tienen
defectos. Utilice estos datos para realizar la prueba respectiva a fin de determinar la
distribución de la variable en estudio al 5% de significación.
1.2.1. Solución del problema N°4
P1) Planteamiento de la hipótesis:
Ho= Los datos provenientes del número de piezas defectuosas encontradas en
las muestras se ajustan a una distribución binomial.
H1= Los datos provenientes del número de piezas defectuosas encontradas en
las muestras no se ajustan a una distribución binomial.
P2) Nivel de significación:
= 0.05α
P3) Cálculo del estadístico de Prueba.
𝑥2
𝑐 =
𝑖=1
𝑘
∑
(𝑜
𝑖
−𝑒
𝑖
)2
𝑒
𝑖
∼ 𝑥
(𝑘−𝑚−1)
2
𝑟 = 4; 𝑝 = 0. 09; 𝑘 = 5; 𝑚 = 0
ℼ1 = 0.68575= 𝑃(𝑋 = 0) =𝐶
0
4
(0, 09) 0 (1 − 0, 09) 4−0
ℼ2 = 0.27129= 𝑃(𝑋 = 1) =𝐶
1
4
(0, 09) 1 (1 − 0, 09) 4−1
ℼ3 = 0.04025= 𝑃(𝑋 = 2) =𝐶
2
4
(0, 09) 2 (1 − 0, 09) 4−2
ℼ4 = 0.00265= 𝑃(𝑋 = 3) =𝐶
3
4
(0, 09) 3 (1 − 0, 09) 4−3
ℼ5 = 0.00006= 𝑃(𝑋 = 4) =𝐶
4
4
(0, 09) 4 (1 − 0, 09) 4−4
N°
Número de
piezas
defectuosas
(𝑋
𝑖
)
Número de
muestras
(𝑂
𝑖
)
𝑋
𝑖
𝑂
𝑖
(π
𝑖
) (𝑒
𝑖
= 𝑛 π
𝑖
) (𝑜
𝑖
−𝑒
𝑖
)2
𝑒
𝑖
1 0 65 0 0.68575 82.28995 3.63279
2 1 30 30 0.27129 32.55427 0.20041
3 2 17 34 0.04025 4.82948 30.67029
4 3 5 15 0.00265 0.31843 68.82931
5 4 3 12 0.00006 0.00787 1137.12630
Total 120 91 1 120 1294.03183
Cuando los valores de la frecuencia esperada son menores a 5, la Chi-Cuadrado
calculada es errónea. En este caso, las filas 3, 4 y 5 son las que presentan valores
menores a 5 en la ; por ello la resulta en un valor muy alto. Para solucionar𝑒
𝑖
𝑥2
𝑐
esto es necesario reagrupar la tabla, uniendo las filas de tal manera que todas tengan
frecuencias esperadas mayores a 5.
Agrupando los valores de las filas 3, 4 y 5, salvo la columna de contribuciones a la
Chi-Cuadrado se obtiene la tabla final.
N°
Número de
piezas
defectuosas
(𝑋
𝑖
)
Número de
muestras
(𝑂
𝑖
)
𝑋
𝑖
𝑂
𝑖
(π
𝑖
) (𝑒
𝑖
= 𝑛 π
𝑖
) (𝑜
𝑖
−𝑒
𝑖
)2
𝑒
𝑖
1 0 65 0 0.68575 82.28995 3.63279
2 1 30 30 0.27129 32.55427 0.20041
3 2,3 y 4 25 61 0.04296 5.15578 76.37896
Total 120 91 1 120 80.21217
𝑘: 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑡𝑒𝑔𝑜𝑟í𝑎𝑠; 𝑦𝑎 𝑛𝑜 𝑠𝑒𝑟í𝑎 5; 𝑠𝑒𝑟í𝑎 3.
P4) Criterio de Decisión
Tenemos 3-0-1 grados de libertad para la estadística de prueba Chi-Cuadrado y con
, el valor crítico es 5.991α = 0. 05
𝑥2
𝑐 =
80. 21217
5.991𝑥2
(0.950; 2)
= 𝑥2
𝑡𝑎𝑏 = 
No se rechaza si𝐻
0
𝑥2
𝑐 
≤ 5, 991
Se rechaza si𝐻
0
𝑥2
𝑐 
> 5, 991
→ A un nivel de 0.05 de significación existe evidencia estadística para rechazar 𝐻
0
P5) Conclusión
No se puede afirmar que la variable “número de piezas defectuosas encontradas”
tenga una distribución binomial.
1.3. Problema N° 5
En un centro de estudios se ofrecen tutorías a los alumnos en las áreas de ciencias. Un
profesor anotó el número de estudiantes por día que hacen uso de sus tutorías a lo
largo del semestre, obteniendo la siguiente distribución de frecuencias. Se desea
determinar el tipo de distribución que tiene el número de estudiantes que hacen uso de
las tutorías diariamente.
Número de estudiantes 0 1 2 3 4 5
Número de días 9 11 14 18 5 7
Utilice estos datos para realizar la prueba respectiva a fin de determinar la
distribución de la variable en estudio al 5% de significación.
1.3.1. Solución del problema N°5
P1) Planteamiento de la hipótesis:
H0: Los datos provenientes del número de estudiantes que hacen uso de las tutorías
diariamente corresponden a una distribución Poisson.
H1: Los datos provenientes del número de estudiantes que hacen uso de las tutorías
diariamente no corresponden a una distribución Poisson.
P2) Nivel de significancia:
= 0.05α
P3) Cálculo del estadístico de prueba:
𝑥2
𝑐 =
𝑖=1
𝑘
∑
(𝑜
𝑖
−𝑒
𝑖
)2
𝑒
𝑖
∼ 𝑥
(𝑘−𝑚−1)
2
𝑘 = 6; 𝑚 = 1
N°
N° de
estudiantes
que usan
tutorías
(𝑋
𝑖
)
Número de
días
(𝑂
𝑖
)
𝑋
𝑖
𝑂
𝑖
(π
𝑖
) (𝑒
𝑖
= 𝑛 π
𝑖
) (𝑜
𝑖
−𝑒
𝑖
)2
𝑒
𝑖
1 0 9 0 0.09901 6.33686 1.11922
2 1 11 11 0.22897 14.65398 0.91112
3 2 14 28 0.26474 16.94367 0.51141
4 3 18 54 0.20407 13.06075 1.86791
5 4 5 20 0.11798 7.55074 0.86168
6 5 7 35 0.08523 5.45400 0.43823
Total 64 148 1 64 5.70957
= 148/64= 2.3125λ
ℼ1 = 𝑃(𝑋 = 0) =
𝑒 −λ (λ) 0
0! =0. 09901
ℼ2 = 0.22897= 𝑃(𝑋 = 1) = 𝑒
−λ (λ) 1
1!
ℼ3 = 0.26474= 𝑃(𝑋 = 2) = 𝑒
−λ (λ) 2
2!
ℼ4 = 0.20407= 𝑃(𝑋 = 3) = 𝑒
−λ (λ) 3
3!
ℼ5 = 0.11798= 𝑃(𝑋 = 4) = 𝑒
−λ (λ) 4
4!
ℼ6 = 0.08523= 𝑃(𝑋 = 5) = 𝑒
−λ (λ) 5
5!
P4) Criterio de decisión:
Tenemos 6-1-1 grados de libertad para la estadística de prueba Chi-Cuadrado y con
, el valor crítico es 9.488α = 0. 05
𝑥2
𝑐 =
5. 70957
9.488𝑥2
(0.950; 4)
= 𝑥2
𝑡𝑎𝑏 = 
No se rechaza si𝐻
0
𝑥2
𝑐 
≤ 9. 488
Se rechaza si𝐻
0
𝑥2
𝑐 
> 9. 488
- A un nivel de 0.05 de significación no existe evidencia estadística para
rechazar 𝐻
0
-
P5) Conclusión:
Se puede afirmar que la variable “número de estudiantes que usan tutorías” tiene una
distribución Poisson.
1.4. Problema N° 7
Un prestamista quiere analizar el número de clientes quetiene problemas para realizar
el pago que corresponde. Para esto, durante 220 días, selecciona al azar 5 clientes que
deben pagar hasta ese día y anota el número de clientes que tiene problemas para
realizar el pago.
Número de clientes con problemas 0 1 2 3 4 5
Número de días 20 32 56 62 28 22
Utilice estos datos para realizar la prueba respectiva a fin de determinar la
distribución de la variable en estudio al 4% de significación.
1.4.1. Solución del problema N°7
Utilizando la prueba estadística
P1) Planteamiento de la hipótesis:
Ho=Los datos provenientes del número de clientes con problemas para realizar el
pago analizado por el prestamista se ajustan a una distribución binomial.
H1= Los datos provenientes del número de clientes con problemas para realizar el
pago analizado por el prestamista no se ajustan a una distribución binomial.
P2) Nivel de significación:
= 0.04α
P3) Cálculo del estadístico de Prueba:
𝑥2
𝑐 =
𝑖=1
𝑘
∑
(𝑜
𝑖
−𝑒
𝑖
)2
𝑒
𝑖
∼ 𝑥
(𝑘−𝑚−1)
2
0𝑟 = 5; 𝑝 = ?; 𝑘 = 6; 𝑚 =
N°
Número de clientes con
problemas
(𝑋
𝑖
)
Número de días
(𝑂
𝑖
) .𝑋
𝑖
𝑂
𝑖
1 0 20 0
2 1 32 32
3 2 56 112
4 3 62 186
5 4 28 112
6 5 22 110
Total 220 552
E(x) = rp = =2.509 = 0.5018552220 → 𝑝 =
2.509
5
Esta probabilidad de éxito será utiliza para calcular las probabilidades teóricas que a
la vez servirán para calcular las frecuencias esperadas:
𝑟 =; 5 𝑝 = 0. 5018
ℼ1 = 0.030685= 𝑃(𝑋 = 0) =𝐶
0
5
(0. 5018) 0 (1 − 0. 5018) 5−0
ℼ2 =0.154549= 𝑃(𝑋 = 1) =𝐶
1
5
(0. 5018) 1 (1 − 0. 5018) 5−1
ℼ3 = 0.311355= 𝑃(𝑋 = 2) =𝐶
2
5
(0. 5018) 2 (1 − 0. 5018) 5−2
ℼ4 = 0.313628= 𝑃(𝑋 = 3) =𝐶
3
5
(0. 5018) 3 (1 − 0. 5018) 5−3
ℼ5 = 0.157958= 𝑃(𝑋 = 4) =𝐶
4
5
(0. 5018) 4 (1 − 0. 5018) 5−4
ℼ6 = 0.031822= 𝑃(𝑋 = 5) =𝐶
5
5
(0. 5018) 4 (1 − 0. 5018) 5−5
N°
Número de
clientes con
problemas
(𝑋
𝑖
)
Número de
días
(𝑂
𝑖
)
.𝑋
𝑖
𝑂
𝑖
(π
𝑖
) (𝑒
𝑖
= 𝑛 π
𝑖
) (𝑜
𝑖
−𝑒
𝑖
)2
𝑒
𝑖
1 0 20 0 0.030685 6.7509 26.002214
2 1 32 32 0.154549 34.0009 0.1177512
3 2 56 112 0.311355 68.4981 2.280421
4 3 62 186 0.313628 68.9981 0.7097935
5 4 28 112 0.157958 34.7509 1.3114687
6 5 22 110 0.031822 7.0009 32.134758
Total 220 552 1 220 62.556407
P4) Criterio de Decisión
Tenemos 6-0-1= 5 grados de libertad para la estadística de prueba Chi-Cuadrado y
con , el valor crítico es 11.644α = 0. 04
𝑥2
𝑐 =
62. 556
11.64𝑥2
(0.96; 5)
= 𝑥2
𝑡𝑎𝑏 = 
No se rechaza si𝐻
0
𝑥2
𝑐 
≤ 11. 64
Se rechaza si𝐻
0
𝑥2
𝑐 
> 11. 64
P5) Conclusión
A un nivel de 0.04 de significación existe evidencia estadística para rechazar .𝐻
0
Por lo tanto no se puede afirmar que la variable “número de clientes con problemas
para realizar los pagos” tenga una distribución binomial.
1.5. Problema N° 18
Un investigador en cultivos de papa está evaluando la cantidad de hongos encontrados
en las plantas que afectan el peso (g.) de la papa. Para ello registra la siguiente
información de los pesos de la papa según variedad:
A B C
45.5 45.2 45.2
55.1 45.1 45.4
44.9 44.8 45.6
44.2 44.9 45.8
44.1 54.1 45.5
43.5 44.8
Asumiendo la normalidad en las muestras, pruebe el supuesto de homogeneidad de
varianzas. Use α=0.05.
1.5.1. Solución del problema N° 18
Utilizando la prueba de homogeneidad de varianzas.
P1) Planteamiento de la hipótesis:
H0: σ12=σ22=σ32=σ2
H1: Al menos una σi2 es diferente i = 1,2,3
P2) Nivel de significación: α=0.05
P3) Cálculo del estadístico de Prueba:
A B C Σ
ni-1 5 4 5 14
Si2 19.418 16.587 0.122 -
Ln(Si2) 2.966 2.809 -2.106 -
(ni-1)*Ln(Si2) 14.831 11.234 -10.532 15.533
1/(ni-1) 0.2 0.25 0.2 0.65
Sp2 11.717
Ln(Sp2) 2.461
t=3
G.L.=2
Q=
Q= 17.258
P4) Criterio de Decisión
Q > Xtab2= X2(0.95;2)= 5.991
17.258 > 5.991
Se rechaza la hipótesis nula con un nivel de significancia α=0.05.
P5) Conclusión
Con un nivel de significancia de 0.05 se rechaza Ho. Por lo tanto, se puede afirmar
que las varianzas son heterogéneas. No se cumple el supuesto de homogeneidad de
varianzas.

Otros materiales