Logo Studenta

Ji cuadrado-estadística

¡Este material tiene más páginas!

Vista previa del material en texto

Cuadernillo de Aplicación III - 27 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
JI CUADRADO 
Pruebas de hipótesis para frecuencias 
Ejercicio 1 
Se supone que en una reserva las especies de flora A, B, C y V (varias) se presentan en una 
relación 5:2:1:1. Luego de una contingencia climática se obtiene una muestra de campo y se 
encuentra que hay 269 unidades de la especie A; 112 de la especie B; 74 de la especie C y 45 de V. 
Pruebe la hipótesis de que luego de la contingencia climática, la relación se mantuvo en 5:2:1:1, para 
un α = 0,05. 
1) Hipótesis científica: La relación de las especias de flora A, B, C y V, en una reserva, se presentan 
en la proporción5:2:1:1 
{
 
 
9 
 
 
9
 
 
9
 
 
 
Aclaración: En este caso, prueba de bondad de ajuste con datos que provienen de una población 
con distribución específica (también pueden ser datos que provienen de una población con una 
distribución conocida) la hipótesis científica concuerda con la nula. Es una excepción. En las 
demás pruebas de hipótesis siempre la H. científica concuerda con la alternativa. 
 
2) Nivel de significancia α = 0,05 
3) Estadígrafo de Prueba 
 ∑
( ̂ )
 
 ̂ 
 
 
 ( ); i:1,2,3,4 
4) Regla de decisión 
 
Para obtener el valor crítico del estadígrafo de prueba puede hacerse por: 
A) Excel: función =INV.CHICUAD.CD 
(probablidad; grados de libertad). Para 
nuestro caso =INV.CHICUAD. CD(0,05;3). 
 
 
 
 
 
 
 
 
B) Infostat: >EstadísticasProbabilidades y 
CuantilesModelo ChiCuadradoGrados de 
libertad (No colocar nada en 
lambda)P(X>x)=α. Para nuestro caso 
Cuadernillo de Aplicación III - 28 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
 
 
Figura 1. Función de densidad de ( )
 
 
5) Cálculo del estadígrafo de prueba 
 
 CÁLCULO CON EXCEL 
 
 
¿CÓMO OBTUVIMOS LOS VALORES QUE SE ENCUENTRAN EN LAS CELDAS DE ESTA PLANILLA? 
El armado de la tabla auxiliar nos permite hacer los cálculos de forma rápida y ordenada. 
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
0,00 3,81 7,62 11,44 15,25
X^2
0,00
0,06
0,12
0,18
0,24
D
e
n
s
id
a
d
Chi cuadrado(3): p(evento)=0,0500
1) Criterio de los puntos críticos 
Si 𝜒𝑚
 > 𝜒𝑐
 se rechaza la hipótesis nula. 
 
2) Criterio del p-valor 
Si 𝑃(𝜒 > 𝜒𝑚
 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 >
𝜒𝑐
 ) 𝛼, entonces se rechaza la hipótesis 
nula 
α =0,05 
𝜒𝑐
 7 8 
Cuadernillo de Aplicación III - 28 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
a) La primera columna corresponde a las diferentes categorías que toma la variable en estudio. La 
segunda son las frecuencias observadas ( ), datos que da el enunciado. 
b) La tercera son las proporciones que nos da la hipótesis nula ( ). Dado que la relación es que se 
pone a prueba es 5:2:1:1, quiere decir que de 9 especímenes 5 pertenecen a la especie A, 2 a la B, 1 
a la C y 1 a V (varios). Entonces, podemos escribir esta relación como proporciones 5/9=0,56; 
2/9=0,22 y 1/9=0,11 (estas cuentas se realizan directamente en la celda colocando =5/9, etc.) 
Recuerde utilizar el aproximador decimal (barra de herramientas  0,00). 
c) La cuarta columna son las frecuencias esperadas ( ̂ ) que se obtienen del producto entre la 
proporción teórica y el total de la muestra ( ̂ ). Puede realizar éste cálculo colocando 
=C6*$B$10 para la primera frecuencia esperada y copiar la fórmula hacia abajo para no tipear los 
números. Recuerde que de esta forma se ahorra tiempo y se puede utilizar la misma tabla para 
cálculos futuros sólo cambiando las frecuencias observadas. 
d) La quinta columna corresponde al término del estadígrafo de prueba que queremos calcular. En la 
celda se calcula 
( ̂ )
 
 ̂ 
 
 
Para ese cálculo puede utilizarse la ecuación =(B6-D6)^2/D6, refiriéndose a las celdas 
correspondientes para la primera categoría y luego copiarla para el resto. Al pie de la columna se 
utiliza la función =SUMA(rango) y se obtiene así el valor del estadígrafo de prueba muestral. 
e) Para calcular el p-valor se utiliza la función =DISTR.CHICUAD (valor; grados de libertad) y devuelve 
el valor de probabilidad acumulada por derecha ( ( > 
 )). En nuestro caso, =DISTR.CHICUAD 
(8,41;3). 
 
En conclusión, obtuvimos: 
 
 8 8 
CÁLCULO CON INFOSTAT 
a) ESTADÍSTICASInferencia con una muestraPrueba de Bondad de Ajuste 
(Multinomial)Frecuencias Esperadas. 
 
b) Es necesario contar con las frecuencias observadas y las frecuencias esperadas. Al clickear 
“Calcular” saldrá un aviso de que los totales no son iguales y que puede ser un error. La 
diferencia es decimal porlo que se hace caso omiso al aviso. Clickear “Aceptar” luego de revisar 
que las diferencias no sea muy grande. Y se obtiene: 
Cuadernillo de Aplicación III - 29 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
6) Toma de decisión 
Criterio de puntos críticos: 
 
 8 > 
 7 8 
entonces, se rechaza 
Criterio del p-valor 
p-valor=0,0382 < 0,05 entonces se rechaza 
7) Interpretación 
Se tiene suficiente evidencia muestral, con un α = 0,05 para decir que las especies de flora de la 
reserva no mantiene la relación de 5:2:1:1 luego de la contingencia climática. 
8) Conclusión 
Luego de la contingencia climática en la reserva, las especies de flora A, B, C y V (otros) han 
perdido la relación de 5:2:1:1. 
 
DE AQUÍ EN ADELANTE USTED RESUELVA DE ACUERDO CON LA 
CORRESPONDIENTE TEORÍA Y CONSIGNAS. TENGA EN CUENTA LO SIGUIENTE: 
 
- DETERMINAR QUÉ TIPO DE PRUEBA ES LAQUE TIENE QUE REALIZAR 
(BONDAD DE AJUSTE, INDEPENDENCIA U HOMOGENEIDAD) 
- TENER EN CLARO EL CÁLCULO DE LOS GRADOS DE LIBERTAD. 
- AL MOMENTO DE CALCULAR LAS FRECUENCIAS ESPERADAS, EN LAS DE 
BONDAD DE AJUSTE, RECORDAR QUE DEBEN SER MAYORES O IGUALES 
A 5. SI NO SE CUMPLE ESTA CONDICIÓN, SE DEBE RECATEGORIZAR LA 
VARIABLE. 
- SI LOS GRADOSDE LIBERTAD SON IGUALES A 1, EN LAS DE 
INDEPENDENCIA Y HOMOGENEIDAD, APLICAR LA CORRECCIÓN DE YATES 
(SE TRABAJA CON TABLAS DE CONTINGENCIA). 
 
 
 
 
 
 
 
 
𝜒𝑚
 
𝑝 𝑣𝑎𝑙𝑜𝑟 
Verificar los 
totales. 
Cuadernillo de Aplicación III - 30 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
 
Ejercicio 2 
Retome el ajustamiento de la Distribución Normal para la variable peso (g) por racimo del caso 6 del 
cuadernillo I y pruebe la hipótesis (α = 0,01) de que la variable sigue una distribución normal. 
1) Hipótesis científica: El peso de racimos de uva de plantas de vid del cuartel de variedad Malbec de 
la Finca San Antonio de la Facultad de Ciencias Agrarias se distribuye normalmente 
 ( ) 
 
2) Nivel de significancia α = 0,01 
 
 
3) Estadígrafo de Prueba 
 ∑
( ̂ )
 
 ̂ 
 
 
 ( ); i=1,…,k 
4) Regla de decisión 
 
 
 
 
 
5) Cálculo del estadígrafo de prueba 
 CÁLCULO CON EXCEL 
En el ejercicio 6 del trabajo práctico de VAC armamos la siguiente tabla de ajustamiento 
 
LI(xi) LS(xs) F(xs) P(xi<X<xs)=F(xs)-F(xs) ni ni^ 
menor a 14,5 0,015945 0,015945 0 2,0 
14,5 28,5 0,079026 0,063082 10 7,8 
28,5 42,5 0,249042 0,170015 19 20,9 
42,5 56,5 0,522582 0,273540 40 33,6 
56,5 70,5 0,785463 0,262881 29 32,3 
70,5 84,5 0,936360 0,150898 14 18,6 
84,5 98,5 0,988060 0,051700 10 6,4 
98,5 112,5 0,998620 0,010559 1 1,3 
112,5 o mayor 1,000000 0,001380 0 0,2 
 1,0000 123 123,0 
 
Con los datos de la tabla anterior armamos la tabla de cálculos auxiliares. 
Criterio de los puntos críticos 
Si 𝜒𝑚
 > 𝜒𝑐
 se rechaza la hipótesis nula. 
 
Criterio del p-valor 
Si 𝑃(𝜒 > 𝜒𝑚
 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐
 ) 𝛼, entonces se rechaza la hipótesis nula. 
Cuadernillo de Aplicación III - 31 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
Debido a que las frecuencias son menores a 5 agrupamos conforme a lo que se observa en la tabla de 
Excel. De esta manera cambian los grados de libertad ( – – 
 ) y también cambia el valor de chi cuadrado crítico siendo 
el nuevo valor 11,344 
 
Cálculo en Excel 
=INV.CHICUAD.CD(0,01;3)=11,344 
En conclusión, obtuvimos: 
 
 7 
También podemos calcularlo por Infostat como se explica en el ejercicio 1 
 
 
Es importante destacar que al realizar el cálculo en Infostat hay que corregir los grados de libertad ya 
que por defecto Infostat considera que los parámetros son conocidos. 
 
Cuadernillo de Aplicación III - 32 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
6) Toma de decisión 
Criterio de puntos críticos: 
 
 < 
 
entonces, se acepta 
Criterio del p-valor 
p-valor=0,2475 > 0,01 entonces se acepta 
7) Interpretación 
Se tiene suficiente evidencia muestral, con un α = 0,01 para decir el peso de los racimos de uva de 
plantas de vid del cuartel de variedad Malbec de la Finca San Antonio de la Facultad de Ciencias 
Agrarias se distribuye normalmente. 
 
8) Conclusión 
Es correcto el ajustamiento que se realizó en el ejercicio 6 del TP de VAC 
Ejercicio 3 
Se realizó una experiencia en trigo a fin de determinar si existe asociación entre los caracteres largo 
de semilla y susceptibilidad a “roya”. Se obtuvieron los siguientes resultados: 
Susceptibilidad 
a la roya 
Largo de la semilla 
Corto Mediano Largo 
Resistente 15 30 40 
Susceptible 8 12 10 
Pruebe, para un α = 0,01, que la susceptibilidad a la roya está asociada al largo de la semilla. 
1) Hipótesis científica: La susceptibilidad del trigo a la roya está asociada al largo de semilla que 
presenta. 
{
 ( ) 
 ( ) 
 
2) Nivel de significancia α = 0,01 
3) Estadígrafo de Prueba 
 ∑∑
( ̂ )
 
 ̂ 
 
 
 
 
 ( ( ) ( ) ) 
4) Regla de decisión 
 
 
 
 
 
 
Criterio de los puntos críticos 
Si 𝜒𝑚
 > 𝜒𝑐
 se rechaza la hipótesis nula. 
 
Criterio del p-valor 
Si 𝑃(𝜒 > 𝜒𝑚
 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐
 ) 𝛼, entonces se rechaza la hipótesis nula . 
Cuadernillo de Aplicación III - 33 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
Figura2. Función de densidad de ( )
 
5) Cálculo del estadígrafo de prueba 
 CÁLCULO CON EXCEL 
 
 
¿CÓMO OBTUVIMOS LOS VALORES QUE SE ENCUENTRAN EN LAS CELDAS DE ESTA PLANILLA? 
El armado de la tabla auxiliar permite hacer los cálculos de forma rápida y ordenada. 
a) La primera columna corresponde a las diferentes categorías que son las celdas combinadas. La 
segunda son las frecuencias observadas ( ), datos que da el enunciado. 
b) La tercera columna son las frecuencias esperadas ( ̂ ) que se obtienen de multiplicar el total de 
la fila y la columna y dividirlo por el total 
 ̂ 
 
 
 
Puede realizarse este cálculo colocando =E9*B11/E11 para la primera frecuencia esperada y hacer 
lo mismo para el resto y no tipear los números. De esta forma se ahorra tiempo y puede utilizarse 
la misma tabla para cálculos futuros sólo cambiando las frecuencias observadas. 
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión EstudiantilVersión Estudiantil Versión Estudiantil Versión Estudiantil
0,00 3,00 6,00 9,00 12,00
X^2
0,00
0,12
0,24
0,36
0,48
D
e
n
s
id
a
d
Chi cuadrado(2): p(evento)=0,0100
α =0,01 
𝜒𝑐
 9 
Cuadernillo de Aplicación III - 34 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
c) La cuarta columna corresponde al término del estadígrafo de prueba que se va a calcular. En la 
celda se calcula 
( ̂ )
 
 ̂ 
 
Para ese cálculo puede utilizarse la ecuación =(B15-C15)^2/C15, refiriéndose a las celdas 
correspondientes para la primera categoría y luego copiarla para el resto. Al pie de la columna se 
utiliza la función =SUMA(rango) y se obtiene así el valor del estadígrafo de prueba muestral. 
d) Para calcular el p-valor se utiliza la función =DISTR.CHICUAD (valor; grados de libertad) y devuelve 
el valor de probabilidad acumulada ( ( > 
 )). En nuestro caso, =DISTR.CHICUAD(2,00;2). 
 
En conclusión, obtuvimos: 
 
 8 
CÁLCULO CON INFOSTAT 
 
a) Se modifica el formato de la tabla de contingencia para pegarla en Infostat 
 
Susceptibilidad Largo Frecuencia 
resistente corto 15 
resistente mediano 30 
resistente largo 40 
susceptibles corto 8 
susceptibles mediano 12 
susceptibles largo 10 
 
b) Luego se importa la tabla en Infostat. ARCHIVO Nueva tabla. Luego se selecciona la tabla en 
Excel y se pega en Infostat. 
 
 
 
c) ESTADÍSTICAS Datos categorizados Tablas de contingencias 
 
Cuadernillo de Aplicación III - 35 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
 
d) En criterios de clasificación se seleccionan las columnas "susceptibillidad" y "Largo" y en criterio 
de clasificación se selecciona "frecuencia". 
 
 
 
e) Luego se hace "click" en el botón aceptar y aparecerá la siguiente pantalla. 
 
 
Cuadernillo de Aplicación III - 36 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
f) En nuestro caso, se selecciona "Largo" como columnas y "susceptibilidad" como fila de acuerdo 
a la tabla de contingencias original. 
 
 
 
g) Finalmente se selecciona “aceptar” y se obtiene la siguiente salida. En los rectángulos en rojo 
se puede observar los mismos resultados que cuando realizamos el cálculo en Excel. 
 
 
6) Toma de decisión 
Criterio de puntos críticos: 
 
 < 
 9 
entonces, se acepta 
Criterio del p-valor 
p-valor=0,3684 > 0,01 entonces se acepta 
 
7) Interpretación 
No se tiene suficiente evidencia muestral, con un α = 0,01 para decir que la susceptibilidad del trigo 
a la roya depende del largo de la semilla. 
8) Conclusión 
El trigo puede o no ser susceptible a la roya independientemente del largo de semilla que presente. 
O: el largo de semilla de trigo no influye en la susceptibilidad que tiene a la roya. 
Cuadernillo de Aplicación III - 37 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
Ejercicio 4 
En un estudio sobre contaminación atmosférica en dos comunidades (I y II), se seleccionó una 
muestra aleatoria de 300 familias de cada comunidad. Se le preguntó, a uno de los miembros de 
cada familia, si alguien de la misma se sentía afectado por la contaminación atmosférica. Las 
respuestas se presentan a continuación: 
Comunidad 
Algún miembro de la familia ha sido afectado por la 
contaminación 
SI NO TOTAL 
I 63 237 300 
II 121 179 300 
TOTAL 184 416 600 
¿Puede concluirse que las dos comunidades difieren con respecto a la variable en estudio? 
1) Hipótesis científica: La proporción de enfermos afectados por la contaminación ambiental no es 
la misma para ambas comunidades 
 ; ; 
:H1 las poblaciones no son homogéneas 
2) Nivel de significancia α = 0,05 
3) Estadígrafo de Prueba 
Se utiliza la corrección de Yates porque se trata de una tabla de contingencias de 2x2 
 
 ∑∑
(|( ̂ ) |)
 
 ̂ 
 
 
 
 
 ( ( ) ( ) ) 
 
 
 
 
4) Regla de decisión 
 
 
 
 
Criterio de los puntos críticos 
Si 𝜒𝑚
 > 𝜒𝑐
 se rechaza la hipótesis nula. 
Criterio del p-valor 
Si 𝑃(𝜒 > 𝜒𝑚
 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐
 ) 𝛼, entonces se rechaza la hipótesis nula. 
Cuadernillo de Aplicación III - 38 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
 
No se ha resuelto con Infostat porque es una tabla de contingencia de 2x2 y se debe realizar la 
corrección de Yates. 
 
5) Toma de decisión 
Criterio de los puntos críticos 
 25,47 > 8 se rechaza la hipótesis nula. 
Criterio del p-valor 
Si < 0,05 entonces se rechaza la hipótesis nula. 
 
6) Interpretación 
No se tiene suficiente evidencia muestral, con un α = 0,05 para decir que la proporción de 
enfermos en ambas comunidades es la misma 
7) Conclusión 
La proporción de enfermos por contaminación ambiental no difieren en las dos comunidades. 
Ejercicio 5 
Un investigador está estudiando la presencia de un parásito intestinal específico en guanacos de 
diferente sexo. Su hipótesis es que uno de los sexos es más propenso a este parasitismo. Toma una 
muestra a campo de 49 animales y registra a partir de sus heces cuántos de ellos están infectados: 
Macho parasitado 18; Macho no parasitado: 6; Hembra parasitada: 10; Hembra no parasitada: 15. 
¿Puede sostenerse la hipótesis de que ese tipo de parasitismo está asociado al sexo, utilizando un 
nivel de significancia de 0,05? 
 
Primeramente, armamos la tabla de contingencias en base a los datos del enunciado: 
 
Género Parasitado 
 SI NO TOTAL 
M 18 6 24 
H 10 15 25 
TOTAL 28 21 49 
Cuadernillo de Aplicación III - 39 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
1) Hipótesis científica: El parasitismo en guanacos se encuentra asociado al sexo de los mismos. 
 
2) {
 ( ) 
 ( ) 
 
 
3) Nivel de significancia α = 0,05 
4) Estadígrafo de Prueba 
Se utiliza la corrección de Yates debido a que se trata de una tabla de contingencias de 2x2 
 
 ∑∑
(|( ̂ ) |)
 
 ̂ 
 
 
 
 
 ( ( ) ( ) ) 
 
5) Regla de decisión 
 
 
 
 
 
 
 
 
6) Cálculo del estadígrafo de prueba 
CÁLCULO CON EXCEL 
Criterio de los puntos críticos 
Si 𝜒𝑚
 > 𝜒𝑐
 se rechaza la hipótesis nula. 
 
Criterio del p-valor 
Si 𝑃(𝜒 > 𝜒𝑚
 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐
 ) 𝛼, entonces se rechaza la hipótesis nula 
Cuadernillo de Aplicación III - 40 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
Acá está mal el 
nivel de significancia, es 0,05 
No se ha resuelto con Infostat porque es una tabla de contingencia de 2x2 y se debe realizar la 
corrección de Yates. 
 
7) Toma de decisión 
Criterio de los puntos críticos 
 78 > 8 se rechaza la hipótesis nula. 
 
8) Criterio del p-valor 
 
 9 < =0,05, entonces se rechaza la hipótesis nula 
 
9) Interpretación 
Se tiene suficiente evidencia muestral, con un α = 0,05 para decir que el parasitismo en guanacos 
es dependiente del sexo de los mismos. 
 
10) Conclusión 
El parasitismo en guanacos se encuentra asociado al sexo. 
 
 
 
 
 
 
 
 
 
Cuadernillo de Aplicación III - 41 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
Ejercicio 6 
Retome los ejercicios de variable aleatoria discreta, referidos al ajustamiento de una distribución 
binomial a los datos obtenidos de la variable y pruebe si las variables siguen dicha distribución, para 
un nivel de significancia del 0,05. 
Caso 1 del trabajo práctico de variable aleatoria discreta 
1) Hipótesis científica: El número de análisis de Salmonella spp positivos realizados en helados decrema por día sigue una distribución binomial. 
 ( ) 
 
2) Nivel de significancia α = 0,05 
3) Estadígrafo de Prueba 
 
 ∑
( ̂ )
 
 ̂ 
 
 
 ( ) 
 
4) Regla de decisión 
 
 
 
 
 
5) Cálculo del estadígrafo de prueba 
 
 CÁLCULO CON EXCEL 
En el ejercicio 1 del trabajo práctico de VAD armamos la siguiente tabla de ajustamiento 
 
Criterio de los puntos críticos 
Si 𝜒𝑚
 > 𝜒𝑐
 se rechaza la hipótesis nula. 
 
 
Criterio del p-valor 
Si 𝑃(𝜒 > 𝜒𝑚
 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐
 ) 𝛼, entonces se rechaza la hipótesis nula 
 
 
Cuadernillo de Aplicación III - 42 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
Debido a que las frecuencias teóricas son menores a 5 agrupamos los casos para los valores 2,3 y 4 
De esta manera cambian los grados de libertad 
( – – ) y también cambia el 
valor de chi cuadrado crítico siendo el nuevo valor 3,84 
 
Cálculo en Excel 
=INV.CHICUAD.CD(0,05;1)=3,84. 
 
En conclusión, obtuvimos: 
 
 8 
También podemos calcularlo por Infostat como se explica en el ejercicio 1 
 
 
5) Toma de decisión 
Criterio de los puntos críticos 
Cuadernillo de Aplicación III - 43 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 8 > 8 se rechaza la hipótesis nula. 
 
6) Criterio del p-valor 
 =0,0000< =0,05 entonces se rechaza la hipótesis nula 
 
7) Interpretación 
No se tiene suficiente evidencia muestral, con un α = 0,05 para decir que el número de análisis de 
Salmonella spp positivos realizados en helados de crema por día sigue una distribución binomial 
 
8) Conclusión 
El número de análisis de Salmonella spp positivos realizados en helados de crema por día no sigue 
una distribución binomial. Se deberá ajustar otro modelo de probabilidad. 
 
Caso 2 del trabajo práctico de variable aleatoria discreta 
1) Hipótesis científica: El número de envases abollados por cuarteto de envase sigue una distribución 
binomial. 
 
 ( ) 
 
2) Nivel de significancia α = 0,05 
3) Estadígrafo de Prueba 
 
 ∑
( ̂ )
 
 ̂ 
 
 
 ( ) 
 
4) Regla de decisión 
 
CÁLCULO CON EXCEL 
En el ejercicio 2 del trabajo práctico de VAD armamos la siguiente tabla de ajustamiento 
Criterio de los puntos críticos 
Si 𝜒𝑚
 > 𝜒𝑐
 se rechaza la hipótesis nula. 
 
 
Criterio del p-valor 
Si 𝑃(𝜒 > 𝜒𝑚
 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐
 ) 𝛼, entonces se rechaza la hipótesis nula 
 
 
Cuadernillo de Aplicación III - 44 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
 
Debido a que las frecuencias teóricas son menores a 5 agrupamos los casos para los valores 3 y 4. 
De esta manera cambian los grados de 
libertad( ) y 
también cambia el valor de chi cuadrado crítico siendo el nuevo valor 7,81 
 
Cálculo en Excel 
=INV.CHICUAD.CD(0,05;3)=7,81 
 
En conclusión, obtuvimos: 
 
 7 
También podemos calcularlo por Infostat como se explica en el ejercicio 1 
Cuadernillo de Aplicación III - 45 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
 
 
 
 
5) Toma de decisión 
Criterio de los puntos críticos 
7 7 8 se acepta hipótesis nula. 
 
6) Criterio del p-valor 
 > 
 entonces se acepta la hipótesis nula 
 
7) Interpretación 
Se tiene suficiente evidencia muestral, con un α = 0,05 para de que de que el número de envases 
abollados por cuarteto de envases sigue una distribución binomial 
 
8) Conclusión 
Es correcto el ajustamiento que se realizó en el caso 2 del TP de VA. 
Ejercicio 7 
La siguiente tabla presenta información sobre la distribución de plantas de jarilla (Larrea divaricata) 
encontrada en 48 cuadrantes sorteados en un campo. 
 
Tabla auxiliar: Distribución de plantas de jarilla por cuadrante 
xi: Cantidad de plantas de jarilla 0 1 2 3 4 5 6 
ni: Cantidad de cuadrantes 9 9 10 14 2 2 2 
 
1.- Complete las líneas punteadas, según corresponda. 
2.- Realice el ajustamiento con el modelo que corresponda y a continuación desarrolle la prueba 
de bondad de ajuste con un nivel de significancia de 0,05. Extraiga conclusiones en términos 
estadísticos y del problema. 
Cuadernillo de Aplicación III - 46 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
2. 
Como no conocemos el parámetro ( ) lo estimamos a través de los datos muestrales (media 
ponderada). Para ello construimos una tabla auxiliar en Excel: 
 
Tabla auxiliar para calcular lambda (media ponderada) 
xi frecuencias frecuencias 
relativas (fi ) 
xi fi 
0 9 0,19 0 
1 9 0,19 0,19 
2 10 0,21 0,42 
3 14 0,29 0,88 
4 2 0,04 0,17 
5 2 0,04 0,21 
6 2 0,04 0,25 
 48 1,000 2,12 
 
 
El valor estimado de es 2,12 
 
Luego realizamos la tabla de ajustamiento como se realizó en el trabajo práctico de VAD 
 
 
 
xi frecuencias P(X=xi) P(Xxi) Frecuencias 
teóricas 
0 9 0,12 0,12 5,76 
1 9 0,25 0,38 12,21 
2 10 0,27 0,65 12,95 
3 14 0,19 0,84 9,15 
4 2 0,10 0,94 4,85 
5 2 0,04 0,98 2,06 
6 2 0,02 1,00 0,73 
 48 1,00000 47,70 
 
Prueba de bondad del ajuste 
 
1) Hipótesis científica: la distribución de plantas de jarilla (Larrea divaricata) encontrada en 48 
cuadrantes sorteados en un campo sigue una distribución de Poisson. 
 ( ) 
 
2) Nivel de significancia α = 0,05 
3) Estadígrafo de Prueba 
 
Cuadernillo de Aplicación III - 47 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 ∑
( ̂ )
 
 ̂ 
 
 
 ( ) 
 
4) Regla de decisión 
 
5) Cálculo del estadígrafo de prueba 
 
 
 
 
Debido a que las frecuencias teóricas son menores a 5 agrupamos los casos para los valores 4, 5 y 
6. De esta manera cambian los grados de libertad ( 
 ) y también cambia el valor de chi cuadrado crítico siendo el nuevo valor 
7,81 
 
Cálculo en Excel 
=INV.CHICUAD.CD(0,05;3)=7,81 
 
En conclusión, obtuvimos: 
 
 8 997 
También podemos realizar el cálculo en Infostat como es explicó en el ejercicio 1 
Criterio de los puntos críticos 
Si 𝜒𝑚
 > 𝜒𝑐
 se rechaza la hipótesis nula. 
 
Criterio del p-valor 
Si 𝑃(𝜒 > 𝜒𝑚
 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐
 ) 𝛼, entonces se rechaza la hipótesis nula 
Cuadernillo de Aplicación III - 48 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
 
 
6) Toma de decisión 
Criterio de los puntos críticos 
 8 7 8 se acepta la hipótesis nula. 
 
Criterio del p-valor 
 997 > , entonces se acepta la hipótesis nula 
 
7) Interpretación 
Se tiene suficiente evidencia muestral, con un α = 0,05 de que las plantas de jarilla (Larrea 
divaricata) encontrada en 48 siguen una distribución de Poisson. 
 
8) Conclusión 
Podemos afirmar que las plantas de jarilla por cuadrante siguen una distribución de Poisson 
por lo tanto el modelo ajustado es correcto. 
 
Ejercicio 8 
Con el fin de determinar si existe asociación entre los tipos de defectos (M: machucado; Q: quemado; 
P: podrido) en duraznos que se reciben en una fábrica y la época de cosecha (T: cosecha temprana; 
R: cosecha tardía). Los resultados han sido: 
n(MT) = 15 ; n(QT) = 19 ; n(MR) = 21 ; 
n(QR) = 13 ; n(PT) = 26 ; n(PR) = 18 
1. Construya la tabla de contingencia que corresponda 
 2. Aplique una prueba de hipótesis que considere apropiada (α = 0,01). Extraiga conclusiones en 
términos estadísticos y del problema. 
3. Dé el fundamento probabilístico aplicado para obtener las frecuencias conjuntasteóricas. 
 
Cuadernillo de Aplicación III - 49 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
1. 
 
Época de 
cosecha 
Defectos 
 Machucado Quemado Podrido Total 
Temprana 15 19 26 60 
Tardía 21 13 18 52 
Total 36 32 44 112 
2. 
1) Hipótesis científica: El tipo de defecto en duraznos que se reciben en una fábrica depende de la 
época de cosecha de los mismos. 
 
{
 ( ) 
 ( ) 
 
 
2) Nivel de significancia α = 0,01 
3) Estadígrafo de Prueba 
 ∑∑
( ̂ )
 
 ̂ 
 
 
 
 
 ( ( ) ( ) ) 
 
4) Regla de decisión 
 
 
 
 
 
5) Cálculo del estadígrafo de prueba 
 
CÁLCULO CON EXCEL 
 
 
Criterio de los puntos críticos 
Si 𝜒𝑚
 > 𝜒𝑐
 se rechaza la hipótesis nula. 
 
Criterio del p-valor 
Si 𝑃(𝜒 > 𝜒𝑚
 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐
 ) 𝛼, entonces se rechaza la hipótesis nula 
Cuadernillo de Aplicación III - 50 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
En conclusión, obtuvimos: 
 Cálculo en Excel 
=INV.CHICUAD.CD(0,01;2)=9,21 
 
 
También podemos calcularlo por Infostat como se explica en el ejercicio 3. Para ello debemos 
editar la tabla de contingencias para pegarla en Infostat. La tabla debe tener el siguiente formato. 
Luego seguimos los mismos pasos que en ejercicio 3. 
 
época defecto frecuencia 
T M 15 
T Q 19 
T P 26 
R M 21 
R Q 13 
R P 18 
 
 
5) Toma de decisión 
Criterio de los puntos críticos 
 9 se acepta la hipótesis nula. 
 
Criterio del p-valor 
 =0,2205> , entonces se acepta la hipótesis nula 
 
6) Interpretación 
No se tiene suficiente evidencia muestral, con un α = 0,01 para decir que el tipo de defecto en 
duraznos está asociado a la época de cosecha de los mismos. 
7) Conclusión 
El defecto del durazno es independiente de la época de cosecha. 
Cuadernillo de Aplicación III - 51 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
3. 
La igualdad, ( ) ( ) ( ), es utilizada para encontrar eventos independientes, y se 
deduce de la expresión de la probabilidad condicionada 
P(A│B)=P(A∩B)/P(B), si P(B)≠0 (1) 
Entonces si los eventos son independientes, la ocurrencia de B no influye en A, 
P(A│B)=P(A) (2). 
Luego, reemplazando la expresión (2) en la expresión (1), resulta: 
P(A)=P(A∩B)/P(B) y, despejando, la P(A∩B)=P(A)*P(B) 
 
Ejercicio 9 
En una agroindustria se ha implantado la evaluación de proveedores. Los envases utilizados son 
provistos por 3 proveedores. Con el objetivo de la evaluación se han tomado los registros del control 
de calidad realizado a las compras de un período anual. Para cada distribuidor se han sorteado 100 
compras. La siguiente tabla muestra los correspondientes resultados 
Proveedor 
Calidad 
No cumple Si cumple 
A 16 94 
B 24 76 
C 9 81 
¿Puede considerarse que los tres proveedores suministran envases con una calidad homogénea? 
 
1) Hipótesis científica: La proporción de envases provistos por los distintos proveedores provienen 
de poblaciones homogeneas. 
 
 = 
 
:H1 las poblaciones no son homogéneas 
 
2) Nivel de significancia α = 0,05 
3) Estadígrafo de Prueba 
Se utiliza la corrección de Yates debido a que se trata de una tabla de contingencias de 2x2 
 
 ∑∑
( ̂ )
 
 ̂ 
 
 
 
 
 ( ( ) ( ) ) 
 
4) Regla de decisión 
 
 
 
 
 
 
Criterio de los puntos críticos 
Si 𝜒𝑚
 > 𝜒𝑐
 se rechaza la hipótesis nula. 
 
 
Criterio del p-valor 
Si 𝑃(𝜒 > 𝜒𝑚
 ) 𝑝 𝑣𝑎𝑙𝑜𝑟 < 𝑃(𝜒 > 𝜒𝑐
 ) 𝛼, entonces se rechaza la hipótesis nula 
 
Cuadernillo de Aplicación III - 52 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
5) Cálculo del estadígrafo de prueba 
CÁLCULO CON EXCEL 
Cálculo en Excel 
=INV.CHICUAD.CD(0,05;2)=5,99 
 
 
 
En conclusión, obtuvimos: 
 
 7 7 
También podemos calcularlo por Infostat como se explica en el ejercicio 3. Para ello debemos 
editar la tabla de contingencias para pegarla en Infostat. La tabla debe tener el siguiente formato. 
Luego seguimos los mismos pasos que en el ejercicio 3. 
Proveedor calidad frecuencia 
A no cumple 16 
A si cumple 94 
B no cumple 24 
B si cumple 76 
C no cumple 9 
C si cumple 81 
 
Cuadernillo de Aplicación III - 53 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCuyo- Año 2020 
 
6) Toma de decisión 
Criterio de los puntos críticos 
 7 > 99 se rechaza la hipótesis nula. 
 
7) Criterio del p-valor 
 7 , entonces se rechaza la hipótesis nula 
 
7) Interpretación 
Se tiene suficiente evidencia muestral, con un α = 0,05 para afirmar que la proporción de 
envases provistos por los distintos proveedores no provienen de la misma población 
 
8) Conclusión 
La calidad de los envases provistos por las distintas empresas no es homogénea.

Continuar navegando

Materiales relacionados

20 pag.
148 pag.
DO-FCE-EE-MAI-UC0307-2018

SIN SIGLA

User badge image

Mucha Aprendizaje

123 pag.
DocsTec-4847

ITESM

User badge image

Todo para Aprender