Logo Studenta

PRUEBAS DE HIPÓTESIS-Estadística

¡Este material tiene más páginas!

Vista previa del material en texto

Cuadernillo Unidad III _ Pruebas de Hipótesis 
Cátedra de Cálculo Estadístico y Biometría. Facultad de Ciencias Agrarias. UNCuyo. Año 2020 
 
RESOLUCIÓN PRUEBAS DE HIPÓTESIS 
 
 
 
 
Ejercicio 1 
Teniendo en cuenta el caso del peso (g) por racimo de uvas del cuartel variedadMalbec de la 
Finca San Antonio de la Facultad de Ciencias Agrarias de la UNCuyo (caso 6 cuadernillo I), 
determine si el peso promedio por racimo ha disminuido para un nivel de significancia de 0,05. 
Para ello tenga en cuenta que 𝑋~𝑁(𝑥; 61 𝑔, 13,8𝑔). 
 
1. Indique qué tipo de inferencia estadística realizará. 
El tipo de Inferencia estadística a realizar es una prueba de Hipótesis 
 
2. Identifique qué estadígrafo está involucrado y cuál es su distribución en el muestreo. 
El estadígrafo involucrado es la media muestral �̅� 
Su distribución en el muestreo es Normal �̅�~ 𝑵(�̅�; 𝝁�̅�, 𝝈�̅�), siendo 𝝈�̅� =
𝝈𝑿
√𝒏
 (error 
típico de la media) 
3. Realice la inferencia indicada en el punto 1, deje constancia de los pasos de la prueba y 
fundamente la elección del estadígrafo de prueba. 
 
1) Hipótesis científica: El peso (g) por racimo de uva del cuartel Malbec de la Finca 
San Antonio de la Facultad de Ciencias Agrarias de la UNCuyo ha disminuido 
H0: µ = 61 g 
H1: µ< 61 g 
2) Nivel de significancia α = 0,05 
3) Estadígrafo de Prueba 
Fundamento de la elección: la población es normal y n≥ 𝟑𝟎 𝒑𝒐𝒓 𝒍𝒐 𝒕𝒂𝒏𝒕𝒐 𝒍𝒂 media 
muestral �̅� tiene una distribución en el muestreo Normal, una E[�̅�⦌= 𝜇�̅� y una 
VAR [�̅�⦌= 𝝈
𝟐
𝒏⁄ . Su transformación es Z, el desvío Normal Tipificado: 
 Z =
�̅�−𝜇�̅�
𝜎�̅�
 ~ N (z; 0,1) 
4) Regla de decisión 
 
Como la hipótesis alternativa nos dice que el promedio ha disminuido, la prueba 
de hipótesis es de una cola a la izquierda. 
Pasos de una prueba de hipótesis 
1º) Identificar el problema y plantear las hipótesis 
2º) Fijar nivel de significancia 
3º) Elegir el estadígrafo de prueba (fundamento, fórmula y distribución) 
4º) Establecer la regla de decisión (formal y gráfica) 
5º) Calcular el valor, según la muestra, del estadígrafo elegido 
6º) Tomar la decisión 
7º) Interpretar estadísticamente 
8º) Concluir en términos del problema 
 
TENGA EN CUENTA QUE PARA EL USO DE LOS SOFTWARE DEBE CONTAR CON LOS DATOS 
CRUDOS. 
EL ESTUDIANTE VERÁ QUE PODEMOS CALCULAR LOS VALORES CRÍTICOS DE LOS ESTADÍGRAFOS 
DE PRUEBA Y EL VALOR DE P (PROBABILIDAD) TANTO CON EXCEL COMO CON INFOSTAT. 
Cuadernillo de Aplicación Unidad III - 2 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 1. Función de densidad para la variable aleatoria Z (DNT) 
 
5) Cálculo del estadígrafo de prueba 
 
 CÁLCULO CON EXCEL 
 
 
 
¿CÓMO OBTUVIMOS LOS VALORES QUE SE ENCUENTRAN EN LAS CELDAS DE 
ESTA PLANILLA? 
 
La media poblacional: µ es un dato de la consigna 
n = 123 es el tamaño de la muestra. Es un dato que traemos del Caso 6, Unidad I 
�̅�: media muestraly DE (desviación estándar)se calculancon los datos del caso 
6,Unidad I. Se utilizan las fórmulas vistas en ese momento 
Alfa (α): es el nivel de significancia y es un dato dentro de la consigna 
𝒛𝟎,𝟎𝟓es el z crítico (es un valor de la variable z que arrastra una probabilidad de 0,05. 
Su aplicación se vio en el práctico de Variable Aleatoria Continua) 
𝒛 𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒍, se obtiene reemplazando en el Estadígrafo de Prueba, los valores 
correspondientes. 
 
 La fórmula para su cálculo es Zm=
�̅�−𝜇�̅�
𝜎�̅�
 . En la celda B10 está la fórmula con sus 
reemplazos. 
 
𝒑 − 𝒗𝒂𝒍𝒐𝒓 = 𝑷(𝒁 < 𝒛𝒎)=F(zm). Su aplicación se dio en el práctico de Variable Aleatoria 
Continua 
 
6) Toma de decisión 
α =0,05 
1) Criterio de los puntos críticos 
Si zm<-z0,05se rechaza la hipótesis nula 
 
2) Criterio del p-valor 
Si el p-valor es menor que el nivel de 
significancia, se rechaza la hipótesis nula. 
p-valor(probabilidad) <α(probabilidad) 
zc =- 1,65 
Cuadernillo de Aplicación Unidad III - 3 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
Para un nivel de significancia de 0,05 no se acepta (o se rechaza) la hipótesis 
nula de que la media poblacional es igual a 61 gramos (µ = 61 g). 
7) Interpretación 
Se tiene suficiente evidencia muestral, con un α = 0,05 para decir que la media 
del peso en gramos por racimo del cuartel variedad Malbec de la Finca San 
Antonio de la Facultad de Ciencias Agrarias de la UNCuyo ha disminuido 
8) Conclusión 
La media del peso en gramos por racimo del cuartel Malbec de la Finca San 
Antonio de la Facultad de Ciencias Agrarias de la UNCuyo es menor a 61 gramos. 
 
 
DE AQUÍ EN ADELANTE USTED RESUELVA DE ACUERDO CON LA 
CORRESPONDIENTE TEORÍA Y CONSIGNAS 
 
Ejercicio 2 
Un vivero compró 400 bulbos de tulipán a un productor de la zona, que aseguró que la 
proporción de bulbos que no florecen es de 0,1. De los 400 bulbos no florecieron 48. ¿Puede 
decirse, para un nivel de significancia del 0,05, que la proporción obtenida es diferente a la 
indicada por el productor? 
1. Indique qué estadígrafo está involucrado y cuál es su distribución en el muestreo 
 
El estadígrafo involucrado es �̂� 
Su distribución en el muestreo es: �̂�~ N(�̂�; π, 𝝈�̂�), siendo 𝝈�̂� = √
𝝅∗(𝟏−𝝅)
𝒄
 
 
2. Realice la inferencia, dejando constancia de todos los pasos y de los supuestos que deben 
cumplirse. 
 
Supuestos:La distribución en el muestreo de la proporción muestral�̂� es normal con 
una media igual a π y un error típico igual a 𝝈�̂� = √
𝝅∗(𝟏−𝝅)
𝒄
 Cuando n → ∞ el 
estadígrafo de prueba es 
𝑧 =
�̂� − 𝜋
√
𝜋(1−𝜋)
𝑐
 
1) Planteo de las hipótesis 
a. Hipótesis científica:“La proporción de bulbos de tulipán que florecieron es diferente 
que la indicada por el productor”. 
b. 𝐻0: 𝜋 = 0,1 
c. 𝐻1: 𝜋 ≠ 0,1 
 
2) Nivel de significancia:𝛼 = 0,05 
 
3) Estadígrafo de prueba: 𝑧 =
�̂�−𝜋
√
𝜋(1−𝜋)
𝑐
 
4) Regla de decisión: 
 
Se rechaza la hipótesis nula si 𝑧𝑚 < −1,96 𝑜 𝑠𝑖 𝑧𝑚 > 1,96 
 
 
 
 
 
𝑓(𝑧) 
-1,96 1,96 
Figura 2. Función de densidad de 
la Variable Aleatoria Z (DNT). 
Cuadernillo de Aplicación Unidad III - 4 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
5) Cálculos: 
 
�̂� = 
𝑥
𝑐
 = 
48
400
 = 0,12 
 
 
𝑧 =
�̂�−𝜋
√
𝜋(1−𝜋)
𝑐
=
0,12−0,1
√
0,1∗0,90
400
 =1,33 
 
6) Toma de decisión: 
Como zm(1,33)es menor que z0,975(1,96) y mayor que z0,025(-1,96) no se puede rechazar la 
hipótesis nula para un nivel de significancia α = 0,05. 
7) Interpretación: 
Se tiene evidencia muestral suficiente para decir que la proporción de bulbos de tulipán que no 
florecen es de 0,1 para un nivel de significancia de 0,05. 
 
8) Conclusión: 
El porcentaje de bulbos de tulipán que no florecen es del 10% tal como afirma el productor. 
Ejercicio 3 
Un departamento de inspección de cauces realizó un estudio para determinar si la 
concentración de microorganismos, en dos estaciones colectoras de un río, es significativamente 
diferente. Se supone que la densidad de microorganismos de ambas estaciones tiene distribución 
normal y las varianzas son iguales. Los resultados fueron los siguientes: 
 
 
 
 
 
 
 
 
 
1. Defina las Variables Aleatorias para cada estación y dé su distribución con los parámetros 
correspondientes 
Variable aleatoriaX1: “densidad de microorganismos en estación colectora 1 expresada 
en número de microorganismos por metro cuadrado” 
 
Variable aleatoria X2: “densidad de microorganismos en estación colectora 2 expresada 
en número de microorganismos por metro cuadrado” 
 
La distribución de la variable aleatoria es normal: 
 
• Estación 1: 𝑿𝟏~𝑵(𝒙𝟏; 𝝁𝟏; 𝝈𝟏
𝟐) 
• Estación 2: 𝑿𝟐~𝑵(𝒙𝟐; 𝝁𝟐; 𝝈𝟐
𝟐) 
 
Número de microorganismos por metro cuadrado 
Estación 1 Estación 2 
5030 4980 2800 1330 
13700 11900 4670 3320 
10730 8130 6890 1230 
11400 26850 7720 2130 
860 17660 7030 2190 
2200 22800 7330 
42501130 2810 
15040 1690 
 
Cuadernillo de Aplicación Unidad III - 5 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
 
 
 
2. ¿Conoce los parámetros de estas distribuciones? 
No, se desconocen 𝝁𝟏; 𝝁𝟐; 𝝈𝟏
𝟐 𝒚 𝝈𝟐
𝟐 
 
3. Si desconoce los parámetros¿Cómo los estimaría? Especifique fórmula/s y valor/es 
 
�̂� = �̂� 
 
𝑿�̂� =
∑ 𝑿𝒊
𝒏
=
𝟏𝟓𝟖𝟑𝟓𝟎
𝟏𝟔
= 𝟗𝟖𝟗𝟔, 𝟗 𝒎𝒊𝒄𝒓𝒐𝒐𝒓𝒈𝒂𝒏𝒊𝒔𝒎𝒐𝒔 
 
𝑿�̂� =
∑ 𝑿𝒊
𝒏
=
𝟒𝟗𝟒𝟓𝟎
𝟏𝟐
= 𝟒𝟏𝟐𝟎, 𝟖 𝒎𝒊𝒄𝒓𝒐𝒐𝒓𝒈𝒂𝒏𝒊𝒔𝒎𝒐𝒔 
 
�̂�𝒙 
𝟐 = 𝒔 ̂𝒙
 𝟐 
 
�̂�𝟏
𝟐 = 𝟔𝟐𝟎𝟎𝟐𝟑𝟖𝟐, 𝟗 
�̂�𝟐
𝟐 = 𝟔𝟏𝟒𝟕𝟗𝟑𝟓, 𝟔 
 
 𝑺𝒙 = √�̂�𝑿
𝟐 
 
𝑺𝟏 = √�̂�𝟏
𝟐 = √𝟔𝟐𝟎𝟎𝟐𝟑𝟖𝟐, 𝟗 = 7874,16 
𝑺𝟐 = √�̂�𝟐
𝟐 =√𝟔𝟏𝟒𝟕𝟗𝟑𝟓, 𝟔 = 2479,50 
 
Cálculo utilizando Infostat→ 
 
 
 
 
 
 
 
 
 
4. Realice una estimaciónpor intervalo para la densidad media de microorganismos por 
metro cuadrado de la estación 1. (1- α=0,95) 
 
𝑷 (�̄� − 𝒕𝜶
𝟐⁄
𝒔
√𝒏
< 𝝁 < �̄� + 𝒕𝜶
𝟐⁄
𝒔
√𝒏
) = 𝟏 − 𝜶 
 
𝑷 (𝟗𝟖𝟗𝟔, 𝟗 − 𝒕𝜶
𝟐⁄
𝟕𝟖𝟕𝟒, 𝟐
√𝟏𝟔
< 𝝁 < 𝟗𝟖𝟗𝟔, 𝟗 + 𝒕𝜶
𝟐⁄
𝟕𝟖𝟕𝟒, 𝟐
√𝟏𝟔
) = 𝟏 − 𝟎, 𝟎𝟓 
 
(𝟗𝟖𝟗𝟔, 𝟗 − 𝟐, 𝟏𝟑 ∗ 𝟏𝟗𝟔𝟖, 𝟔 < 𝝁 < 𝟗𝟖𝟗𝟔, 𝟗 + 𝟐, 𝟏𝟑 ∗ 𝟏𝟗𝟔𝟖, 𝟔) = 𝟎, 𝟗𝟓 
 
(𝟓𝟕𝟎𝟐, 𝟖𝟖 < 𝝁 < 𝟏𝟒𝟎𝟖𝟗, 𝟏𝟐) = 𝟎, 𝟗𝟓 
 
IC95% (7928,4; 1409,02)µ 
 
Interpretación: Con una confianza del 95% el intervalo [5702,88; 14089,12] contiene 
la media poblacional de la densidad de microorganismos por metro cuadrado de la 
estación 1. 
Cuadernillo de Aplicación Unidad III - 6 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
 
5. Se quiere realizar una prueba de hipótesis para probar que la densidad media de 
microorganismos es diferente en ambas estaciones. 
 
5.1.Indique qué estadígrafo de prueba está involucrado y cuál es su distribución en el 
muestreo 
 
La diferencia de medias: (�̅�𝟏 − �̅�𝟐) tiene una distribución de probabilidades Normal con 
media 𝝁(�̅�𝟏−�̅�𝟐)= (𝝁𝟏 − 𝝁𝟐) y error típico 𝝈(�̅�𝟏−�̅�𝟐) = √
𝝈𝟏
𝟐
𝒏𝟏
+
𝝈𝟐
𝟐
𝒏𝟐
 cuando n →∞. 
 
En este caso: 
1.- Suponiendo que las densidades de microorganismos en ambas estaciones tienen 
una distribución Normal, 
2.- Que las muestras provienen de poblaciones independientes 
3.- que las varianzas poblacionales de ambas estaciones son desconocidas y se las 
supone iguales, 
4.- y siendo el tamaño de las muestras de ambas estaciones menores a 30, el 
estadígrafo de prueba esT: 
 
𝑻 =
(�̅�𝟏 − �̅�𝟐) − (𝝁𝟏 − 𝝁𝟐)
𝒔𝒄√
𝟏
𝒏𝟏
+
𝟏
𝒏𝟐
=
(�̅�𝟏 − �̅�𝟐) − 𝟎
𝒔𝒄√
𝟏
𝒏𝟏
+
𝟏
𝒏𝟐
 ~𝒕(𝒏𝟏 + 𝒏𝟐 − 𝟐) 
𝒔𝒄 = √
(𝒏𝟏−𝟏)𝒔𝟏
𝟐+(𝒏𝟐−𝟏)𝒔𝟐
𝟐
𝒏𝟏+𝒏𝟐−𝟐
, desviación típica conjunta 
5.2.Pruebe, con un 𝛼 = 0,05, que la densidad media de microorganismos es diferente 
en ambas estaciones. 
1) Planteo de la hipótesis 
a. Hipótesis científica: “La densidad media de microorganismos es diferente en 
ambas estaciones colectoras” 
b. 𝑯𝟎: (𝜇1 − 𝜇2) = 0 
c. 𝑯𝟏: ( 𝜇1 − 𝜇2 ) ≠ 0 (prueba de dos colas) 
 
2) Nivel de significancia: α= 0,05 
3) Estadígrafo de prueba: 
𝑇 =
(�̅�1 − �̅�2) − (𝝁𝟏 − 𝝁𝟐)
𝑠𝑐√
1
𝑛1
+
1
𝑛2
=
(�̅�1 − �̅�2) − 0
𝑠𝑐√
1
𝑛1
+
1
𝑛2
 ~𝑡(𝑛1 + 𝑛2 − 2) 
𝑠𝑐 = √
(𝑛1 − 1)𝑠1
2 + (𝑛2 − 1)𝑠2
2
𝑛1 + 𝑛2 − 2
 
4) Regla de decisión: 
 
Rechazo la H0 si 𝑡 > 𝑡0,025 o bien t < −𝑡0,975 
Valor crítico de t para 𝛼 2⁄ = 0,025 y 𝜐 = 16 + 12 − 2 = 26 
𝑡0,025 = −2,056 y 𝑡0,975 = 2,056 
 
 
 
 
 
𝑓(𝑡) 
-2,056 2,056 
Figura 3. Función de densidad de 
la Variable Aleatoria t de Student. 
Cuadernillo de Aplicación Unidad III - 7 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
5) Cálculos: 
Reemplazando en el estadígrafo de prueba obtenemos el valor muestral de T 
𝑠𝑐 = √
(𝑛1−1)𝑠1
2+(𝑛2−1)𝑠2
2
𝑛1+𝑛2−2
= 𝑠𝑐 = √
(16−1)62002382,9+(12−1)6147935,6
16+12−2
 =6194,5 
𝑇 =
(9896,9 − 4120,8) − 0
6194,5√
1
16
+
1
12
= 2,44 
 
6) Toma de decisión: 
Como tm (2,44) es mayor a tα/2 (2,056), se debe rechazar la hipótesis nula para un nivel de 
significancia de 0,05. 
7) Interpretación: 
Se tiene evidencia muestral suficiente para decir que la densidad media de microorganismos es 
diferente en ambas estaciones para un nivel de significancia de 0,05. 
8) Conclusión: 
La densidad media de microorganismos por metro cuadrado es diferente en ambas estaciones 
colectoras. 
RESOLUCIÓN CON EXCEL 
1.- Cargar los datos en una hoja de Excel. En columnas 
2.- Buscar en Datos → Análisis de Datos → Funciones para Análisis→Prueba t para 
dos muestras suponiendo varianzas iguales 
 
 
 
 
 
Cuadernillo de Aplicación Unidad III - 8 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
 
Salida 
Prueba t para dos muestras suponiendo varianzas 
iguales 
 Estación 1 Estación 2 
Media 9896,875 4120,833333 
Varianza 62002382,92 6147935,606 
Observaciones 16 12 
Varianza agrupada 38371655,21 
Diferencia hipotética de las medias 0 
Grados de libertad 26 
Estadístico t 2,441724435 
P(T<=t) una cola 0,010864824 
Valor crítico de t (una cola) 1,70561792 
P(T<=t) dos colas 0,021729647 
 
Excel nos devuelve la descriptiva junto con la prueba de hipótesis. También nos indica el 
valor de p, la P(T >tm) = 0,02172. Podemos usar este valor para tomar la decisión 
comparándolo con el nivel de significancia: p-valor< α o sea 0,02172 < 0,05, entonces se 
rechaza H0. Al comparar ambas probabilidades vemos que la decisión es rechazar la H0. 
RESOLUCIÓN CON INFOSTAT 
Prueba T para muestras independientes 
Menú → ESTADÍSTICAS → INFERENCIA BASADA EN DOS MUESTRAS →PRUEBA T 
(MUESTRAS INDEPENDIENTES) 
 
 
 
 
Cuadernillo de Aplicación Unidad III - 9 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
 
RESULTADOS INFOSTAT 
Prueba T para muestras Independientes 
Grupo 1 Grupo 2 n(1) n(2) Media(1) Media(2) T p-valor prueba 
{Estación 1} {Estación 2} 16 12 9896,88 4120,83 2,76 0,0125 Bilateral 
Ejercicio 4 
Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre 
un análisis químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de 
hierro. Cada muestra se divide en dos submuestras y se aplican los dos tipos de análisis, ya que 
se desea conocer si los dos métodos arrojan el mismo resultado. Se supone que las mediciones 
tienen una distribución normal. Los datos figuran a continuación: 
 
 Muestra 
Análisis 1 2 3 4 5 
Rayos X 2,0 2,0 2,3 2,1 2,4 
Químico 2,2 1,9 2,5 2,3 2,4 
 
1. Indique qué estadígrafo está involucrado y cuál es su distribución en el muestreo 
 
�̅�: promedio de la diferencia en el contenido de hierro 
El Estadígrafo tiene una distribución en el muestro t de Student porque: 
1.- Se supone que la muestra proviene de una población con distribución 
Normal 
2.- La varianza poblacional es desconocida 
3.- La muestra es pequeña 
4.- Ambos análisis se realizan sobre una misma muestra que está dividida en 
dos, por eso las muestras se denominan “pareadas” o “emparejadas” 
 
𝑇 =
�̅� − 𝜇𝐷
𝑠�̅�
=
�̅� − 𝜇𝐷
𝑠𝐷
√𝑛
⁄
=
�̅�
𝑠𝐷
√𝑛
⁄
~ 𝑡(𝑛 − 1) 
2. Pruebe si hay diferencia entre ambos métodos (𝛼 = 0,01). 
1) Planteo de las hipótesis 
a. Hipótesis científica:“Existe diferencia entre los dos tipos de análisis, rayos 
X y químico, en el contenido de hierro de una sustancia” 
b. 𝑯𝟎: 𝜇𝐷 = 0 
c. 𝑯𝟏: 𝜇𝐷 ≠ 0 (prueba de dos colas) 
2) Nivel de significancia: α= 0,01 
3) Estadígrafo de prueba: 
𝑇 =
�̅� − 𝜇𝐷
𝑠�̅�
=
�̅� − 𝜇𝐷
𝑠𝐷
√𝑛
⁄
=
�̅�
𝑠𝐷
√𝑛
⁄
 
 
4) Regla de decisión: 
Rechazo la H0 si 𝑡 > 𝑡0,005 o bien t < 𝑡0,995 
Elvalor crítico de t para 𝛼 2⁄ = 0,005 y 𝜐 = 5 − 1 = 4 
𝑡0,005 = −4,604 y 𝑡0,995 = 4,604 
𝑓(𝑡)-4,604 4,604 
Fig4. Función de densidad de la 
Variable Aleatoria t de Student. 
Cuadernillo de Aplicación Unidad III - 10 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
5) Cálculos: 
Tabla auxiliar de cálculo 
Muestra Rayos X Químico d (d - d̅)^2 
1 2 2,2 -0,2 0,01 
2 2 1,9 0,1 0,04 
3 2,3 2,5 -0,2 0,01 
4 2,1 2,3 -0,2 0,01 
5 2,4 2,4 0 0,01 
SUMA -0,5 0,08 
 
Reemplazando en el estadígrafo de prueba obtenemos el valor muestral de t 
�̅� =
∑ 𝑑𝑖
𝑛
=
−0,5
5
= −0,1 
𝑠𝑑 = √
∑(−0,2 − (−0,1))2 + (0,1 − (−0,1))2(−0,2 − (−0,1))2(−0,2 − (−0,1))2(0 − (−0,1))2
5 − 1
= √0,02
= 0,141 
𝑠𝑑 = √
∑(𝑑𝑖−�̅�)
2
𝑛−1
 = √
0,08
4
 = 0,141 
𝑠�̅� = 
𝑠𝑑
√𝑛
⁄ = 0,141/√5 = 0,0630 
El estadígrafo de prueba resulta 
𝑇 =
�̅� − 𝜇𝐷
𝑠�̅�
=
−0,1 − 0
0,0630
= −1,587 
6) Toma de decisión: 
Como tm=-1,587 no es mayor a t0,995 (4,604) y no es menor a t0,005 (-4,604), se acepta la hipótesis 
nula para un nivel de significancia de 0,01. 
7) Interpretación: 
No se tiene evidencia muestral suficiente para decir que hay una diferencia entre un análisis 
químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro de una 
sustancia para un nivel de significancia de 0,01. 
8) Conclusión: 
La cantidad de hierro en la muestra analizada de una sustancia ferrosa no es diferente tanto si la 
determinación de hierro se realiza mediante análisis por rayos X como por análisis químico. 
 
 
 
Cuadernillo de Aplicación Unidad III - 11 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
CÁLCULOS CON EXCEL 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Si comparamos el valor de p (0,189) con el nivel de significancia nos lleva al mismo resultado, el 
valor de p es mayor que el α = 0,05 utilizado en la prueba. 
 
Con InfoStat 
 
Prueba de dos colas. 𝑡𝑐=±4,604; 𝑡𝑚=−1,58 
Ejercicio 5 
Dos grupos de 200 cerdos cada uno afectados por una enfermedad (A y B), son usados 
para probar la eficacia de un nuevo tratamiento sobre la base de un suero. Ambos grupos son 
tratados idénticamente, excepto que al grupo A se le da el suero y al B no. Se encuentra que 140 
y 120 de los enfermos del grupo A y B, respectivamente, se recuperan de la enfermedad. ¿Puede 
concluirse que el nuevo tratamiento ayuda a curar la enfermedad a un nivel de significancia de 
0,01? 
1) Planteo de la hipótesis 
a. Hipótesis científica:“El nuevo tratamientono ayuda a curar la enfermedad de 
los cerdos luego de la aplicación del suero” 
b. 𝑯𝟎: 𝜋1 = 𝜋2 
c. 𝑯𝟏: 𝜋1 > 𝜋2 (prueba de una cola) 
 
2) Nivel de significancia: α= 0,01 
 
3) Estadígrafo de prueba: 
Las muestras se seleccionaron de forma aleatoria e independiente en las dos 
poblaciones binomiales, y c1 y c2 son lo suficientemente grandes para que la 
distribución de muestreo de (�̂�1 − �̂�2) pueda ser aproximada mediante una distribución 
normal. 
 
Prueba t para medias de dos muestras 
emparejadas 
 
 Rayos X Químico 
Media 2,16 2,26 
Varianza 0,033 0,053 
Observaciones 5 5 
Diferencia hipotética de las medias 0 
Grados de libertad 4 
Estadístico t -1,58113883 
P(T<=t) una cola 0,094501829 
Valor crítico de t (una cola) 3,746947388 
P(T<=t) dos colas 0,189003658 
Valor crítico de t (dos colas) 4,604094871 
Cuadernillo de Aplicación Unidad III - 12 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
𝑍 =
(�̂�1 − �̂�2)
√
�̂�1(1−�̂�1)
𝑐1
+
�̂�2(1−�̂�2)
𝑐2
=
𝑋1
𝑐1
−
𝑋2
𝑐2
√
�̂�(1−�̂�)
𝑐1
+
�̂�(1−�̂�)1
𝑐2
=
𝑋1
𝑐1
−
𝑋2
𝑐2
√�̂�(1 − �̂�) (
1
𝑐1
+
1
𝑐2
)
 ~𝑁(0,1) 
Puesto que no se conoce el valor común de  == 21 (utilizado en el error estándar), se 
estima por 
�̂� =
𝑋1 + 𝑋2
𝑐1 + 𝑐2
 
4) Regla de decisión:rechazo la H0 cuando zm> zc 
 
 
 
 
 
 
 
 
 
 
5) Cálculos: 
Al sustituir en la fórmula �̂� =
𝑥1+𝑥2
𝑐1+𝑐2
 los valores correspondientes se obtiene �̂� =
140+120
200+200
=
0,65 
Reemplazando en el estadígrafo de prueba obtenemos el valor muestral de z 
𝑧 =
𝑥1
𝑐1
−
𝑥2
𝑐2
√�̂�(1 − �̂�) (
1
𝑐1
+
1
𝑐2
)
=
140
200
−
120
200
√(0,65)(0,35) (
1
200
+
1
200
)
= 2,097 
 
 
 
6) Toma de decisión: 
Como zm (2,097) es menor a z0,01 (2,33), no se puede rechazar la hipótesis nula para un 
nivel significancia de 0,01. 
7) Interpretación: 
No se tiene evidencia muestral suficiente para decir que existe diferencia en el tratamiento 
de los cerdos afectados por la misma enfermedad frente al efecto de los sueros aplicados. 
8) Conclusión: 
El nuevo tratamiento no ayuda a curar la enfermedad en los cerdos. 
 
0,01 
zα= 2,33 
𝑓(𝑧) 
Fig5. Función de densidad de la 
Variable Aleatoria Z (DNT). 
Cuadernillo de Aplicación Unidad III - 13 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
Ejercicio 6 
Un fabricante de alimento balanceado para ganado asegura que la ración que él vende genera 
un aumento mayor a 1,07 kg/cabeza/día con una varianza de 0,0144 (kg/cabeza/día)2. Para poner 
a prueba la conjetura del fabricante se realizó un ensayo de alimentación en un lote de 16 
animales. Del mismo se obtuvo una media de 1,04 kg/cabeza/día y un desvío estándar de 0,04 
kg/cabeza/día. 
1. Indique qué estadígrafo está involucrado, cuál es su distribución en el muestreo y los 
supuestos que deben cumplirse. 
 
La población es normal, n es menor a 30 y la varianza poblacional es conocida por lo que la 
media muestral �̅� tiene una distribución en el muestreo Normal. 
Su transformación es Z, el desvío Normal Tipificado: 
 
 
𝒁 = 
�̅�−𝛍 
𝝈�̅�
~𝑵(𝟎, 𝟏) siendo 𝝈�̅� = 𝝈𝑿 √𝒏⁄ 
Supuestos: 
La población original tiene una distribución normal, la muestra se selecciona al azar y la 𝜎�̅�
2 
(varianza poblacional) es conocida. 
 
2. Considerando un nivel de significancia de 0,05, ¿se puede probar la conjetura de que el 
alimento produce ese aumento promedio en el peso del ganado? 
1) Planteo de las hipótesis 
a. Hipótesis científica: “El nuevo alimento balanceado genera un aumento de peso 
en el ganado mayor al que dice el fabricante.” 
b. 𝑯𝟎: 𝜇 = 𝜇0 
c. 𝑯𝟏: 𝜇 > 𝜇0 
 
2) Nivel de significancia: α= 0,05 
 
3) Estadígrafo de prueba: 
𝑍 = 
�̅� − μ 
𝜎𝑋 √𝑛⁄
 ~ 𝑁 (𝑧; 0, 1) 
4) Regla de decisión 
Se rechaza la hipótesis nula si 𝑧𝑚 > 1,645 
 
 
 
 
 
 
 
 
 
 
5) Cálculos 
𝒁 = 
�̅�−𝛍
𝝈𝑿 √𝒏⁄
 = 
𝟏,𝟎𝟒 −𝟏,𝟎𝟕 
𝟎,𝟏𝟐 √𝟏𝟔⁄
= −𝟏 
Figura 6. Función de densidad de la 
Variable Aleatoria Z (DNT). 
0,05 
zα= 1,645 
𝑓(𝑧) 
Cuadernillo de Aplicación Unidad III - 14 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
 
6) Toma de decisión 
Como zm (-1) es menor a z0,95(1,645) se debe aceptar la hipótesis nula para un nivel de 
significancia de 0,05. 
7) Interpretación 
No se tiene evidencia muestral suficiente para decir que el aumento de peso del ganado es 
diferente a 1,07 kg/cabeza/día para un nivel de significancia de 0,05. 
8) Conclusión 
El aumento promedio de peso del ganado luego del consumo de cierto alimento balanceado 
es como afirma el fabricante. 
Ejercicio 7 
De acuerdo con un estudio dietético una ingesta alta de sodio se puede relacionar con úlceras, 
cáncer de estómago y migraña. El requerimiento humano de sal es de sólo 2200 mg por día, el 
cual se rebasa en la mayoría de las porciones individuales de cereales listos para consumir. Si 
una muestra aleatoria de 40 porciones de una determinada marca de cereal tiene un contenido 
medio de 2440 mg de sodio y una desviación típica de 240,5 mg, ¿se puede decir que el 
contenido promedio de sodio para porciones individuales de dicha marca de cereal supera el 
requerimiento por día? 
1. Identifique que tipo de inferencia estadística requiere utilizar 
Prueba de hipótesis 
 
2. Indique qué estadígrafo está involucrado y cuál es su distribución en el muestreo. 
Fundamentode la elección: la población es normal y n≥ 𝟑𝟎 por lo tanto, la media 
muestral �̅� tiene una distribución en el muestreo Normal, una E[�̅�⦌= 𝜇�̅� y una VAR [�̅�⦌= 
𝝈𝟐
𝒏⁄ . Su transformación es Z, el desvío Normal Tipificado: Z =
�̅�−𝜇�̅�
𝜎�̅�
 ~ N (z; 0,1) 
 
3. Realice la inferencia para un 𝛼 = 0,01, dejando constancia de todos los pasos. 
1) Planteo de la hipótesis 
a. Hipótesis científica: “El contenido promedio de sodio de los cereales de una 
determinada marca supera el valor de requerimiento diario”. 
b. 𝐻0: µ = 2200 mg 
c. 𝐻1: µ > 2200 mg 
 
2) Nivel de significancia: α= 0,01 
 
3) Estadígrafo de prueba: 
𝑍 =
�̅� − µ
𝝈𝑿
√𝒏
 ~𝑁(0,1) 
4) Regla de decisión: rechazo la H0 cuando si zm> zα 
 
 
 
 
 
 
 
 
 
0,01 
zα= 2,33 
𝑓(𝑧) 
Figura 7. Función de densidad de 
la Variable Aleatoria Z (DNT). 
Cuadernillo de Aplicación Unidad III - 15 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
 
5) Cálculos: 
Reemplazando en el estadígrafo de prueba obtenemos el valor muestral de z 
𝑍 =
�̅� − µ
𝑆𝑋
√𝑛
=
2440 − 2200
240,5
√40
= 6,311 
6) Toma de decisión: 
Como zm(6,311) es mayor a zc (2,33), se debe rechazar la hipótesis nula para un nivel de 
significancia de 0,01. 
7) Interpretación: 
Se tiene evidencia muestral suficiente para decir que el contenido de sodio en las muestras de 
cereal supera los 2200 mg. 
8) Conclusión: 
El contenido promedio de sodio en una porción de cereal supera el requerimiento diario de este 
mineral. 
Ejercicio 8. DE RESOLUCIÓN INDIVIDUAL 
La forma más práctica para expresar la calidad de un forraje es a través de la carne, leche o 
lana producidos por el animal que consume dicho forraje. La predicción del valor nutritivo del 
mismo a través de un análisis químico puede llegar a ser bastante buena, pero en condiciones de 
pastoreo surgen problemas debido a la complejidad que generan los factores ambientales, 
culturales y genéticos. Existen varios métodos para determinar el porcentaje de pared celular 
(fibra), que es un elemento importante en la nutrición. Se quiere saber si existe diferencia entre 
dos de ellos: Fibra Detergente Neutro (FDN) y Fibra Detergente Ácido (FDA), suponiendo que 
ambos tienen distribución normal. Los valores obtenidos de % de pared celular contenidos en un 
forraje figuran a continuación: 
FDN FDA FDN FDA FDN FDA 
53,20 46,50 54,80 45,60 43,80 32,20 
54,60 47,60 45,00 35,90 29,70 38,00 
47,40 41,70 57,50 40,50 47,20 34,80 
49,00 42,40 46,20 38,50 49,40 41,30 
40,20 36,60 54,10 40,60 50,10 36,70 
40,10 34,50 53,80 41,50 49,80 38,20 
46,70 42,70 59,60 44,40 49,40 40,50 
43,60 36,80 50,40 36,20 49,30 39,80 
43,40 35,60 52,60 38,10 49,90 40,10 
36,50 29,60 44,70 32,70 50,10 39,20 
53,20 37,30 55,90 39,30 43,20 40,40 
48,10 40,30 45,90 36,80 43,60 31,20 
46,60 35,30 51,20 46,90 37,60 32,50 
35,80 29,00 48,70 37,50 43,70 28,30 
36,90 30,40 49,30 37,00 37,80 33,20 
34,20 27,20 45,30 37,10 34,10 30,00 
31,20 26,20 45,80 34,70 41,40 26,10 
44,20 35,40 41,20 32,90 41,90 33,40 
45,60 35,20 45,20 35,80 41,70 33,70 
37,50 32,10 37,60 31,60 41,50 34,50 
37,60 28,50 37,10 29,20 49,60 36,30 
Cuadernillo de Aplicación Unidad III - 16 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
39,00 34,10 40,60 30,60 48,90 35,50 
39,60 33,20 47,90 35,40 47,50 34,00 
 
1. Identifique la variable y la unidad de análisis. 
 
2. Se realizó la corrida de datos en los softwaresInfoStat y Excel, obteniéndose los 
siguientes resultados: 
 
Tabla 1. Distribución de muestras de forraje según % de pared celular obtenida por el 
método FDN 
Variable Clase LI LS MC FA FR FAA FRA 
FDN 1 29,70 35,68 32,69 4 0,06 4 0,06 
FDN 2 35,68 41,66 38,67 17 0,25 21 0,30 
FDN 3 41,66 47,64 44,65 22 0,32 43 0,62 
FDN 4 47,64 53,62 50,63 19 0,28 62 0,90 
FDN 5 53,62 59,60 56,61 7 0,10 69 1,00 
 
Tabla 2. Distribución de muestras de forraje según % de pared celular obtenida por el 
método FDA 
Variable Clase LI LS MC FA FR FAA FRA 
FDA 1 26,10 30,40 28,25 10 0,14 10 0,14 
FDA 2 30,40 34,70 32,55 17 0,25 27 0,39 
FDA 3 34,70 39,00 36,85 23 0,33 50 0,72 
FDA 4 39,00 43,30 41,15 14 0,20 64 0,93 
FDA 5 43,30 47,60 45,45 5 0,07 69 1,00 
 
ESTADÌSTICA DESCRIPTIVA 
 
Resumen FDN FDA 
n 69,00 69,00 
Media 45,16 36,04 
D.E. 6,42 4,93 
Var(n-1) 41,20 24,30 
E.E. 0,77 0,59 
CV 14,22 13,68 
Mín 29,70 26,10 
Máx 59,60 47,60 
Mediana 45,60 35,80 
Q1 40,60 32,90 
Q3 49,40 39,30 
Suma 3115,80 2486,90 
Asimetría -0,15 0,20 
Kurtosis -0,35 -0,16 
P(10) 36,90 29,20 
P(90) 53,80 42,40 
 
Cuadernillo de Aplicación Unidad III - 17 
Cátedra de Cálculo Estadístico y Biometría - Facultad de Ciencias Agrarias – UNCUYO- Año 2020 
 
 
 
 
 
 
 
Figura 9: Distribución de la proporción de muestras 
de forraje según % de pared celular obtenida por el 
método FDN 
 
 
Prueba z para medias de dos muestras 
 FDN FDA 
Media 45,157 36,042 
Varianza (conocida) 41,200 24,300 
Observaciones 69,000 69,000 
Diferencia hipotética de las medias 0,000 
z 9,355 
P(Z<=z) una cola 0,000 
Valor crítico de z (una cola) 1,645 
Valor crítico de z (dos colas) 0,000 
Valor crítico de z (dos colas) 1,960 
 
3. Extraiga conclusiones de la descripción estadística de ambas muestras. 
4. Realice el planteo de la prueba que corresponda para determinar si hay diferencia 
entre ambos métodos. Interprete. 
 
26,71 32,69 38,67 44,65 50,63 56,61 62,59
FDN
0,00
0,08
0,17
0,25
0,33
fr
e
cu
e
n
ci
a
 r
e
la
tiv
a
23,95 28,25 32,55 36,85 41,15 45,45 49,75
FDA
0,00
0,09
0,17
0,26
0,35
fre
cu
en
ci
a 
re
la
tiv
a
Figuras 8: Distribución de la proporción de muestras de 
forraje según % de pared celular obtenida por el método 
FDA

Continuar navegando