Logo Studenta

analitica guia 1ra parte

Vista previa del material en texto

Facultad de Ciencias 
Veterinarias 
 
U.B.A. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Área Bioestadística 
2017– 2do. Cuatrimestre 
 
Estadística Analítica 
 
Guía de Trabajos PrácticosGuía de Trabajos PrácticosGuía de Trabajos PrácticosGuía de Trabajos Prácticos 
1era1era1era1era parte parte parte parte 
 II 
Cronograma 2017 – 2do. Cuatrimestre 
Sem lunes Contenidos 
1 07-Ago 
 Revisión de conceptos relativos a inferencia. Intervalos de confianza y prue-
bas de hipótesis para la diferencia de medias de dos poblaciones. (hasta test 
t con varianzas desconocidas y distintas inclusive). 
2 14-Ago 
Continuación: valores centrales (medias/medianas) de dos poblaciones. Inter-
valo de confianza y pruebas de hipótesis para el valor central (me-
dia/mediana) de diferencias apareadas. 
3 21-Ago 
Intervalo de confianza y pruebas de hipótesis para la diferencia de proporcio-
nes de dos poblaciones. Distribución F. Intervalo de confianza y pruebas de 
hipótesis para el cociente de varianzas de dos poblaciones. 
4 28-Ago Ejercitación de unidad 1. 
5 04-Sep 
Introducción al Diseño de experimentos. Diseño Completamente Aleatorizado 
(DCA) 
6 11-Sep Continuación de DCA paramétrico y no paramétrico. Ejercitación. 
7 18-Sep Revisión e integración (Sábado 23 de setiembre 1er. Parcial) 
8 25-Sep 
Estadístico de Chi cuadrado para pruebas de bondad de ajuste. Pruebas de 
Independencia 
9 02-Oct 
Estadístico de Chi cuadrado para Pruebas de Homogeneidad. Ejercitación de 
la unidad. 
09-Oct 
Feriado 10 
 Lunes 
Introducción a la regresión. Regresión lineal simple. Dócima e intervalos de 
confianza para los parámetros de la recta utilizando la t de Student. 
11 16-Oct 
Continuación de Regresión Lineal Simple: Intervalos de predicción y de con-
fianza. 
12 23-Oct 
Coeficiente de determinación. ANOVA en la regresión. Regresión lineal múlti-
ple. 
13 30-Oct Correlación Simple paramétrica y no paramétrica. 
14 06-Nov Integración. Revisión y consulta. (Sábado 11-11-17 2do. Parcial) 
15 13-Nov -------- 
20-Nov 
Feriado 16 
 Lunes 
Recuperatorio: Jueves 23 de Noviembre, a las 18 hs 
 III 
NOTA IMPORTANTE: 
 
La cátedra publica solamente la 
GUIA DE TRABAJOS PRACTICOS 
y la GUIA DE FORMULAS Y TABLAS 
para la cursada de esta materia. 
Cualquier otra publicación NO CUENTA 
CON LA APROBACION DE LA CATEDRA. 
Bibliografía 
 
 
� Cantatore de Frank, Norma M.: Manual de Estadística Aplicada. Ed. Hemis-
ferio Sur. 1ra. Edición. Buenos Aires. Capítulos: 4, 5, 6, 7, 8, 12 y 13. 
 
� Cappelletti, Carlos A.: Elementos de estadística. Cesarini Hnos. Editores. 
2da. Edición. Bs. As. Capítulos 8, 9, 10, 11, 13 y 14. 
 
� Daniel, Wayne W.: Bioestadística. Base para el análisis de las ciencias de la 
salud. 3ra. Edición. Uteha, Noriega Editores. México. Capítulos: 5, 6, 8, y 10. 
 
 
 
 
 IV 
Sistema de Evaluación de Estadística Analítica 
Se tomarán dos parciales, que serán calificados en una escala de 0 a 10, en for-
ma global. 
Las condiciones de LIBRE, ASISTENCIA CUMPLIDA, REGULAR Y PROMO-
CIÓN se obtienen si se cumplen las situaciones con respecto a calificación y 
asistencia que abajo se detallan. 
 
ASISTENCIA: Concurrencia a las clases teórico-prácticas en un porcentaje: 
LIBRE: inferior al 75% 
ASISTENCIA CUMPLIDA y REGULAR: mayor o igual al 75% 
PROMOCIÓN: mayor o igual al 80% 
 
CALIFICACIÓN: 
 
 SEGUNDO PARCIAL 
 1 2 3 4 5 6 7 8 9 10 
1 LIBRE LIBRE LIBRE AC AC 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
2 LIBRE LIBRE LIBRE AC AC 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
3 LIBRE LIBRE LIBRE AC AC 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
4 AC AC AC AC AC 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
COL 
5 AC AC AC AC AC 
REC 
1P 
REC 
1P 
REC 
1P 
COL COL 
6 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
REG REG PROM PROM PROM 
7 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
REG PROM PROM PROM PROM 
8 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
PROM PROM PROM PROM PROM 
9 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
COL PROM PROM PROM PROM PROM 
 
 
 
P
R
IM
E
R
 P
A
R
C
IA
L 
10 
REC 
2P 
REC 
2P 
REC 
2P 
COL COL PROM PROM PROM PROM PROM 
Siendo: 
AC: asistencia cumplida 
COL: coloquio 
PROM: promoción 
REC 2P: recupera 2do. Parcial 
REC 1P: recupera 1er. Parcial 
REG: regular 
 
NOTA 
1. Los alumnos que estén ausentes a un parcial y presenten certificado oportu-
namente en la cátedra lo rendirán en la fecha de recuperatorio y si posteriormen-
te quedan en situación de recuperar un parcial se les asignará una fecha. 
2. Los alumnos que recuperan algún parcial consiguen como máximo la condición 
de REGULAR. 
3. Los coloquios se tomarán en forma oral sobre los contenidos que involucra el 
parcial de menor puntaje y definen la condición del alumno. 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 1 
Unidad 1: INFERENCIA para DOS POBLACIONES 
 
Objetivos específicos: 
 
• Comprender la importancia de diseñar experimentos. 
• Analizar la adecuación de cada diseño en función del contexto de la investigación. 
• Aplicar los conceptos de inferencia estadística a la comparación de dos poblaciones, utilizando como 
procedimientos la estimación y la prueba de hipótesis. 
• Seleccionar el procedimiento de inferencia adecuado en función del objetivo y del cumplimiento de los 
supuestos. 
• Resolver problemas e interpretar conclusiones aplicando los métodos de análisis sobre dos 
poblaciones. 
 
Contenidos temáticos: 
� Diseño de experimentos: necesidad, ventajas, propósitos, definiciones previas. Tipos de diseños y 
alcances. 
� Revisión de conceptos relativos a la estimación puntual y por intervalos. Intervalos de confianza 
para la diferencia de medias y para la media de las diferencias. Estimaciones para la diferencia de dos 
proporciones, para el cociente de varianzas, y para el cociente de desvíos estándar. 
� Revisión de conceptos relacionados con las pruebas de hipótesis. Prueba de hipótesis para: 
diferencia de medias en base a dos muestras independientes: diferencia de medias, cociente de 
varianzas, diferencias de proporciones. Muestras apareadas: media de las diferencias. 
� Relación entre intervalo de confianza y prueba de hipótesis bilateral. Aplicaciones. 
 
Glosario: 
Diseño de experimentos : experimento, unidad experimental, tratamiento, factor, niveles de un factor, 
observación, efecto. Repetición, aleatorización, control local. Estudios observacionales, pre-
experimentales, cuasiexperimentales y experimentales. 
Inferencia para dos poblaciones : Población, muestra. Parámetro. Estimador. Estimación. Estimador 
puntual. Intervalo. Intervalo de confianza. Nivel de confianza. Hipótesis de trabajo. Hipótesis estadística. 
Hipótesis nula y alternativa. Error tipo I y tipo II. Nivel de significación. Región crítica. Regla de decisión. 
Distribución F de Snedecor. Diferencia de medias y de proporciones, cociente de varianzas para muestras 
independientes. Muestras apareadas: media de las diferencias. 
 
El diseño de experimentos 
La ciencia, tiene entre sus objetivos la explicación y comprensión de los acontecimientos. Un requisito 
fundamental en toda ciencia fáctica es el contraste de las hipótesis planteadas, poniendo a prueba las 
mismas mediante una confrontación con la experiencia. 
El diseño experimental crea las condiciones para el contraste de la hipótesis y brinda la metodología esta-
dística correspondiente para el análisis de los datos. 
Es el proceso de planear un experimento para obtener datos apropiados que puedan ser analizados 
mediante métodos estadísticos, con objeto de producir conclusiones válidas y objetivas. La metodolo-
gía estadística es el único enfoque objetivo para analizar un problema que involucre datos sujetos a 
errores experimentales. Así es que hay dos aspectos en cualquier problema experimental: el diseño del 
experimento y el análisis estadísticode los datos. 
 
El propósito del diseño experimental es controlar la máxima cantidad de información pertinente al pro-
blema bajo investigación. Sin embargo también es importante que el diseño o plan sea tan simple co-
mo sea posible, a fin de ahorrar tiempo, dinero, personal y material experimental. 
Para que la metodología de diseño de experimentos sea eficaz es fundamental que el diseño sea el ade-
cuado. Un experimento puede realizarse por alguno de los siguientes motivos: 
� Determinar los factores principales que influyen sobre la variable respuesta. 
� Encontrar las condiciones experimentales con las que se consigue un valor extremo en la variable 
de interés o respuesta. 
� Comparar las respuestas en diferentes niveles de observación de variables controladas. 
� Obtener un modelo estadístico-matemático que permita hacer predicciones de respuestas futuras. 
 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 2 
Para poder realizar un buen diseño experimental, es necesario previamente comprender el problema 
que se desea estudiar, planteándose un conjunto de preguntas clásicas: 
1- ¿Cuáles son las características de interés? 
2- ¿Qué variables afectan a las características que se van a analizar? 
3- ¿Cuántas veces debería repetirse el experimento? 
4- ¿A partir de qué valor se considerará que el efecto es significativo? 
Lo cual conduce a elegir las variables más apropiadas y sus niveles de medición, elegir la o las res-
puestas a evaluar y el modelo de diseño. 
Para responder estas preguntas es necesario definir claramente algunos términos fundamentales: 
� Experimento : es un ensayo o una observación, realizado bajo condiciones establecidas y contro-
ladas por el experimentador, susceptible de repetirse bajo las mismas condiciones. 
� Variable de interés o respuesta : es la variable que se desea estudiar. 
� Unidad experimental : es la parte más pequeña de material experimental, entidad física o sujeto, 
en la que se aplica un tratamiento una sola vez. También puede entenderse como cada una de las 
reproducciones del experimento. 
� Tamaño del Experimento : es el número total de observaciones recogidas en la ejecución del ex-
perimento. Ejemplo: si se asignan 10 gallinas a cada una de tres dietas el tamaño del experimento es 
30. 
� Factor : es una variable que se sospecha que puede ejercer influencia sobre la variable respuesta 
de interés. 
� Factor controlado : se denomina así a una variable manipulada por el investigador o variable in-
dependiente, a fin de estudiar su influencia sobre la variable de interés o dependiente. Algunos autores 
la denominan variable de entrada al proceso. Ejemplo: si pensamos que la temperatura o la humedad 
pueden afectar a la conservación de cierta propiedad de un alimento o medicamento, se puede contro-
lar manteniendo dicho producto con tres valores distintos de temperatura. 
� Niveles del factor : son cada una de las categorías, o valores, o formas específicas que adopta la 
variable independiente o controlada. Ejemplo: en el caso de las tres dietas, el factor dieta tiene tres 
niveles; en el caso del rodeo, el factor tiene dos niveles. 
� Tipos de factores : existen factores cuantitativos, cuyos niveles son cantidades numéricas, y cuali-
tativas, cuyos niveles son procedimientos o cualidades. Ejemplo de factor cuantitativo puede ser la 
cantidad de fertilizante adicionado a las parcelas de cultivo por hectárea con niveles: 10kg/ha – 20 
kg/ha -30 kg/ha de fertilizante. Ejemplo de factor cualitativo puede ser el tipo de nutriente adicionado a 
una dieta con niveles: potasio, magnesio y calcio. 
� Tratamiento : conjunto de condiciones experimentales o procedimientos creados para el experi-
mento en función de la hipótesis de investigación a las que se someterá a las unidades experimentales 
en un diseño elegido. Con varios factores es una de las combinaciones específicas de los niveles de 
los factores de estudio, y en un diseño unifactorial es uno de los distintos niveles del factor en el caso. 
Por ejemplo: si se asignan tres dietas distintas a las gallinas de un criadero, cada una de las dietas es 
un tratamiento. Si en un tambo se combinan tres raciones de alimentación dos rodeos con vacas en 
ordeñe (uno con vacas de alta producción y el otro con las de baja producción). Cada combinación de 
rodeo y ración constituye un tratamiento (6 tratamientos). 
� Observación : valor que asume una variable, también denominada variable respuesta, en una de-
terminada realización del experimento, es decir cada registro realizado en el contexto del experimento 
de la variable respuesta. 
� Efecto : diferencia entre los valores medios poblacionales de la variable respuesta en presencia y 
ausencia de un nivel del factor. Si la variable respuesta de interés es el engorde semanal medido en 
gramos de una gallina con cierta dieta enriquecida, el efecto es la diferencia entre el engorde medio 
poblacional con la dieta enriquecida y el engorde medio poblacional con la dieta tradicional, ambos 
medidos en gramos. 
� Diseño equilibrado o balanceado : es el diseño en el que todos los tratamientos son asignados a 
un número igual de unidades experimentales, en el cual se obtiene la misma cantidad de repeticiones 
por tratamiento. Por ejemplo hay cuatro vacas en cada combinación de rodeo y nutriente para el agua. 
 
Principios Básicos del diseño experimental 
 
Los tres principios básicos que caracterizan a un diseño experimental: 
 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 3 
♦ Repetición: cuando un tratamiento es aplicado a más de una unidad experimental. Las observacio-
nes repetidas con las mismas condiciones experimentales en el contexto de un experimento no coinci-
den necesariamente, y por lo tanto una de las cuestiones fundamentales a la hora de diseñar un expe-
rimento es la selección del tamaño de muestra o número de repeticiones adecuado en cada contexto. 
Las razones por las cuales es deseable realizar repeticiones del experimento son: 
a- Proporcionar una estimación del error experimental (error generado por causas no controladas por 
el experimentador), que actúa como unidad básica de medida para indicar el significado de las di-
ferencias. 
b- Obtener mayor precisión en la estimación. 
c- Permitirnos extender el alcance de la inferencia relativa al experimento. 
 
El error experimental según el contexto puede reflejar: 
• errores de experimentación 
• errores de observación 
• errores de medición 
• variación del material experimental 
 
El error experimental puede reducirse generalmente adoptando una o más de las técnicas siguientes: 
• usando material experimental tan homogéneo como sea posible. 
• utilizando información proporcionada por otras variables aleatorias 
• teniendo cuidado al dirigir el experimento 
• usando un diseño experimental más eficiente. 
 
♦ Aleatorización: Todo procedimiento de prueba se basa en un conjunto de supuestos que deben 
satisfacerse para que la prueba resulte válida. Una de las suposiciones más frecuentes es que las ob-
servaciones, o los errores en ellas, son independientes. Dicho en otras palabras la aleatorización 
hace válida la prueba. 
 
♦ Control local: Se denomina de esta manera al conjunto de acciones que implementa el investiga-
dor con el fin de reducir al máximo posible el error experimental manteniéndolo en un rango de varia-
ción manejable. 
Por ejemplo: selección de unidades experimentales homogéneas, división en bloques, calibración de 
instrumentos, etc. 
 
Tipos de estudios de investigación 
Los estudios observacionales son un conjunto de estudios en los que no hay intervención por parte 
del investigador y este se limita a medir las variables que define en el estudio. Por ejemplo, los estu-
dios epidemiológicos. 
 
Ventajas de los estudios observacionales 
1. Son más prácticos y factibles de realizar ya que la cooperación de los sujetos es menos necesaria 
2. Sus resultados son más generalizables a poblaciones, geográfica o demográficamentedefinidas. 
 
Inconvenientes de los estudios observacionales 
1. Escaso control de las influencias de los factores de confusión sobre los resultados del estudio. 
(Los factores de confusión son factores no tenidos en cuenta que pueden llegar a modificar los re-
sultados de un análisis). 
2. Debido a la falta de control por parte del investigador, cada estudio observacional tiende a ser úni-
co, siendo muy difícil reproducir los resultados por otro investigador. 
Los estudios pre-experimentales se caracterizan por analizar una única variable y prácticamente no 
existe ningún tipo de control. No existe manipulación de la variable independiente ni se utiliza el grupo 
de control; por consiguiente son escasas las posibilidades de que este grupo sea representativo de los 
demás. Este tipo de diseño consiste en administrar un tratamiento o estímulo en la modalidad de solo 
pre-prueba / posprueba. 
Un estudio de intervención , también llamado estudio experimental , es un estudio caracterizado por 
la manipulación artificial del factor de estudio por el investigador y por la aleatorización de los casos o 
sujetos en dos grupos, llamados control y tratado. 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 4 
Cuando la característica de la aleatorización en el estudio no se cumple, se dice que el estudio es 
cuasiexperimental . La falta de aleatorización de los estudios cuasiexperimentales indica que no existe 
manera de asegurar la equivalencia inicial de los grupos denominados experimental y de control. 
También es usual que, en un experimento, se utilicen controles históricos. El problema que presenta 
este tipo de diseño es que el grupo actualmente en tratamiento puede presentar importantes diferen-
cias relativas al tratamiento respecto al grupo de control histórico. Los trabajos con controles históricos 
están generalmente sesgados a favor del tratamiento, mientras que los experimentos aleatorios evitan 
este tipo de sesgo. 
PROBLEMAS RESUELTOS 
 
1) Mediante los estudios ecográficos, los bebés pueden actualmente ser observados mientras están en 
el seno materno. Sin embargo, gran cantidad de experimentos desarrollados en animales de laborato-
rio dieron como resultado que la aplicación de ultrasonidos podía ser la causa de que el peso al nacer 
fuese inferior al normal. 
 Ante el temor de que esta conclusión fuese aplicable a los humanos, un grupo de especialistas del 
Hospital John Hopkins de Baltimore puso en marcha un estudio para investigar el tema. En el mismo 
se observó el peso al nacimiento de los bebés que estuvieron expuestos a controles ecográficos (ultra-
sonido) y de los que no estuvieron expuestos. 
 También en este caso los bebés expuestos al ultrasonido durante el embarazo pesaban en su mayo-
ría al nacer menos que aquellos que no lo habían estado, pero un dato a tener en cuenta es que los 
obstetras recomendaban el ultrasonido cuando sospechaban que el embarazo no se desarrollaba con 
normalidad. 
a) ¿Se trata de un estudio observacional o experimental? ¿Por qué? 
b) ¿Puede concluirse que el ultrasonido influye sobre el peso del nacimiento? 
 
Solución: 
a) Se trata de un estudio observacional, porque no hay intervención del investigador. 
b) Los bebés expuestos al ultrasonido y los no expuestos presentaban diferencias que no tenían nada 
que ver con el hecho de ser tratados o no. De modo tal que los investigadores tuvieron un conjunto de 
factores de confusión con el cual enfrentarse. La conclusión del estudio fue, por lo tanto, que las eco-
grafías y el menor peso de los bebés tenían una causa común: problemas durante el embarazo. 
 
2) Mediante la siguiente experiencia se quiere determinar si una droga reduce el nivel promedio de gluco-
sa en sangre (glucemia) en una línea de ratas diabéticas. 
Se tomaron al azar 40 ratas de esta línea y se les suministró la droga (grupo tratado). Al mismo 
tiempo se tomaron otras 30 ratas de la misma línea y se les suministró un placebo (grupo control). 
Los niveles sanguíneos de glucosa (mg/ml) en las ratas fueron: 
Tratadas con droga Tratadas con placebo 
1,82 1,89 1,39 1,79 1,27 1,73 2,01 1,74 1,91 1,52 1,41 
1,88 1,88 1,66 1,93 1,56 1,93 1,70 1,74 2,16 1,60 1,70 
1,69 1,94 1,62 1,44 1,68 1,99 1,82 1,40 1,68 1,57 1,91 
1,83 1,60 1,58 2,12 1,61 1,91 1,70 
2,15 1,91 1,93 2,22 2,18 1,75 1,93 2,03 
2,37 1,65 2,09 1,75 2,00 2,23 2,10 1,95 2,18 
1,95 1,92 2,01 2,48 1,67 2,23 1,96 1,87 2,06 
2,00 2,26 1,94 1,89 
 
 
 
 
 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p(una cola) 
Droga 40 1,73 0,20 0,97 0,7640 
 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 5 
 
 
 
 
 
 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p(una cola) 
Placebo 30 2,02 0,20 0,97 0,7499 
 
a) ¿Es la droga efectiva para reducir el nivel promedio de glucosa en sangre, al 5%? Asuma que la 
droga no modifica la varianza poblacional del nivel de glucosa en sangre, y que ésta es conocida, sim-
bólicamente σ2droga=σ
2
placebo =0,04 mg
2/ml2 
 
b) Construya un intervalo de confianza del 95% para la diferencia entre la media poblacional de la 
glucemia de las ratas tratadas con droga y la media poblacional de la glucemia de las ratas tratadas con 
placebo. 
 
Datos del problema: 
 
• Variables en estudio 
 X: nivel de glucosa de una rata de una línea diabética, tratada con droga , en mg/ml 
 Y: nivel de glucosa de una rata de una línea diabética, tratada con placebo , en mg/ml 
• Tamaños de las muestras: n1= 40 y n2= 30 
• Varianzas poblacionales: Conocidas e iguales. (σ21 = σ
2
2 = 0,04 mg
2/ml2) 
• Nivel de significación: α = 0,05 
• Nivel de confianza: 1 - α = 0,95 
 
Solución: 
a) 
• La hipótesis de trabajo que se desea poner a prueba es: 
“El empleo de la droga disminuye el nivel medio de glucosa en sangre de ratas de la línea diabética” 
 
• Verificación de condiciones para la elección de la mejor variable pivotal: Para poder plantear las 
hipótesis estadísticas y llevar a cabo la prueba, hay que verificar las condiciones teóricas necesarias. 
En este caso, dichas condiciones son: 
-Que ambas variables (X y Y) sean independientes 
-Que se extraigan dos muestras aleatorias X1, X2, …,Xn1 e Y1, Y2, …, Yn2 
-Que cada Xi y cada Yi se distribuya normalmente. 
-σ1
2 y σ2
2 deben ser conocidas 
 
El supuesto de independencia se cumple por la forma en que se realizó el experimento: a un grupo de 
ratas, tomadas al azar, se le suministró la droga y a otro grupo, también tomado al azar, se lo trató con 
placebo. 
Por otro lado, las muestras fueron seleccionadas al azar, según el enunciado, y también éste nos apor-
ta el dato de las varianzas poblacionales. Por ende, la única condición que aún debemos verificar me-
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 6 
diante la prueba de hipótesis correspondiente es que cada Xi y cada Yi de las muestras aleatorias se 
distribuyan normalmente. 
Empezaremos realizando unos gráficos denominados gráfico de cuantil-cuantil (qqplot) como un primer 
acercamiento al tratamiento de la condición en estudio. En este gráfico se comparan dos distribucio-
nes, la de los datos muestrales y la de una normal. Cuando los puntos están perfectamente alineados, 
se infiere que la distribución es exactamente normal, si los puntos están muy cercanos a la línea, la 
distribución es aproximadamente normal, grandes apartamientos de esta estructura indican falta de 
normalidad. Esto sin embargo no tiene la fuerza de un test estadístico es una técnica exploratoria. 
 
Para X: 
 
 
 
 
Observando el gráfico se puede ver 
que los puntos no se alejan mucho 
de la recta, sin embargo, por ser un 
gráfico, no se puede hacer 
inferencia sobre el comportamiento 
distribucional de la variable a nivel 
poblacional. 
 
 
 
 
 
 
 
 
Para poder concluir a nivel poblacional es necesario un test de normalidad. En Elementos de 
Estadísticase estudió la prueba Shapiro-Wilks, para verificar normalidad, cuyas hipótesis son: 
 
( )
( )
2
0 1 1
2
1 1 1
: ~N ; 
: no se distribuye normalmente N ; 
H X
H X
µ σ
µ σ



 
 
En todos los casos para esta prueba utilizaremos un nivel de significación del 10% 
 
Al realizar el test, utilizando InfoStat, se obtuvieron los siguientes resultados: 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
X1 40 1.73 0.20 0.97 0,7640 
 
La regla de decisión tiene el siguiente formato: 
No se rechaza la hipótesis nula si el p-valor>0,10 
Se rechaza la hipótesis nula si el p-valor ≤0,10 
 
Como el p-valor= 0,7640 y es mayor que α=0,10 no se rechaza H0 y se puede concluir que: 
Con un nivel de significación del 10% no tengo evidencias suficientes para rechazar mi hipótesis nula 
( ( )21 1~N ;X µ σ ) entonces el nivel de glucosa en sangre de las ratas tratadas con droga, en mg/ml, se 
distribuye normalmente en esta población de ratas de línea diabética en estudio. 
 
 
Análogamente se estudia la normalidad de la variable Y: 
 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 7 
 
 
 
 
( )
( )
2
0 2 2
2
1 2 2
: ~N ; 
: no se distribuye normalmente N ;
H Y
H Y
µ σ
µ σ



 
 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
Y 30 2.02 0.20 0.97 0,7499 
 
 
 
 
Como ya fur visto, la regla de decisión es: 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor ≤0,10 
 
Como el p-valor= 0,7499 y es mayor que α=0,10 no se rechaza H0 y se puede concluir que: 
Con un nivel de significación del 10% no tengo evidencias suficientes para rechazar mi hipótesis nula 
( ( )21 1Y~N ;µ σ ) entonces el nivel de glucosa en sangre de las ratas tratadas con placebo, en mg/ml, 
se distribuye normalmente en esta población de ratas de línea diabética en estudio. 
 
Nota : este test no será necesario si la información asegura distribución normal de la variable. 
 
Una vez verificada la condición teórica faltante se puede seguir adelante con la prueba. 
 
• Hipótesis estadísticas. 
El interés del investigador es probar si la droga disminuye el nivel medio de glucosa en sangre, 
por lo tanto quiere saber si la media del nivel de glucosa en sangre de ratas tratadas con droga es me-
nor que la media del nivel de glucosa en sangre de las ratas tratadas con placebo. 
Simbólicamente: 1 2µ µ< . Esta expresión no lleva el signo igual, por lo tanto debe corresponder a 
la hipótesis alternativa. Es decir que las hipótesis estadísticas son: 
0 1 2
1 1 2
:
:
H
H
µ µ
µ µ
≥
 <
 
Equivalentemente podría escribirse 
0 1 2
1 1 2
: 0
: 0
H
H
µ µ
µ µ
− ≥
 − <
 
o también 
0 2 1
1 2 1
: 0
: 0
H
H
µ µ
µ µ
− ≤
 − >
 
 
Cualquiera de estas formas expresan las mismas hipó tesis estadísticas . Sin embargo hay que 
elegir una expresión para poder continuar con la prueba manteniendo la elección a lo largo de todo el 
análisis y concluir para las hipótesis elegidas. Si esto no se mantiene se podría estar concluyendo 
erróneamente. En este caso se va a trabajar 
 
con: 
0 1 2
1 1 2
:
:
H
H
µ µ
µ µ
≥
 <
 
• Nivel de significación: α=0,05 
• Estadístico de prueba (o variable pivotal) 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 8 
 
Se está realizando un test de hipótesis para la diferencia de medias poblacionales, por lo cual se 
cuenta con dos opciones al elegir la variable pivotal: Z o t de Student, dependiendo del conocimiento o 
no las varianzas poblacionales. En este caso las varianzas poblacionales son conocidas, por lo tanto 
se utiliza Z, la expresión de la variable pivotal es: 
( ) ( ) ( )1 2
2 2
1 2
1 2
~ 0;1
X Y
Z N
n n
µ µ
σ σ
− − −
=
+
 
• Región crítica: 
Observando la hipótesis alternativa (del par de hipótesis elegidas), se ve que la región crítica es unila-
teral izquierda. Se llega a esta conclusión analizando que si se rechazaría la H0 entonces 1 2µ µ< , lo 
que provoca que en la mayoría de los casos X Y< . De esta forma, el numerador da por resultado un 
número negativo y el denominador siempre es positivo (desvío estándar poblacional) así, en la mayo-
ría de los casos en que se cumpla la hipótesis alternativa, el cálculo de la variable pivotal será negati-
vo, esto me indica que la región crítica es unilateral izquierda. 
Por lo tanto el valor crítico es: 0,05 1,64z = − y la región crítica es: 1,64Z ≤ − 
• Regla de decisión: 
Rechazo H0 si 1,64
oH
Z ≤ − 
No rechazo H0 si 1,64
oH
Z > − 
• Cálculo de ZHo: 
Hasta este momento no utilizamos los valores muestrales, excepto en la verificación de las condi-
ciones para la elección de la variable pivotal, sin embargo se podría haber hecho con muestras piloto y 
recién en esta instancia extraer las muestras para el análisis. Antes de calcular el valor del estadístico 
de prueba hay que calcular las medias muestrales utilizando las fórmulas dadas en la unidad de esta-
dística descriptiva de Elementos de Estadística: 1,73; y 2,02x = = . Hay que tener en cuenta que la 
prueba se está realizando bajo la hipótesis nula que contiene el caso en que las medias poblacionales 
son iguales, por lo tanto la diferencia de las medias poblacionales es cero, es decir que 1 2 0µ µ− = . 
Se utiliza esta igualdad en la prueba debido a que 1 2 0µ µ− = es el valor extremo entre la hipótesis 
alternativa y la hipótesis nula, la decisión que se tome se cumplirá para cualquier otro resultado que 
valide la hipótesis nula ( 1 2µ µ≥ ). Reemplazando estos valores y el resto de la información en la fór-
mula nos queda: 
 
( ) ( ) ( )1 2
2 2
1 2
1 2
1,73 2,02 0 0, 29 0,29
6,017
0,04820,04 0,04 0,001 0,00133
40 30
X Y
Z
n n
µ µ
σ σ
− − − − − − −= = = = = −
+++
 
• Decisión: Se rechaza la hipótesis nula porque 6,017
oH
z = − , es menor que –1,64, o sea que 
ZCALCULADO < ZCRITICO. 
• Conclusión: Con un nivel de significación de 5% tengo evidencia suficiente para rechazar la hipó-
tesis nula ( 0 1 2:H µ µ≥ ), por lo tanto la media poblacional del nivel de glucosa en sangre de ratas dia-
béticas tratadas con droga es menor que la media poblacional del nivel de glucosa en sangre de ratas 
diabéticas tratadas con placebo, en estas poblaciones de ratas diabéticas en estudio. Por lo tanto pue-
do decir que la droga es efectiva. 
b) La fórmula del intervalo del 95% que se está pidiendo se despeja de la variable pivotal y es: 
( ) ( )
2 2 2 2
1 2 1 2
1 1
2 2
1 2 1 2
;x y z x y z
n n n n
α α
σ σ σ σ
− −
 
− − + − + + 
  
 
 
reemplazando se obtiene que 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 9 
 
( ) ( )
[ ] [ ]
0,04 0,04 0,04 0,04
1,73 2,02 1,96 ; 1,73 2,02 1,96
40 30 40 30
0,29 1,96 0,0023; 0,29 1,96 0,0023
0, 29 0,0939; 0, 29 0,0939 0,3839; 0,1961
 
− − + − + + = 
 
 = − − − + = 
= − − − + = − −
 
 
Por lo tanto el intervalo de confianza para la diferencia de medias poblacionales 1 2µ µ− es: 
[-0,3839 mg/ml; -0,1961 mg/ml] 
Conclusión : Con un nivel de confianza del 95%, se espera que el intervalo [-0,3839 mg/ml; -0,1961 
mg/ml] cubra o abarque a la diferencia entre la media poblacional del nivel de glucosa de las ratas tra-
tadas con droga y la media poblacional del nivel de glucosa de las ratas tratadas con placebo, en estas 
poblaciones de ratas diabéticas. 
 
NOTA: Observemos que el 0 (cero) no está incluido en el intervalo de confianza, y que ambos límites 
son negativos, lo cual es indicador de que la diferencia es negativa. Sin embargo, hay que tener en 
cuenta que el IC no es equivalente a la prueba de hipótesis realizada en el punto anterior porque la 
prueba es unilateral. 
 
3) Se tomó una muestra aleatoria de 21 cerdos Yorkshire del norte de la provincia de Buenos Aires. Los 
mismos tenían 3 meses de edad y pesos homogéneos, y se los separó, aleatoriamente, en dos lotes. Al 
lote 1 se le asignó una ración estándar (A) y al lote 2 otra con distinta formulación (B). La siguiente tablacontiene las ganancias de peso de cada animal, luego de 30 días de experiencia, expresadas en kg. 
 
Lote 1(A) 24 26 25 23 28 27 28 24 29 29 
Lote 2(B) 26 32 28 25 29 27 28 27 27 28 30 
 
 
Por estudios anteriores se sabe que ambas variables se distribuyen normalmente con varianzas igua-
les, pero desconocidas. 
a) ¿Se puede suponer, al 5%, que la ganancia media de peso de los animales alimentados con la 
ración B supera significativamente la ganancia media de peso de los animales alimentados con ración 
A? 
b) Construir un intervalo para la diferencia de medias al 95%. ¿Qué puede concluir? 
 
Datos del problema: 
• Variables en estudio: 
XA: ganancia de peso de un cerdo Yorkshire de 3 meses de edad del norte de la provincia de Bs. As. 
alimentado con la ración estándar A 
XB: ganancia de peso de un cerdo Yorkshire de 3 meses de edad del norte de la provincia de Bs. As. 
alimentado con la formulación distinta B 
• Tamaños de las muestras: nA=10 y nB=11 
• Varianzas Poblacionales: σA
2 = σB
2 = σ2 (desconocidas) 
• Nivel de significación: α=0,05 
• Nivel de confianza: 1 - α = 0,95 
 
Solución 
a) 
• Hipótesis de trabajo: “La ganancia media de peso de los animales alimentados con la ración B supera 
la ganancia media de peso de los animales alimentados con ración A” 
• Verificación de las condiciones para elegir la mejor variable pivotal: 
- XA y XB son variables aleatorias independientes. 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 10 
- Se extrajeron dos muestras aleatorias XA1, XA2, …,XAn1 e XB1, XB2, …,XBn2 
-Ambas variables tiene la misma varianza poblacional aunque ésta tiene un valor desconocido. 
-XA ∼ N (µA, σ
2) y XB ∼ N (µB, σ
2) 
En este caso, a diferencia del ejercicio anterior, en el enunciado se asegura la normalidad de ambas 
variables, por estudios anteriores. Por lo tanto no es necesaria la prueba de Shapiro–Wilks para verifi-
carla. Por otro lado la condición de independencia también se cumple por la forma en que se realizó el 
experimento: a un grupo de cerdos, tomado al azar, se lo alimenta con la ración A y al otro grupo, tam-
bién tomado al azar, se lo alimentó con la ración B. 
• Hipótesis estadísticas: La hipótesis de trabajo simbólicamente nos lleva a la expresión: B Aµ µ> , por 
lo tanto esta corresponde a la hipótesis del investigador que ubicamos en la hipótesis alternativa. 
0
1
:
:
B A
B A
H
H
µ µ
µ µ
≤
 >
 
nuevamente, existen diversas formas de plantear la misma hipótesis, como por ejemplo: 
0
1
: 0
: 0
B A
B A
H
H
µ µ
µ µ
− ≤
 − >
 
y otras más. En este caso, se trabajará con la segunda expresión y se concluirá para esta expresión: 
0
1
: 0
: 0
B A
B A
H
H
µ µ
µ µ
− ≤
 − >
 
 
• Nivel de significación: α=0,05 
• Variable pivotal: En este caso, como en el ejercicio anterior, se está realizando un test para la 
diferencia de medias poblacionales, por lo tanto hay dos opciones para la variable pivotal (Z o t-Student). 
Como las varianzas poblacionales son desconocidas no se puede utilizar la variable Z, por lo tanto se 
utilizará la variable pivotal t de Student. 
En Estadística Analítica, al comparar dos medias poblacionales en poblaciones independientes, 
trabajaremos con dos tipos de variables pivotales con distribución t de Student dependiendo del 
conocimiento de la igualdad de las varianzas poblacionales (será un valor desconocido pero igual a ambas 
varianzas poblacionales). Si se conoce que σA
2=σB
2 entonces la fórmula a utilizar es: 
( ) ( )
( )2~
1 1 A B
B A B A
n n
a
A B
x x
t t
s
n n
µ µ
+ −
− − −
=
+
 
Donde sa es la raíz cuadrada de la estimación de la varianza amalgamada, es decir que la varianza 
muestral amalgamada es un promedio ponderado entre la varianza muestral de la variable XA y la varianza 
muestral de la variable XB, y estima a la única varianza poblacional que se desconoce, σ 2. 
• Región crítica: Observando la hipótesis alternativa planteada se deduce que la región crítica es 
unilateral derecha (es decir que se rechaza la hipótesis nula a valores grandes de la variable pivotal). Se 
llega a esta conclusión analizando que si 0B Aµ µ− > , entonces, en la mayoría de los casos debería ser 
0B Ax x− > , lo que hará que el numerador de por resultado un número positivo y el denominador 
siempre es positivo (desvío estándar poblacional) así que el cálculo de la VP será positivo en la mayoría 
de los casos en que se cumpla la hipótesis alternativa, esto me indica que la región crítica es unilateral 
derecha. El valor crítico que se utiliza es 2;1 10 11 2;0,95 19;0,95 1,729A Bn nt t tα+ − − + −= = = , por lo tanto la región 
crítica es: 1,729t ≥ . Gráficamente: 
 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 11 
 
 
• Regla de decisión: Rechazo H0 si 1,729
oH
t ≥ y no rechazo H0 si 1,729
oH
t < 
• Cálculo: Para obtener el valor calculado del estadístico de prueba, hay que realizar ciertos cálcu-
los auxiliares (
2
A B aX ; X y S ) utilizando las fórmulas habituales para las medias y las varianzas muestra-
les, y la siguiente fórmula para la varianza amalgamada: 
2 2
2 ( 1) ( 1)
2
A A B B
a
A B
n s n s
s
n n
− + −=
+ − 
Se obtuvo: 2 226,3 ; 27,91 ; 4,90 ; 3,69A B A Bx x s s= = = = y 
2 (9)4,90 (10)3,69 44,1 36,9 4,26
10 11- 2
as
+ += =
+
 
 = 
19
 
por lo tanto 2,06as = 
 
Reemplazando estos valores en la fórmula de la variable pivotal queda: 
 
( ) ( ) ( )
0
27,91 26,3 0 1,61 1,61 1,61
1,78
2,06*0, 44 0,9061 1 1 1 21
2,06 2,06
10 11 110
B A B A
H
a
A B
x x
t
s
n n
µ µ− − − − −
= = = = = =
+ +
 
 
Como 
0
1,78Ht = y utilizando la regla de decisión se rechaza la hipótesis nula ya que 1,78 es mayor 
que 1,729. 
• Conclusión: Con un nivel de significación del 5% tengo evidencia suficiente para rechazar la hipó-
tesis nula (Ho: µB - µA ≤ 0), por lo tanto, la diferencia entre la media poblacional de la ganancia de peso 
de los cerdos alimentados con la ración B y la media poblacional de la ganancia de peso de los cerdos 
alimentados con la ración A es mayor a cero, en estas poblaciones de cerdos de 3 meses de raza 
Yorkshire del norte de la provincia de Buenos Aires. 
• Respuesta: Se puede suponer, al 5%, que la ganancia media poblacional del peso de los cerdos 
alimentados con la ración B supera significativamente a la ganancia media poblacional del peso de los 
cerdos alimentados con la ración A en esta población de cerdos Yorkshire de 3 meses de edad del nor-
te de la provincia de Bs. As. 
Para este problema, la salida de InfoStat correspondiente es: 
Prueba T para muestras Independientes 
Gr(1) Gr(2) n(1) n(2) media(1) media(2) p(Var.Hom.) T p prueba 
{A} {B} 10 11 26,30 27,91 0,6623 -1,78 0,0452 Unilat 
 
Nota: InfoStat compara grupos en orden alfabético, por lo cual la prueba es unilateral izquierda, o sea 
que utiliza H1: µA-µB<0. Para la comparación es indistinta la forma en que se plantea la diferencia, 
siempre que se respete el sentido de la misma. El valor de t observado es el mismo que obtuvimos al 
aplicar la fórmula, pero de signo opuesto, por haber invertido el orden de la diferencia. 
Si se presenta la salida de computadora, existe la opción de la regla de decisión y decisión con el valor 
de T dado en la tabla así como también con el p-valor de la prueba (0,0452) comparándolo con el α 
utilizado. Por ser un curso de introducción a la materia, la cátedra recomienda la regla de decisión y 
decisión con el estadístico de contraste bajo la hipótesis nula, T. 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 12 
Como puede verse, al realizar la Prueba T para muestras independientes, también se realiza una 
prueba para evaluar la Homogeneidad de Varianzas (luego se analizará en detalle en el resuelto 6), el 
p-valor es 0,6623, por lo que se cumple este supuesto. 
 
En este caso, en que la región crítica es unilateral 
izquierda, el cálculo del p valor es: 
p valor= P(t ≤ V.Calc.) = P (t19≤ -1,78) 
 
 
 
 
 
Ahora, si consideramos la región crítica derecha que 
planteamos al principio, el p valor se grafica y se calcula de la 
siguiente forma, dado que la región crítica es unilateral 
derecha: 
p valor= P (t ≥ V.Calc) = P (t19≥ 1,78) 
 
b) La fórmula del intervalo de 95% de confianza para la diferencia de medias se deduce de la distribución 
de la variable pivotal: 
2;1 /2 2;1 /2
1 1 1 1
( ) ;( )
A B A BB A n n a B A n n a
A B A B
x x t s x x t s
n n n n
α α+ − − + − −
 
− − + − + + 
 
 
Reemplazando con los valores correspondientes queda: 
( ) ( )
[ ] [ ] [ ]
10 11 2;0,975 10 11 2;0,975
1 1 1 1
27,91 26,3 *2,06 ; 27,91 26,3 *2,06
10 11 10 11
1,61 2,093*2,06*0,44; 1,61 2,093*2,06*0,44 1,61 1,90; 1,61 1,90 0,29; 3,51
t t+ − + −
 
− − + − + + = 
 
= − + = − + = −
 
Por lo tanto el intervalo pedido es: [-0,29 Kg; 3,51 Kg] 
Conclusión: Con un nivel de confianza del 95% se espera que el intervalo [-0,29 Kg; 3,51 Kg] cubra o con-
tenga a la diferencia entre la media poblacional de la ganancia de peso de los cerdos alimentados con la 
ración B y la media poblacional de la ganancia de peso de los cerdos alimentados con la ración A, en es-
tas poblaciones de cerdos Yorkshire de 3 meses del norte de la provincia de Buenos Aires. 
 
NOTA: Tener en cuenta que en este caso el IC no es equivalente a la prueba de hipótesis porque la 
prueba es unilateral. 
 
4) En un experimento referido al uso de la vitamina B12 en casos de anemia perniciosa durante el período 
de remisión, se administró, por vía intramuscular, 30 µg de B12 a un total de 10 pacientes tomado al azar. 
En ellos se midió la concentración de hemoglobina en sangre (mg%) en dos momentos, al inicio del 
tratamiento y luego de tres meses. Los valores observados se muestran en la siguiente tabla: 
 
 Paciente 1 2 3 4 5 6 7 8 9 10 
Inicial (I) 12,2 11,3 14,7 11,4 11,5 12,7 12,3 13,0 12,7 13,0 
Hemoglobina 
(mg%) Después de 3 
meses (F, o final) 13,0 13,4 16,0 13,6 14,0 13,0 14,2 15,1 15,9 14,5 
¿Hay aumento significativo de hemoglobina después del tratamiento al nivel del 5%? 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 13 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
D 10 -1,79 0,84 0,97 0,9425 
 
 
Datos del problema: 
• Variable en estudio: 
D: diferencia entre la concentración de hemoglobina en sangre (en mg%) al inicio del tratamiento 
con vitamina B12 y la concentración de hemoglobina en sangre (en mg%) después de tres meses del 
tratamiento con vitamina B12, de un paciente con anemia perniciosa. 
En símbolos: di = ii - fi 
En la siguiente tabla están calculados los valores correspondientes a la diferencia planteada: 
d i -0,8 -2,1 -1,3 -2,2 -2,5 -0,3 -1,9 -2,1 -3,2 -1,5 
 
Nota: En este caso se utilizará: di = ii - fi, pero también se podría haber definido la variable como di = 
fi - ii. La definición de esta variable debe quedar clara al comienzo de la resolución del ejercicio y debe 
mantenerse a lo largo del mismo. 
• Nivel de significación: α=0,05 
Solución: 
• Hipótesis de trabajo: “Hay aumento significativo del nivel de hemoglobina después del tratamiento” 
 Antes de plantear las hipótesis estadísticas hay que analizar las condiciones para elegir la mejor va-
riable pivotal para la situación planteada, ya que no es igual a las anteriores, dado que no hay indepen-
dencia entre las mediciones realizadas, ya que se realizaron dos veces sobre cada individuo, al inicio y al 
finalizar los 3 meses de aplicado el tratamiento con vitamina B12. Por esta razón no se van a comparar las 
medias en los diferentes tiempos, sino que se va a estudiar la media de la variable diferencia. 
• Verificación de las condiciones: En este caso tenemos: 
-I y F variables aleatorias no independientes. 
- (I1,F1), (I2, F2), …, (In1, Fn2) muestra aleatoria de pares 
-normalidad de la variable D definida como D1= I1-F1, D2= I2-F2,…, Dn= In-Fn . 
La muestra aleatoria de pares se confecciona teniendo en cuenta a la independencia entre las diferentes 
unidades experimentales que se cumple por el tipo de muestreo realizado. No confundir con “I y F no son 
independientes” en la misma unidad experimental. Por lo tanto, la única condición que debemos verificar 
es la normalidad de la variable D. 
 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 14 
( )
( )
2
0
2
1
: ;
: ;
D D
D D
H D se distribuye normal
H D no se distribuye normal
µ σ
µ σ



 
 
Shapiro-Wilks (modificado) 
 
Variable n Media D.E. W* p (una cola) 
D 10 -1,79 0,84 0,97 0,9425 
 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor ≤0,10 
 
 
 
Como 0,9425 es mayor que 0,10, no se rechaza la hipótesis nula. Entonces, con un nivel de significación 
del 10% no tengo evidencias suficientes para rechazar H0 ( ( )2 ;D DD se distribuye normal µ σ ), enton-
ces la diferencia entre la concentración de hemoglobina en sangre (mg%) al inicio del tratamiento con 
vitamina B12 y la concentración de hemoglobina en sangre (mg%) luego de 3 meses de tratamiento con 
vitamina B12 en pacientes con anemia perniciosa se distribuye normalmente en esta población de pacien-
tes con anemia perniciosa en estudio. 
Simbólicamente ( )2~ ;D DD N µ σ 
 
• Hipótesis estadísticas: si el tratamiento produce un aumento en el nivel de hemoglobina en 
sangre, los niveles de hemoglobina medidos a los 3 meses deberían ser mayores que los medidos al 
inicio del tratamiento, es decir que la variable D = I – F, tendría una media negativa. Simbólicamente 
0Dµ < . 
La definición de la hipótesis alternativa depende exclusivamente de la definición de la variable en 
estudio, por esta razón debe quedar clara la forma en que se realiza la diferencia entre Ii y Fi. 
Luego, las hipótesis estadísticas son: 
0
1
: 0
: 0
D
D
H
H
µ
µ
≥
 <
 
• Variable pivotal: Por ser una prueba de medias apareadas la opción más usual para la variable 
pivotal es una t de Student (difícilmente se conocerá la varianza de la variable diferencia) con la 
siguiente fórmula: ( )1~
D
n
D
d
t t
s
n
µ
−
−= . Observar que esta expresión es la misma que la utilizada en 
Elementos de Estadística para estudiar una población, la variable estudiada es D, su media muestral 
es d y su varianza muestral es 2Ds . 
• Región crítica: Observando la hipótesis alternativa planteada, se ve que la región crítica es 
unilateral izquierda, con valor crítico: 1;0,05 10 1;0,05 9;0,95 1,83nt t t− −= = − = − (los grados de libertad son 10 
- 1, porque hay 10 diferencias). Se llega a esta conclusión analizando que si 0Dµ < , entonces, en la 
mayoría de los casos debería ser 0d < , lo que hará que el numerador de por resultado un número 
negativo y el denominador siempre es positivo (desvío estándar poblacional) así que el cálculo de la 
VP será negativo en la mayoría de los casos en que se cumpla la hipótesis alternativa, esto me indica 
que la región crítica es unilateral izquierda. Por lo tanto, la región crítica queda definida como 
1,83t ≤ − . Gráficamente: 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 15 
 
• Regla de decisión: Rechazo H0 si 1,83
oH
t ≤ − y no rechazo H0 si 1,83
oH
t > − 
• Cálculo: Para obtener el valor calculado del estadístico de prueba hay que realizar ciertos cálculos 
auxiliares (
2
Dd y s ), utilizando las fórmulas habituales para la media muestral y la varianza muestral, 
sobre las 10 diferencias. 
Utilizando los valores calculados para di (ver la tabla correspondiente al plantear la forma de realizar la 
misma), se obtuvo 1,79d = − y 2 0,71Ds = , reemplazando en la fórmula de la variable pivotal: 
1,79 1,79
6,7
0,84 0, 26
10
oH
t
− −= = = − . 
Como el valor observado –6,7 es menor que –1,83, vale decir pertenece a la región crítica, se rechaza 
la hipótesis nula. 
• Conclusión: Con un nivel de significacióndel 5% tengo evidencia suficiente para rechazar la 
hipótesis nula ( 0Dµ ≥ ), por lo tanto la media poblacional de las diferencias entre la concentración de 
hemoglobina en sangre (mg%) de pacientes con anemia perniciosa al inicio del tratamiento y la 
concentración de hemoglobina en sangre (mg%) de pacientes con anemia perniciosa después de tres 
meses de iniciado el tratamiento con vitamina B12 es menor que cero, en la población de pacientes con 
anemia perniciosa. Por lo cual la hemoglobina aumenta significativamente luego del tratamiento con 
vitamina B12. 
• A continuación se da la salida del programa InfoStat para este problema 
 
Prueba T para un parámetro Valor del parámetro pr obado: 0 
Variable n Media DE T p(Unilateral I) 
D 10 -1,79 0,84 -6,72 <0,0001 
 
Nota: con un p-valor tan pequeño puede decirse que ésta es una decisión “fuerte“. 
 
 
Para el caso de que la región crítica sea unilateral 
izquierda, el cálculo del p valor es: 
P-valor= P (t ≤ V.Calc.) 
 
 
Nota: Al comienzo del ejercicio se definió la variable diferencia como: di = ii - fi, Se recomienda realizar 
de nuevo la prueba, pero definiendo de la otra forma a la variable y observar qué se modifica y qué 
permanece igual. 
 
 
5) Se desea estudiar si una nueva dieta logra un incremento significativo en el peso con respecto a una 
dieta normal en conejos de raza Nueva Zelandia. Se seleccionan 10 pariciones, de cada una de ellas 
se extraen dos conejos machos de 120 días de vida, asignando de manera aleatoria, la forma de ali-
mentación. Los resultados fueron los siguientes: 
 
Par 1 2 3 4 5 6 7 8 9 10 
Peso dieta normal (kg) (X1) 3,9 3,8 4,2 4,8 4 3,5 3,5 4,3 4,1 4,2 
Peso dieta nueva (kg) (X2) 3,7 4,5 3,8 4,1 4,2 4,3 3,4 4 6,8 4,6 
Utilizando un nivel de significación del 5% pruebe la hipótesis planteada por los investigadores. 
 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 16 
Shapiro-Wilks (modificado) 
 Variable n Media D.E. W* p (una cola) 
Dieta norm 10 4,03 0,39 0,94 0,7055 
Dieta nueva 10 4,34 0,94 0,78 0,0072 
D(nueva-norm) 10 -0,31 0,97 0,84 0,0738 
 
 
Datos del problema: 
• Variables en estudio: 
Para poder decidir cual es la variable necesitamos analizar si hay independencia o no entre el peso 
de un conejo con la nueva dieta y el peso de un conejo con la dieta normal. Como los animales 
que se pesaron son de la misma camada entonces comparten las mismas características 
genéticas, por lo tanto hay dependencia entre dichas variables. En consecuencia, elegimos la 
variable diferencia porque tenemos una muestra apareada. 
D (X2-X1)= diferencia entre el peso de un conejo alimentado con una dieta nueva y el peso de su 
gemelo alimentado con una dieta normal. 
• Tamaño de muestras: 10=n1= n2 
• Nivel de significación: α=0,05 
 
Solución: 
 
Se pide una prueba que compare las medias poblacionales y para empezar deberíamos testear si 
cumple el supuesto teórico de normalidad de la variable en estudio. Para lo cual se aplica la prueba de 
Shapiro Wilks: 
 
( )
( )
2
0
2
1
: ;
: ;
D D
D D
H D se distribuye normal
H D no se distribuye normal
µ σ
µ σ



 
 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor ≤0,10 
 
Como p-valor=0,0738≤0,10 se rechaza H0. Por lo tanto, con un nivel de significación del 10%, tengo 
evidencias suficientes para rechazar H0 ( ( )2 ;D DD se distribuye normal µ σ ), entonces la diferencia 
entre el peso de los conejos alimentados con una dieta nueva y el peso de los conejos alimentados con 
una dieta normal, no se distribuye normalmente en esta población de conejos machos Nueva Zelandia 
de 120 días en estudio. 
 
Como la distribución de la variable no es normal no podemos utilizar las dos variables pivotales que se 
basan fuertemente en esta condición que son la Z y la t. Por otro lado, el tamaño de muestra es menor a 
30, lo que retira la posibilidad de utilizar el teorema central del límite, por lo que no podemos usar como 
variable pivotal a la Z correspondiente. Lo que sí se puede decir, es que la variable con la que estamos 
trabajando es por lo menos ordinal al tratarse de una variable numérica, suponemos que posee una 
distribución simétrica (no realizaremos un test para este supuesto aunque sí podría verse una idea 
intuitiva en un box-plot), y cada par es independiente de los demás, por esta razón podemos utilizar el 
test no paramétrico de Wilcoxon para muestras apareadas, ya que cumple con las condiciones 
pertinentes. En resumen: 
- X1 y X2 variables aleatorias no independientes. 
- X e Y son de escala al menos ordinal. 
- (X11,X21), (X12, X22), …, (X1n, X2n) muestra aleatoria de pares. 
- Se define la variable D como D1= X21-X11, D2= X22-X12, …, Dn= X2n- X1n con distribución desconocida pero 
forma simétrica y de única mediana. 
- n<30. 
 
Desarrollemos el test pedido: 
 
Hipótesis de trabajo: Los conejos sometidos a una dieta nueva muestran un incremento significativo en 
el peso con respecto a una dieta normal 
 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 17 
 
 
Hipótesis estadísticas: 
 
0
1
: 0
: 0
D
D
H
H
θ
θ
≤
 >
 
 
Primero, debemos calcular los valores correspondientes a la “diferencia entre el peso de un conejo 
alimentado con una dieta nueva y el peso de su gemelo alimentado con una dieta normal”, en la 
muestra analizada. 
A cada valor de estas diferencias se deberá restarle el correspondiente ΘD bajo H0 (en nuestro caso 
es de 0). 
Luego, debemos obtener el valor absoluto de esta diferencia (AbsD), y asignar un rango a estos 
valores, diferenciando los rangos provenientes de diferencias negativas y diferencias positivas. 
Recordemos que, en caso de que dos valores de D - θ posean valores absolutos iguales, los rangos 
correspondientes a cada una se promedian y se coloca el promedio de los rangos empatados a cada 
valor. 
Dieta nueva Dieta norm D=Nuev-Norm D - θ Abs( D) Rango (-) Rango (+) 
3,7 3,9 -0,2 -0,2 0,2 2,5 
4,5 3,8 0,7 0,7 0,7 7,5 
3,8 4,2 -0,4 -0,4 0,4 5,5 
4,1 4,8 -0,7 -0,7 0,7 7,5 
4,2 4 0,2 0,2 0,2 2,5 
4,3 3,5 0,8 0,8 0,8 9 
3,4 3,5 -0,1 -0,1 0,1 1 
4 4,3 -0,3 -0,3 0,3 4 
6,8 4,1 2,7 2,7 2,7 10 
4,6 4,2 0,4 0,4 0,4 5,5 
 
Luego debemos calcular el valor de la variable pivotal bajo H0. 
 
Llamemos T+ a la suma de rangos provenientes de valores de la variable (D – θ) positivos. En este 
caso: T+ = 7,5 + 2,5 + 9 + 10 + 5,5 = 34,5 
 
T+ tendrá una distribución exacta Tn cuyos valores críticos se encuentra en la tabla de “Prueba de 
rangos con signos de Wilcoxon”. En nuestro ejemplo: VP: T+ ~ T10 
 
Valores Críticos: la tabla sólo ofrece los valores críticos inferiores para cuando se trabaja a una cola o 
a dos colas con ciertos niveles de significación. Si se necesita algún valor crítico superior, se deberá 
hallar mediante la fórmula: 
( )
;1 ;
1
2
n n
n n
T Tα α−
+
= − . 
En nuestro caso, la región crítica es unilateral derecha, por lo que tendremos que usar la fórmula 
anterior para calcular el valor crítico superior. Buscamos en la tabla el valor crítico inferior, T10; 0,05 = 11, 
y aplicamos la fórmula 
( ) ( )
10;0.95 10;0.05
1 10 10 1
11 44
2 2
n n
T T
+ +
= − = − = 
 
La región crítica, es: T+ ≥ 44 
 
Regla de decisión: Rechazo H0 si 44
0
≥+HT 
 No rechazo H0 si 44
0
<+HT 
 
Decisión: como 5,34
0
=+HT y 34,5 < 44, entonces no rechazo H0. 
 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 18 
Conclusión : Con un nivel de significación del 5%, no tengo evidencias suficientes para rechazar H0 
( 0Dθ ≤ ). Por lo tanto, se puede decir que la mediana poblacional de la diferencia entre el peso de los 
conejos alimentados con una dieta nueva y el peso de sus pares alimentados con una dieta normal es 
menor o igual a cero en esta población de conejos machos de raza Nueva Zelandia en estudio. 
Al mismo nivel se puede suponer que la nueva dieta no logra un incremento de peso significativo en losconejos de la raza Nueva Zelanda en estudio. 
 
En caso de tener otro par de hipótesis, la selección del valor crítico correspondiente se realizará según 
la siguiente tabla: 
 
H0 H1 Región crítica 
00 : θθ =H 01 : θθ ≠H ( )
2/;2/;
2
1
αα nn T
nn
TóTT −+≥≤ ++ 
00 : θθ ≥H 01 : θθ <H α;nTT ≤
+ 
00 : θθ ≤H 01 : θθ >H ( )
α;
2
1
nT
nn
T −+≥+ 
 
 
6) En las poblaciones de adultos y adolescentes que veían un programa de televisión los sábados a la 
noche se tomaron sendas muestras al azar de 400 y 600 individuos, respectivamente. A la pregunta “si 
realmente les gustaba el programa”, 100 adultos y 300 adolescentes, de estas muestras, contestaron 
que sí. 
a) Estimar puntualmente y con una confianza del 95% la diferencia entre las proporciones de adultos y 
adolescentes que ven el programa y les gusta. 
b) Probar, al 5%, si ambas proporciones son iguales. 
Datos del problema 
• Variable en estudio: 
X1: Cantidad de adultos que ven el programa los sábados a la noche y les gusta, en una muestra de 400. 
X2: Cantidad de adolescentes que ven el programa los sábados a la noche y les gusta, en una muestra de 
600. 
• Tamaños de muestras: n1 = 400; n2 = 600 
• Nivel de confianza: 1 – α = 0,95. 
Solución : 
a) Antes de comenzar a construir el intervalo hay que verificar las condiciones para arribar a la variable 
pivotal mas indicada. 
• Condiciones: En este caso, a diferencia de los ejercicios anteriores, la condición que se le debe 
pedir a las distribuciones de las variables es que ambas tengan distribución binomial. La verificación de 
esta condición es más sencilla que la verificación de la normalidad, ya que solamente hay que observar 
que las variables cumplan con las condiciones de una variable binomial, es decir: 
� Que cada repetición del experimento tenga dos resultados posibles (éxito y fracaso). Si lo aplica-
mos al ejemplo veremos que las dos posibles respuestas que podemos obtener, al encuestar a una 
persona, son: “que le guste el programa del sábado a la noche” y “que no le guste el programa del sá-
bado a la noche”. 
� Que los resultados (éxito y fracaso) sean mutuamente excluyentes en una misma repetición. Con-
textualizando, que sean mutuamente excluyentes quiere decir que tanto un adulto como un adolescen-
te pueden elegir sólo una de las dos respuestas posibles: “que le guste el programa del sábado a la 
noche” o “que no le guste el programa del sábado a la noche” 
� Que los resultados (éxito y fracaso) sean independientes de repetición en repetición. En el contex-
to del problema, quiere decir que la respuesta de un adulto o de un joven no modifica la probabilidad 
de una posible respuesta de otro adulto o joven respectivamente, en otra repetición del experimento al 
azar. 
� Que el número de repeticiones esté prefijado de antemano, en este caso 400 adultos y 600 ado-
lescentes encuestados, y que la probabilidad de éxito sea constante a lo largo de todas las repeticio-
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 19 
nes del experimento aleatorio, ¼ en el caso de los adultos y ½ en el caso de los adolescentes (estima-
ciones puntuales especificadas en el siguiente inciso). 
En este caso ambas variables cumplen con estas condiciones. 
• Estimación puntual: Lo que se quiere estimar es:”la diferencia entre las proporciones 
poblacionales de adultos y adolescentes que ven el programa y les gusta”, simbólicamente: p1-p2. Por 
lo tanto la estimación puntual de esta diferencia es la diferencia entre las proporciones estimadas, 
1 2
ˆ ˆp p− . 
1
 100
ˆ 0,25
 400
cantidad de adultos que ven el programa los sábados a la noche y les gusta
p
cantidad total de adultos
= = =
 
1
 300
ˆ 0,5
 600
cantidad de adolescentes que ven el programa los sábados a la noche y les gusta
p
cantidad total de adolescentes
= = =
 
Por lo tanto la estimación puntual es: 1 2ˆ ˆ 0,25 0,5 0,25p p− = − = − 
• Intervalo de confianza: La fórmula del intervalo de confianza para la diferencia de proporciones se 
deduce de la única variable pivotal posible, cuya fórmula es: 
( ) ( )
( ) ( )
( )1 2 1 2 1 21 2
1 21 1 2 2
1 2
ˆ ˆ
ˆ ˆ0;1 
ˆ ˆ ˆ ˆ1 1
d
p p p p x x
Z N donde p y p
n np p p p
n n
− − −
= → = =
− −
+
 
Por lo tanto la fórmula del intervalo es: 
( ) ( ) ( ) ( ) ( ) ( )1 1 2 2 1 1 2 21 2 1 21 1 
2 2
1 2 1 2
ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ1 1 1 1
ˆ ˆ ˆ ˆ;
p p p p p p p p
p p z p p z
n n n n
α α− −
 − − − −
− − + − + + 
  
 
 
 Reemplazando: 
( ) ( ) ( ) ( ) ( ) ( )
[ ]
0, 25 1 0, 25 0,5 1 0,5 0, 25 1 0,25 0,5 1 0,5
0, 25 0,5 1,96 ; 0,25 0,5 1,96
400 600 400 600
0,1875 0, 25 0,1875 0, 25
0, 25 1,96 ; 0,25 1,96
400 600 400 600
0,25 1,96*0,03; 0,25 1,96*0,03 0, 25 0,0588; 0, 25
 − − − −
− − + − + + = 
  
 
= − − + − + + = 
 
= − − − + = − − −[ ] [ ]0,0588 0,31; 0,19+ = − −
 
• Conclusión: Con un nivel de confianza del 95% se espera que el intervalo [-0,31;-0,19] cubra o 
contenga a la diferencia entre la proporción poblacional de adultos que ven el programa los sábados a 
la noche y les gusta, y la proporción poblacional de adolescentes que ven el programa los sábados a la 
noche y les gusta, en estas poblaciones de adultos y adolescentes que ven el programa los sábados a 
la noche. 
b) Las hipótesis estadísticas son: H0: p1-p2=0 versus H1: p1-p2≠0 
 
El nivel de significación es 5%, siendo el estadístico de contraste: 
( ) ( )
( )
( )1 2 1 2 1 2 1 21 2
1 2 1 2
1 2
ˆ ˆ
ˆ ˆ ˆ0;1 ; 
1 1
ˆ ˆ1
d
p p p p x x x x
Z N donde p p y p
n n n n
p p
n n
− − − += → = = =
+ 
− + 
 
 
 
Nota: como p1-p2=0 ⇒ p1=p2 bajo el supuesto de la hipótesis nula, entonces se calcula p̂ como un 
promedio ponderado entre 1p̂ y 2p̂ . 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 20 
Como p1-p2≠0 por la hipótesis alternativa, se puede suponer que debería ser 1p̂ - 2p̂ ≠0, lo que no ase-
gura el signo del numerador de la variable pivotal pudiendo ser este tanto positivo como negativo y el 
denominador es siempre positivo por ser la estimación de un desvío estándar poblacional, por lo tanto, 
el resultado del cálculo de la variable pivotal para una cierta muestra podrá ser tanto negativo como 
positivo. Por ello, la región crítica es bilateral, y está formada por los valores de Z mayores o iguales a 
1,96, y los menores o iguales a -1,96. 
 
La regla de decisión es: RECHAZO H0 si Zobs ≥ 1,96 o Zobs ≤ -1,96 
 NO RECHAZO H0 si -1,96 < Zobs < 1,96 
 
1 2
1 2
100 300
ˆ 0, 4
400 600
x x
p
n n
+ += = =
+ +
 
 
( )
( )
0,25 0,5 0 0,25 0,25
7,81
0,03211 1
0,24*0,4 1 0,4
240400 600
Obsz
− − − −= = = = −
 − +  
 
 
Como zobs = -7,81 la decisión es rechazar H0 
 
En esta situación (región crítica bilateral) el p valor se grafica y se calcula de la siguiente forma: 
 
p valor= 2*(min { P(Z ≤ -7,81) P(Z ≥ -7,81) } ) = 2* P(Z ≤ -7,81) 
 
• Con un nivel de significación del 5%, hay evidencias suficientes para rechazar H0 (p1-p2=0), por lo 
tanto la diferencia entre la proporción poblacional de adultos que ven el programa los sábados a la no-
che y les gusta, y la proporción poblacional de adolescentes que ven el programa los sábados a la noche y 
les gusta, es distinta de cero en estas poblaciones de adultos y adolescentes que ven el programa los 
sábados a la noche. 
7) Basándose en el mismo texto y los mismos datos del problema 3 con excepción de la igualdad de las 
varianzas poblaciones, responda los siguientes ítems: 
a.- Estimar el cociente entre las varianzas, puntualmente y con un nivel de confianza del 95%. 
b.- Los nutricionistas que desarrollaron la nueva ración (B) sostienen que además esta genera mayor 
uniformidad en el crecimiento. Probar la hipótesis sugerida con un nivel de significación del 5%. 
 
(Nota : “Mayor uniformidad” hace referencia a la obtención de ganancias de peso parecidas dentro del 
lote, con baja dispersión, siendo ésta una característica deseada por los productores. También podría 
habersedicho que el crecimiento generado por la ración B es más homogéneo que el crecimiento 
generado por la ración A) 
 
Solución: Los datos son los mismos que los del problema 3 y el análisis de las condiciones para la 
elección de la variable pivotal nos indica que: 
- XA y XB son variables aleatorias independientes. 
- Se extrajeron dos muestras aleatorias XA1, XA2, …,XAn1 e XB1, XB2, …,XBn2 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 21 
-XA ∼ N (µA, σ
2) y XB ∼ N (µB, σ
2) 
 
Entonces: 
a) 
• Estimación puntual: se pide estimar puntualmente el cociente entre las varianzas, por ejemplo, sim-
bólicamente
2
2
A
B
σ
σ , cuyo estimador puntual es el cociente de las varianzas muestrales, es decir 
2
2
A
B
s
s
 
 Utilizando la fórmula de la varianza muestral se obtiene: 
( ) ( ) [ ]
2 2
12 2
1
1 1
2631 1 1 44,1
6961 6961 6916,9 4,9
1 9 10 9 9
i
A i
x
s x
n n
   
 = − = − = − = = 
−      
∑
∑ 
( ) ( ) [ ]
2 2
22 2
2
2 2
3071 1 1 36,91
8605 8605 8568,09 3,69
1 10 11 10 10
i
B i
x
s x
n n
   
 = − = − = − = = 
−      
∑
∑ 
 
Por lo tanto el estimador puntual del cociente entre σA
2 y σB
2 es: 
2
2
4,9
1,3279
3,69
A
B
s
s
= = 
(Nota : En este caso se estima el cociente entre la varianza poblacional de A y la varianza poblacional 
de B, pero también podríamos resolver este ejercicio haciendo el cociente inverso, dado que en el 
enunciado no hay ninguna orientación en especial para realizarlo.) 
• Intervalo de confianza: La fórmula del intervalo de confianza para el cociente de varianzas se de-
duce de la variable pivotal que se utiliza para estudiar el cociente de varianzas, cuya fórmula es: 
2 2
2 2
( 1), ( 1) ( 1), ( 1)2 2
2 2
~ o ~
A B A B
A A
A B
n n n n
B A
B B
s s
s
F F F F
s
σ
σ
σ σ
− − − −= = 
La distribución se grafica de la siguiente manera: 
 
 
 
 
Donde: 
( ) ( )1 1 , 1 ;
2
A Bn n
F F α− −
= y 
( ) ( )2 1 , 1 ;1
2
A Bn n
F F α− − −
= 
 
 
 
 
Como en la tabla de F de Snedecor que se usa en el presente curso el valor de F1 no está tabulado, 
para conocerlo es necesario hacer uso de la siguiente igualdad: 
( ) ( )
( ) ( )
1 , 1 ;
2
1 , 1 ;1
2
1
A B
B A
n n
n n
F
F
α
α
− −
− − −
= 
Por ejemplo, en el problema que estamos resolviendo: 
9,10;0,975 9,10;0,025
10,9;0,975
1 1
3,78; 0, 25
3,96
F F
F
= = = = 
El intervalo se construye basándose en las siguientes igualdades: 
 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 22 
2
2
2
( 1),( 1); ( 1),( 1);1
2 2
2
1
A B A B
A
B
n n n n
A
B
s
s
P F Fα α ασ
σ
− − − − −
 
 
 ≤ ≤ = −
 
 
 
 
 
2
2
2
( 1),( 1); ( 1),( 1);1
22 2
1 1
1
A B A B
A
B
A
n n n n
B
P
sF F
s
α α
σ
σ α
− − − − −
 
 
 ≥ ≥ = −
 
 
 
 
 
2
2
2
( 1),( 1);1 ( 1),( 1);
22 2
1 1
1
A B A B
A
B
A
n n n n
B
P
sF F
s
α α
σ
σ α
− − − − −
 
 
 ≤ ≤ = −
 
 
 
 
 
 
2 2
2 2 2
2
( 1),( 1);1 ( 1),( 1);
2 2
1
A B A B
A A
B A B
B
n n n n
s s
s s
P
F Fα α
σ α
σ
− − − − −
 
 
 ≤ ≤ = −
 
 
 
 
Entonces, en nuestro problema: 
2
2
1,3279 1,3279
3,78 0, 25
A
B
σ
σ
 
≤ ≤ 
 
 
2
2
0,3513 5,3116A
B
σ
σ
 
≤ ≤ 
 
 
• Conclusión: Con una confianza del 95% se espera que el intervalo [0,35136; 5,3116] cubra al 
cociente entre la varianza poblacional de la ganancia de peso de los cerdos alimentados con la ración A 
durante 30 días, y la varianza poblacional de la ganancia de peso de los cerdos alimentados con la ración 
B durante 30 días, en estas poblaciones de cerdos Yorkshire de 3 meses de edad del norte de la provincia 
de Buenos Aires en estudio. 
 
b) 
• Hipótesis de trabajo: “la nueva ración genera mayor uniformidad en el crecimiento”. 
• Condiciones para la elección de la variable pivotal: Ya fueron verificados en el ejercicio 3 las con-
diciones de independencia y normalidad de las variables “ganancia de peso de los cerdos ali-
mentados con la ración A durante 30 días” y “ganancia de peso de los cerdos alimentados con la 
ración B durante 30 días”. 
• Hipótesis estadísticas: Si se quiere probar que la nueva formulación es más uniforme, se quiere 
probar que la nueva formulación es menos variable que la ración A, simbólicamente:
2 2
A Bσ σ> , esta 
expresión no contiene el signo igual por lo que corresponde a la hipótesis alternativa. Entonces las 
hipótesis quedan: 
2 2
0
2 2
1
:
:
A B
A B
H
H
σ σ
σ σ
 ≤

>
 o equivalentemente 
2
0 2
2
1 2
: 1
: 1
A
B
A
B
H
H
σ
σ
σ
σ

≤


 >

 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 23 
al igual que en las demás pruebas se debe plantear solo un par de hipótesis y mantenerlas a lo largo de 
toda la prueba, en esta caso vamos a trabajar con
2
0 2
2
1 2
: 1
: 1
A
B
A
B
H
H
σ
σ
σ
σ

≤


 >

 
• Nivel de significación: α=0,05 
• Variable pivotal: Existe una única opción al elegir la variable pivotal en esta prueba, la F de Snedecor, 
cuya fórmula es: 
2 2
2 2
( 1),( 1) ( 1),( 1)2 2
2 2
~ o ~
A B A B
A A
A B
n n n n
B A
B B
s s
s
F F F F
s
σ
σ
σ σ
− − − −= =
 
• Región crítica: Observando la hipótesis alternativa, se ve que la región crítica es unilateral derecha. 
Se llega a esta conclusión analizando que si 
2
2
1A
B
σ
σ
> , entonces, en la mayoría de los casos debería ser 
2
2
1A
B
s
s
> , en consecuencia se rechaza cuando la varianza de la variable A es mayor que la varianza de 
la variable B, o sea, cuando el cociente sea grande lo que implica una región critica unilateral derecha. 
El valor crítico que la determina debe buscarse en la tabla de la distribución de F de Snedecor. Éste es: 
( ) ( ) ( ) ( ) ( )1 , 1 ;1 10 1 , 11 1 ;1 0,05 9,10 ;0,95 3,02A Bn nF F Fα− − − − − −= = = . Por lo cual, la región crítica es 3,02F ≥ 
• Regla de decisión: Rechazo H0 si 0 3,02HF ≥ y no rechazo H0 si 0 3,02HF < 
• Cálculo del estadístico de prueba: Todos los valores necesarios ya fueron calculados, por lo tanto, 
reemplazando en la fórmula, se obtiene: 
 
 Observar que el cociente de las varianzas poblacionales fue 
reemplazado por 1, porque el cálculo se hace bajo la hipótesis nula que 
plantea la igualdad de las varianzas. Como 1,3279 es menor que 3,02, 
No se rechaza la hipótesis nula. 
 
• Conclusión: Con un nivel de significación del 5% no hay evidencia suficiente para rechazar H0 
(
2
0 2
: 1A
B
H
σ
σ
≤ ). Esto significa que el cociente entre la varianza poblacional de la ganancia de peso de los 
cerdos Yorkshire del norte de la provincia de Buenos Aires de 3 meses de edad alimentados con la 
ración A y la varianza poblacional de la ganancia de peso de los cerdos Yorkshire del norte de la 
provincia de Buenos Aires de 3 meses de edad alimentados con la ración B, es menor o igual a 1, en 
estas poblaciones de cerdos Yorkshire de 3 meses de edad del norte de la provincia de Buenos Aires en 
estudio. Por lo tanto, al mismo nivel, no es cierta la hipótesis de los nutricionistas. 
 
Nota: a continuación se da la salida del programa InfoStat para este problema. Observar que los 
resultados son los mismos que se obtuvieron anteriormente. 
 
Prueba F para igualdad de varianzas 
Grupo(1) Grupo(2) n(1) n(2) Var(1) Var(2) F p prueba 
 1 2 10 11 4.900 3.691 1.328 0.3312 Unilat D 
 
8) En un criadero el dueño quiere estudiar si el alimento N produce un menor engorde en los cerdos 
que el alimento T. Para ello a un grupo de cerdos seleccionados aleatoriamente se les administró el 
alimento N y a otro grupo el alimento T y al cabo de un tiempo se registraron los aumentos de peso 
(kg). 
0
2
2
2
2
4,9
3,69
1,3279
1
A
B
H
A
B
s
s
F
σ
σ
= = =
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 24 
 
Alimento T 70 62 85 85 70 65 82 89 88 
Alimento N 81 90 90 86 88 83 89 85 94 95 100 
 
Probar la sospecha del dueño del criadero a un nivel del5%. 
 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
T 9 77,33 10,51 0,84 0,0801 
N 11 89,18 5,56 0,96 0,8858 
 
Datos del problema: 
• Variables: 
T: “Aumento de peso, en kg, de un cerdo que recibió el alimento T” 
N: “Aumento de peso, en kg, de un cerdo que recibió el alimento N” 
• Tamaño de las muestras: nT= 9 y nN= 11 
• Nivel de significación: α=0,05 
 
Solución: 
 
Como primer paso debemos verificar si las muestras en estudio son independientes o contienen datos 
apareados. En este caso, como los cerdos provienen de grupos diferentes y al no contar con informa-
ción adicional que indique que comparten características genéticas consideraremos que las muestras 
son independientes. 
Para verificar la condición de normalidad, realizamos el test de Shapiro-Wilks: 
( )
( )
2
0 T
2
1 T
: ~N ; 
: no se distribuye normalmente ; 
T T
T T
H X
H X
µ σ
µ σ



 
 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor ≤0,10 
 
Como el p-valor es de 0,0801<0,10 se rechaza la hipótesis nula y concluye: Con un nivel de significa-
ción del 10%, tengo evidencias suficientes para rechazar la hipótesis nula (XT∼N(µT;σT
2)) por lo tanto el 
aumento de peso, en kg, de los cerdos que recibieron el alimento T no se distribuye normalmente en 
esta población de cerdos de cierto criadero en estudio. 
 
( )
( )
2
0 N
2
1 N
: ~N ; 
: no se distribuye normalmente ; 
N N
N N
H X
H X
µ σ
µ σ



 
 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor ≤0,10 
 
Como el p-valor es de 0,8858>0,10 no se rechaza la hipótesis nula y concluye: con un nivel de signifi-
cación del 10%, no tengo evidencias suficientes para rechazar la hipótesis nula (XN∼N(µN;σN
2)) por lo 
tanto el aumento de peso, en kg, de los cerdos que recibieron el alimento N se distribuye normalmente 
en esta población de cerdos de cierto criadero en estudio. 
 
No se cumple la condición de normalidad de alguna de las variables en estudio por lo que no podemos 
realizar una prueba t para muestras independientes, debemos realizar un análisis no paramétrico, la 
prueba de Mann-Whitney . Recordemos cuáles son las condiciones para aplicar dicho test: 
- XT y XN deben ser variables aleatorias independientes. 
- XT1, XT2, …,XT nT e XN1, XN2, …,XN nN deben ser muestras aleatorias. 
- nT<30 y/o nN<30. 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 25 
- las variables en estudio XT y XN deben ser de escala por lo menos ordinal. 
- XT y XN deben poseer una única mediana y distribuciones similares 
 
Como estas condiciones se cumplen, desarrollaremos el correspondiente test de Mann-Whitney 
 
Para plantear las hipótesis estadísticas correspondientes, notemos que las muestras no poseen el 
mismo tamaño (nT= 9 y nN= 11). Denominaremos como muestra 1 a aquella que posee la menor 
cantidad de observaciones. En caso de empate, se elige indistintamente. Para este ejemplo, el 
subíndice 1 corresponde a los cerdos que recibieron el alimento T y consecuentemente, el subíndice 2 
corresponde a los cerdos que recibieron el alimento N. 
Como se desea probar que el alimento N produce menor aumento de peso que el T, esto se ve 
reflejado en sus medianas poblacionales de la siguiente forma: 
θ2 < θ1 o equivalentemente θ1 > θ2 
Como en las hipótesis se debe respetar el orden θ1 − θ2 entonces, las mismas quedan planteadas de 
la siguiente forma: 
H0: θ1 − θ2 ≤ 0 
H1: θ1 − θ2 > 0 
 
Se combinan ambas muestras en una única muestra ordenada y luego asignamos a cada dato su ran-
go (posición) según su valor, sin tener en cuenta de cuál de las muestras proviene. 
 
Luego se registra T1 = Suma de rangos de la muestra designada como 
muestra 1. 
 
T1 = 3,5+1+9+9+3,5+2+6+14,5+12,5 = 61 
 
Si los tamaños de muestra no superan a 30, entonces se debe usar la tabla 
de valores críticos del estadístico U de Mann Whitney. Este estadístico es 
( )1 1
1
1
2
n n
U T
+
= − 
 
Variable pivotal: 
( )
( )1 2
1 1
1 ;
1
- ~
2
n n
n n
U T U
+
= 
 
Valores críticos: 
La tabla sólo trae los valores críticos inferiores trabajando a una o dos colas con ciertos niveles de signifi-
cación. En este caso, la región crítica es unilateral derecha ya que la hipótesis alternativa plantea que 
θ1 > θ2 . En consecuencia, buscamos el valor crítico considerando que 1 9n = y 2 11n = , y el nivel de 
significación es 5% (a una cola). Observando en la tabla correspondiente U9;11, al 5% de significación y a la 
prueba de una cola obtenemos U9,11; 0.05=27 
 
Para hallar el valor crítico superior, se utiliza la fórmula: 
1 2 1 2n ,n ; /2 n ,n ; 1- /2 1 2
U U n nα α+ = ⋅ 
9,11;0.95
9,11;0.95
27 9 11
9 11 27 99 27 72
U
U
+ = ⋅
= ⋅ − = − =
 
 
Luego la región crítica resulta U 72≥ 
 
Regla de decisión: Rechazo H0 si 72
0
≥HU 
 No rechazo H0 si 72
0
<HU 
 
T R(T) N R(N) 
70 3,5 81 5 
62 1 90 16,5 
85 9 90 16,5 
 85 9 86 11 
70 3,5 88 12,5 
65 2 83 7 
82 6 89 14,5 
89 14,5 85 9 
88 12,5 94 18 
 95 19 
 100 20 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 26 
( )
0
1 1
1
1 9 10
61 61 45 16
2 2
H
n n
U T
+ ⋅= − = − = − =
 
Como 7216
0
<=HU , entonces no rechazo H0 
Conclusión: Al nivel de significación del 5%, no existen evidencias suficientes para rechazar H0 (H0: θ1 − θ2 
≤ 0), por lo que la diferencia entre la mediana poblacional del aumento de peso, en kg, de los cerdos que 
recibieron el alimento T y la mediana poblacional del aumento de peso, en kg, de los cerdos que recibieron 
el alimento N es menor o igual a cero en estas poblaciones de cerdos de cierto criadero en estudio. 
 
En caso de tener otro par de hipótesis, la selección del valor crítico correspondiente se realizará según 
la siguiente tabla: 
 
H0 H1 Región crítica 
0 1 2H :θ =θ 1 1 2H :θ θ≠ 1 2 1 2n ,n ;α/2 1 2 n ,n ;α/2ó n n -U U U U≤ ≥ ⋅ 
0 1 2H :θ θ≥ 1 1 2H :θ <θ 1 2n ,n ;αU U≤
 
0 1 2H :θ θ≤ 1 1 2H :θ >θ 1 21 2 n ,n ;αn nU U≥ ⋅ −
 
 
9) Con el fin de comparar el rendimiento académico (en una escala de 0 a 100 puntos) entre estable-
cimientos privados y estatales, se seleccionan aleatoriamente 15 personas que han realizado estudios 
secundarios en establecimientos privados, y 15 personas que han realizado estudios secundarios en 
establecimientos estatales. Los datos obtenidos son los siguientes: 
 
PRIVADO 41 65 41 64 51 55 47 92 91 80 45 53 56 71 52 
ESTATAL 90 65 59 65 54 42 48 46 44 43 65 36 35 57 49 
¿Podemos suponer que los rendimientos académicos difieren significativamente? (α=0,05) 
 
Shapiro-Wilks (modificado) 
 Tipo Variable n Media D.E. W* p(una cola) 
Estatal Rendimiento 15 53,20 14,29 0,91 0,2897 
Privado Rendimiento 15 60,27 16,68 0,87 0,0555 
X1: “rendimiento académico (en una escala de 0 a 100 puntos) de un alumno de escuela estatal” 
X2: “rendimiento académico (en una escala de 0 a 100 puntos) de un alumno de escuela privado” 
 
Como primer paso debemos verificar la condición de normalidad, por lo que realizamos el test de Sha-
piro-Wilks: 
( )
( )
2
0 1 1 1
2
1 1 1 1
: ~N ; 
: no se distribuye normalmente ; 
H X
H X
µ σ
µ σ



 
 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor ≤0,10 
 
Como el p-valor es de 0,2897>0,10 no se rechaza la hipótesis nula y concluye: Con un nivel de signifi-
cación del 10%, no tengo evidencias suficientes para rechazar la hipótesis nula (X1∼N(µ1;σ1
2)) por lo 
tanto el rendimiento académico (en una escala de 0 a 100 puntos) de los alumnos de escuela estatal 
se distribuye normalmente en esta población de alumnos de escuela estatal. 
( )
( )
2
0 2 2 2
2
1 2 2 2
: ~N ; 
: no se distribuye normalmente ; 
H X
H X
µ σ
µ σ



 
 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor ≤0,10 
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A) 
 27 
Como el p-valor es de 0,0555≤0,10 se rechaza la hipótesis

Otros materiales