Logo Studenta

Analitica Guia 2013

¡Este material tiene más páginas!

Vista previa del material en texto

Facultad de Ciencias 
Veterinarias 
 
U.B.A. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Área Bioestadística 
2013 – 1er. Cuatrimestre 
Estadística Analítica 
Guía de Trabajos Prácticos 
 II 
Cronograma 2013 – 1er. Cuatrimestre 
Sem lunes 
1 4/3 
Jueves: Revisión de conceptos relativos a inferencia. Intervalos de confianza y 
pruebas de hipótesis para la diferencia de medias de dos poblaciones.(hasta test t 
con varianzas desconocidas y distintas inclusive). 
2 
11/3 
 
Martes: Revisión de conceptos relativos a inferencia. Intervalos de confianza y 
pruebas de hipótesis para la diferencia de medias de dos poblaciones.(hasta test t 
con varianzas desconocidas y distintas inclusive). 
Jueves: Continuación con medias de dos poblaciones. Intervalos de confianza y 
pruebas de hipótesis para la media de las diferencias. 
 
3 18/3 
Martes: Continuación con medias de dos poblaciones. Intervalos de confianza y 
pruebas de hipótesis para la media de las diferencias. 
Jueves: Intervalos de confianza y pruebas de hipótesis para la diferencia de pro-
porciones de dos poblaciones. Distribución F. Intervalos de confianza y pruebas 
de hipótesis para el cociente de varianzas de dos poblaciones. 
4 25/3 
Martes: Intervalos de confianza y pruebas de hipótesis para la diferencia de pro-
porciones de dos poblaciones. Distribución F. Intervalos de confianza y pruebas 
de hipótesis para el cociente de varianzas de dos poblaciones. 
5 1/4 
Diseño de Experimentos. Diseño Completamente Aleatorizado. Modelo paramé-
trico. 
6 8/4 
Diseño Completamente Aleatorizado modelo paramétrico (continuación) y Di-
seño Completamente Aleatorizado no paramétrico. 
 
7 
15/4 
 
Ejercitación e integración 1er. Parcial Sábado 20/4 
8 22/9 
Estadístico de Chi cuadrado para pruebas de bondad de ajuste. Pruebas de Prue-
bas de Independencia. 
9 29/4 
Estadístico de Chi cuadrado para Pruebas de Homogeneidad 
Ejercitación. 
 
10 6/5 
Regresión Lineal Simple. Supuestos del Modelo y Estimadores. Dócima de hipó-
tesis e intervalo de confianza utilizando la t de Student. 
11 13/5 
Regresión Lineal Simple. Intervalos de predicción. Coeficiente de determina-
ción. ANOVA en la regresión. 
12 20/5 Regresión Lineal Múltiple. Correlación Lineal Simple paramétrica. 
13 27/5 Correlación Simple no paramétrica. Ejercitación. 
14 3/6 Integración. Revisión y consulta. 2do. Parcial Sábado 8/6 a las 11 hs 
 
15 10/6 
16 17/6 
17 24/6 Recuperatorio 25/6 a las 18 hs. 
 
 III 
NOTA IMPORTANTE: 
 
La cátedra publica solamente la 
GUIA DE TRABAJOS PRACTICOS 
y la GUIA DE FORMULAS Y TABLAS 
para la cursada de esta materia. 
Cualquier otra publicación NO CUENTA 
CON LA APROBACION DE LA CATEDRA. 
 
 
 
 
Bibliografía 
 
 
 Cantatore de Frank, Norma M.: Manual de Estadística Aplicada. Ed. Hemis-
ferio Sur. 1ra. Edición. Buenos Aires. Capítulos: 4, 5, 6, 7, 8, 12 y 13. 
 
 Cappelletti, Carlos A.: Elementos de estadística. Cesarini Hnos. Editores. 
2da. Edición. Bs. As. Capítulos 8, 9, 10, 11, 13 y 14. 
 
 Daniel, Wayne W.: Bioestadística. Base para el análisis de las ciencias de la 
salud. 3ra. Edición. Uteha, Noriega Editores. México. Capítulos: 5, 6, 8, y 10. 
 
 
 
 
 IV 
Sistema de Evaluación de Estadística Analítica 
Se tomarán dos parciales, que serán calificados en una escala de 0 a 10, en for-
ma global. 
Las condiciones de LIBRE, ASISTENCIA CUMPLIDA, REGULAR Y PROMO-
CIÓN se obtienen si se cumplen las situaciones con respecto a calificación y 
asistencia que abajo se detallan. 
 
ASISTENCIA: Concurrencia a las clases teórico-prácticas en un porcentaje: 
LIBRE: inferior al 75% 
ASISTENCIA CUMPLIDA y REGULAR: mayor o igual al 75% 
PROMOCIÓN: mayor o igual al 80% 
 
CALIFICACIÓN: 
 
 SEGUNDO PARCIAL 
 1 2 3 4 5 6 7 8 9 10 
 
 
 
 
 P
R
IM
E
R
 P
A
R
C
IA
L
 
1 LIBRE LIBRE LIBRE AC AC 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
2 LIBRE LIBRE LIBRE AC AC 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
3 LIBRE LIBRE LIBRE AC AC 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
4 AC AC AC AC AC 
REC 
1P 
REC 
1P 
REC 
1P 
REC 
1P 
COL 
5 AC AC AC AC AC 
REC 
1P 
REC 
1P 
REC 
1P 
COL COL 
6 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
REG REG PROM PROM PROM 
7 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
REG PROM PROM PROM PROM 
8 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
PROM PROM PROM PROM PROM 
9 
REC 
2P 
REC 
2P 
REC 
2P 
REC 
2P 
COL PROM PROM PROM PROM PROM 
10 
REC 
2P 
REC 
2P 
REC 
2P 
COL COL PROM PROM PROM PROM PROM 
Siendo: 
AC: asistencia cumplida 
COL: coloquio 
PROM: promoción 
REC 2P: recupera 2do. Parcial 
REC 1P: recupera 1er. Parcial 
REG: regular 
 
NOTA 
1. Los alumnos que estén ausentes a un parcial y presenten certificado oportu-
namente en la cátedra lo rendirán en la fecha de recuperatorio y si posteriormen-
te quedan en situación de recuperar un parcial se les asignará una fecha. 
2. Los alumnos que recuperan algún parcial consiguen como máximo la condición 
de REGULAR. 
3. Los coloquios se tomarán en forma oral sobre los contenidos que involucra el 
parcial de menor puntaje y definen la condición del alumno. 
 
Unidad 1: INFERENCIA para DOS POBLACIONES 
 
Objetivos específicos: 
 
 Comprender la importancia de diseñar experimentos. 
 Analizar la adecuación de cada diseño en función del contexto de la investigación. 
 Aplicar los conceptos de inferencia estadística a la comparación de dos poblaciones, utilizando como 
procedimientos la estimación y la prueba de hipótesis. 
 Seleccionar el procedimiento de inferencia adecuado en función del objetivo y del cumplimiento de los 
supuestos. 
 Resolver problemas e interpretar conclusiones aplicando los métodos de análisis sobre dos 
poblaciones. 
 
Contenidos temáticos: 
 Diseño de experimentos: necesidad, ventajas, propósitos, definiciones previas. Tipos de diseños y 
alcances. 
 Revisión de conceptos relativos a la estimación puntual y por intervalos. Intervalos de confianza 
para la diferencia de medias y para la media de las diferencias. Estimaciones para la diferencia de dos 
proporciones, para el cociente de varianzas, y para el cociente de desvíos estándar. 
 Revisión de conceptos relacionados con las pruebas de hipótesis. Prueba de hipótesis para: 
diferencia de medias en base a dos muestras independientes: diferencia de medias, cociente de 
varianzas, diferencias de proporciones. Muestras apareadas: media de las diferencias. 
 Relación entre intervalo de confianza y prueba de hipótesis bilateral. Aplicaciones. 
 
Glosario: 
Diseño de experimentos: experimento, unidad experimental, tratamiento, factor, niveles de un factor, 
observación, efecto. Repetición, aleatorización, control local. Estudios observacionales, pre-
experimentales, cuasiexperimentales y experimentales. 
Inferencia para dos poblaciones: Población, muestra. Parámetro. Estimador. Estimación. Estimador 
puntual. Intervalo. Intervalo de confianza. Nivel de confianza. Hipótesis de trabajo. Hipótesis estadística. 
Hipótesis nula y alternativa. Error tipo I y tipo II. Nivel de significación. Región crítica. Regla de decisión. 
Distribución F de Snedecor. Diferencia de medias y de proporciones, cociente de varianzas para muestras 
independientes. Muestras apareadas: media de las diferencias. 
 
El diseño de experimentos 
La ciencia, tiene entre sus objetivos la explicación y comprensión de los acontencimientos. Un requisito 
fundamental en toda ciencia fáctica es el contraste de las hipótesis planteadas, poniendo a prueba las 
mismas mediante una confrontación con la experiencia. 
El diseño experimental crea las condiciones para el contraste de la hipótesis y brinda la metodología es-
tadística correspondiente para el análisis de los datos. 
Es el proceso de planear un experimento para obtener datos apropiados que puedan ser analizadosmediante métodos estadísticos, con objeto de producir conclusiones válidas y objetivas. La metodolog-
ía estadística es el único enfoque objetivo para analizar un problema que involucre datos sujetos a 
errores experimentales. Así es que hay dos aspectos en cualquier problema experimental: el diseño del 
experimento y el análisis estadístico de los datos. 
 
El propósito del diseño experimental es controlar la máxima cantidad de información pertinente al pro-
blema bajo investigación. Sin embargo también es importante que el diseño o plan sea tan simple co-
mo sea posible, a fin de ahorrar tiempo, dinero, personal y material experimental. 
Para que la metodología de diseño de experimentos sea eficaz es fundamental que el diseño sea el ade-
cuado. Un experimento puede realizarse por alguno de los siguientes motivos: 
 Determinar los factores principales que influyen sobre la variable respuesta. 
 Encontrar las condiciones experimentales con las que se consigue un valor extremo en la variable 
de interés o respuesta. 
 Comparar las respuestas en diferentes niveles de observación de variables controladas. 
 Obtener un modelo estadístico-matemático que permita hacer predicciones de respuestas futuras. 
 
 
Para poder realizar un buen diseño experimental, es necesario previamente comprender el problema 
que se desea estudiar, planteándose un conjunto de preguntas clásicas: 
1- ¿Cuáles son las características de interés? 
2- ¿Qué variables afectan a las características que se van a analizar? 
3- ¿Cuántas veces debería repetirse el experimento? 
4- ¿A partir de qué valor se considerará que el efecto es significativo? 
 
Lo cual conduce a elegir las variables más apropiadas y sus niveles de medición, elegir la o las res-
puestas a evaluar y el modelo de diseño. 
 
Para responder estas preguntas es necesario definir claramente algunos términos fundamentales: 
 Experimento: es un ensayo o una observación realizado bajo condiciones establecidas y contro-
ladas por el experimentador, susceptible de repetirse bajo las mismas condiciones. 
 Variable de interés o respuesta: es la variable que se desea estudiar. 
 Unidad experimental: es la parte más pequeña de material experimental, entidad física o sujeto, 
en la que se aplica un tratamiento una sola vez. También puede entenderse como cada una de las 
reproducciones del experimento. 
 Tamaño del Experimento: es el número total de observaciones recogidas en la ejecución del ex-
perimento. Ejemplo: si se asignan 10 gallinas a cada una de tres dietas el tamaño del experimento es 
30. 
 Factor: es una variable que se sospecha que puede ejercer influencia sobre la variable respuesta 
de interés. 
 Factor controlado: se denomina así a una variable manipulada por el investigador o variable in-
dependiente, a fin de estudiar su influencia sobre la variable de interés o dependiente. Algunos autores 
la denominan variable de entrada al proceso. Ejemplo: si pensamos que la temperatura o la humedad 
pueden afectar a la conservación de cierta propiedad de un alimento o medicamento, se puede contro-
lar manteniendo dicho producto con tres valores distintos de temperatura. 
 Niveles del factor: son cada una de las categorías, o valores, o formas específicas que adopta la 
variable independiente o controlada. Ejemplo: en el caso de las tres dietas, el factor dieta tiene tres 
niveles; en el caso del rodeo, el factor tiene dos niveles. 
 Tipos de factores: existen factores cuantitativos, cuyos niveles son cantidades numéricas, y cuali-
tativas, cuyos niveles son procedimientos o cualidades. Ejemplo de factor cuantitativo puede ser la 
cantidad de fertilizante adicionado a las parcelas de cultivo por hectárea con niveles: 10kg/ha – 20 
kg/ha -30 kg/ha de fertilizante. Ejemplo de factor cualitativo puede ser el tipo de nutriente adicionado a 
una dieta con niveles: potasio, magnesio y calcio. 
 Tratamiento: conjunto de condiciones experimentales o procedimientos creados para el experi-
mento en función de la hipótesis de investigación a las que se someterá a las unidades experimentales 
en un diseño elegido. Con varios factores es una de las combinaciones específicas de los niveles de 
los factores de estudio, y en un diseño unifactorial es uno de los distintos niveles del factor en el caso. 
Por ejemplo: si se asignan tres dietas distintas a las gallinas de un criadero, cada una de las dietas es 
un tratamiento. Si en un tambo se combinan tres raciones de alimentación dos rodeos con vacas en 
ordeñe (uno con vacas de alta producción y el otro con las de baja producción). Cada combinación de 
rodeo y ración constituye un tratamiento (6 tratamientos). 
 Observación: valor que asume una variable, también denominada variable respuesta, en una de-
terminada realización del experimento, es decir cada registro realizado en el contexto del experimento 
de la variable respuesta. 
 Efecto: diferencia entre los valores medios de la variable respuesta en presencia y ausencia de un 
nivel del factor. Si la variable respuesta de interés es el engorde semanal medido en gramos de una 
gallina con cierta dieta enriquecida, el efecto es la diferencia entre el engorde medio con la dieta enri-
quecida y el engorde medio con la dieta tradicional, ambos medidos en gramos. 
 Diseño equilibrado o balanceado: es el diseño en el que todos los tratamientos son asignados a 
un número igual de unidades experimentales, en el cual se obtiene la misma cantidad de repeticiones 
por tratamiento. Por ejemplo hay cuatro vacas en cada combinación de rodeo y nutriente para el agua. 
 
Principios Básicos del diseño experimental 
 
Los tres principios básicos que caracterizan a un diseño experimental: 
 
 
 Repetición: cuando un tratamiento es aplicado a más de una unidad experimental. Las observacio-
nes repetidas con las mismas condiciones experimentales en el contexto de un experimento no coinci-
den necesariamente, y por lo tanto una de las cuestiones fundamentales a la hora de diseñar un expe-
rimento es la selección del tamaño de muestra o número de repeticiones adecuado en cada contexto. 
 
Las razones por las cuales es deseable realizar repeticiones del experimento son: 
a- Proporcionar una estimación del error experimental (error generado por causas no controladas por 
el experimentador), que actúa como unidad básica de medida para indicar el significado de las di-
ferencias. 
b- Obtener mayor precisión en la estimación. 
c- Permitirnos extender el alcance de la inferencia relativa al experimento. 
 
El error experimental según el contexto puede reflejar: 
 errores de experimentación 
 errores de observación 
 errores de medición 
 variación del material experimental 
 
El error experimental puede reducirse generalmente adoptando una o más de las técnicas siguientes: 
 usando material experimental tan homogéneo como sea posible. 
 utilizando información proporcionada por otras variables aleatorias 
 teniendo cuidado al dirigir el experimento 
 usando un diseño experimental más eficiente. 
 
 Aleatorización: Todo procedimiento de prueba se basa en un conjunto de supuestos que deben 
satisfacerse para que la prueba resulte válida. Una de las suposiciones más frecuentes es que las 
observaciones, o los errores en ellas, son independientes. Dicho en otras palabras la aleatorización 
hace válida la prueba. 
 
 Control local: Se denomina de esta manera al conjunto de acciones que implementa el investiga-
dor con el fin de reducir al máximo posible el error experimental manteniéndolo en un rango de varia-
ción manejable. 
Por ejemplo: selección de unidades experimentales homogéneas, división en bloques, calibración de 
instrumentos, etc. 
 
Tipos de estudios de investigación 
Los estudios observacionales son un conjunto de estudios en los que no hay intervención por parte 
del investigador y este se limita a medir las variables que define en el estudio. Por ejemplo, los estu-
dios epidemiológicos. 
 
Ventajas de los estudios observacionales1. Son más prácticos y factibles de realizar, ya que la cooperación de los sujetos es menos necesa-
ria. 
2. Sus resultados son más generalizables a poblaciones, geográfica o demográficamente definidas. 
 
Inconvenientes de los estudios observacionales 
1. Escaso control de las influencias de los factores de confusión sobre los resultados del estudio. 
(Los factores de confusión son factores no tenidos en cuenta que pueden llegar a modificar los re-
sultados de un análisis). 
2. Debido a la falta de control por parte del investigador, cada estudio observacional tiende a ser úni-
co, siendo muy difícil reproducir los resultados por otro investigador. 
Los estudios pre-experimentales se caracterizan por analizar una única variable y prácticamente no 
existe ningún tipo de control. No existe manipulación de la variable independiente ni se utiliza el grupo 
de control; por consiguiente son escasas las posibilidades de que este grupo sea representativo de los 
demás. Este tipo de diseño consiste en administrar un tratamiento o estímulo en la modalidad de solo 
pre-prueba / posprueba. 
 
Un estudio de intervención, también llamado estudio experimental, es un estudio caracterizado por 
la manipulación artificial del factor de estudio por el investigador y por la aleatorización de los casos o 
sujetos en dos grupos, llamados control y tratado. 
Cuando la característica de la aleatorización en el estudio no se cumple, se dice que el estudio es 
cuasiexperimental. La falta de aleatorización de los estudios cuasiexperimentales indica que no existe 
manera de asegurar la equivalencia inicial de los grupos denominados experimental y de control. 
También es usual que, en un experimento, se utilicen controles históricos. El problema que presenta 
este tipo de diseño es que el grupo actualmente en tratamiento puede presentar importantes diferen-
cias relativas al tratamiento respecto al grupo de control histórico. Los trabajos con controles históricos 
están generalmente sesgados a favor del tratamiento, mientras que los experimentos aleatorios evitan 
este tipo de sesgo. 
 
PROBLEMAS RESUELTOS 
 
1) Mediante los estudios ecográficos, los bebés pueden actualmente ser observados mientras están en 
el seno materno. Sin embargo, gran cantidad de experimentos desarrollados en animales de laborato-
rio dieron como resultado que la aplicación de ultrasonidos podía ser la causa de que el peso al nacer 
fuese inferior al normal. 
 Ante el temor de que esta conclusión fuese aplicable a los humanos, un grupo de especialistas del 
Hospital John Hopkins de Baltimore puso en marcha un estudio para investigar el tema. En el mismo 
se observó el peso al nacimiento de los bebés que estuvieron expuestos a controles ecográficos (ultra-
sonido) y de los que no estuvieron expuestos. 
 También en este caso los bebés expuestos al ultrasonido durante el embarazo pesaban en su ma-
yoría al nacer menos que aquellos que no lo habían estado, pero un dato a tener en cuenta es que los 
obstetras recomendaban el ultrasonido cuando sospechaban que el embarazo no se desarrollaba con 
normalidad. 
 
a) ¿Se trata de un estudio observacional o experimental? ¿Por qué? 
b) ¿Puede concluirse que el ultrasonido influye sobre el peso del nacimiento? 
 
Solución: 
a) Se trata de un estudio observacional, porque no hay intervención del investigador. 
b) Los bebés expuestos al ultrasonido y los no expuestos presentaban diferencias que no tenían nada 
que ver con el hecho de ser tratados o no. De modo tal que los investigadores tuvieron un conjunto de 
factores de confusión con el cual enfrentarse. La conclusión del estudio fue, por lo tanto, que las eco-
grafías y el menor peso de los bebés tenían una causa común: problemas durante el embarazo. 
 
2) Mediante la siguiente experiencia se quiere determinar si una droga reduce el nivel promedio de gluco-
sa en sangre (glucemia) en una línea de ratas diabéticas. 
Se tomaron al azar 40 ratas de esta línea y se les suministró la droga (grupo tratado). Al mismo 
tiempo se tomaron otras 30 ratas de la misma línea y se les suministró un placebo (grupo control). 
Los niveles sanguíneos de glucosa (mg/ml) en las ratas fueron: 
 
 
Tratadas con droga Tratadas con placebo 
1,82 1,89 1,39 1,79 1,27 1,73 2,01 1,74 1,91 1,52 
1,41 1,88 1,88 1,66 1,93 1,56 1,93 1,70 1,74 2,16 
1,60 1,70 1,69 1,94 1,62 1,44 1,68 1,99 1,82 1,40 
1,68 1,57 1,91 1,83 1,60 1,58 2,12 1,61 1,91 1,70 
2,15 1,91 1,93 2,22 2,18 1,75 1,93 2,03 
2,37 1,65 2,09 1,75 2,00 2,23 2,10 1,95 
2,18 1,95 1,92 2,01 2,48 1,67 2,23 1,96 
1,87 2,06 2,00 2,26 1,94 1,89 
 
 
 
 
 
 
 
1,27 1,50 1,72 1,95 2,17
Cuantiles de una Normal(1,7328,0,04161)
1,27
1,50
1,72
1,95
2,17
C
u
a
n
ti
le
s
 o
b
s
e
rv
a
d
o
s
(D
ro
g
a
)
n= 40 r= 0,994 (Droga)
 
 
 
 
 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p(una cola) 
Droga 40 1,73 0,20 0,97 0,7640 
 
 
1,62 1,84 2,05 2,27 2,48
Cuantiles de una Normal(2,022,0,038086)
1,62
1,84
2,05
2,27
2,48
C
u
a
n
ti
le
s
 o
b
s
e
rv
a
d
o
s
(P
la
c
e
b
o
)
n= 30 r= 0,989 (Placebo)
 
 
 
 
 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p(una cola) 
Placebo 30 2,02 0,20 0,97 0,7499 
 
 
a) ¿Es la droga efectiva para reducir el nivel promedio de glucosa en sangre, al 5%? Asuma que la 
droga no modifica la varianza poblacional del nivel de glucosa en sangre, y que ésta es conocida, 
simbólicamente 
2
droga=
2
placebo =0,04 mg
2
/ml
2 
 
b) Construya un intervalo de confianza del 95% para la diferencia entre la media poblacional de la 
glucemia de las ratas tratadas con droga y la media poblacional de la glucemia de las ratas tratadas con 
placebo. 
 
Datos del problema: 
 
 Variables en estudio 
 X1: nivel de glucosa de una rata diabética de la línea, tratada con droga, en mg/ml 
 X2: nivel de glucosa de una rata diabética de la línea, tratada con placebo, en mg/ml 
 Tamaños de las muestras: n1= 40 y n2= 30 
 Varianzas poblacionales: Conocidas e iguales. (
2
1 = 
2
2 = 0,04 mg
2
/ml
2
) 
 Nivel de significación: =0,05 
 Nivel de confianza: 1 - = 0,95 
 
Solución: 
a) 
 La hipótesis de trabajo que se desea poner a prueba es: 
“El empleo de la droga disminuye el nivel medio de glucosa en sangre de ratas diabéticas de la línea” 
 
 Verificación de supuestos: Para poder plantear las hipótesis estadísticas y llevar a cabo la prue-
ba, hay que verificar los supuestos teóricos necesarios. En este caso, los supuestos son que ambas 
variables (X1 y X2) sean independientes y se distribuyan normalmente. El supuesto de independencia 
se cumple por la forma en que se realizó el experimento: a un grupo de ratas se le suministró la droga 
y a otro grupo, también tomado al azar, se lo trató con placebo. 
 
Para X1: se realizó un gráfico de cuantil-cuantil (qqplot) para estudiar la normalidad de la variable. En este 
gráfico se comparan dos distribuciones, la de los datos muestrales y la de una normal. Cuando los puntos 
están perfectamente alineados, se infiere que la distribución es exactamente normal, si los puntos estan 
muy cercanos a la línea, la distribución es aproximadamente normal, grandes apartamientos de esta es-
tructura indican falta de normalidad. Esto sin embargo no tiene la fuerza de un test estadístico es una 
técnica exploratoria. 
 
 
 
 
Observando el gráfico se puede ver que los 
puntos no se alejan mucho de la recta, sin 
embargo, por ser un gráfico, no se puede 
hacer inferencia sobre el comportamiento 
distribucional de la variable a nivel 
poblacional. Para poder concluir a nivel 
poblacional es necesario un test de 
normalidad. En Elementos de Estadística se 
estudió la prueba Shapiro-Wilks, para verificar 
normalidad, y cuyas hipótesis son: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
En todos los casos para esta prueba utilizaremos un nivel de significación del 10% 
Al realizarel test, utilizando InfoStat, se obtuvieron los siguientes resultados: 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
X1 40 1.73 0.20 0.97 0,7640 
 
Como p-valor= 0,7731 y es mayor que =0,10, no se rechaza la hipótesis nula, por lo tanto, con un 
nivel de significación del 10% se puede decir que la variable X1 (nivel de glucosa en sangre de una rata 
tratada con droga, en mg/ml) se distribuye normalmente. 
 
1.27 1.50 1.72 1.95 2.17
Cuantiles de una Normal(1.7328,0.04161)
1.27
1.50
1.72
1.95
2.17
C
u
a
n
ti
le
s
 o
b
s
e
rv
a
d
o
s
(X
1
)
Qqplot
 
1.62 1.84 2.05 2.27 2.48
Cuantiles de una Normal(2.022,0.038086)
1.62
1.84
2.05
2.27
2.48
C
u
a
n
ti
le
s
 o
b
s
e
rv
a
d
o
s
(X
2
)
Qqplot
Análogamente se estudia la normalidad de la variable X2: 
 
 
2
0 2 2 2
2
1 2 2 2
: ~N ; 
: no se distribuye normalmente N ;
H X
H X
 
 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
X2 30 2.02 0.20 0.97 0,7499 
 
 
 
 
 
 
 
 
 
Como p-valor= 0,7739 y es mayor que =0,10, no se rechaza la hipótesis nula, por lo tanto, con un 
nivel de significación del 10% se puede decir que la variable X2 (nivel de glucosa en sangre de una rata 
tratada con placebo, en mg/ml) se distribuye normalmente. 
Una vez verificado el supuesto teórico se puede seguir adelante con la prueba. 
Nota:este test no será necesario si la información asegura distribución normal de la variable. 
 Hipótesis estadísticas. 
El interés del investigador es probar si la droga disminuye el nivel medio de glucosa en sangre, 
por lo tanto quiere saber si la media del nivel de glucosa en sangre de ratas tratadas con droga es 
menor que la media del nivel de glucosa en sangre de las ratas tratadas con placebo. 
Simbólicamente: 
1 2
, esta expresión no lleva el signo igual, por lo tanto debe corresponder a 
la hipótesis alternativa. Es decir que las hipótesis estadísticas son: 
 
0 1 2
1 1 2
:
:
H
H
Equivalentemente podría escribirse 
0 1 2
1 1 2
: 0
: 0
H
H
o también 
0 2 1
1 2 1
: 0
: 0
H
H
 
 
Cualquiera de estas formas expresan las mismas hipótesis estadísticas. Sin embargo hay que 
elegir una expresión para poder continuar con la prueba manteniendo la elección a lo largo de todo el 
análisis y por sobre todo concluir para las hipótesis elegidas. Si esto no se mantiene deja de tener vali-
dez la prueba o peor aún, se podría estar concluyendo erróneamente. En este caso se va a trabajar 
 
con:
0 1 2
1 1 2
:
:
H
H
 
 Nivel de significación: =0,05 
 Estadístico de prueba (o variable pivotal) 
 
Se está realizando un test de hipótesis para la diferencia de medias poblacionales, por lo cual se 
cuenta con dos opciones al elegir la variable pivotal: Z o t de Student, dependiendo del conocimiento o 
no las varianzas poblacionales. En este caso las varianzas poblacionales son conocidas e iguales, por 
lo tanto se utiliza Z, la expresión de la variable pivotal es: 
 
 
 
 Región crítica: 
Observando la hipótesis alternativa (del par de hipótesis elegidas), se ve que la región crítica es unila-
teral izquierda. Por lo tanto el valor crítico es: 
0,05 1,64Z y la región crítica es: 0 1,64HZ 
 Regla de decisión: 
Rechazo H0 si 
0
1,64HZ 
No rechazo H0 si 
0
1,64HZ 
 Cálculo de ZHo: 
Hasta este momento no utilizamos los valores muestrales, excepto en la verificación de supues-
tos, sin embargo se podría haber hecho con muestras piloto y recién en esta instancia extraer las 
muestras para el análisis. Antes de calcular el valor del estadístico de prueba hay que calcular las me-
dias muestrales utilizando las fórmulas dadas en la unidad de estadística descriptiva de Elementos de 
Estadística: 
1 21,73; 2,02X X . Hay que tener en cuenta que la prueba se está realizando bajo la 
hipótesis nula que contiene el caso en que las medias poblacionales son iguales, por lo tanto la dife-
rencia de las medias poblacionales es cero, es decir que 
1 2 0. Reemplazando estos valores y 
el resto de la información en la fórmula nos queda: 
 
 
 Decisión: Se rechaza la hipótesis nula porque 
oH
=Z -6,017 , es menor que –1,64, o sea que 
ZCALCULADO < ZCRITICO. 
 Conclusión: Con un nivel de significación de 5% tengo evidencia suficiente para rechazar la hipó-
tesis nula (
0 1 2:H ), por lo tanto la media poblacional del nivel de glucosa en sangre de ratas 
diabéticas tratadas con droga es menor que la media poblacional del nivel de glucosa en sangre de 
ratas diabéticas tratadas con placebo, en estas poblaciones de ratas diabéticas en estudio. Por lo tanto 
puedo decir que la droga es efectiva. 
b) La fórmula del intervalo del 95% que se está pidiendo se despeja de la variable pivotal y es: 
2 2 2 2
1 2 1 2
1 2 1 / 2 1 2 1 / 2
1 2 1 2
( ) ;( )X X Z X X Z
n n n n
 
reemplazando se obtiene que 
 
Por lo el tanto intervalo de confianza para la diferencia de medias poblacionales 1 2 es: 
 
Conclusión: Con un nivel de confianza del 95%, se espera que el intervalo [-0,3839 mg/ml; -0,1961 
mg/ml] cubra o contenga a la diferencia entre la media poblacional del nivel de glucosa de las ratas 
tratadas con droga y la media poblacional del nivel de glucosa de las ratas tratadas con placebo, en 
estas poblaciones de ratas diabéticas en estudio. 
 
NOTA: Observemos que el 0 (cero) no está incluido en el intervalo de confianza, y que ambos límites 
son negativos, lo cual es indicador de que la diferencia es negativa. Sin embargo, hay que tener en 
cuenta que el IC no es equivalente porque la prueba es unilateral. 
 
 
3) Se tomó una muestra aleatoria de 21 cerdos Yorkshire del norte de la provincia de Buenos Aires. Los 
mismos tenían 3 meses de edad y pesos homogéneos, y se los separó, aleatoriamente, en dos lotes. Al 
lote 1 se le asignó una ración estándar (A) y al lote 2 otra con distinta formulación (B). La siguiente tabla 
contiene las ganancias de peso de cada animal, luego de 30 días de experiencia, expresadas en kg. 
 
Lote 1(A) 24 26 25 23 28 27 28 24 29 29 
Lote 2(B) 26 32 28 25 29 27 28 27 27 28 30 
 
Por estudios anteriores se sabe que ambas variables se distribuyen normalmente con varianzas igua-
les, pero desconocidas. 
a) ¿Se puede suponer, al 5%, que la ganancia media de peso de los animales alimentados con la 
ración B supera significativamente la ganancia media de peso de los animales alimentados con ración 
A? 
b) Construir un intervalo para la diferencia de medias al 95%. ¿Qué puede concluir? 
 
Datos del problema: 
 Variables en estudio: 
XA: ganancia de peso de un cerdo Yorkshire de 3 meses de edad del norte de la provincia de Bs. As. 
alimentado con la ración estándar A 
XB: ganancia de peso de un cerdo Yorkshire de 3 meses de edad del norte de la provincia de Bs. As. 
alimentado con la formulación distinta B 
 Tamaños de las muestras: nA=10 y nB=11 
 Varianzas Poblacionales: A
2 
= B
2
 = 
2
 (desconocidas) 
 Nivel de significación: =0,05 
 Nivel de confianza: 1 - = 0,95 
 
 
Solución 
a) 
 Hipótesis de trabajo: “La ganancia media de peso de los animales alimentados con la ración B supera 
la ganancia media de peso de los animales alimentados con ración A” 
 Verificación de supuestos: En este caso, a diferencia del ejercicio anterior, en el enunciado se 
asegura la normalidad de ambas variables, por estudios anteriores. Por lo tanto no es necesaria la 
prueba de Shapiro–Wilks para verificarla. Por otro lado el supuesto de independencia también se cum-
ple por la forma en que se realizó el experimento: a un grupo de cerdos, tomado al azar, se lo alimenta 
con la ración A y al otro grupo, también tomado al azar, se lo alimentó con la ración B. Es decir que: 
XA N ( A, 
2
) y XB N ( B, 
2
) son variables aleatorias independientes. Observar que ambas va-
riables tiene la misma varianza poblacional. 
 Hipótesis estadísticas: La hipótesis de trabajo simbólicamente nos lleva a la expresión: 
B A
, por 
lo tanto esta corresponde a la hipótesisdel investigador que ubicamos en la hipótesis alternativa. 
0
1
:
:
B A
B A
H
H
 
nuevamente, existen diversas formas de plantear la misma hipótesis, como por ejemplo: 
0
1
: 0
: 0
B A
B A
H
H
 
y otras más. En este caso, se trabajará con la segunda expresión y se concluirá para esta expresión: 
0
1
: 0
: 0
B A
B A
H
H
 
 
 Nivel de significación: =0,05 
 Variable pivotal: En este caso, como en el ejercicio anterior, se está realizando un test para la 
diferencia de medias poblacionales, por lo tanto hay dos opciones para la variable pivotal (Z o t-Student). 
Como las varianzas poblacionales son desconocidas no se puede utilizar la variable Z, por lo tanto se 
utilizará la variable pivotal t de Student, cuya fórmula es: 
. 
Donde Sa es la raíz cuadrada positiva de la varianza amalgamada, es decir que es un promedio 
ponderado entre la varianza muestral de la variable XA y la varianza muestral de la variable XB y estima a 
la única varianza poblacional que se desconoce, 
2
. 
 Región crítica: Observando la hipótesis alternativa planteada se deduce que la región crítica es 
unilateral derecha (es decir que se rechaza la hipótesis nula a valores grandes de la variable pivotal). El 
valor crítico que se utiliza es 
2;1 10 11 2;0,95 19;0,95 1,729A Bn nt t t , por lo tanto la región crítica es: 
1,729t . Gráficamente: 
 
 
 
 
 
 
 Regla de decisión: Rechazo H0 si 
0
1,729Ht y no rechazo H0 si 0 1,729Ht 
 Cálculo: Para obtener el valor calculado del estadístico de prueba, hay que realizar ciertos cálcu-
los auxiliares (
2
A B aX ;X y S ) utilizando las fórmulas habituales para las medias y las varianzas muestra-
les, y la siguiente fórmula para la varianza amalgamada: 
2 2
2 2( 1) ( 1)
2
A A B
a
A B
n S n S
S
n n
 
Se obtuvo:
2 226,3 ; 27,91 ; 4,90 ; 3,69A B A BX X S S y 
2 (9)4,90 (10)3,69 44,1 36,9 4,26
10 11- 2
aS
 
 = 
19
 
por lo tanto 2,06aS 
 
Reemplazando estos valores en la fórmula de la variable pivotal queda: 
 
 
Como 
0
1,78Ht y utilizando la regla de decisión se rechaza la hipótesis nula ya que 1,78 es mayor 
que 1.729. 
 Conclusión: Con un nivel de significación del 5% tengo evidencia suficiente para rechazar la hipó-
tesis nula (Ho: B - A 0), por lo tanto, la diferencia entre la media poblacional de la ganancia de peso 
de los cerdos alimentados con la ración B y la media poblacional de la ganancia de peso de los cerdos 
alimentados con la ración A es mayor a cero, en estas poblaciones de cerdos de 3 meses de raza 
Yorkshire del norte de la provincia de Buenos Aires. 
 
 Respuesta: Se puede suponer, al 5%, que la ganancia media poblacional del peso de los cerdos 
alimentados con la ración B supera significativamente a la media poblacional del peso de los cerdos 
alimentados con la ración A. 
Para este problema, la salida de InfoStat correspondiente es: 
Prueba T para muestras Independientes 
Gr(1) Gr(2) n(1) n(2) media(1) media(2) p(Var.Hom.) T p prueba 
{A} {B} 10 11 26,30 27,91 0,6623 -1,78 0,0452 UnilatI 
 
Nota: InfoStat compara grupos en orden alfabético, por lo cual la prueba es unilateral izquierda, o sea 
que utiliza H1: A- B<0. Para la comparación es indistinta la forma en que se plantea la diferencia, 
siempre que se respete el sentido de la misma. El valor de t observado es el mismo que obtuvimos al 
aplicar la fórmula, pero de signo opuesto, por haber invertido el orden de la diferencia. 
Como puede verse, al realizar la Prueba T para muestras independientes, también se realiza una 
prueba para evaluar la Homogeneidad de Varianzas, el p-valor es 0,6623, por lo que se cumple este 
supuesto. 
 
En este caso, en que la región crítica es unilateral 
izquierda, el cálculo del p valor es:, 
p valor= P(t V.Calc.) = P(t19 -1,78) 
 
 
 
 
 
Ahora, si consideramos la región crítica derecha que 
planteamos al principio, el p valor se grafica y se calcula de la 
siguiente forma, dado que la región crítica es unilateral 
derecha: 
p valor= P(t V.Calc) = P(t19≥ 1,78) 
 
b) La fórmula del intervalo de 95% de confianza para la diferencia de medias se deduce de la distribución 
de la variable pivotal: 
2;1 / 2 2;1 / 2
1 1 1 1
( ) ;( )
A B A BB A n n a B A n n a
A B A B
X X t S X X t S
n n n n
 
Reemplazando con los valores correspondientes queda: 
 
Por lo tanto el intervalo pedido es: [-0,29 Kg ; 3,51 Kg] 
Conclusión: Con un nivel de confianza del 95% se espera que el intervalo [-0,29 Kg ; 3,51 Kg] cubra o 
contenga a la diferencia entre la media poblacional del peso de los cerdos alimentados con la ración B y la 
media poblacional del peso de los cerdos alimentados con la ración A, en estas poblaciones de cerdos 
Yorkshire de 3 meses de la provincia de Buenos Aires. 
 
NOTA: Tener en cuenta que en este caso el IC no es equivalente a la prueba de hipótesis porque la 
prueba es unilateral. 
 
4) En un experimento referido al uso de la vitamina B12 en casos de anemia perniciosa durante el período 
de remisión, se administró, por vía intramuscular, 30 g de B12 a un total de 10 pacientes tomado al azar. 
En ellos se midió la concentración de hemoglobina en sangre (mg%) en dos momentos, al inicio del 
tratamiento y luego de tres meses. Los valores observados se muestran en la siguiente tabla: 
 
-3,20 -2,48 -1,75 -1,02 -0,30
Cuantiles de una Normal(-1,79,0,70989)
-3,20
-2,48
-1,75
-1,02
-0,30
C
u
a
n
ti
le
s
 o
b
s
e
rv
a
d
o
s
(D
)
Qqplot
 Paciente 1 2 3 4 5 6 7 8 9 10 
Hemoglobina 
(mg%) 
Inicial (I) 12,2 11,3 14,7 11,4 11,5 12,7 12,3 13,0 12,7 13,0 
Después de 3 
meses (F, o final) 
13,0 13,4 16,0 13,6 14,0 13,0 14,2 15,1 15,9 14,5 
¿Hay aumento significativo de hemoglobina después del tratamiento al nivel del 5%? 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
D 10 -1,79 0,84 0,97 0,9425 
 
 
 
Datos del problema: 
 Variable en estudio: 
D: diferencia entre la concentración de hemoglobina en sangre (en mg%) al inicio del tratamiento 
con vitamina B12 y la concentración de hemoglobina en sangre (en mg%) después de tres meses del 
tratamiento con vitamina B12, de un paciente con anemia perniciosa. 
En símbolos: di = ii - fi 
En la siguiente tabla están calculados los valores correspondientes a la diferencia planteada: 
di -0,8 -2,1 -1,3 -2,2 -2,5 -0,3 -1,9 -2,1 -3,2 -1,5 
 
Nota: En este caso se utilizará: di = ii - fi, pero también se podría haber definido la variable como di = 
fi - ii . La definición de esta variable debe quedar clara al comienzo de la resolución del ejercicio y debe 
mantenerse a lo largo del mismo. 
 Nivel de significación: =0,05 
Solución: 
 Hipótesis de trabajo: “Hay aumento significativo del nivel de hemoglobina después del tratamiento” 
 Antes de plantear las hipótesis estadísticas hay que analizar la situación planteada, ya que no es 
igual a las anteriores, dado que no hay independencia entre las mediciones realizadas, ya que se realiza-
ron dos veces sobre cada individuo, al inicio y al finalizar los 3 meses de aplicado el tratamiento con vita-
mina B12. Por esta razón no se van a comparar las medias en los diferentes tiempos, sino que se va estu-
diar la media de la variable diferencia. 
 Verificación de supuestos: En este caso, solamente hay que probar la normalidad de la variable Di. El 
otro supuesto teórico corresponde a la no independencia entre las mediciones, o sea, X1 y X2 no son inde-
pendientes. 
 
-3,20 -2,48 -1,75 -1,02 -0,30
Cuantiles de una Normal(-1,79,0,70989)
-3,20
-2,48
-1,75
-1,02
-0,30
C
u
a
n
til
e
s 
o
b
se
rv
a
d
o
s(
D
)
Qqplot
2
0
2
1
: se distribuye normal ( ; )
: no se distribuye normal ( ; )
D D
D D
H D
H D
 
 
Shapiro-Wilks (modificado) 
 
Variable n Media D.E. W* p (una cola) 
D 10 -1,79 0,84 0,97 0,9425 
 
 
 Como 0,9425 es mayor que 0,10, no se rechaza la hipótesis nula.Entonces, con un nivel de significa-
ción del 10% se puede concluir que la diferencia entre la concentración de hemoglobina en sangre (mg%) 
al inicio del tratamiento con vitamina B12 y la concentración de hemoglobina en sangre (mg%) luego de 3 
meses de tratamiento con vitamina B12 en pacientes con anemia perniciosa se distribuye normalmente. 
Simbólicamente 
2
D D~ ( , )D N 
 
 Hipótesis estadísticas: si el tratamiento produce un aumento en el nivel de hemoglobina en 
sangre, los niveles de hemoglobina medidos a los 3 meses deberían ser mayores que los medidos al 
inicio del tratamiento, es decir que la variable D = I – F, tendría una media negativa. Simbólicamente 
0D . 
La definición de la hipótesis alternativa depende exclusivamente de la definición de la variable en 
estudio, por esta razón debe quedar clara la forma en que se realiza la diferencia entre I i y Fi. 
Luego, las hipótesis estadísticas son: 
0
1
: 0
: 0
D
D
H
H
 
 Variable pivotal: Por ser una prueba de medias apareadas la opción más usual para la variable 
pivotal es una t de Student (difícilmente se conocerá la varianza de la variable diferencia) con la 
siguiente fórmula: 1~
d
n
d
d
t t
s
n
. Observar que esta expresión es la misma que la utilizada en 
Elementos de Estadística para estudiar una población, la variable estudiada es D, su media muestral 
es d y su varianza muestral es 2
DS . 
 Región crítica: Observando la hipótesis alternativa planteada, se ve que la región crítica es unila-
teral izquierda, con valor crítico: 
1;0,05 10 1;0,05 9;0,05 9;0,95 1,83nt t t t (los grados de libertad son 
10 - 1, porque hay 10 diferencias). Por lo tanto, la región crítica queda definida como 1,83t . 
Gráficamente: 
 
 
 
 
 Regla de decisión: Rechazo H0 si 
0
1,83Ht y no rechazo H0 si 0 1,83Ht 
 
 Cálculo: Para obtener el valor calculado del estadístico de prueba hay que realizar ciertos cálculos 
auxiliares (
2
Dd y s ), utilizando las fórmulas habituales para la media muestral y la varianza muestral, 
sobre las 10 diferencias. 
Utilizando los valores calculados para di (ver la tabla correspondiente al plantear la forma de realizar la 
misma), se obtuvo 
21,79 0,71Dd y s , reemplazando en la fórmula de la variable pivotal: 
0
1,79 1,79
6,7
0,84 0,26
10
Ht . 
Como el valor observado –6,7 es menor que –1,83, vale decir pertenece a la región crítica, se rechaza 
la hipótesis nula. 
 Conclusión: Con un nivel de significación del 5% tengo evidencia suficiente para rechazar la 
hipótesis nula ( 0D ), por lo tanto la media poblacional de las diferencias entre la concentración de 
hemoglobina en sangre (mg%) de pacientes con anemia perniciosa al inicio del tratamiento y la 
concentración de hemoglobina en sangre (mg%) de pacientes con anemia perniciosa después de tres 
meses de iniciado el tratamiento con vitamina B12 es menor que cero, en la población de pacientes con 
anemia perniciosa. Por lo cual la hemoglobina aumenta significativamente luego del tratamiento con 
vitamina B12. 
 A continuación se da la salida del programa InfoStat para este problema 
Prueba T para un parámetro Valor del parámetro probado: 0 
Variable n Media DE T p(Unilateral I) 
D 10 -1,79 0,84 -6,72 <0,0001 
Nota: con un p-valor tan pequeño puede decirse que esta es una decisión “fuerte“. 
 
 
Para el caso de que la región crítica sea unilateral 
izquierda, el cálculo del p valor es: 
p-valor= P(t V.Calc.) 
 
Nota: Al comienzo del ejercicio se definió la variable 
diferencia como: di = ii - fi, Se recomienda realizar de nuevo la prueba, pero definiendo de la otra forma 
a la variable y observar qué se modifica y qué permanece igual. 
 
5) En las poblaciones de adultos y adolescentes que veían un programa de televisión los sábados a la 
noche se tomaron sendas muestras al azar de 400 y 600 individuos, respectivamente. A la pregunta “si 
realmente les gustaba el programa”, 100 adultos y 300 adolescentes, de estas muestras, contestaron 
que sí. 
a) Estimar puntualmente y con una confianza del 95% la diferencia entre las proporciones de adultos y 
adolescentes que ven el programa y les gusta. 
b) Probar, al 5%, si ambas proporciones son iguales. 
Datos del problema 
 Variable en estudio: 
X1: Cantidad de adultos que ven el programa los sábados a la noche y les gusta, en una muestra de 400. 
X2: Cantidad de adolescentes que ven el programa los sábados a la noche y les gusta, en una muestra de 
600. 
 Tamaños de muestras: n1 = 400; n2 = 600 
 Nivel de confianza: 1 – = 0,95. 
Solución: 
a) Antes de comenzar a construir el intervalo hay que verificar los supuestos teóricos. 
 Supuestos teóricos: En este caso, a diferencia de los ejercicios anteriores, el supuesto teórico es 
distribución binomial de ambas variables. La verificación de este supuesto es más sencilla que la verifi-
 
cación de la normalidad de las variables, ya que solamente hay que verificar que las variables cumplan 
con las condiciones de una variable binomial, es decir: 
 Que cada repetición del experimento tenga dos resultados posibles (éxito y fracaso). Si lo aplica-
mos al ejemplo veremos que las dos posibles respuestas que podemos obtener, al encuestar a una 
persona, son: “que le guste el programa del sábado a la noche” y “que no le guste el programa del 
sábado a la noche”. 
 Que los resultados (éxito y fracaso) sean mutuamente excluyentes en una misma repetición. 
 Que los resultados (éxito y fracaso) sean independientes de repetición en repetición. 
 Que el número de repeticiones esté prefijado de antemano y que la probabilidad de éxito sea cons-
tante a lo largo de todas las repeticiones del experimento aleatorio. 
En este caso ambas variables cumplen con estas condiciones. 
 Estimación puntual: Lo que se quiere estimar es:”la diferencia entre las proporciones 
poblacionales de adultos y adolescentes que ven el programa y les gusta”, simbólicamente: p1-p2. Por 
lo tanto la estimación puntual de esta diferencia es la diferencia entre las proporciones estimadas, 
1 2
ˆ ˆp p . 
1
cantidad de adultos que ven el programa los sábados a la noche y les gusta 100
ˆ 0,25
cantidad total de adultos 400
p 
 
2
cantidad de adolescentes que ven el programa los sábados a la noche y les gusta 300
ˆ 0,5
cantidad total de adolescentes 600
p
 
Por lo tanto la estimación puntual es: 
1 2
ˆ ˆ 0,25 0,5 0,25p p 
 Intervalo de confianza: La fórmula del intervalo de confianza para la diferencia de proporciones se 
deduce de la única variable pivotal posible, cuya fórmula es: 
 
Por lo tanto la fórmula del intervalo es: 
 
 
 Reemplazando: 
 
 Conclusión: Con un nivel de confianza del 95% se espera que el intervalo [-0,31;-0,19] cubra o 
contenga a la diferencia entre la proporción poblacional de adultos que ven el programa los sábados a 
la noche y les gusta y la proporción poblacional de adolescentes que ven el programa los sábados a la 
noche y les gusta. 
b) Las hipótesis estadísticas son: H0: p1-p2=0 versus H1: p1-p2 0 
 
El nivel de significación es 5%, siendo el estadístico de contraste: 
 
 
La región crítica es bilateral, y está formada por los valores de Z mayores o iguales a 1,96, y los meno-
res o iguales a -1,96.
 
 
La regla de decisión es: RECHAZO H0 si Zobs 1,96 o Zobs ≤ -1,96 
 NO RECHAZO H0 si -1,96 < Zobs < 1,96 
 
1 2
1 2
100 300
ˆ 0,4
400 600
x x
p
n n
 
 
 
 
Como Zobs = -7,81 la decisión es 
.............................................................................................................................. 
 
En esta situación (región crítica bilateral) el p valor se grafica y se calcula de la siguiente forma: 
 
p valor= 2*(min { P(Z -7,81) P(Z -7,81) } ) = 2* P(Z -7,81) 
 
Con un nivel de significación del 5%, hay/no hay (tache lo que no corresponda) evidencias suficientes 
para rechazar H0, por lo tanto ........................................................................................................................................................................................................................................................................................
..................................................................................................................................................................... 
6) Basándose en el mismo texto y los mismos datos del problema 02, responda los siguientes ítems: 
a.- Estimar el cociente entre las varianzas, puntualmente y con un nivel de confianza del 95%. 
b.- Los nutricionistas que desarrollaron la nueva ración (B) sostienen que además esta genera mayor 
uniformidad en el crecimiento. Probar la hipótesis sugerida con un nivel de significación del 5%. 
(Nota: “Mayor uniformidad” hace referencia a la obtención de ganancias de peso parecidas dentro del 
lote, con baja dispersión, siendo esta una característica deseada por los productores.) 
Solución: Los datos son los mismos que los del problema 3 y los supuestos teóricos también 
a) 
 Estimación puntual: se pide estimar puntualmente el cociente entre las varianzas, por ejemplo, 
simbólicamente
2
2
A
B
, cuyo estimador puntual es el cociente de las varianzas muestrales, es decir 
2
2
A
B
S
S
 
 
 Utilizando la fórmula de la varianza muestral se obtiene: 
 
 
Por lo tanto el estimador puntual del cociente entre SA
2
 y SB
2
 es: 
2
2
4,9
1,3279
3,69
A
B
S
S
 
(Nota: En este caso se estima el cociente entre la varianza poblacional de A sobre la varianza pobla-
cional de B, pero también podríamos resolver este ejercicio haciendo el cociente inverso, dado que en 
el enunciado no hay ninguna orientación en especial para realizarlo.) 
 Intervalo de confianza: La fórmula del intervalo de confianza para el cociente de varianzas se de-
duce de la variable pivotal que se utiliza para estudiar el cociente de varianzas, cuya fórmula es: 
2 2
2 2
( 1),( 1) ( 1),( 1)2 2
2 2
~ o ~
A B A B
A A
A B
n n n n
B A
B B
S S
S
F F F F
S
 
La distribución se grafica de la siguiente manera: 
 
 
 
 
Donde: 1
( 1),( 1);
2
A Bn n
F F y 2
( 1),( 1);1
2
A Bn n
F F . 
 
 
 
Como en la tabla de F de Snedecor que se usa en el 
presente curso el valor de F1 no está tabulado, para conocerlo es necesario hacer uso de la siguiente 
igualdad: 
( 1),( 1);
2
( 1),( 1);1
2
1
A B
B A
n n
n n
F
F
 
Por ejemplo, en el problema que estamos resolviendo: 
9,10;0,975 9,10;0,025 9,10;0,025
10,9;0,975
1 1
3,78; ; 0,25.
3,96
F F F
F
 
El intervalo se construye basándose en las siguientes igualdades: 
 
2
2
2
( 1),( 1); ( 1),( 1);1
2 2
2
1
A B A B
A
B
n n n n
A
B
S
S
P F F 
 
 
2
2
2
( 1),( 1); ( 1),( 1);1
22 2
1 1
1
A B A B
A
B
A
n n n n
B
P
SF F
S
 
 
2
2
2
( 1),( 1);1 ( 1),( 1);
22 2
1 1
1
A B A B
A
B
A
n n n n
B
P
SF F
S
 
 
 
2 2
2 2 2
2
( 1),( 1);1 ( 1),( 1);
2 2
1
A B A B
A A
B A B
B
n n n n
S S
S S
P
F F
 
Entonces, en nuestro problema: 
2
2
1,3279 1,3279
3,78 0, 25
A
B
 
2
2
0,3513 5,3116A
B
 
 Conclusión: Con una confianza del 95% se espera que el intervalo [0,35136; 5,3116] cubra, o 
contenga, al cociente entre la varianza poblacional de la ganancia de peso de los cerdos Yorkshire de 3 
meses de edad del norte de la provincia de Buenos Aires alimentados con la ración A durante 30 días, y 
la varianza poblacional de la ganancia de peso de los cerdos Yorkshire de 3 meses de edad del norte de la 
provincia de Buenos Aires alimentados con la ración B durante 30 días. 
 
b) 
 Hipótesis de trabajo: “la nueva ración genera mayor uniformidad en el crecimiento”. 
 Supuestos teóricos: Ya fueron verificados en el ejercicio 3 
 Hipótesis estadísticas: Si se quiere probar que la nueva formulación es más uniforme, se quiere 
probar que la nueva formulación es menos variable que la ración A, simbólicamente:
2 2
A B
, esta 
expresión no contiene el signo igual por lo que corresponde a la hipótesis alternativa. Entonces las 
hipótesis quedan: 
2 2
0
2 2
1
:
:
A B
A B
H
H
o equivalentemente 
2
0 2
2
1 2
: 1
: 1
A
B
A
B
H
H
 
al igual que en las demás pruebas se debe plantear solo un par de hipótesis y mantenerlas a lo largo de 
toda la prueba, en esta caso vamos a trabajar con
2
0 2
2
1 2
: 1
: 1
A
B
A
B
H
H
 
 Nivel de significación: =0,05 
 Variable pivotal: Existe una única opción al elegir la variable pivotal en esta prueba, la F de Snedecor, 
cuya fórmula es: 
 
2 2
2 2
( 1),( 1) ( 1),( 1)2 2
2 2
~ o ~
A B A B
A A
A B
n n n n
B A
B B
S S
S
F F F F
S
 
 Región crítica: Observando la hipótesis alternativa, se ve que la región crítica es unilateral derecha. El 
valor crítico que la determina, debe buscarse en la tabla de la distribución de F de Snedecor y es: 
1, 1 ;1 10 1,9 1 ;1 0,05 9,10 ;0,95
3,02
A Bn n
F F F , por lo tanto la región crítica está determinada por 
3,02F 
 Regla de decisión: Rechazo H0 si 
0
3,02HF y no rechazo H0 si 0 3,02HF 
 Cálculo del estadístico de prueba: Todos los valores necesarios ya fueron calculados, por lo tanto, 
reemplazando en la fórmula, se obtiene: 
 
 Observar que el cociente de las varianzas poblacionales fue 
reemplazado por 1, porque el cálculo se hace bajo la hipótesis nula que 
plantea la igualdad de las varianzas. Como 1,3279 es menor que 3,02, 
no se rechaza la hipótesis nula. 
 
 Conclusión: Con un nivel de significación del 5% no hay evidencia suficiente para rechazar H0 
(
2
0 2
: 1A
B
H ). Esto significa que el cociente entre la varianza poblacional de la ganancia de peso de los 
cerdos Yorkshire del norte de la provincia de Buenos Aires de 3 meses de edad alimentados con la 
ración A y la varianza poblacional de la ganancia de peso de los cerdos Yorkshire del norte de la 
provincia de Buenos Aires de 3 meses de edad alimentados con la ración B, es menor o igual a 1. Por 
lo tanto, al mismo nivel, no es cierta la hipótesis de los nutricionistas. 
 
Nota: a continuación se da la salida del programa InfoStat para este problema. Observar que los 
resultados son los mismos que se obtuvieron anteriormente. 
 
Prueba F para igualdad de varianzas 
Grupo(1) Grupo(2) n(1) n(2) Var(1) Var(2) F p prueba 
 1 2 10 11 4.900 3.691 1.328 0.3312 Unilat D 
 
7) Con el fin de comparar el rendimiento académico (en una escala de 0 a 10 puntos) entre estableci-
mientos privados y estatales, se seleccionan aleatoriamente 15 personas que han realizado estudios 
secundarios en establecimientos privados, y 15 personas que han realizado estudios secundarios en 
establecimientos estatales. Los datos obtenidos son los siguientes: 
 
PRIVADO 7 6 4 7 5 5 4 9 9 8 4 5 5 7 5 
ESTATAL 9 6 5 6 5 4 4 4 4 4 6 3 3 5 4 
¿Podemos suponer que los rendimientos académicos difieren significativamente? ( =0,05) 
Shapiro-Wilks (modificado) 
Secundario Variable n Media D.E. W* p (una cola) 
Estatal Rendim 15 4,80 1,52 0,85 0,0330 
Privado Rendim 15 6,00 1,73 0,85 0,0253 
 
Como primer paso debemos verificar el supuesto de normalidad, por lo que realizamos el test de Sha-
piro-Wilks: 
 
No se cumple el supuesto de normalidad para el rendimiento académico de las personas que provie-
nen de establecimientos secundarios estatales y privados, por lo que no podemos realizar una prueba t 
para muestras independientes, debemos realizar un análisis no paramétrico, la prueba de Mann-
Whitney. 
 
0
2
2
2
2
4,9
3,69
1,3279
1
A
B
H
A
B
S
S
F
 
 
 
 
 
Como podemos ver en el boxplot, las distribucio-
nes de rendimiento académico de los individuos 
que provienen de establecimientos estatales y 
privados, son similares. 
Ambas son asimétricas positivas, ya que prácti-
camente coinciden el C2 con el C1. La falta de 
normalidad ya la habíamos confirmado con la 
prueba de Shapiro Wilks. 
 
 
Las hipótesis a testear en este caso son: 
H0: E P = 0 vs H1: E P ≠ 0 (hipótesis bilateral) 
 
Se combinanambas muestras en una única muestra ordenada y luego asignamos a cada dato su ran-
go (posición) sin tener en cuenta de cuál de las muestras proviene. 
 
 
 
 
 
 
 
 
 
3+4+5+6+7+8+9+10+11 63
= =7
9 9
 
 
 
 
 
Estadístico: 
T = Suma de rangos de una de las muestras 
 
El valor esperado del estadístico y la varianza del estadístico bajo H0 
son, respectivamente: 
 
T (estatal)= 1,5*2 + 7*6 + 15,5*3 + 21,5*3 + 29 = 185 
T
nnn
TE
2
)1(
)( 211 
15*(15 15 1)
( ) 232,5
2
E T 
22121
12
)1(
V(T ) T
nnnn
 
15*15*(15 15 1)
V(T) 581,25
12
 
581,5 24,109T 
)1;0(
V(T)
E(T)-T
 Zobs N 
185 232,5
1,97
24,109
obsZ 
 
A un nivel de significación del 5%, y para nuestra hipótesis, rechazamos H0 si Zobs< -1,96 o Zobs>1,96 
Puesto que -1,97 < -1,96, la decisión es rechazar Ho. 
Datos Secundario Orden Rango 
3 Estatal 1 1,5 
3 Estatal 2 1,5 
4 Estatal 3 7 
4 Estatal 4 7 
4 Estatal 5 7 
4 Estatal 6 7 
4 Estatal 7 7 
4 Estatal 8 7 
4 Privado 9 7 
4 Privado 10 7 
4 Privado 11 7 
5 Estatal 12 15,5 
5 Estatal 13 15,5 
5 Estatal 14 15,5 
5 Privado 15 15,5 
5 Privado 16 15,5 
5 Privado 17 15,5 
5 Privado 18 15,5 
5 Privado 19 15,5 
6 Estatal 20 21,5 
6 Estatal 21 21,5 
6 Estatal 22 21,5 
6 Privado 23 21,5 
7 Privado 24 25 
7 Privado 25 25 
7 Privado 26 25 
8 Privado 27 27 
9 Estatal 28 29 
9 Privado 29 29 
9 Privado 30 29 
 
 
Al nivel del 5%, existen evidencias suficientes para rechazar H0, por lo que la mediana poblacional del 
rendimiento académico de los individuos que han realizado estudios secundarios en establecimientos 
estatales es distinta a la mediana poblacional de los que han realizado sus estudios secundarios en esta-
blecimientos privados. 
Como respuesta a la pregunta, podemos decir, que, al 5%, los rendimientos académicos difieren significa-
tivamente entre los individuos que han realizado sus estudios secundarios, al comparar establecimientos 
estatales y privados. 
 
Utilizando InfoStat, tenemos que aplicar el test de Wilcoxon para muestras independientes, y obtenemos la 
siguiente salida, en la que figuran medidas resumen, el estadístico correspondiente, y el p-valor de la 
prueba. 
Prueba de Wilcoxon para muestras independientes (Mann Whitney) 
Variab Gr1 Gr2 n1 n2 Me1 Me2 R-media1 R-media2 W p(2 colas) 
Rta ESTATAL PRIVADO 15 15 4,00 5,00 12,33 18,67 185,0 0,0433 
 
8) Los datos que se presentan a continuación provienen de los pesos, en g, de 22 ratas hembras, de entre 
28 y 84 días de vida. Doce de ellas fueron alimentadas con una dieta alta en proteínas, y 10 con una dieta 
baja en proteínas. 
Alta en proteína 120,2 120,57 119,78 120,29 118,62 120,69 120,27 119,13 118,04 120,29 117,46 119,7 
Baja en proteína 102,13 105,3 103,39 104,73 98,00 95,89 98,65 98,73 95,2 102,47 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
 Alta en proteína 12 119.58 1.049 0.8715 0.1683 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
Baja en proteína 10 100.45 3.62 0.9282 0.4305 
 
a) ¿Se puede suponer, al 5%, que el peso medio de las ratas alimentadas con la dieta alta en 
proteínas es mayor que el peso medio las ratas alimentadas con la dieta baja en proteínas? 
b) Construir un intervalo para la diferencia de medias al 95%. ¿Qué puede concluir? 
 
Datos del problema: 
 Variables en estudio 
 X1: peso de una rata de entre 28 y 84 días de vida alimentada con una dieta alta en proteínas. Medida 
en g. 
 X2: peso de una rata de entre 28 y 84 días de vida alimentada con una dieta baja en proteínas. 
Medida en g. 
 
 Tamaños de las muestras: n1= 12 y n2= 10 
 
 Varianzas poblacionales: Desconocidas 
 
 Nivel de significación: =0,05 
 
 Nivel de confianza: 1- =0,95 
 
Solución: 
a) 
 La hipótesis de trabajo que se desea poner a prueba es: 
“La dieta alta en proteínas produce un peso medio mayor que la dieta baja en proteínas” 
 
 Verificación de supuestos: Para poder plantear las hipótesis estadísticas y poder llevar a cabo la 
prueba, hay que verificar los supuestos teóricos necesarios. En este caso, los supuestos son que am-
bas variables (X1 y X2) sean independientes y se distribuyan normalmente. El supuesto de indepen-
dencia se cumple por la forma en que se realizó el experimento: a un grupo de ratas seleccionado 
aleatoriamente se le suministró la dieta alta en proteínas y a otro grupo, también tomado al azar, se le 
suministro una dieta baja en proteínas. 
 
 
Para X1: se realizó un test de Shapiro Wilks cuyas hipótesis son: 
 
 
Al realizar el test, utilizando InfoStat, se obtuvieron los siguientes resultados: 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
X1 12 119.58 1.049 0.8715 0.1683 
 
Como p-valor= 0,1683 y es mayor que =0,10, no se rechaza la hipótesis nula. por lo tanto, con un nivel 
de significación del 10% se puede decir que la variable X1 (peso de una rata de entre 28 y 84 días de vida 
alimentada con una dieta alta en proteínas medido en g) se distribuye normalmente. 
Análogamente se estudia la normalidad de la variable X2: 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
X2 10 100.45 3.62 0.9282 0.4305 
 
Como p-valor= 0,4305 y es mayor que =0,10, no se rechaza la hipótesis nula. Por lo tanto, con un nivel 
de significación del 10%, se puede decir que la variable X2 (peso de una rata de entre 28 y 84 días de vida 
alimentada con una dieta baja en proteínas medida en g) se distribuye normalmente. 
 
En este caso, no hay información de las varianzas poblacionales, por lo tanto son desconocidas, y hay que 
probar si son iguales. Para esto hay que realizar un test de homogeneidad de varianzas, cuyas hipótesis 
son: 
2
2
2
11
2
2
2
10
:
:
H
H
 
 
Prueba F para igualdad de varianzas 
Variable Grupo(1) Grupo(2) n(1) n(2) Var(1) Var(2) F p prueba 
Peso {Alta} {Baja} 12 10 1,10 13,10 0,08 0,0009 Bilateral 
 
El resultado del estadístico es F= 0,08 y un p-valor de 0,0009, por lo tanto se rechaza la hipótesis de 
homogeneidad de varianzas. 
Es decir que ambas variables se distribuyen normalmente con varianzas desconocidas y diferentes. 
 
 Hipótesis estadísticas. 
Como el interés del investigador es probar si al alimentar a las ratas con una dieta con alta con-
centración de proteínas produce un peso medio superior, simbólicamente: 21 . Por lo que las 
hipótesis estadísticas son: 
211
210
:
:
H
H
 
 Nivel de significación: =0,05 
 Estadístico de prueba (o variable pivotal) 
Se está realizando un test de hipótesis para la diferencia de medias poblacionales de variables 
con distribución normal, por lo cual se cuenta con dos opciones al elegir la variable pivotal: Z o t de 
Student, dependiendo del hecho de conocer o no las varianzas poblacionales. En este caso, las va-
 
rianzas poblacionales son desconocidas y desiguales, por lo tanto se utiliza una t, con la siguiente ex-
presión: 
wt
n
s
n
s
XX
2
2
2
1
2
1
21 0)( T con 
2
2 2
1 2
1 2
2 2
2 2
1 2
1 2
1 21 1
s s
n n
w
s s
n n
n n
 
 Región crítica: 
Es unilateral derecha, dado que H1: 1- 2>0 , por lo tanto el valor crítico es: 95,0,wt , siendo w 
 
El valor crítico es 812,195,0,10t y la región crítica queda determinada por: 812,1t 
 
 Regla de decisión: Rechazo H0 si 812,1
0H
t 
No rechazo H0 si 812,1
0H
t 
 Cálculo de tHo: 
Hasta este momento no fueron necesarias las muestras, excepto en la verificación de supuestos, 
sin embargo se podría haber hecho con muestras piloto y recién en esta instancia extraer las muestras 
para el análisis. Antes de calcular el valor del estadístico de prueba hay que calcular las medias mues-
trales utilizando las fórmulas dadas en la unidad de estadística descriptiva de Elementos de Estadísti-
ca: 45,10058,119 21 XX . Hay que tener en cuenta que laprueba se está realizando bajo la 
hipótesis nula que contiene el caso en que las medias poblacionales son iguales, por lo tanto la dife-
rencia de las medias poblacionales es cero, es decir que 
1 2 0. Reemplazando estos valores y 
el resto de la información en la fórmula nos queda: 
0
1 2
H
2 2
1 2
1 2
 ( ) 0 (119,58 100,45) 19,13 19,13 19,13
T 16,162
1,18361,1 13,1 0.091 1,31 1,401
12 10
X X
s s
n n
 
 
 Decisión: Se rechaza la hipótesis nula porque 162,16
0H
t , es mayor que 1,812 
 Conclusión: Con un nivel de significación de 5% tengo evidencia suficiente para rechazar la hipó-
tesis nula ( 210 :H ), por lo tanto la media poblacional del peso de las ratas de entre 28 y 84 días 
de vida que reciben la dieta alta en proteínas es mayor que la media poblacional de las ratas de entre 
28 y 84 días de vida que reciben la dieta baja en proteínas, en estas poblaciones de ratas en estudio. 
 
b) La fórmula del intervalo del 95% que se está pidiendo se despeja de la variable pivotal y es: 
2
2
2
1
2
1
2
1,21
2
2
2
1
2
1
2
1,21
)(;)(
n
s
n
s
tXX
n
s
n
s
tXX
ww
 
 
reemplazando se obtiene que 
10;0,975 10;0,975
1,1 13,1 1,1 13,1
(119,58 100,45) ; (119,58 100,45)
12 10 12 10
 (19,13) 2,228 0,091 1,31; (19,13) 2,228 0,091 1,31
 (19,13) 2,228 1,401; (19,13) 2,228 1,401 (19,13) 2,228(1,1
t t
836); (19,13) 2,228(1,1836)
(19,13) 2,637; (19,13) 2,637 16,493 g; 21,767 g
 
 
 
0
1 2
H
2 2
1 2
1 2
 ( ) 0 (119,58 100,45) 19,13 19,13 19,13
T 16,162
1,18361,1 13,1 0.091 1,31 1,401
12 10
X X
s s
n n
 
Conclusión: Con un nivel de confianza del 95%, se espera que el intervalo (16,493 g; 21,767 g) cubra 
o contenga a la diferencia entre la media poblacional del peso de la ratas de entre 28 y 84 días de vida 
alimentadas con la dieta alta en proteínas y la media poblacional de las ratas de entre 28 y 84 días de 
vida alimentadas con la dieta baja en proteínas, en estas poblaciones de ratas de entre 28 y 84 días de 
vida. 
La correspondiente salida de Infostat es: 
Prueba T para muestras Independientes 
Variable:peso - Clasific:Variab - prueba:Unilateral 
 Grupo 1 Grupo 2 
 X1 X2 
n 12 10 
Media 119,59 100,45 
Varianza 1,10 1,10 
 
pHomVar 0,0003 
T 16,16 
p-valor <0,0001 
 
Se puede observar en la salida que se realiza la prueba de homogeneidad y se rechaza la hipótesis de 
igualdad de varianzas; luego se realiza la prueba de diferencia de medias unilateral izquierda 
suponiendo falta de homogeneidad. 
 
PROBLEMAS PROPUESTOS 
 
1) Para comparar cinco dietas para porcinos se seleccionaron veinticinco animales al azar para ser 
usados en el experimento. Aleatoriamente se les asignó una dieta a cada grupo, midiéndose sobre 
cada animal el peso inicial y el peso al cabo de 30 días. 
Responder: 
a) La unidad experimental es ........................................................................................................... 
b) Los tratamientos son ................................................................................................................... 
c) La observación es ....................................................................................................................... 
d) El objetivo del trabajo es ............................................................................................................ 
...................................................................................................................................................... 
 
2) Para estudiar el efecto de un nuevo fertilizante sobre el rendimiento de un cultivo de oleaginosas, se 
sembraron 12 ha del cultivo con fertilizante y 10 ha sin fertilizante. Una vez levantada la cosecha resultó: 
1X =1089 kg/ha y 2X = 877 kg/ha, respectivamente. Suponiendo que 1 = 2 = 105 kg/ha, y que ambas 
variables tienen distribución normal: 
a) a.- ¿Es la diferencia entre los rendimientos medios con y sin fertilizante, significativa al 5%? 
b) b.- ¿Considera conveniente construir un intervalo de confianza para la diferencia entre las 
medias? Justifique. 
 
 
3) Las personas que tienen el síndrome de Raynaud sufren un súbito deterioro en la circulación sanguínea 
de los dedos de las manos y de los pies. Para estudiar esta enfermedad, en un experimento se midió la 
generación de calor, mediante calorimetría, en cal/cm
2
/min, de un dedo índice luego de haberlo sumergido 
en agua a 19°C. En este estudio, se contó con una muestra tomada al azar de 10 individuos con el 
síndrome y una muestra de 10 individuos sanos. 
Sanos (S) 2,43 1,83 2,43 2,70 1,88 1,96 1,53 2,08 1,85 2,44 
Síndrome de Raynaud (E) 0,81 0,70 0,74 0,36 0,75 0,56 0,65 0,87 0,40 0,31 
Asuma que las distribuciones de ambas variables son normales, y que E
2
 = S
2
. 
a) a.- Definir: 
 Variables en estudio: ........................................................................................................................ 
............................................................................................................................................................. 
............................................................................................................................................................. 
 Parámetros: ..................................................................................................................................... 
............................................................................................................................................................. 
............................................................................................................................................................. 
 Poblaciones: .................................................................................................................................... 
............................................................................................................................................................. 
............................................................................................................................................................. 
 
b) b.- Estimar puntualmente y por intervalo de confianza la diferencia entre la generación de calor 
media de los individuos enfermos ( E) y la generación de calor media de los individuos sanos ( S) 
(1- = 0,95). 
 
c) c.- Se cree que la generación de calor por parte de los afectados por este síndrome es más 
homogénea. Probarlo con un nivel de significación del 5%. 
 
4) De una población de individuos afectados por una enfermedad, se tomaron dos muestras aleatorias e 
independientes de 100 individuos cada una. A una de las mismas (que llamaremos grupo A), se le 
administró un suero, al otro grupo (B, control) se le administró un placebo; en todo lo demás, los dos 
grupos fueron tratados idénticamente. Se encontró que en los grupos A y B, 75 y 55 individuos, 
respectivamente, se habían recuperado luego de un mes de observación. Probar la hipótesis de que el 
suero ayuda a curar la enfermedad con un nivel de significación del 5%. 
a) La hipótesis de trabajo es: ......................................................................................................... 
..................................................................................................................................................... 
..................................................................................................................................................... 
 
 
b) La región crítica es ..................................................... 
 
c) El valor calculado del estadístico de prueba es: 
Fórmula empleada Reemplazo numérico Resultado 
 
d) Conclusión a la que llega luego de la prueba: .............................................................................................................................................................................................................................................. 
....................................................................................................................................................... 
....................................................................................................................................................... 
....................................................................................................................................................... 
 
5) Un estudio llevado a cabo para probar si la aspirina afecta el tiempo de coagulación, se tomó una 
muestra de 12 adultos varones. El tiempo de protrombina, que mide el tiempo en segundos entre el 
inicio de la reacción de coagulación y la formación del coágulo, fue medido en cada uno de los 
individuos antes y después de 3 hs de haber ingerido dos tabletas de aspirina (500mg cada una). 
Antes 12,3 12,0 12,0 13,0 13,0 12,5 11,3 11,8 11,5 11,0 11,0 11,3 
Después 12,0 12,3 12,5 12,0 13,0 12,5 10,3 11,3 11,5 11,5 11,0 11,5 
a) Probar si existe alguna diferencia en el tiempo de protrombina con un nivel de significación del 5%, 
tener en cuenta la verificación de supuestos, sin hacer cálculos y utilizando la información que le 
proporciona alguna de las salidas de InfoStat que abajo se detallan. Comente brevemente por qué eligió 
esa salida y a qué decisión llega a partir de la información. 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
antes 12 11.89 0.71 0.89 0.2210 
después 12 11.79 0.75 0.97 0.9213 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
Dif_AD 12 0,11 0,51 0,86 0,1172 
 
Prueba T para muestras Independientes 
Grupo1 Grupo2 n1 n2 med1 med2 LI(95%) LS(95%) T p prueba 
Antes Después 12 12 11,89 11,78 -0,51 0,72 0,37 0,7186 Bilat 
 
Prueba T para un parámetro 
Valor del parámetro probado: 0 
Variable n Media DE LI(95) LS(95) T p(Bilateral) 
Dif_AD 12 0,11 0,51 -0,21 0,43 0,74 0,4748 
....................................................................................................................................................... 
....................................................................................................................................................... 
b) El intervalo de confianza correspondiente tiene como límites: ......................................................... 
c) La conclusión para el intervalo de confianza es: ............................................................................ 
....................................................................................................................................................... 
....................................................................................................................................................... 
....................................................................................................................................................... 
 
6) Las empresas que comercializan agua para beber, realizan controles de calidad diariamente. Una de 
las variables de interés es el pH, que mide el grado de acidez del agua contenida en los envases lista 
para su distribución. Un pH menor a 7 es considerado ácido, un pH mayor a 7 es considerado alcalino 
y un pH igual a 7 es considerado neutro. Un investigador sospecha que el material de los nuevos en-
vases modifica el pH del agua. Para estimar la diferencia entre los pH medios, extrae 20 muestras de 
agua con el envase viejo y 15 muestras de agua con el envase nuevo. Algunos datos obtenidos son: 
 
 Media Desvío Shapiro-Wilks (p-valor) 
Envase viejo 8,366 0,54 0,6413 
Envase nuevo 6,318 3,73 0,9609 
 
Al hacer la prueba de homogeneidad de varianzas, resultó: F = 0,0209, p-value = 0 
Construir un intervalo para la diferencia de medias al 95%. ¿Qué puede concluir? 
 
7) Alle y Bowen (1932) estudiaron el tiempo de supervivencia de la carpa dorada, en minutos, cuando se 
coloca en suspensiones de plata. Los investigadores realizaron varios experimentos, entre ellos el siguien-
te: se asignan aleatoriamente 10 carpas a cada grupo. En uno de ellos se exponen a las carpas a una 
concentración baja de nitrato de plata disuelto en el agua (Conc1, 50 g/l), y el otro grupo, a una concentra-
ción mayor (Conc2, 80g/l). Al nivel del 5%, ¿difieren los tiempos de supervivencia? 
 
 
 
 
 
 
 
 
 
 
 
Conc1 Conc2 
210 81 
180 75 
240 156 
60 180 
55 102 
75 200 
78 135 
82 85 
125 78 
83 87 
 
 
 
 
Shapiro-Wilks (modificado) 
Concentración Variable n Media D.E. W* p (una cola) 
1 Sobrevida 10 118,80 67,11 0,81 0,0247 
2 Sobrevida 10 117,90 46,46 0,82 0,0307 
 
Prueba de Wilcoxon para muestras independientes (Mann Whitney) 
Variable Gr1 Gr2 n1 n2 Me1 Me2 R-media1 R-media2 W p(2 colas) 
Sobrevida 1 2 10 10 82,50 94,50 9,75 11,25 97,50 0,5703 
 
CUESTIONARIO 
 
1.- ¿Cuál es el objeto de un diseño experimental? ¿Qué beneficios trae? 
 
2.- ¿De qué manera puede controlarse la confusión de factores en el estudio experimental? 
 
3.- ¿Cuál/es de las siguientes preguntas corresponde hacerse en un estudio observacional? Tache lo 
que no corresponda. 
a) ¿se aleatorizaron las asignaciones a tratamiento y control? SÍ NO 
b) ¿qué característica determinó la separación entre los grupos? SÍ NO 
c) ¿existen factores que pueden confundirse con los tratamientos? SÍ NO 
d) ¿si existe posibilidad de confusión, puede controlarse? SÍ NO 
 
4.- En los estudios observacionales pueden establecerse asociaciones, es decir poner de manifiesto 
que una cosa está relacionada con otra. ¿Pueden estos estudios establecer causalidad? 
 
5.- ¿Cómo diseñaría un experimento para estudiar si la hipertensión durante el embarazo provoca 
bebés nacidos con menor peso? ¿Qué factor podría confundirse y cómo lo controlaría? 
6.- Según un estudio observacional realizado en el Kaiser Permanente de Walmut Creek, California, se 
daba un índice más elevado de cáncer de cuello de matriz entre mujeres que usaban anticonceptivos ora-
les que entre las que no usaban, independientemente de su edad, educación, estado civil, religión y hábito 
de fumar. Los investigadores llegaron a la conclusión de que la píldora causaba el cáncer del cuello de 
matriz. ¿Es correcta esta afirmación? ¿Por qué? 
 
7.- Identifique en el ejemplo anterior los términos: unidad experimental, tratamiento, factor, niveles del 
 
8.- En qué casos debe aplicarse el test de Welch? 
 
1 2
Concentración
50
100
150
200
250
S
ob
re
vi
da
Boxplot
 
9.- ¿Qué entiende por confianza en la estimación de un intervalo? 
 
10.- ¿Qué ocurre con la amplitud de un intervalo de confianza para la diferencia de medias 
poblacionales con varianzas desconocidas pero iguales si: 
a.- aumenta el tamaño de las muestras (manteniéndose la varianza muestral constante) 
b.- disminuye el nivel de confianza. 
c.- disminuye la variabilidad de las muestras. 
11.- ¿Puede resultar negativo algún límite de un intervalo de confianza para la diferencia de dos 
proporciones? Justifique su respuesta. 
12- ¿En qué casos es recomendable aplicar un test de Mann Whitney? Explicite los supuestos y las 
hipótesis que se corresponden con los mismos. 
13.- ¿Cuándo le parece conveniente utilizar una prueba para la media de las diferencias apareadas? 
¿Cuántas son las variables en estudio? 
14.- Se tiene la sospecha de que la proporción de individuos que no tienen enfermedades cardiovascu-
lares en la población A es mayor que en la población B. Para poner a prueba esta hipótesis se tomó 
una muestra aleatoria de individuos de la población A y otra de la población B y se observó el número 
de individuos

Otros materiales

Materiales relacionados

74 pag.
39 pag.
72 pag.
analitica guia 1ra parte

User badge image

Estudiando Veterinaria