Logo Studenta

Análisis de Datos - Ejercicios de Estadística

¡Estudia con miles de materiales!

Vista previa del material en texto

Análisis de Datos (Primer Semestre 2020)
TRABAJO PRÁCTICO 7
Ejercicio 1. Para uniones de espiga de dos tipos diferentes utilizados en la construcción
de bastidores de madera, se determinó la fuerza de unión en plano (libras/pulgadas),
teniendo el primer tipo mayor grosor de riel. Suponemos que la fuerza de unión sigue una
distribución normal en ambos tipos de unión. Llamemos µ1 y µ2 a las respectivas medias
y sean σ1 = 155 y σ2 = 140 las respectivas desviaciones t́ıpicas. Para 10 espećımenes
probados del primer tipo se obtuvo x1 = 1376, 4; para 9 espećımenes del segundo tipo
x2 = 1215, 6
a) Pruebe H0 : µ1 − µ2 = 0 vs. HA : µ1 − µ2 > 0 con un nivel α = 0,05
b) Calcule el valor − p
c) Construya desde el pivote y estime un intervalo de 95 % confianza para la diferencia
µ1 − µ2
Ejercicio 2. Dos métodos para enseñanza de lectura se aplicaron a dos grupos de niños
de escuela primaria seleccionados al azar y luego se compararon con base en un examen
de comprensión de lectura aplicado al final del periodo de enseñanza. Se supone que las
distribuciones de las calificaciones del examen en ambos grupos tienen distribución normal
con varianzas iguales. Las medias y las varianzas muestrales calculadas a partir de dichas
calificaciones se muestran en la tabla siguiente.
n x̄ s2
Método I 11 64 52
Método II 14 69 71
a) Estimar la diferencia de las medias de las calificaciones de ambos grupos, mediante un
intervalo de 95 % de confianza.
b) ¿Puede afirmarse con nivel α = 0,05 que existe diferencia entre las medias de las
calificaciones de ambos grupos?
Ejercicio 3. Se seleccionaron 22 animales experimentales con deficiencia de vitamina D y
se dividieron en dos grupos de 11. El grupo 1 recibió una dieta rica en vitamina D, y el 2
la dieta común. Luego se midió para cada animal la concentración de vitamina D en suero.
Puede suponerse que la concentración de vitamina D en suero es una variable aleatoria
con distribución normal, con la misma varianza en ambos grupos. A continuación se listan
los valores para cada grupo (en mg/100ml).
n x s
G1 11 10,95 1,25
G2 11 8,24 1,39
1
a) Se desea determinar si la dieta rica en vitamina D aumenta la concentración de vita-
mina D en suero en más de 2 unidades. Plantee las hipótesis pertinentes. Resuelva
el problema para α = 0,05. Indique el estad́ıstico de prueba, su distribución bajo la
hipótesis nula y la región de rechazo. Dar la conclusión en términos del problema.
b) Según su conclusión anterior, ¿qué puede decir del p-valor? ¿será mayor o menor a
0,05?
Ejercicio 4. Se cree que las personas infectadas por E. canis tienen, en promedio, un
recuento de glóbulos blancos más bajo que los no infectados. Sabemos que el recuento
de glóbulos blancos tiene distribución normal. Para una muestra de 15 personas infec-
tadas, el recuento medio de glóbulos blancos es de 4767/mm3, y la desviación estándar
es 2204/mm3; para una muestra de 10 personas sanas estos valores son 7360/mm3 y
2415/mm3 respectivamente.
a) ¿Brindan estos datos evidencia que confirme la hipótesis planteada? Utilice α = 0,01.
b) ¿Cuál seŕıa su conclusión para α = 0,005? ¿Qué puede decir del p-valor considerando
sus respuestas?
Ejercicio 5. El cobre sólido, producido por sinterización (calentamiento sin fundir) de
un polvo en condiciones ambientales especificadas, se mide a continuación para ver su
porosidad (en fracción de volumen debido a huecos) en un laboratorio. Una muestra de
4 mediciones independientes de porosidad tienen una media de y1 = 0,22 y varianza de
s21 = 0,0010. Un segundo laboratorio repite el mismo proceso en cobre sólido formado de
un polvo idéntico y obtiene 5 mediciones independientes de porosidad con y2 = 0,17 y
s22 = 0,0020. Estime mediante un intervalo de 95 % de confianza, la diferencia real entre
las medias poblacionales para estos dos laboratorios. Suponga que la porosidad sigue una
distribución normal.
Ejercicio 6. Para una muestra de 11 hombres se midieron los niveles de creatinina usando
dos métodos diferentes, “A” y “B”. Suponemos que los niveles de creatinina siguen una
distribución normal
sujeto 1 2 3 4 5 6 7 8 9 10 11
A 7,92 8,03 6,87 7,00 7,28 6,94 8,32 7,58 7,88 7,83 10,26
B 8,04 7,71 6,54 6,96 7,62 6,95 8,25 7,46 8,17 7,84 9,79
Se desea determinar si los métodos difieren.
a) ¿Brindan estos datos evidencia suficiente para afirmar que los métodos A y B difieren,
con nivel α = 0,05?
b) Si utilizara un nivel α = 0,10 ¿cuál seŕıa su conclusión? Teniendo en cuenta su res-
puesta ¿qué puede decir respecto al p-valor?
2
c) Calcule un intervalo de 95 % de confianza para la media de las diferencias, ¿puede usar
este intervalo para responder el inciso a)?
Ejercicio 7. Para 10 animales experimentales se registró la frecuencia card́ıaca (latidos
por minuto) antes y después de ser sometidos a un experimento (la distribución de la
frecuencia card́ıaca se supone normal); los datos son
Animal
1 2 3 4 5 6 7 8 9 10
Frecuencia card́ıaca antes 70 84 88 110 105 100 110 67 79 86
Frecuencia card́ıaca después 115 148 176 191 158 178 179 140 161 157
a) ¿Se puede concluir, con nivel α = 0,05, que el experimento produce un aumento de la
frecuencia card́ıaca media?
b) Construya desde el pivote y estime con un intervalo de 95 % de confianza la diferencia
media en la frecuencia card́ıaca. ¿Podŕıa utilizar este intervalo para contestar a
pregunta del inciso a)? ¿Por qué?
Ejercicio 8. La siguiente tabla compara los niveles de carboxihemoglobina (COHb) de
un grupo de no fumadores y un grupo de fumadores de cigarrillos. Se presentan las medias
y desviaciónes t́ıpicas observadas en los dos grupos. Se desea probar que el al nivel medio
de COHb en los fumadores supera en 2 unidades al de los no fumadores.
Grupo n COHb ( %)
Fumadores 31 x1 = 6,7, s1 = 1,7
No fumadores 40 x2 = 3,2, s2 = 1,1
a) Plantee las hipótesis y resuelva el problema para un α = 0,05
b) Calcule el p-valor aproximado.
Ejercicio 9. Como parte de un estudio para determinar si la exposición al DDT, está
asociada con el cáncer de mama, se seleccinó una muestra de mujeres a las que se les
diagnosticó cáncer y un grupo testigo de mujeres sanas relacionadas a las pacientes de
cáncer en lo que se refiere a varias caracteŕısticas, como: edad, condición de fumadora, etc.
A cada mujer se le tomó una muestra de sangre y se midió el nivel de DDE (un derivado
del DDT en el cuerpo humano), y se calculó la diferencia de niveles de cada paciente y
su control asociado. Para las 171 diferencias se obtuvo una media de d = 2,7ng/ml y una
desviación t́ıpica de s = 15,9ng/ml. ¿Se puede inferir de estos datos que los niveles de
DDE difieren en el grupo de mujeres con cáncer de mama y el grupo de mujeres sanas?
Calcule un intervalo de 95 % confianza para la media de las diferencias de niveles de DDE
entre pacientes y controles. Utilice dicho intervalo para responder la pregunta planteada.
3
Ejercicio 10. En un art́ıculo reportó sobre un experimento en el cual 120 pacientes con
caracteŕısticas cĺınicas similares fueron divididos al azar en un grupo de control y un grupo
de tratamiento, cada uno compuesto de 60 pacientes. La permanencia media en la unidad
de cuidados intensivos y la desviación estándar muestrales para el grupo de tratamiento
fueron 19, 9 y 39, 1, respectivamente, en tanto que estos valores para el grupo de control
fueron 13, 7 y 15, 8. Nada hace suponer que el tiempo de permanencia en la unidad de
cuidados intensivos tenga una distribución normal.
a) Calcule una estimación puntual de la diferencia entre la permanencia en la unidad de
cuidados intensivos promedio verdadera para los grupos de tratamiento y control.
¿Sugiere esta estimación que existe una diferencia significativa entre las permanen-
cias promedio verdaderas en las dos condiciones?
b) Responda la pregunta planteada en el inciso a) realizando una prueba formal de hipóte-
sis. ¿Es diferente el resultado de lo que hab́ıa conjeturado en el inciso a)? Calcule el
p-valory utiĺıcelo para dar su conclusión.
c) Construya un intervalo de 95 % confianza para la diferencia en la permanencia media
entre ambos grupos.
d) ¿Cómo podŕıa utilizar el intervalo de confianza halaldo en c) para responder a la
pregunta en a)? ¿Con qué nivel de significación seŕıa su conclusión?
Ejercicio 11. Un biólogo ha lanzado la hipótesis de que una alta concentración de acti-
nomicina D inhibe la śıntesis del ácido ribonucleico en células y, por lo tanto, inhibe la
producción de protéınas. Un experimento realizado para probar esta teoŕıa comparó la
śıntesis del ácido ribonucleico en células tratadas con dos concentraciones de actinomicina
D: 0.6 y 0.7 microgramos por litro. Las células tratadas con la concentración más baja
(0.6) de actinomicina D indicaron que 55 de entre 70 se desarrollaron normalmente, mien-
tras que sólo 23 de entre 70 parecieron desarrollarse normalmente con la concentración
más alta (0.7). ¿Esta información indica que el porcentaje de śıntesis normal de ácido ribo-
nucleico es menor para células expuestas a las concentraciones más altas de actinomicina
D?
a) Plantee las hipótesis adecuadas, el estad́ıstico de prueba y su distribución bajo H0.
b) Encuentre el p-valor aproximado para la prueba.
c) Si usted elige usar α = 0,05, ¿cuál es su conclusión? Utilice la información obtenida
en el inciso a) para dar su respuesta.
Ejercicio 12. Se realizaron mediciones de los niveles de plomo en una muestra, y se
construyeron intervalos de confianza para el nivel medio de plomo (µ) en esa muestra:
un intervalo de nivel 0,90 fue [4,72; 4,97], un intervalo de nivel 0,95 fue [4,69; 4,99] y un
intervalo de nivel 0,99 fue [4,65; 5,03]. Si se realiza un test para H0 : µ = 5, vs HA : µ 6= 5,
¿cuál de las siguientes afirmaciones es verdadera?
4
i) p− valor ≤ 0,01
ii) 0,01 ≤ p− valor ≤ 0,05
iii) 0,05 ≤ p− valor ≤ 0,10
iv) p− valor ≥ 0,10
5

Continuar navegando