Logo Studenta

PRIMER REGULATORIO RESUELTO

¡Este material tiene más páginas!

Vista previa del material en texto

1 
 
Primer Regulatorio de Bioestadística 
Variable Aleatoria 
Ejercicio 1 
La función de distribución de una variable aleatoria X es: 
 
 
Calcular el valor de k tal que 𝑃(𝑋 > 𝑘) =
1
4
 0 < k < 2 
Resolución: 
𝑃(𝑋 > 𝑘) = 1 − 𝐹(𝑘) = 1 −
𝑘2
4
=
1
4
 
−
𝑘2
4
=
1
4
− 1 −
𝑘2
4
= −
3
4
 𝑘2 = 3 𝑘 = √3 
 
Ejercicio 2 
La función de distribución de una variable aleatoria X es: 
 
Hallar el valor de k tal que: 𝑃(𝑋 > 𝑘) =
3
4
; con 0 < k < 2 
Resolución: 
𝑃(𝑋 > 𝑘) = 1 − 𝐹(𝑘) = 1 −
𝑘2
4
=
3
4
 
𝑘2
4
=
1
4
 k=1 
 
Ejercicio 3 
Hallar la función de distribución de una variable aleatoria discreta X, con E(X) = 0,7 y 
función de probabilidad puntual: 
 
2 
 
Resolución: 
𝐸(𝑋) = −1 ∙ 0,1 + 1 ∙ 0,2 + 2𝑏 = 0,7 
𝑏 = 0,3 → 𝑎 = 0,4 (𝑦𝑎 𝑞𝑢𝑒 ∑ 𝑝(𝑥𝑖) = 1) 
 
𝐹𝑥(𝑋) =
{
 
 
 
 
0 𝑠𝑖 𝑥 < −1
0,1 𝑠𝑖 − 1 ≤ 𝑥 < 0
0,5 𝑠𝑖 0 ≤ 𝑥 < 1
0,7 𝑠𝑖 1 ≤ 𝑥 < 2
1 𝑠𝑖 𝑥 ≥ 2
 
 
Ejercicio 4 
Las variables aleatorias X e Y son discretas, 𝑌 = 𝑋2, y X tiene probabilidad puntual dada 
por: 
 
Hallar E(Y), justificando todos los pasos realizados. 
Resolución: 
RY = {0; 1; 4} 
Yi 0 1 4 
p(xi) 0,3 0,3 0,4 
 
E(Y) = 1,9 
 
3 
 
Probabilidad 
Ejercicio 1 
Un test detecta la presencia de cierto tipo T de bacterias en el agua. La probabilidad de 
que una muestra de agua no contenga bacterias del tipo T es 0,8; la probabilidad de que 
el testeo dé positivo es 0,34; y la probabilidad de que el testeo dé positivo cuando hay 
presencia de dichas bacterias en el agua es de 0,9. Calcular la probabilidad de que la 
muestra de agua contenga bacterias del tipo T si el test dio positivo. 
Resolución: 
+ : “test positivo” 
B: “hay presencia de bacterias” 
Datos: P(B´) = 0,80; P(+ ) = 0,34 ; P(+/B) = 0,90 
 
P(B/+) = P(B ∩ +) / P(+) 
P(B ∩ +) = P(B) P(+/B) = 0,20 * 0,90 = 0,18 
 P(B / +) = 0,18 / 0,34 = 0,5294 
 
Ejercicio 2 
Un test detecta la presencia de cierto tipo T de bacterias en el agua. La probabilidad de 
que una muestra de agua contenga bacterias del tipo T es 0,15; la probabilidad de que la 
prueba dé negativa es 0,93; y la probabilidad de que la prueba dé negativa cuando no hay 
presencia de dichas bacterias en el agua es de 0,95. Calcular la probabilidad de que la 
muestra de agua no contenga bacterias del tipo T si el test dio negativo. 
Resolución: 
- : “test negativo” 
B: “hay presencia de bacterias” 
Datos: P(B) = 0,15; P(- ) = 0,93 ; P(-/B) = 0,95 
 
P(B’/-) = P(B´ ∩ -) / P(-) 
P(B’ ∩ -) = P(B’) P(-/B’) = 0,85 * 0,95 = 0,8075 
P(B’ / -) = 0,8075 / 0,93 = 0,8683 
 
Ejercicio 3 
En una campaña de erradicación de tuberculosis se somete a la población escolar a una 
prueba de tuberculina. La probabilidad de que la prueba dé positiva es 0,51; la 
4 
 
probabilidad de que la prueba sea positiva en personas enfermas confirmadas es 0,96 y se 
sabe además que un 0,1% de la población escolar posee la enfermedad. Calcular la 
probabilidad de que la persona esté enferma si la prueba dio positiva. 
Resolución: 
+ : “prueba positiva” 
E: “persona enferma” 
Datos: P(+) = 0,51; P(+/E) = 0,96 ; P(E) = 0,001 
 
P(E/+) = P(E ∩ +) / P(+) 
P(E ∩ +) = P(E) P(+/E) = 0,001 * 0,96 = 0,00096 
 P(E / +) = 0,00096 / 0,51 = 0,001882 
 
Ejercicio 4 
En una campaña de erradicación de tuberculosis se somete a la población escolar a una 
prueba de tuberculina. La probabilidad de que la prueba de negativa es 0,35; la 
probabilidad de que la prueba de negativa en personas enfermas confirmadas es 0,05 y se 
sabe además que un 0,1% de la población escolar posee la enfermedad. Calcular la 
probabilidad de que la persona esté enferma si la prueba dio negativa. 
Resolución: 
- : “prueba negativa” 
E: “persona enferma” 
Datos: P(-/E) = 0,05 P(-) = 0,35 P(E) = 0,001 
P(E/-) = P(E ∩ -) / P(-) = P(E) P(- /E) / P(-) =0,001*0,05/0,35 = 0,000143 
 
 
5 
 
Estadística Descriptiva 
Ejercicio 1 
En el contexto del estudio de una infección bacteriana, uno de los análisis consistió en registrar 
los días que tarda en resolverse. Se siguió la evolución hasta la resolución en 800 pacientes, y se 
obtuvo la siguiente tabla de frecuencias absolutas: 
 
 
 
Indicar y calcular el estadístico de tendencia central que considera mejor para describir la 
situación. Justificar. 
Resolución: 
Mediana. Por los valores extremos que pueden afectarla, la media es menos adecuada. Su valor 
es de 20. 
Ejercicio 2 
En el siguiente box plot se grafica la distribución de uso de energía de los continentes, agrupados 
por fuente de energía usada. Analizar el gráfico y responder las siguientes preguntas: ¿Cuál es la 
fuente de energía que presenta menos dispersión de datos? ¿Se puede concluir cuál es la fuente 
de energía que tiene menor cantidad de datos analizados? ¿Cuál es la fuente de energía que 
presenta mayor rango? ¿Cuál es la fuente de energía con menor y con mayor mediana? 
 
 
 
Resolución: 
La energía hidroeléctrica. No se puede saber. Oil, considerando el outlier. Menor: Nuclear. 
Mayor: Oil 
6 
 
Ejercicio 3 
Se sabe que en los bioterios existen factores, asociados al manejo diario de los animales de 
experimentación que pueden influenciar su comportamiento. Por ese motivo se realizó un estudio 
de llamadas ultrasónicas en ratas jóvenes. Cada animal fue aislado y se grabaron los sonidos que 
produjo. La variable registrada es el número de llamadas emitidas. Para completar el estudio, se 
dispuso un grupo de animales de control, no manipulados en absoluto. Los datos para los dos 
grupos son los siguientes: 
 
Calcular los estadísticos descriptivos en ambos grupos: media, desviación estándar, varianza, 
mediana, CV (%) y rango o recorrido. 
Resolución: 
 
r = 23 Control 
r = 24 Experimental 
 
Ejercicio 4 
En un estudio sobre cerezos realizado en Japón, se obtuvo información sobre el diámetro, altura, 
volumen del tronco y la variedad de distintos cerezos, en dos regiones. Para visualizar la 
distribución de la variable Diámetro se cuenta con el diagrama de barras, donde se visualiza la 
media y el desvío estándar de dicha variable, para cada región: 
 
7 
 
 
 
Responda las siguientes preguntas: ¿En qué región la media del diámetro de los cerezos es menor 
y en qué elemento del gráfico de barras ubica su valor? ¿En qué región es mayor el desvío 
estándar, y en qué elemento del gráfico de barras ubica su valor? Si hay tres variedades de cerezos 
en la región B y sus cantidades son: 4 cerezos amarillos; 3 cerezos blancos y 7 cerezos rosas. 
¿Cómo los representaría, aproximadamente, en un gráfico de sectores? 
Resolución: 
La media es menor en la región A (media para la región A=10,91 y para la región B =16,08). El 
desvío estándar es mayor en la región B (desvío en la región A = 1,31 y en la región B = 2,21). 
Amarillos 4 (29%) Blancos 3 (21%) Rosas 7 (50%) 
k 
 
8 
 
Distribuciones 
Ejercicio 1 
La presión arterial sistólica en mujeres de una determinada población de 18 a 74 años tiene 
distribución normal con media   77 mm Hg. Calcular el desvío estándar  , si se sabe que al 
seleccionar al azar una mujer de esta población, la probabilidad de que tenga una presión arterial 
sistólica mayor que 74 mm Hg es 0,5987. 
Resolución: 
Sea X = Presión arterial sistólica de una mujer entre 18 y 74 años (en mm Hg) 
Suponemos 𝑋 ∼ 𝑁(77; 𝜎) y 𝑃(𝑋 > 74) = 0,5987. 
𝑃(𝑋 > 74) = 𝑃 (
𝑋 − 77
𝜎
>
74 − 77
𝜎
) = 𝑃 (𝑍 >
74 − 77
𝜎
) = 0,5987 ⇒ 
𝑃 (𝑍 < −
74 − 77
𝜎
) = 0,5987 
Busco en Tabla: −
74−77
𝜎
= 0,25 ⇒
3
𝜎
= 0,25 ⇒ 𝜎 =
3
0,25
= 12 
Rta: 12  mm Hg. 
Ejercicio 2 
En un centro médico se realizan intervenciones quirúrgicas menores, cuya duración tiene 
distribución normal con media   30 minutos, y desvío estándar 8  minutos. En este centro 
se considera que una de estas intervenciones es “prolongada”,cuando menos del 10% de todas 
las intervenciones, duran más que ella. Calcular el tiempo límite para considerar que una 
intervención quirúrgica en este centro es “prolongada”. 
Resolución: 
Sea X = Duración de una intervención quirúrgica menor (en minutos) 
 
Suponemos 𝑋 ∼ 𝑁(30; 8) 
Sea L el tiempo límite para considerar que una intervención quirúrgica sea “prolongada”. 
Entonces 𝑃(𝑋 ≥ 𝐿) = 0,10 
𝑃 (
𝑋 − 30
8
≥
𝐿 − 30
8
) = 0,10 ⇒ 𝑃 (𝑍 ≥
𝐿 − 30
8
) = 0,10 
𝑃 (𝑍 <
𝐿−30
8
) = 0,90 Veo en Tabla  
𝐿−30
8
= 1,282 
Y entonces 𝐿 = 1,282 ⋅ 8 + 30 = 40,256 
Rta: Una intervención quirúrgica en este centro es “prolongada” cuando dura 40,256 minutos o 
más. 
 
9 
 
Ejercicio 3 
En una población de hombres adultos entre 35 y 45 años, la probabilidad de tener un valor de 
colesterol en sangre superior a 210 mg/dl es igual a 0,35. Si se seleccionan 12 hombres adultos 
entre 35 y 45 años de esta población, hallar la probabilidad de que a lo sumo 4 de ellos tengan un 
valor de colesterol en sangre superior a 210 mg/dl sabiendo que por lo menos 2 lo tienen. 
Resolución: 
Sea X = “Número de hombres adultos entre 35 y 45 años de una cierta población que presentan 
un nivel de colesterolemia superior a 210 mg/dl, de un total de 12” 
 
Donde X~𝐵𝑖(12; 0,35) 𝑅𝑥 = {0,1,2, … ,12} 
 
Luego, se pide calcular 𝑃(𝑋 ≤ 4/𝑋 ≥ 2) =
𝑃(2≤𝑋≤4)
𝑃(𝑋≥2)
 (de acuerdo con la definición de 
probabilidad condicional). 
 
Ahora bien, 𝑃(2 ≤ 𝑋 ≤ 4) = 𝑃(𝑋 ≤ 4) − 𝑃(𝑋 < 2) y teniendo en cuenta el recorrido de nuestra 
variable, resulta 𝑃(𝑋 < 2) = 𝑃(𝑋 ≤ 1). 
 
Entonces 𝑃(2 ≤ 𝑋 ≤ 4) = 𝑃(𝑋 ≤ 4) − 𝑃(𝑋 ≤ 1) = 𝐹(4) − 𝐹(1) 
 
Análogamente, puede verse que 𝑃(𝑋 ≥ 2) = 1 − 𝑃(𝑋 ≤ 1) = 1 − 𝐹(1) 
 
Finalmente, siendo F (4) = 0,5833 y F (1) = 0,0424, obtenemos: 
 
𝑃(𝑋 ≤ 5/𝑋 ≥ 3) =
0,5833 − 0,0424
1 − 0,0424
=
0,5409
0,9576
= 𝟎, 𝟓𝟔𝟒𝟖 
 
Ejercicio 4 
En una población de hombres adultos entre 40 y 50 años, la probabilidad de tener un valor de 
colesterol en sangre superior a 214 mg/dl es igual a 0,4. Si se seleccionan 10 hombres adultos 
entre 40 y 50 años de esta población, hallar la probabilidad de que a lo sumo 5 de ellos tengan un 
valor de colesterol en sangre superior a 214 mg/dl sabiendo que por lo menos 3 lo tienen. 
Resolución: 
Sea X = “Número de hombres adultos de entre 40 y 50 años de una cierta población que presentan 
un nivel de colesterolemia superior a 214 mg/dl, de un total de 10” 
 
Donde X~𝐵𝑖(10; 0,4) 𝑅𝑥 = {0,1,2,… ,10} 
 
Luego, se pide calcular 𝑃(𝑋 ≤ 5/𝑋 ≥ 3) =
𝑃(3≤𝑋≤5)
𝑃(𝑋≥3)
 (de acuerdo con la definición de 
probabilidad condicional) 
 
Ahora bien, 𝑃(3 ≤ 𝑋 ≤ 5) = 𝑃(𝑋 ≤ 5) − 𝑃(𝑋 < 3) y teniendo en cuenta el recorrido de nuestra 
variable, resulta 𝑃(𝑋 < 3) = 𝑃(𝑋 ≤ 2). 
 
Entonces 𝑃(3 ≤ 𝑋 ≤ 5)= 𝑃(𝑋 ≤ 5) − 𝑃(𝑋 ≤ 2) = 𝐹(5) − 𝐹(2) 
10 
 
 
Análogamente, puede verse que 𝑃(𝑋 ≥ 3) = 1 − 𝑃(𝑋 ≤ 2) = 1 − 𝐹(2) 
 
Finalmente, siendo F (5) = 0,8338 y F (2) = 0,1673, obtenemos: 
 
𝑃(𝑋 ≤ 5/𝑋 ≥ 3) =
0,8338−0,1673
1−0,1673
= 𝟎, 𝟖𝟎𝟎𝟒 
11 
 
Estimación Puntual 
Ejercicio 1 
Durante un experimento de laboratorio se contabilizó el número de partículas radioactivas 
que registraba un contador en intervalos de 1 milisegundo. Se efectuó el registro en 120 
intervalos, obteniéndose: 
 
 
Dado un milisegundo donde pasan menos de 5 partículas, ¿cuál es la probabilidad 
estimada de que pasen por lo menos 2 partículas? 
 
Resolución: 
X: número de partículas radioactivas que pasan por el contador en un milisegundo. 
 
𝑋~𝑃(𝜆) 
 
�̂� = �̅� = 3,6 
 
�̂�((𝑋 ≥ 2) / (𝑋 < 5)) =
�̂�(2 ≤ 𝑋 < 5)
�̂�(𝑋 < 5)
=
�̂�(1 < 𝑋 ≤ 4)
�̂�(𝑋 ≤ 4)
=
𝐹𝑋(4) − 𝐹𝑋(1)
𝐹𝑋(4)
= 
 
=
0,7064 − 0,1257
0,7064
= 𝟎, 𝟖𝟐𝟐𝟏 
Ejercicio 2 
Durante un experimento de laboratorio se contabilizó el número de partículas radioactivas 
que registraba un contador en intervalos de 1 milisegundo. Se efectuó el registro en 140 
intervalos, obteniéndose: 
 
Dado un milisegundo donde pasan por lo menos 3 partículas, ¿cuál es la probabilidad 
estimada de que pasen menos de 7 partículas? 
 
Resolución: 
X: número de partículas radioactivas que pasan por el contador en un milisegundo. 
 
𝑋~𝑃(𝜆) 
 
�̂� = �̅� = 3,3 
 
�̂�((𝑋 < 7) / (𝑋 ≥ 3)) =
�̂�(3 ≤ 𝑋 < 7)
�̂�(𝑋 ≥ 3)
=
�̂�(2 < 𝑋 ≤ 6)
1 − �̂�(𝑋 < 3)
=
𝐹𝑋(6) − 𝐹𝑋(2)
1 − 𝐹𝑋(2)
= 
 
=
0,9490 − 0,3594
1 − 0,3594
= 𝟎, 𝟗𝟐𝟎𝟒 
 
12 
 
Ejercicio 3 
La eliminación urinaria diaria de α-17-cetoesteroides en varones adultos jóvenes, medida 
en mg/24 hs, puede suponerse una variable aleatoria con distribución aproximadamente 
normal. En la tabla adjunta se muestran las medidas resumen de una muestra aleatoria de 
35 varones adultos jóvenes. Estimar la probabilidad de que, en un día, un varón adulto 
joven elimine menos de 20 mg de α-17-cetoesteroides. 
 
 
 
Resolución: 
 Definición de la variable aleatoria y su distribución: 
 
X = Eliminación urinaria diaria de α-17-cetoesteroides en varón adulto joven. 
X ~ N (μ; σ) 
 
 Estimación de los parámetros de la distribución: 
 
 E (X) = μ 
 𝜇 ̂ = �̅� 
A partir de la tabla de medidas resumen, obtenemos que �̅� = 16,3 ; entonces: 𝜇 ̂ = 16,3 
 Var (X) = σ2 
 
 �̂�2 = 𝑠2 
 
 �̂� = 𝑠 
A partir de la tabla de medidas resumen, obtenemos que s = 5,0 ; entonces: 𝜎 ̂ = 5,0 
Por lo tanto: X ~ N (16,3; 5,0) 
 Estimación de la probabilidad de que, en un día, un varón adulto joven elimine 
menos de 20 mg de α-17-cetoesteroides: 
 �̂� (X < 20) = �̂� ( 
𝑋− μ 
σ
 < 
20−16,3
5,0
 ) = �̂� ( 𝑍 < 0,74 ) = Fz (0,74) = 0,7704 
 
13 
 
Ejercicio 4 
El aumento en los valores de uricemia por sobre los 4 mg/dL es sugerente de preeclampsia 
(síndrome hipertensivo específico del embarazo). En la tabla adjunta se muestran las 
medidas resumen de una muestra aleatoria de 25 mujeres embarazadas con diagnóstico 
de preeclampsia. Estimar la probabilidad de que una mujer de esa población tenga un 
valor de uricemia menor a 5,6 mg/dL. 
 
 
 
Resolución: 
 Definición de la variable aleatoria y su distribución: 
 
X = Uricemia en mujer embarazada con diagnóstico de preeclampsia. 
X ~ N (μ; σ) 
 
 Estimación de los parámetros de la distribución: 
 
 E (X) = μ 
 𝜇 ̂ = �̅� 
A partir de la tabla de medidas resumen, obtenemos que �̅� = 4,9 ; entonces: 𝜇 ̂ = 4,9 
 Var (X) = σ2 
 
 �̂�2 = 𝑠2 
 
 �̂� = 𝑠 
A partir de la tabla de medidas resumen, obtenemos que s = 0,7 ; entonces: 𝜎 ̂ = 0,7 
Por lo tanto: X ~ N (4,9; 0,7) 
 Estimación de la probabilidad de que el valor de uricemia, en la población, sea 
menor a 5,6 mg/dL. 
 �̂� (X < 5,6) = �̂� ( 
𝑋− μ 
σ
 < 
5,6−4,9
0,7
 ) = �̂� (𝑍 < 1) = Fz (1) = 0,8413

Continuar navegando