Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
1 Primer Regulatorio de Bioestadística Variable Aleatoria Ejercicio 1 La función de distribución de una variable aleatoria X es: Calcular el valor de k tal que 𝑃(𝑋 > 𝑘) = 1 4 0 < k < 2 Resolución: 𝑃(𝑋 > 𝑘) = 1 − 𝐹(𝑘) = 1 − 𝑘2 4 = 1 4 − 𝑘2 4 = 1 4 − 1 − 𝑘2 4 = − 3 4 𝑘2 = 3 𝑘 = √3 Ejercicio 2 La función de distribución de una variable aleatoria X es: Hallar el valor de k tal que: 𝑃(𝑋 > 𝑘) = 3 4 ; con 0 < k < 2 Resolución: 𝑃(𝑋 > 𝑘) = 1 − 𝐹(𝑘) = 1 − 𝑘2 4 = 3 4 𝑘2 4 = 1 4 k=1 Ejercicio 3 Hallar la función de distribución de una variable aleatoria discreta X, con E(X) = 0,7 y función de probabilidad puntual: 2 Resolución: 𝐸(𝑋) = −1 ∙ 0,1 + 1 ∙ 0,2 + 2𝑏 = 0,7 𝑏 = 0,3 → 𝑎 = 0,4 (𝑦𝑎 𝑞𝑢𝑒 ∑ 𝑝(𝑥𝑖) = 1) 𝐹𝑥(𝑋) = { 0 𝑠𝑖 𝑥 < −1 0,1 𝑠𝑖 − 1 ≤ 𝑥 < 0 0,5 𝑠𝑖 0 ≤ 𝑥 < 1 0,7 𝑠𝑖 1 ≤ 𝑥 < 2 1 𝑠𝑖 𝑥 ≥ 2 Ejercicio 4 Las variables aleatorias X e Y son discretas, 𝑌 = 𝑋2, y X tiene probabilidad puntual dada por: Hallar E(Y), justificando todos los pasos realizados. Resolución: RY = {0; 1; 4} Yi 0 1 4 p(xi) 0,3 0,3 0,4 E(Y) = 1,9 3 Probabilidad Ejercicio 1 Un test detecta la presencia de cierto tipo T de bacterias en el agua. La probabilidad de que una muestra de agua no contenga bacterias del tipo T es 0,8; la probabilidad de que el testeo dé positivo es 0,34; y la probabilidad de que el testeo dé positivo cuando hay presencia de dichas bacterias en el agua es de 0,9. Calcular la probabilidad de que la muestra de agua contenga bacterias del tipo T si el test dio positivo. Resolución: + : “test positivo” B: “hay presencia de bacterias” Datos: P(B´) = 0,80; P(+ ) = 0,34 ; P(+/B) = 0,90 P(B/+) = P(B ∩ +) / P(+) P(B ∩ +) = P(B) P(+/B) = 0,20 * 0,90 = 0,18 P(B / +) = 0,18 / 0,34 = 0,5294 Ejercicio 2 Un test detecta la presencia de cierto tipo T de bacterias en el agua. La probabilidad de que una muestra de agua contenga bacterias del tipo T es 0,15; la probabilidad de que la prueba dé negativa es 0,93; y la probabilidad de que la prueba dé negativa cuando no hay presencia de dichas bacterias en el agua es de 0,95. Calcular la probabilidad de que la muestra de agua no contenga bacterias del tipo T si el test dio negativo. Resolución: - : “test negativo” B: “hay presencia de bacterias” Datos: P(B) = 0,15; P(- ) = 0,93 ; P(-/B) = 0,95 P(B’/-) = P(B´ ∩ -) / P(-) P(B’ ∩ -) = P(B’) P(-/B’) = 0,85 * 0,95 = 0,8075 P(B’ / -) = 0,8075 / 0,93 = 0,8683 Ejercicio 3 En una campaña de erradicación de tuberculosis se somete a la población escolar a una prueba de tuberculina. La probabilidad de que la prueba dé positiva es 0,51; la 4 probabilidad de que la prueba sea positiva en personas enfermas confirmadas es 0,96 y se sabe además que un 0,1% de la población escolar posee la enfermedad. Calcular la probabilidad de que la persona esté enferma si la prueba dio positiva. Resolución: + : “prueba positiva” E: “persona enferma” Datos: P(+) = 0,51; P(+/E) = 0,96 ; P(E) = 0,001 P(E/+) = P(E ∩ +) / P(+) P(E ∩ +) = P(E) P(+/E) = 0,001 * 0,96 = 0,00096 P(E / +) = 0,00096 / 0,51 = 0,001882 Ejercicio 4 En una campaña de erradicación de tuberculosis se somete a la población escolar a una prueba de tuberculina. La probabilidad de que la prueba de negativa es 0,35; la probabilidad de que la prueba de negativa en personas enfermas confirmadas es 0,05 y se sabe además que un 0,1% de la población escolar posee la enfermedad. Calcular la probabilidad de que la persona esté enferma si la prueba dio negativa. Resolución: - : “prueba negativa” E: “persona enferma” Datos: P(-/E) = 0,05 P(-) = 0,35 P(E) = 0,001 P(E/-) = P(E ∩ -) / P(-) = P(E) P(- /E) / P(-) =0,001*0,05/0,35 = 0,000143 5 Estadística Descriptiva Ejercicio 1 En el contexto del estudio de una infección bacteriana, uno de los análisis consistió en registrar los días que tarda en resolverse. Se siguió la evolución hasta la resolución en 800 pacientes, y se obtuvo la siguiente tabla de frecuencias absolutas: Indicar y calcular el estadístico de tendencia central que considera mejor para describir la situación. Justificar. Resolución: Mediana. Por los valores extremos que pueden afectarla, la media es menos adecuada. Su valor es de 20. Ejercicio 2 En el siguiente box plot se grafica la distribución de uso de energía de los continentes, agrupados por fuente de energía usada. Analizar el gráfico y responder las siguientes preguntas: ¿Cuál es la fuente de energía que presenta menos dispersión de datos? ¿Se puede concluir cuál es la fuente de energía que tiene menor cantidad de datos analizados? ¿Cuál es la fuente de energía que presenta mayor rango? ¿Cuál es la fuente de energía con menor y con mayor mediana? Resolución: La energía hidroeléctrica. No se puede saber. Oil, considerando el outlier. Menor: Nuclear. Mayor: Oil 6 Ejercicio 3 Se sabe que en los bioterios existen factores, asociados al manejo diario de los animales de experimentación que pueden influenciar su comportamiento. Por ese motivo se realizó un estudio de llamadas ultrasónicas en ratas jóvenes. Cada animal fue aislado y se grabaron los sonidos que produjo. La variable registrada es el número de llamadas emitidas. Para completar el estudio, se dispuso un grupo de animales de control, no manipulados en absoluto. Los datos para los dos grupos son los siguientes: Calcular los estadísticos descriptivos en ambos grupos: media, desviación estándar, varianza, mediana, CV (%) y rango o recorrido. Resolución: r = 23 Control r = 24 Experimental Ejercicio 4 En un estudio sobre cerezos realizado en Japón, se obtuvo información sobre el diámetro, altura, volumen del tronco y la variedad de distintos cerezos, en dos regiones. Para visualizar la distribución de la variable Diámetro se cuenta con el diagrama de barras, donde se visualiza la media y el desvío estándar de dicha variable, para cada región: 7 Responda las siguientes preguntas: ¿En qué región la media del diámetro de los cerezos es menor y en qué elemento del gráfico de barras ubica su valor? ¿En qué región es mayor el desvío estándar, y en qué elemento del gráfico de barras ubica su valor? Si hay tres variedades de cerezos en la región B y sus cantidades son: 4 cerezos amarillos; 3 cerezos blancos y 7 cerezos rosas. ¿Cómo los representaría, aproximadamente, en un gráfico de sectores? Resolución: La media es menor en la región A (media para la región A=10,91 y para la región B =16,08). El desvío estándar es mayor en la región B (desvío en la región A = 1,31 y en la región B = 2,21). Amarillos 4 (29%) Blancos 3 (21%) Rosas 7 (50%) k 8 Distribuciones Ejercicio 1 La presión arterial sistólica en mujeres de una determinada población de 18 a 74 años tiene distribución normal con media 77 mm Hg. Calcular el desvío estándar , si se sabe que al seleccionar al azar una mujer de esta población, la probabilidad de que tenga una presión arterial sistólica mayor que 74 mm Hg es 0,5987. Resolución: Sea X = Presión arterial sistólica de una mujer entre 18 y 74 años (en mm Hg) Suponemos 𝑋 ∼ 𝑁(77; 𝜎) y 𝑃(𝑋 > 74) = 0,5987. 𝑃(𝑋 > 74) = 𝑃 ( 𝑋 − 77 𝜎 > 74 − 77 𝜎 ) = 𝑃 (𝑍 > 74 − 77 𝜎 ) = 0,5987 ⇒ 𝑃 (𝑍 < − 74 − 77 𝜎 ) = 0,5987 Busco en Tabla: − 74−77 𝜎 = 0,25 ⇒ 3 𝜎 = 0,25 ⇒ 𝜎 = 3 0,25 = 12 Rta: 12 mm Hg. Ejercicio 2 En un centro médico se realizan intervenciones quirúrgicas menores, cuya duración tiene distribución normal con media 30 minutos, y desvío estándar 8 minutos. En este centro se considera que una de estas intervenciones es “prolongada”,cuando menos del 10% de todas las intervenciones, duran más que ella. Calcular el tiempo límite para considerar que una intervención quirúrgica en este centro es “prolongada”. Resolución: Sea X = Duración de una intervención quirúrgica menor (en minutos) Suponemos 𝑋 ∼ 𝑁(30; 8) Sea L el tiempo límite para considerar que una intervención quirúrgica sea “prolongada”. Entonces 𝑃(𝑋 ≥ 𝐿) = 0,10 𝑃 ( 𝑋 − 30 8 ≥ 𝐿 − 30 8 ) = 0,10 ⇒ 𝑃 (𝑍 ≥ 𝐿 − 30 8 ) = 0,10 𝑃 (𝑍 < 𝐿−30 8 ) = 0,90 Veo en Tabla 𝐿−30 8 = 1,282 Y entonces 𝐿 = 1,282 ⋅ 8 + 30 = 40,256 Rta: Una intervención quirúrgica en este centro es “prolongada” cuando dura 40,256 minutos o más. 9 Ejercicio 3 En una población de hombres adultos entre 35 y 45 años, la probabilidad de tener un valor de colesterol en sangre superior a 210 mg/dl es igual a 0,35. Si se seleccionan 12 hombres adultos entre 35 y 45 años de esta población, hallar la probabilidad de que a lo sumo 4 de ellos tengan un valor de colesterol en sangre superior a 210 mg/dl sabiendo que por lo menos 2 lo tienen. Resolución: Sea X = “Número de hombres adultos entre 35 y 45 años de una cierta población que presentan un nivel de colesterolemia superior a 210 mg/dl, de un total de 12” Donde X~𝐵𝑖(12; 0,35) 𝑅𝑥 = {0,1,2, … ,12} Luego, se pide calcular 𝑃(𝑋 ≤ 4/𝑋 ≥ 2) = 𝑃(2≤𝑋≤4) 𝑃(𝑋≥2) (de acuerdo con la definición de probabilidad condicional). Ahora bien, 𝑃(2 ≤ 𝑋 ≤ 4) = 𝑃(𝑋 ≤ 4) − 𝑃(𝑋 < 2) y teniendo en cuenta el recorrido de nuestra variable, resulta 𝑃(𝑋 < 2) = 𝑃(𝑋 ≤ 1). Entonces 𝑃(2 ≤ 𝑋 ≤ 4) = 𝑃(𝑋 ≤ 4) − 𝑃(𝑋 ≤ 1) = 𝐹(4) − 𝐹(1) Análogamente, puede verse que 𝑃(𝑋 ≥ 2) = 1 − 𝑃(𝑋 ≤ 1) = 1 − 𝐹(1) Finalmente, siendo F (4) = 0,5833 y F (1) = 0,0424, obtenemos: 𝑃(𝑋 ≤ 5/𝑋 ≥ 3) = 0,5833 − 0,0424 1 − 0,0424 = 0,5409 0,9576 = 𝟎, 𝟓𝟔𝟒𝟖 Ejercicio 4 En una población de hombres adultos entre 40 y 50 años, la probabilidad de tener un valor de colesterol en sangre superior a 214 mg/dl es igual a 0,4. Si se seleccionan 10 hombres adultos entre 40 y 50 años de esta población, hallar la probabilidad de que a lo sumo 5 de ellos tengan un valor de colesterol en sangre superior a 214 mg/dl sabiendo que por lo menos 3 lo tienen. Resolución: Sea X = “Número de hombres adultos de entre 40 y 50 años de una cierta población que presentan un nivel de colesterolemia superior a 214 mg/dl, de un total de 10” Donde X~𝐵𝑖(10; 0,4) 𝑅𝑥 = {0,1,2,… ,10} Luego, se pide calcular 𝑃(𝑋 ≤ 5/𝑋 ≥ 3) = 𝑃(3≤𝑋≤5) 𝑃(𝑋≥3) (de acuerdo con la definición de probabilidad condicional) Ahora bien, 𝑃(3 ≤ 𝑋 ≤ 5) = 𝑃(𝑋 ≤ 5) − 𝑃(𝑋 < 3) y teniendo en cuenta el recorrido de nuestra variable, resulta 𝑃(𝑋 < 3) = 𝑃(𝑋 ≤ 2). Entonces 𝑃(3 ≤ 𝑋 ≤ 5)= 𝑃(𝑋 ≤ 5) − 𝑃(𝑋 ≤ 2) = 𝐹(5) − 𝐹(2) 10 Análogamente, puede verse que 𝑃(𝑋 ≥ 3) = 1 − 𝑃(𝑋 ≤ 2) = 1 − 𝐹(2) Finalmente, siendo F (5) = 0,8338 y F (2) = 0,1673, obtenemos: 𝑃(𝑋 ≤ 5/𝑋 ≥ 3) = 0,8338−0,1673 1−0,1673 = 𝟎, 𝟖𝟎𝟎𝟒 11 Estimación Puntual Ejercicio 1 Durante un experimento de laboratorio se contabilizó el número de partículas radioactivas que registraba un contador en intervalos de 1 milisegundo. Se efectuó el registro en 120 intervalos, obteniéndose: Dado un milisegundo donde pasan menos de 5 partículas, ¿cuál es la probabilidad estimada de que pasen por lo menos 2 partículas? Resolución: X: número de partículas radioactivas que pasan por el contador en un milisegundo. 𝑋~𝑃(𝜆) �̂� = �̅� = 3,6 �̂�((𝑋 ≥ 2) / (𝑋 < 5)) = �̂�(2 ≤ 𝑋 < 5) �̂�(𝑋 < 5) = �̂�(1 < 𝑋 ≤ 4) �̂�(𝑋 ≤ 4) = 𝐹𝑋(4) − 𝐹𝑋(1) 𝐹𝑋(4) = = 0,7064 − 0,1257 0,7064 = 𝟎, 𝟖𝟐𝟐𝟏 Ejercicio 2 Durante un experimento de laboratorio se contabilizó el número de partículas radioactivas que registraba un contador en intervalos de 1 milisegundo. Se efectuó el registro en 140 intervalos, obteniéndose: Dado un milisegundo donde pasan por lo menos 3 partículas, ¿cuál es la probabilidad estimada de que pasen menos de 7 partículas? Resolución: X: número de partículas radioactivas que pasan por el contador en un milisegundo. 𝑋~𝑃(𝜆) �̂� = �̅� = 3,3 �̂�((𝑋 < 7) / (𝑋 ≥ 3)) = �̂�(3 ≤ 𝑋 < 7) �̂�(𝑋 ≥ 3) = �̂�(2 < 𝑋 ≤ 6) 1 − �̂�(𝑋 < 3) = 𝐹𝑋(6) − 𝐹𝑋(2) 1 − 𝐹𝑋(2) = = 0,9490 − 0,3594 1 − 0,3594 = 𝟎, 𝟗𝟐𝟎𝟒 12 Ejercicio 3 La eliminación urinaria diaria de α-17-cetoesteroides en varones adultos jóvenes, medida en mg/24 hs, puede suponerse una variable aleatoria con distribución aproximadamente normal. En la tabla adjunta se muestran las medidas resumen de una muestra aleatoria de 35 varones adultos jóvenes. Estimar la probabilidad de que, en un día, un varón adulto joven elimine menos de 20 mg de α-17-cetoesteroides. Resolución: Definición de la variable aleatoria y su distribución: X = Eliminación urinaria diaria de α-17-cetoesteroides en varón adulto joven. X ~ N (μ; σ) Estimación de los parámetros de la distribución: E (X) = μ 𝜇 ̂ = �̅� A partir de la tabla de medidas resumen, obtenemos que �̅� = 16,3 ; entonces: 𝜇 ̂ = 16,3 Var (X) = σ2 �̂�2 = 𝑠2 �̂� = 𝑠 A partir de la tabla de medidas resumen, obtenemos que s = 5,0 ; entonces: 𝜎 ̂ = 5,0 Por lo tanto: X ~ N (16,3; 5,0) Estimación de la probabilidad de que, en un día, un varón adulto joven elimine menos de 20 mg de α-17-cetoesteroides: �̂� (X < 20) = �̂� ( 𝑋− μ σ < 20−16,3 5,0 ) = �̂� ( 𝑍 < 0,74 ) = Fz (0,74) = 0,7704 13 Ejercicio 4 El aumento en los valores de uricemia por sobre los 4 mg/dL es sugerente de preeclampsia (síndrome hipertensivo específico del embarazo). En la tabla adjunta se muestran las medidas resumen de una muestra aleatoria de 25 mujeres embarazadas con diagnóstico de preeclampsia. Estimar la probabilidad de que una mujer de esa población tenga un valor de uricemia menor a 5,6 mg/dL. Resolución: Definición de la variable aleatoria y su distribución: X = Uricemia en mujer embarazada con diagnóstico de preeclampsia. X ~ N (μ; σ) Estimación de los parámetros de la distribución: E (X) = μ 𝜇 ̂ = �̅� A partir de la tabla de medidas resumen, obtenemos que �̅� = 4,9 ; entonces: 𝜇 ̂ = 4,9 Var (X) = σ2 �̂�2 = 𝑠2 �̂� = 𝑠 A partir de la tabla de medidas resumen, obtenemos que s = 0,7 ; entonces: 𝜎 ̂ = 0,7 Por lo tanto: X ~ N (4,9; 0,7) Estimación de la probabilidad de que el valor de uricemia, en la población, sea menor a 5,6 mg/dL. �̂� (X < 5,6) = �̂� ( 𝑋− μ σ < 5,6−4,9 0,7 ) = �̂� (𝑍 < 1) = Fz (1) = 0,8413
Compartir