Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
LABORATORIO #3 - PyE FACULTAD DE CIENCIAS BÁSICAS 1. Facultad de Ingeniería, Ingeniería Ambiental, Karla Lara- 2175618. 2. Facultad de Ingeniería, Ingeniería Mecatrónica, Juan Sebastián Cortés-2176357. 3. Facultad de Ingeniería, Ingeniería Biomédica, Daniela Campo-2176067. 4. Facultad de Ingeniería, Ingeniería Ambiental, Johan Bolaños- 2176466. INTRODUCCIÓN El coronavirus (COVID-19) sigue expandiéndose en diferentes partes del mundo. Ya son más de 1.273.990 casos de contagio confirmados y 69.479 muertes en el mundo. Por lo tanto, los gobiernos de diferentes países del mundo han empezado a utilizar técnicas de análisis de datos con el fin de identificar con precisión los principales brotes de contagio y establecer puntos críticos para atenderlos. De acuerdo a lo anterior, se realizó el análisis de la data publicada por el Instituto Nacional de Salud el día 5 de abril de 2020, teniendo en cuenta principalmente variables como sexo, ciudad, atención y tipo de caso de cada paciente. ANÁLISIS DE DATOS En primer lugar, se construyó la tabla de frecuencias de los casos respecto al sexo y la ciudad para las principales ciudades de Colombia (Bogotá, Cali, Medellín y Barranquilla), la cual se muestra a continuación. Tabla 1. Casos en las ciudades principales de acuerdo al sexo y la ciudad. SEXO CIUDAD Femenino % Masculino % Total general Barranquilla 22 2,14% 22 2,14% 44 Bogotá 353 34,37% 372 36,22% 725 Cali 66 6,43% 82 7,98% 148 Medellín 61 5,94% 49 4,77% 110 Total general 502 48,88% 525 51,12% 1027 De acuerdo a la tabla presentada anteriormente, si se selecciona al azar un paciente diagnosticado, la probabilidad de que sea mujer dado que es de Bogotá es de 0.487, dicha probabilidad fue obtenida al aplicar la siguiente fórmula: Pr (M/B) = Pr (𝑀 ∩ 𝐵) Pr(𝐵) = 353 725 = Por estudios anteriores, la probabilidad de que un paciente diagnosticado como positivo por el virus sea de Bogotá es de 0.5, Cali de 0.25, Medellín de 0.15 y Barranquilla 0.1. Con base en esto, la probabilidad que sea de Cali debido a que es mujer es de 0.228, valor que fue obtenido aplicando el teorema de Bayes del siguiente modo: Bo Ba Ca Me ✓ M = Mujer ✓ H = Hombre ✓ Bo = Bogotá ✓ Ba = Barranquilla ✓ Ca = Cali ✓ Me = Medellín 0,487 0,5 0,487 M ------- 0, 2435 H -------- 0, 2565 0,513 0,5 M -------- 0,05 H --------- 0,05 0,5 0,446 M -------- 0,1115 H --------- 0,1385 0,554 0,555 0,25 0,1 M -------- 0,083 H -------- 0,067 0,15 0,445 Pr (Ca/M) = Pr (𝐶𝑎 ∩ 𝑀) Pr(𝑀) = Pr (𝐶𝑎)∗ Pr ( 𝑀 𝐶𝑎 ) (Pr(𝐵𝑜)∗Pr(𝑀/𝐵𝑜))+(𝑃𝑟(𝐵𝑎)∗Pr( 𝑀 𝐵𝑎 ))+(Pr(𝐶𝑎)∗Pr( 𝑀 𝐶𝑎 ))+(Pr(𝑀𝑒)∗Pr( 𝑀 𝑀𝑒 )) = 0,1115 0,2435+0,05+0,1115+0,083 = Del mismo modo, se calculó la probabilidad de que un paciente sea de Medellín dado que es mujer, obteniendo un valor de 0.17 al aplicar el siguiente procedimiento: Pr (Me/M) = Pr (Me)∗ Pr (𝑀/𝑀𝑒) Pr(𝑀) = 0,083 0,2435+0,05+0,1115+0,083 = Teniendo en cuenta todas las probabilidades calculadas con anterioridad, se concluye que las mujeres presentan un alto riesgo de contraer el virus, más en ciudades densamente pobladas como lo son Cali y Bogotá. Posteriormente, se construyó la tabla de frecuencias relacionada con la atención y el tipo de caso, la cual se muestra a continuación. Tabla 2. Casos en las ciudades principales de acuerdo a la atención y el tipo de caso. Con base en los datos proporcionados por la Tabla 2, si se selecciona al azar un paciente diagnosticado, la probabilidad de que esté en la UCI y sea un caso importado es de 0.013, lo que corresponde a la intersección de estas dos variables, calculada del siguiente modo: Pr (U ∩ I) = 19 1485 = 0,013 TIPO DE CASO ATENCION En estudio % Importado % Relacionado % Total general Casa 305 20,54% 488 32,86% 374 25,19% 1167 Fallecido 18 1,21% 3 0,20% 14 0,94% 35 Hospital 86 5,79% 22 1,48% 24 1,62% 132 Hospital UCI 27 1,82% 19 1,28% 17 1,14% 63 Recuperado 2 0,13% 59 3,97% 27 1,82% 88 Total general 438 29,49% 591 39,80% 456 30,71% 1485 0,228 0,17 Por otra parte, la probabilidad de que dicho paciente tenga atención en casa dado que es un caso relacionado es de 0.82, resultado obtenido tras aplicar la siguiente formula: Pr (C/R) = Pr (𝐶 ∩ 𝑅) Pr(𝑅) = 374 1485 456 1485 = 0,82 Adicionalmente, se determinó que la probabilidad de que sea un caso en estudio o relacionado es de 0.6, este valor hace referencia a la unión de dichas variables, calculada a través del siguiente método: Pr (E U R) = Pr (E) + Pr (R) = 438 1485 + 456 1485 = 0,6 Por último, se realizó una tabla de distribución para la variable X, entendida como la cantidad de casos diagnosticados por día para el mes de abril, dicha tabla se presenta a continuación. Tabla 3. Tabla de distribución para los casos diagnosticados por día en el mes de abril. Día Casos diagnosticados por día (X) P(X) F(X) 1 159 0,2746 0,2746 2 96 0,1658 0,4404 3 106 0,1831 0,6235 4 139 0,2401 0,8636 5 79 0,1364 1 Total general 579 1 Partiendo de esta tabla se calcularon las siguientes probabilidades: - 𝑃𝑟 (𝑋 > 2) = 𝑃𝑟 (3) + 𝑃𝑟 (4) + 𝑃𝑟 (5) = 0,1831 + 0,2401 + 0,1364 = 0,5596 La probabilidad de que un paciente haya sido diagnosticado después del día 2 de abril es de 0.5596 - 𝑃𝑟 (2 ≤ 𝑋 < 4) = 𝑃𝑟 (2) + 𝑃𝑟 (3) = 0,1658 + 0,1831 = 0,3489 La probabilidad de que un paciente haya sido diagnosticado a partir del día 2 y antes del día 4 en el mes de abril es de 0.3489 - 𝐹 (4) = 𝑃𝑟 (1) + 𝑃𝑟 (2) + 𝑃𝑟 (3) + 𝑃𝑟 (4) = 0,2746 + 0,1658 + 0,1831 + 0,2401 = 0,8636 La probabilidad de que un paciente haya sido diagnosticado a lo sumo el día 4 de abril es de 0.8636 En adición a lo anterior, se calculó el valor esperado y la varianza de los casos diagnosticados por día para el mes de abril, obteniendo lo siguiente: 𝐸(𝑋) = 159 × 0,2746 + 96 × 0,1658 + 106 × 0,1831 + 139 × 0,2401 + 79 × 0,1364 = 123,1363 De acuerdo a esto, el número promedio de casos diagnosticados por día es 123. 𝑉(𝑋) = 𝐸(𝑥2) − 𝐸2(𝑥) 𝐸(𝑥2) = 1592 × 0,2746 + 962 × 0,1658 + 1062 × 0,1831 + 1392 × 0,2401 + 792 × 0,1364 = 16017,7315 𝑉(𝑋) = 16017,7315 − (123,1363)2 = 855,183
Compartir