Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
INSTITUTO POLITÉCNICO NACIONAL ESCUELA SUPERIOR CÓMPUTO “APLICACIONES DE LA CIENCIA DE DATOS EN EL ÁREA DE LA SALUD Y EL CAMBIO CLIMÁTICO “ INTRODUCCIÓN A LA CIENCIA DE DATOS PROFESORA. FABIOLA OCAMPO BOTELLO EQUIPO 4 INTEGRANTES: KARLA ESTHER ESCAMILLA GACHUZ KARINA IVONNE FUENTES NAVARRETE LUIS ANTONIO GONZALEZ MIRANDA Aplicaciones de la ciencia de datos en el área de la salud Alrededor de un 30% de los datos a nivel global, son generados por el sector salud, ya que cada paciente provee de una inmensa cantidad de datos a través de estudios y diagnósticos que pueden y deben ser tomados en cuenta para mantener a la población en las mejores condiciones de salud posible, esto a partir de varias vertientes como pueden ser: El descubrimiento y aprobación de nuevas medicinas, a través de simulaciones de las posibles reacciones de los nuevos medicamentos con las proteínas del cuerpo y los destinitos tipos de células permitiendo conocer el tipo de pacientes que pueden hacer uso de las medicinas sin riesgo a efectos secundarios o alteraciones con otros padecimientos. Los retos a los que se enfrentar al tratar con cuestiones farmacéuticas, es que estas empresas cuentan con cientos y cientos de casos clínicos y se deben de asegurar que la diversidad de datos corresponda con la diversidad de la población con la que se está tratando. La ciencia de datos también es capaz de reconocer riesgos y hacer recomendaciones de prevención antes de que los riesgos se conviertan en un problema mayor, es por eso que a través de una variedad de dispositivos personales que son capases de realizar mediciones, producir un historial y detectar patrones de comportamiento hacen posible reconocer un problema antes de que se salga de control. Este tipo de seguimiento ha dado paso a una nueva forma de monitorear pacientes con enfermedades crónicas para que puedan llevar sus condiciones bajo control. Es el caso de “Propeller health” que desarrolló un rastreador que junto al centro de prevención y control de desastres utilizan la base de datos de las condiciones del aire para advertir a los pacientes con asma. En lo que respecta a la realización de diagnósticos, existen casos en que, por haber recibido un diagnóstico erróneo, tiene implicaciones médicas graves, esto se puede solucionar aplicando técnicas de “machine learning” proveyendo de la mayor cantidad de imágenes de estudios para poder identificar patrones, tumores y anomalías obteniendo mediciones más precisas que pueden ayudar a dar diagnósticos más certeros. Mientras más datos se tengan de cada paciente por individual, es más sencillo darle una atención personalizada y una mejor precisión en cuestión de los medicamentos que requiere. Muchas veces después de una operación el seguimiento posquirúrgico es complicado especialmente cuando el paciente es dado de alta, y tiene que seguir con sus cuidados por su cuenta, para ayudarles pueden hacer uso de aplicaciones con las que notifiquen su estado, si siente dolor o cualquier tipo de malestar y definir si requiere de un reingreso o hace falta mayor atención al caso. Aplicaciones de la ciencia de datos en el cambio climático El cambio climático ha sido motivo de discusión durante más de un siglo, y es que la acción- reacción no es inmediata, sucede en lugares y momentos distintos. Las Naciones Unidas catalogan el cambio climático como el mayor desafío de nuestro tiempo y apuntan a que estamos justo en el momento decisivo. Los riesgos son evidentes: meteorología cambiante, amenazas para la producción de alimentos, aumento del nivel del mar, riesgo de inundaciones, etc. La observación basada en datos, que se ha llevado a lo largo de décadas en el mundo de la meteorología, ha sido el gran punto de partida. Gracias a la observación y registro, actualmente los científicos de todo el planeta tienen datos históricos sobre los que entrenar modelos matemáticos predictivos, pero para ello es necesario que la información sea compartida. El problema del cambio climático es global y muchos países han comenzado a abrir sus sets de datos mediante open data (datos abiertos), fácilmente descargables y que ayuden a cualquier institución, empresa o particular a trabajar con ellos y buscar nuevo conocimiento. En 1992, se crea el sistema Mundial de Observación del Clima (GCOS), en colaboración con: la Organización Meteorológica Mundial (WMO), Comisión Oceanográfica Intergubernamental (IOC), UNESCO, Programa de las Naciones Unidas para el Medio Ambiente (UN Enviroment) y el Consejo Internacional para la Ciencia (ISC). Su misión es garantizar la observación e información necesaria para abordar los problemas relacionados con el clima potenciando que la información esté a disposición de todos los usuarios. La GCOS también define cuáles son los puntos en los que se debe realizar foco para la recogida de datos y define las ECVs (Essential Climate Variables), variables climáticas esenciales. A continuación, se presentará una tabla con las 54 variables que permiten categorizar las tipologías de datos que se pueden aportar y las que se consideran relevantes para el estudio climático. Según las predicciones de la Agencia Internacional de la Energía, International Energy Agency (IEA, por sus siglas en inglés), el consumo mundial de energía en el 2050 será el doble del que había en el 2007 y el objetivo marcado para los niveles de CO2 deberá ser la mitad de los registrados en el 1990. Solo cumpliendo estos dos puntos se podrán contrarrestar los efectos del cambio climático. Sin embargo, de la misma manera que la revolución industrial sirvió para transformar el estilo de vida de nuestra sociedad, la revolución tecnológica puede ayudarnos a paliar los efectos negativos de este cambio. Las tecnologías también han llegado a la producción de energía. TABLA CON LAS 54 ECVS Por ejemplo, en Europa se creó el proyecto CCI Program bajo la supervisión de la Agencia Espacial Europea, la cual provee 27 open datas de las 54 ECVs definidas por la GCOS, la gran parte de todos ellos obtenidos gracias a Copernicus (Copernicus Earth Observation Program). Casi todos los países del mundo desarrollado y algunos del subdesarrollado, van aportando datos open data para mejorar las predicciones sobre el clima, las cosechas y los desastres naturales, entre otros. Smart Grid (red eléctrica inteligente) es una solución basada en sensores inteligentes de medición (IoT), un muy buen análisis de datos en tiempo real y modelos predictivos futuros. Esto requiere modernizar la infraestructura energética tal como la conocemos y la incorporación de energías verdes o renovables. Para la implementación de Smart Grid tendremos que contar con tres pilares: Smart Grid producirá un ahorro que puede ayudar a reducir el impacto climático de la principal fuente del problema, la producción de energía, ya que es la culpable de los dos tercios de los gases de efecto invernadero. Con el Smart Grid se busca la eficiencia de los consumos e infraestructuras haciendo uso de la cantidad ingente de datos que recopila, creando modelos predictivos que ayuden a hacer un uso más racional de la energía. 01 AMI (Advanced Metering Infraestructure) Se refiere a los sistemas que miden, recolectan y analizan el uso de la energía, e interactúan con dispositivos como los medidores inteligentes de electricidad. 02 03 DER (Distributed Energy Resources) Opta por crear pequeñas centrales cerca de los puntos de consumo, apostando por energías renovables que permitan almacenar la energía sobranteen momentos valle para ser suministrada en picos, aumentando el número de estaciones productoras de media y baja tensión y evitando la pérdida de energía durante el traslado. ADA (Advanced Distribution Automation) Es el centralizador de toda la información recibida por los sistemas AMI y DER para la toma de decisiones. Es decir, es en donde se encuentra el Big Data para dar solución a todos los posibles escenarios. Existen modelos predictivos globales y locales, dependiendo de las fuentes de datos que se han usado para entrenarlos, pero el objetivo que se busca es único: intentar predecir desastres naturales tales como tsunamis, terremotos, ciclones, inundaciones, etc Algunas de las iniciativas que podemos encontrar son: CAPRA The Comprehensive Approach to Probabilistic Risk Assessment o CAPRA es un proyecto desarrollado por los gobiernos centro americanos con el soporte del Central American Coordination Centre for Disaster Prevention (CEPREDENAC), UNISDR y el World Bank. Busca proveer información GIS (Geographic Information System) sobre desastres naturales, muestra cálculos probabilísticos sobre terremotos, inundaciones, huracanes, volcanes, etc. Las tecnologías empleadas en las Smart Cities, Smart Grids o Smart Agriculture sumadas a los elementos IoT de meteorología, imágenes aéreas, etc. están siendo una fuente de datos de gran valor para los modelos predictivos. De todas formas, el 90% de la información de la que se dispone se ha creado en los últimos dos años y a finales de 2020 se espera que llegue a los 44 zetabytes. Pero si hablamos del clima, dos años de datos no son suficientes, pero si un buen punto de partida para empezar a trabajar en modelos de inteligencia artificial que ayuden a las predicciones. DISTRIBUCIÓN DEL INDICADOR DE RIESGO POR INUNDADCIÓN PARA VARIAS UNIDADES GEOGRÁFICAS EN BOGOTÁ GLOBAL VOLCANO MODEL Se trata de la predicción mundial de la actividad volcánica. Se divide el mundo en 18 zonas volcánicas y para cada una de ellas se muestra el histórico hasta la fecha, el riesgo de futuras erupciones de los volcanes correlacionados por densidad de población alrededor, existencia de aeropuertos cercanos, magnitud de la futura erupción, etc. REGIONES VOLCANICAS EN EL MUNDO ¿Qué es la Inteligencia de Negocios? El Data Warehouse Institute define la IN como la combinación de tecnología, herramientas y procesos que me permiten transformar mis datos almacenados en información, esta información en conocimiento y este conocimiento dirigido a un plan o una estrategia comercial. También puede ser definida como el uso que las empresas hacen de los datos y de la información que tienen del mercado, de sus competidores, clientes, proveedores o incluso de sus empleados y de cómo la procesan para poder tomar decisiones bien informadas. Encontramos que la IN nos permite: Manejar de forma ágil los cambios en los procesos y las necesidades de la empresa. Ofrece la capacidad de medir gastos, y detallar, la línea de negocio, producto y centro de costo. Ser capaces de entender a los clientes, ya que estos generan información valiosa, la cual debe ser convertida en conocimiento y aplicar este conocimiento a un plan de acción. Promover indicadores de gestión que nos permitan establecer medidas dividiendo todo el proceso en objetivos, métricas, iniciativos y tareas dirigidas a integrantes específicos. Fuentes de datos Proceso de extracción, transformación y carga “mapping” Datos transformados representados visualmente en modelos multidimensionales, dimensiones y tablas de datos. interfase de acceso a usuarios permite interaccionar con los datos. 01 02 03 Podemos encontrar que la arquitectura de la IN no es para nada alejada a lo que ya conocemos como el ciclo de vida de los datos dándonos a entender que existe una estrecha relación entre una y la otra. Tendencias de la Analítica de datos, IA, “Big Data” El auge del análisis de datos continúa creciendo en los últimos años, al punto en que podemos esperar que el 65% de las empresas con modelo de negocios B2B (transacciones comerciales entre empresas), implementen estrategias de toma de decisiones basada en datos, según un estudio de Gartner. Desde la fusión de DataOps (una serie de técnicas y operaciones para la optimización de los datos en procesamientos de Inteligencia Artificial) y MLOps (operaciones de aprendizaje automático), para la creación de AnalyticsOps, que permitirá corregir errores en la administración de la estructura de datos convirtiéndose en la manera más ágil, limpia y eficiente de mantener la calidad de los datos en análisis componibles. Por parte del “Big Data” lo que se espera lograr a partir de año 2022, es que, a través del uso de la analítica aumentada, se pueden implementar técnicas de Inteligencia artificial y aprendizaje automático para reducir los errores que se pueden llegar a cometer con la analítica tradicional; También se menciona que el Big Data se enfoca en el uso de Data Lakes para dar soluciones de gestión de datos híbridos y proporcionar analítica en tiempo real. Según informes de la firma de investigación Fortune Business Insights, se estima que el mercado global del análisis de Big Data crecerá hasta los 549,700 millones USD en 2028, con una CAGR (tasa decrecimiento anual compuesto) del 13.2% entre 2021 y 2028. Además, un paso delante del Big Data, surge la tendencia al uso de Small and Wide Data, que combina el análisis de datos pequeños y grandes, ordenados y no estructurados, que pueden provenir de una amplia variedad de fuentes al mismo tiempo; todo esto con el objetivo de no perder de vista características o indicadores potenciales, generalmente ignorados cuando se analiza una sola especie de datos. Según Gartner, para el 2025 el 70% de las empresas estaría pasando de Big Data a Small and Wide Data. Con la evidente democratización de los datos, donde la relevancia del análisis de datos para la toma de decisiones empresariales y los estudios de proyectos se ha convertido en una actividad primordial de supervivencia y no secundaria. Los negocios necesitan optimizar sus operaciones de datos para adaptarse a un mercado cada vez más intuitivo y competitivo en este aspecto. Otra de las tendencias de análisis de datos se concentra en el campo del Edge Computing, implementado en el sector de redes informáticas, que conecta el área de computación y almacenamiento de datos para mejorar los tiempos de respuesta y ahorrar ancho de banda. Ésta tecnología permite el análisis de datos en tiempo real, permitiendo la autonomía para dispositivos de Internet de las cosas (IoT). Según Gartner, para 2023 el 50% de los líderes en análisis de datos utilizarían Edge Computing para crear, administrar y analizar datos. Bibliografía • https://www.fundacionaquae.org/cambio-climatico-ciencia- datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20homb re%20(IPCC%202021). • https://conexionintal.iadb.org/2018/07/27/ideas3-2/ • Ciencia de datos en salud, s.f. Fundación Medifé. Recuperado el día 30 de Mayo de 2022, de: https://www.fundacionmedife.com.ar/CienciadeDatosenSalud • W. Marcano, mayo 2020. Como a influido la ciencia de datos en el estudio de la salud. Recuperado el día 30 de mayo de 2022, de: https://i2ds.org/2020/05/30/como-ha-influido-la-ciencia- de-datos-en-el-estudio- de-la-salud/ • L. Davidson, marzo 2019. Data science in healthcare: How it improves care. Recuperado el día 30 de mayo de 2022, de: • https://www.springboard.com/blog/data-science/data-science-in-healthcare/ • ¿Qué es la inteligencia de negocios? S.f. Oracle Recuperado el día 30 de mayo de 2022, de: https://www.oracle.com/ocom/groups/public/@otn/documents/webcontent/317529_esa.pdf • Media. Abril 2021. ¿Qué es business intelligence (BI) y que herramientas existen? Recuperado el día 30 de mayo de 2022, de:https://blog.signaturit.com/es/que-es-business-intelligence- bi-y-que- herramientas-existen • P. Torralba, diciembre 2021. Tendencias Big Data 2022 para que el futuro no te pille por sorpresa. Recuperado el día 30 de mayo de 2022,de:https://www.iebschool.com/blog/tendencias-big- data/#:~:text=Por%20todo%20esto%2C%20otra%20de,compartici%C3%B3n%20d e%20an%C3%A1lisis%20de%20datos. • https://www.fundacionaquae.org/cambio-climatico-ciencia- datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20homb re%20(IPCC%202021). • https://conexionintal.iadb.org/2018/07/27/ideas3-2/ • Subirà, M. (2020). Big Data, tecnología imprescindible para el cambio climático. Universitat Poltécnica De Cataluyna. https://marketing.onlinebschool.es/Prensa/Informes/OBS_ThreePoints_ Informe_BigData_CambioClimatico.pdf (Obra original publicada en 2020) • Tres tendencias de datos y análisis que dominarán 2022. (2022, 12 mayo). IDG Communications S.A.U. Recuperado 30 de mayo de 2022, de https://www.ciospain.es/big-data/tres-tendencias-de-datos-y-analisis-que- dominaran-2022 • El 65% de las empresas B2B tomarán decisiones basadas en los datos para 2026. (2022, 11 mayo). IDG Communications S.A.U. Recuperado 30 de mayo de 2022, de https://www.computerworld.es/analitica/el-65-de-las-empresas-b2b-tomaran- decisiones-basadas-en-los-datos-para-2026 https://www.fundacionaquae.org/cambio-climatico-ciencia-datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20hombre%20(IPCC%202021) https://www.fundacionaquae.org/cambio-climatico-ciencia-datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20hombre%20(IPCC%202021) https://www.fundacionaquae.org/cambio-climatico-ciencia-datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20hombre%20(IPCC%202021) https://conexionintal.iadb.org/2018/07/27/ideas3-2/ https://www.fundacionmedife.com.ar/CienciadeDatosenSalud https://i2ds.org/2020/05/30/como-ha-influido-la-ciencia-de-datos-en-el-estudio-de-la-salud/ https://www.springboard.com/blog/data-science/data-science-in-healthcare/ https://www.oracle.com/ocom/groups/public/@otn/documents/webcontent/317529_esa.pdf https://www.oracle.com/ocom/groups/public/@otn/documents/webcontent/317529_esa.pdf https://blog.signaturit.com/es/que-es-business-intelligence-bi-y-que-herramientas-existen https://www.iebschool.com/blog/tendencias-big-data/#:~:text=Por%20todo%20esto%2C%20otra%20de,compartici%C3%B3n%20de%20an%C3%A1lisis%20de%20datos https://www.iebschool.com/blog/tendencias-big-data/#:~:text=Por%20todo%20esto%2C%20otra%20de,compartici%C3%B3n%20de%20an%C3%A1lisis%20de%20datos https://www.iebschool.com/blog/tendencias-big-data/#:~:text=Por%20todo%20esto%2C%20otra%20de,compartici%C3%B3n%20de%20an%C3%A1lisis%20de%20datos https://www.fundacionaquae.org/cambio-climatico-ciencia-datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20hombre%20(IPCC%202021) https://www.fundacionaquae.org/cambio-climatico-ciencia-datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20hombre%20(IPCC%202021) https://www.fundacionaquae.org/cambio-climatico-ciencia-datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20hombre%20(IPCC%202021) https://conexionintal.iadb.org/2018/07/27/ideas3-2/ https://marketing.onlinebschool.es/Prensa/Informes/OBS_ThreePoints_Informe_BigData_CambioClimatico.pdf https://marketing.onlinebschool.es/Prensa/Informes/OBS_ThreePoints_Informe_BigData_CambioClimatico.pdf https://www.ciospain.es/big-data/tres-tendencias-de-datos-y-analisis-que-dominaran-2022 https://www.ciospain.es/big-data/tres-tendencias-de-datos-y-analisis-que-dominaran-2022 https://www.computerworld.es/analitica/el-65-de-las-empresas-b2b-tomaran-decisiones-basadas-en-los-datos-para-2026 https://www.computerworld.es/analitica/el-65-de-las-empresas-b2b-tomaran-decisiones-basadas-en-los-datos-para-2026 • IBM. (s. f.). Soluciones de la plataforma DataOps | IBM. Recuperado 30 de mayo de 2022, de https://www.ibm.com/mx-es/analytics/dataops • Amarnath, R. (2022, 14 abril). Eight Trends Predicted To Define Data Analytics In 2022. Forbes. Recuperado 31 de mayo de 2022, de https://www.forbes.com/sites/forbestechcouncil/2022/02/25/eight-trends-predicted- to-define-data-analytics-in-2022/?sh=6941927effd7 https://www.ibm.com/mx-es/analytics/dataops https://www.forbes.com/sites/forbestechcouncil/2022/02/25/eight-trends-predicted-to-define-data-analytics-in-2022/?sh=6941927effd7 https://www.forbes.com/sites/forbestechcouncil/2022/02/25/eight-trends-predicted-to-define-data-analytics-in-2022/?sh=6941927effd7
Compartir