Logo Studenta

Actividad1_Aplicaciones de la Ciencia de Datos

¡Este material tiene más páginas!

Vista previa del material en texto

INSTITUTO POLITÉCNICO NACIONAL 
ESCUELA SUPERIOR CÓMPUTO 
“APLICACIONES DE LA CIENCIA DE DATOS 
EN EL ÁREA DE LA SALUD Y EL CAMBIO 
CLIMÁTICO “ 
 
INTRODUCCIÓN A LA CIENCIA DE DATOS 
PROFESORA. FABIOLA OCAMPO BOTELLO 
 
 
EQUIPO 4 
 
INTEGRANTES: 
KARLA ESTHER ESCAMILLA GACHUZ 
KARINA IVONNE FUENTES NAVARRETE 
LUIS ANTONIO GONZALEZ MIRANDA 
 
 
Aplicaciones de la ciencia de datos en el área de la 
salud 
 
Alrededor de un 30% de los datos a nivel global, son generados por el sector salud, ya que 
cada paciente provee de una inmensa cantidad de datos a través de estudios y diagnósticos 
que pueden y deben ser tomados en cuenta para mantener a la población en las mejores 
condiciones de salud posible, esto a partir de varias vertientes como pueden ser: 
El descubrimiento y aprobación de nuevas medicinas, a través de simulaciones de las 
posibles reacciones de los nuevos medicamentos con las proteínas del cuerpo y los 
destinitos tipos de células permitiendo conocer el tipo de pacientes que pueden hacer uso 
de las medicinas sin riesgo a efectos secundarios o alteraciones con otros padecimientos. 
Los retos a los que se enfrentar al tratar con cuestiones farmacéuticas, es que estas 
empresas cuentan con cientos y cientos de casos clínicos y se deben de asegurar que la 
diversidad de datos corresponda con la diversidad de la población con la que se está 
tratando. 
 
 
 
 
 
 
 
 
 
 
La ciencia de datos también es capaz de 
reconocer riesgos y hacer recomendaciones 
de prevención antes de que los riesgos se 
conviertan en un problema mayor, es por 
eso que a través de una variedad de 
dispositivos personales que son capases de 
realizar mediciones, producir un historial y 
detectar patrones de comportamiento hacen 
posible reconocer un problema antes de que 
se salga de control. Este tipo de seguimiento 
ha dado paso a una nueva forma de 
monitorear pacientes con enfermedades 
crónicas para que puedan llevar sus 
condiciones bajo control. 
Es el caso de “Propeller health” que desarrolló un rastreador que junto al centro de 
prevención y control de desastres utilizan la base de datos de las condiciones del aire para 
advertir a los pacientes con asma. 
 
 
 
 
 
 
 
 
 
 
 
 
 
En lo que respecta a la realización de diagnósticos, existen casos en que, por haber recibido 
un diagnóstico erróneo, tiene implicaciones médicas graves, esto se puede solucionar 
aplicando técnicas de “machine learning” proveyendo de la mayor cantidad de imágenes de 
estudios para poder identificar patrones, tumores y anomalías obteniendo mediciones más 
precisas que pueden ayudar a dar diagnósticos más certeros. 
Mientras más datos se tengan de cada paciente por individual, es más sencillo darle una 
atención personalizada y una mejor precisión en cuestión de los medicamentos que 
requiere. 
Muchas veces después de una operación el seguimiento posquirúrgico es complicado 
especialmente cuando el paciente es dado de alta, y tiene que seguir con sus cuidados por 
su cuenta, para ayudarles pueden hacer uso de aplicaciones con las que notifiquen su 
estado, si siente dolor o cualquier tipo de malestar y definir si requiere de un reingreso o 
hace falta mayor atención al caso. 
 
 
 
 
 
 
 
Aplicaciones de la ciencia de datos en el cambio 
climático 
 
El cambio climático ha sido motivo de discusión durante más de un siglo, y es que la acción-
reacción no es inmediata, sucede en lugares y momentos distintos. Las Naciones Unidas 
catalogan el cambio climático como el mayor desafío de nuestro tiempo y apuntan a que 
estamos justo en el momento decisivo. Los riesgos son evidentes: meteorología cambiante, 
amenazas para la producción de alimentos, aumento del nivel del mar, riesgo de 
inundaciones, etc. 
 
La observación basada en datos, que se ha llevado a lo largo de décadas en el mundo de 
la meteorología, ha sido el gran punto de partida. Gracias a la observación y registro, 
actualmente los científicos de todo el planeta tienen datos históricos sobre los que entrenar 
modelos matemáticos predictivos, pero para ello es necesario que la información sea 
compartida. El problema del cambio climático es global y muchos países han comenzado a 
abrir sus sets de datos mediante open data (datos abiertos), fácilmente descargables y que 
ayuden a cualquier institución, empresa o particular a trabajar con ellos y buscar nuevo 
conocimiento. 
 
 
 
 
 
 
 
 
 
En 1992, se crea el sistema Mundial de Observación del 
Clima (GCOS), en colaboración con: la Organización 
Meteorológica Mundial (WMO), Comisión Oceanográfica 
Intergubernamental (IOC), UNESCO, Programa de las 
Naciones Unidas para el Medio Ambiente (UN 
Enviroment) y el Consejo Internacional para la Ciencia 
(ISC). 
 
Su misión es garantizar la observación e información 
necesaria para abordar los problemas relacionados con el 
clima potenciando que la información esté a disposición de 
todos los usuarios. 
La GCOS también define cuáles son los puntos en los que 
se debe realizar foco para la recogida de datos y define las 
ECVs (Essential Climate Variables), variables climáticas 
esenciales. 
A continuación, se presentará una tabla con las 54 variables 
que permiten categorizar las tipologías de datos que se 
pueden aportar y las que se consideran relevantes para el 
estudio climático. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Según las predicciones de la Agencia Internacional de la Energía, International Energy 
Agency (IEA, por sus siglas en inglés), el consumo mundial de energía en el 2050 será el 
doble del que había en el 2007 y el objetivo marcado para los niveles de CO2 deberá ser la 
mitad de los registrados en el 1990. Solo cumpliendo estos dos puntos se podrán 
contrarrestar los efectos del cambio climático. 
Sin embargo, de la misma manera que la revolución industrial sirvió para transformar el 
estilo de vida de nuestra sociedad, la revolución tecnológica puede ayudarnos a paliar los 
efectos negativos de este cambio. Las tecnologías también han llegado a la producción de 
energía. 
TABLA CON LAS 54 ECVS 
Por ejemplo, en Europa se creó 
el proyecto CCI Program bajo la 
supervisión de la Agencia 
Espacial Europea, la cual 
provee 27 open datas de las 54 
ECVs definidas por la GCOS, la 
gran parte de todos ellos 
obtenidos gracias a Copernicus 
(Copernicus Earth Observation 
Program). 
 
Casi todos los países del mundo 
desarrollado y algunos del 
subdesarrollado, van aportando 
datos open data para mejorar 
las predicciones sobre el clima, 
las cosechas y los desastres 
naturales, entre otros. 
Smart Grid (red eléctrica inteligente) es una solución basada en sensores inteligentes de 
medición (IoT), un muy buen análisis de datos en tiempo real y modelos predictivos futuros. 
Esto requiere modernizar la infraestructura energética tal como la conocemos y la 
incorporación de energías verdes o renovables. 
 
Para la implementación de Smart Grid tendremos que contar con tres pilares: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Smart Grid producirá un ahorro que puede ayudar a reducir el impacto climático de la 
principal fuente del problema, la producción de energía, ya que es la culpable de los dos 
tercios de los gases de efecto invernadero. 
Con el Smart Grid se busca la eficiencia de los consumos e infraestructuras haciendo uso 
de la cantidad ingente de datos que recopila, creando modelos predictivos que ayuden a 
hacer un uso más racional de la energía. 
 
01 
AMI (Advanced Metering Infraestructure) 
Se refiere a los sistemas que miden, recolectan y analizan el uso de la energía, e 
interactúan con dispositivos como los medidores inteligentes de electricidad. 
 
02 
03 
DER (Distributed Energy Resources) 
Opta por crear pequeñas centrales cerca de los puntos de consumo, 
apostando por energías renovables que permitan almacenar la energía 
sobranteen momentos valle para ser suministrada en picos, aumentando el 
número de estaciones productoras de media y baja tensión y evitando la 
pérdida de energía durante el traslado. 
 
ADA (Advanced Distribution Automation) 
Es el centralizador de toda la información recibida por los sistemas AMI y 
DER para la toma de decisiones. Es decir, es en donde se encuentra el 
Big Data para dar solución a todos los posibles escenarios. 
 
 
 
 
 
 
 
 
Existen modelos predictivos globales y locales, dependiendo de las fuentes de datos que 
se han usado para entrenarlos, pero el objetivo que se busca es único: intentar predecir 
desastres naturales tales como tsunamis, terremotos, ciclones, inundaciones, etc 
 
 
 
 
 
 
 
 
 
 
 
 
Algunas de las iniciativas que podemos encontrar son: 
 
CAPRA 
The Comprehensive Approach to Probabilistic Risk Assessment o CAPRA es un proyecto 
desarrollado por los gobiernos centro americanos con el soporte del Central American 
Coordination Centre for Disaster Prevention (CEPREDENAC), UNISDR y el World Bank. 
Busca proveer información GIS (Geographic Information System) sobre desastres 
naturales, muestra cálculos probabilísticos sobre terremotos, inundaciones, huracanes, 
volcanes, etc. 
Las tecnologías empleadas en las Smart Cities, Smart 
Grids o Smart Agriculture sumadas a los elementos 
IoT de meteorología, imágenes aéreas, etc. están 
siendo una fuente de datos de gran valor para los 
modelos predictivos. De todas formas, el 90% de la 
información de la que se dispone se ha creado en los 
últimos dos años y a finales de 2020 se espera que 
llegue a los 44 zetabytes. Pero si hablamos del clima, 
dos años de datos no son suficientes, pero si un buen 
punto de partida para empezar a trabajar en modelos 
de inteligencia artificial que ayuden a las predicciones. 
DISTRIBUCIÓN DEL INDICADOR DE RIESGO POR INUNDADCIÓN 
PARA VARIAS UNIDADES GEOGRÁFICAS EN BOGOTÁ 
 
 
 
 
GLOBAL VOLCANO MODEL 
Se trata de la predicción mundial de la actividad volcánica. Se divide el mundo en 18 zonas 
volcánicas y para cada una de ellas se muestra el histórico hasta la fecha, el riesgo de 
futuras erupciones de los volcanes correlacionados por densidad de población alrededor, 
existencia de aeropuertos cercanos, magnitud de la futura erupción, etc. 
 
 
 
 
 
 
 
 
REGIONES VOLCANICAS 
EN EL MUNDO 
¿Qué es la Inteligencia de Negocios? 
 
El Data Warehouse Institute define la IN como la combinación de tecnología, herramientas 
y procesos que me permiten transformar mis datos almacenados en información, esta 
información en conocimiento y este conocimiento dirigido a un plan o una estrategia 
comercial. También puede ser definida como el uso que las empresas hacen de los datos 
y de la información que tienen del mercado, de sus competidores, clientes, proveedores o 
incluso de sus empleados y de cómo la procesan para poder tomar decisiones bien 
informadas. 
Encontramos que la IN nos permite: 
Manejar de forma ágil los cambios en los procesos y las necesidades de la 
empresa. Ofrece la capacidad de medir gastos, y detallar, la línea de negocio, 
producto y centro de costo. 
 
Ser capaces de entender a los clientes, ya que estos generan información 
valiosa, la cual debe ser convertida en conocimiento y aplicar este 
conocimiento a un plan de acción. 
 
Promover indicadores de gestión que nos permitan establecer medidas 
dividiendo todo el proceso en objetivos, métricas, iniciativos y tareas dirigidas 
a integrantes específicos. 
 
 
Fuentes 
de datos 
Proceso de 
extracción, 
transformación y 
carga “mapping” 
Datos transformados 
representados 
visualmente en modelos 
multidimensionales, 
dimensiones y tablas de 
datos. 
interfase de acceso 
a usuarios permite 
interaccionar con 
los datos. 
01 
02 
03 
Podemos encontrar que la arquitectura de la IN no es para nada alejada a lo que ya 
conocemos como el ciclo de vida de los datos dándonos a entender que existe una estrecha 
relación entre una y la otra. 
 
Tendencias de la Analítica de datos, IA, “Big Data” 
El auge del análisis de datos continúa creciendo en los últimos años, al punto en que 
podemos esperar que el 65% de las empresas con modelo de negocios B2B (transacciones 
comerciales entre empresas), implementen estrategias de toma de decisiones basada en 
datos, según un estudio de Gartner. 
Desde la fusión de DataOps (una serie de técnicas y operaciones para la optimización de 
los datos en procesamientos de Inteligencia Artificial) y MLOps (operaciones de aprendizaje 
automático), para la creación de AnalyticsOps, que permitirá corregir errores en la 
administración de la estructura de datos convirtiéndose en la manera más ágil, limpia y 
eficiente de mantener la calidad de los datos en análisis componibles. 
 
 
Por parte del “Big Data” lo que se espera lograr a partir de año 2022, es que, a través del 
uso de la analítica aumentada, se pueden implementar técnicas de Inteligencia artificial y 
aprendizaje automático para reducir los errores que se pueden llegar a cometer con la 
analítica tradicional; También se menciona que el Big Data se enfoca en el uso de Data 
Lakes para dar soluciones de gestión de datos híbridos y proporcionar analítica en tiempo 
real. 
Según informes de la firma de investigación Fortune Business Insights, se estima que el 
mercado global del análisis de Big Data crecerá hasta los 549,700 millones USD en 2028, 
con una CAGR (tasa decrecimiento anual compuesto) del 13.2% entre 2021 y 2028. 
Además, un paso delante del Big Data, surge la tendencia al uso de Small and Wide Data, 
que combina el análisis de datos pequeños y grandes, ordenados y no estructurados, que 
pueden provenir de una amplia variedad de fuentes al mismo tiempo; todo esto con el 
objetivo de no perder de vista características o indicadores potenciales, generalmente 
ignorados cuando se analiza una sola especie de datos. Según Gartner, para el 2025 el 
70% de las empresas estaría pasando de Big Data a Small and Wide Data. 
Con la evidente democratización de los datos, donde la relevancia del análisis de 
datos para la toma de decisiones empresariales y los estudios de proyectos se ha 
convertido en una actividad primordial de supervivencia y no secundaria. Los 
negocios necesitan optimizar sus operaciones de datos para adaptarse a un mercado 
cada vez más intuitivo y competitivo en este aspecto. 
Otra de las tendencias de análisis de datos se concentra en el campo del Edge 
Computing, implementado en el sector de redes informáticas, que conecta el área de 
computación y almacenamiento de datos para mejorar los tiempos de respuesta y ahorrar 
ancho de banda. Ésta tecnología permite el análisis de datos en tiempo real, permitiendo la 
autonomía para dispositivos de Internet de las cosas (IoT). Según Gartner, para 2023 el 
50% de los líderes en análisis de datos utilizarían Edge Computing para crear, administrar 
y analizar datos. 
 
 
Bibliografía 
 
• https://www.fundacionaquae.org/cambio-climatico-ciencia-
datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20homb
re%20(IPCC%202021). 
• https://conexionintal.iadb.org/2018/07/27/ideas3-2/ 
• Ciencia de datos en salud, s.f. Fundación Medifé. Recuperado el día 30 de Mayo de 
2022, de: https://www.fundacionmedife.com.ar/CienciadeDatosenSalud 
• W. Marcano, mayo 2020. Como a influido la ciencia de datos en el estudio de la 
salud. Recuperado el día 30 de mayo de 2022, de: 
https://i2ds.org/2020/05/30/como-ha-influido-la-ciencia- de-datos-en-el-estudio-
de-la-salud/ 
• L. Davidson, marzo 2019. Data science in healthcare: How it improves care. 
Recuperado el día 30 de mayo de 2022, de: 
• https://www.springboard.com/blog/data-science/data-science-in-healthcare/ 
• ¿Qué es la inteligencia de negocios? S.f. Oracle Recuperado el día 30 de mayo de 
2022, de: 
https://www.oracle.com/ocom/groups/public/@otn/documents/webcontent/317529_esa.pdf 
• Media. Abril 2021. ¿Qué es business intelligence (BI) y que herramientas existen? 
Recuperado el día 30 de mayo de 2022, 
de:https://blog.signaturit.com/es/que-es-business-intelligence- bi-y-que-
herramientas-existen 
• P. Torralba, diciembre 2021. Tendencias Big Data 2022 para que el futuro no te pille 
por sorpresa. Recuperado el día 30 de mayo de 
2022,de:https://www.iebschool.com/blog/tendencias-big-
data/#:~:text=Por%20todo%20esto%2C%20otra%20de,compartici%C3%B3n%20d
e%20an%C3%A1lisis%20de%20datos. 
• https://www.fundacionaquae.org/cambio-climatico-ciencia-
datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20homb
re%20(IPCC%202021). 
• https://conexionintal.iadb.org/2018/07/27/ideas3-2/ 
• Subirà, M. (2020). Big Data, tecnología imprescindible para el cambio 
climático. Universitat Poltécnica De 
Cataluyna. https://marketing.onlinebschool.es/Prensa/Informes/OBS_ThreePoints_
Informe_BigData_CambioClimatico.pdf (Obra original publicada en 2020) 
• Tres tendencias de datos y análisis que dominarán 2022. (2022, 12 mayo). IDG 
Communications S.A.U. Recuperado 30 de mayo de 2022, de 
https://www.ciospain.es/big-data/tres-tendencias-de-datos-y-analisis-que-
dominaran-2022 
• El 65% de las empresas B2B tomarán decisiones basadas en los datos para 2026. 
(2022, 11 mayo). IDG Communications S.A.U. Recuperado 30 de mayo de 2022, 
de https://www.computerworld.es/analitica/el-65-de-las-empresas-b2b-tomaran-
decisiones-basadas-en-los-datos-para-2026 
https://www.fundacionaquae.org/cambio-climatico-ciencia-datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20hombre%20(IPCC%202021)
https://www.fundacionaquae.org/cambio-climatico-ciencia-datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20hombre%20(IPCC%202021)
https://www.fundacionaquae.org/cambio-climatico-ciencia-datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20hombre%20(IPCC%202021)
https://conexionintal.iadb.org/2018/07/27/ideas3-2/
https://www.fundacionmedife.com.ar/CienciadeDatosenSalud
https://i2ds.org/2020/05/30/como-ha-influido-la-ciencia-de-datos-en-el-estudio-de-la-salud/
https://www.springboard.com/blog/data-science/data-science-in-healthcare/
https://www.oracle.com/ocom/groups/public/@otn/documents/webcontent/317529_esa.pdf
https://www.oracle.com/ocom/groups/public/@otn/documents/webcontent/317529_esa.pdf
https://blog.signaturit.com/es/que-es-business-intelligence-bi-y-que-herramientas-existen
https://www.iebschool.com/blog/tendencias-big-data/#:~:text=Por%20todo%20esto%2C%20otra%20de,compartici%C3%B3n%20de%20an%C3%A1lisis%20de%20datos
https://www.iebschool.com/blog/tendencias-big-data/#:~:text=Por%20todo%20esto%2C%20otra%20de,compartici%C3%B3n%20de%20an%C3%A1lisis%20de%20datos
https://www.iebschool.com/blog/tendencias-big-data/#:~:text=Por%20todo%20esto%2C%20otra%20de,compartici%C3%B3n%20de%20an%C3%A1lisis%20de%20datos
https://www.fundacionaquae.org/cambio-climatico-ciencia-datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20hombre%20(IPCC%202021)
https://www.fundacionaquae.org/cambio-climatico-ciencia-datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20hombre%20(IPCC%202021)
https://www.fundacionaquae.org/cambio-climatico-ciencia-datos/#:~:text=Ciencia%20de%20datos%3A%20una%20herramienta,del%20hombre%20(IPCC%202021)
https://conexionintal.iadb.org/2018/07/27/ideas3-2/
https://marketing.onlinebschool.es/Prensa/Informes/OBS_ThreePoints_Informe_BigData_CambioClimatico.pdf
https://marketing.onlinebschool.es/Prensa/Informes/OBS_ThreePoints_Informe_BigData_CambioClimatico.pdf
https://www.ciospain.es/big-data/tres-tendencias-de-datos-y-analisis-que-dominaran-2022
https://www.ciospain.es/big-data/tres-tendencias-de-datos-y-analisis-que-dominaran-2022
https://www.computerworld.es/analitica/el-65-de-las-empresas-b2b-tomaran-decisiones-basadas-en-los-datos-para-2026
https://www.computerworld.es/analitica/el-65-de-las-empresas-b2b-tomaran-decisiones-basadas-en-los-datos-para-2026
• IBM. (s. f.). Soluciones de la plataforma DataOps | IBM. Recuperado 30 de mayo 
de 2022, de https://www.ibm.com/mx-es/analytics/dataops 
• Amarnath, R. (2022, 14 abril). Eight Trends Predicted To Define Data Analytics In 
2022. Forbes. Recuperado 31 de mayo de 2022, de 
https://www.forbes.com/sites/forbestechcouncil/2022/02/25/eight-trends-predicted-
to-define-data-analytics-in-2022/?sh=6941927effd7 
 
 
https://www.ibm.com/mx-es/analytics/dataops
https://www.forbes.com/sites/forbestechcouncil/2022/02/25/eight-trends-predicted-to-define-data-analytics-in-2022/?sh=6941927effd7
https://www.forbes.com/sites/forbestechcouncil/2022/02/25/eight-trends-predicted-to-define-data-analytics-in-2022/?sh=6941927effd7

Continuar navegando