Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
405 >Ei 87 BIG DATA EN SALUD: RETOS Y OPORTUNIDADES La informatización de los procesos ha provocado que empresas y organizaciones de todo tipo hayan acumulado una cantidad ingente de datos. Esto nos ha llevado a denominar los tiempos actuales como la era del «Big Data», donde se requieren nuevas tecnologías para gestionar y extraer el valor de los datos complejos que se generan en grandes volúmenes a altas velocidades. Si bien este fenómeno está afec- tando a todos los sectores, el sector sanitario es una de las áreas en las que la incidencia de este fenóme- no está siendo especialmente relevante, debido entre otros elementos a la implantación de la Historia Clínica Electrónica (EHR) (1), a la reciente explosión en lo referi- do a generación de datos de tipo genómico (gracias en parte a su abaratamiento), y al hecho de que la mayoría de datos que se generan en el sector son no estructurados. Las aplicaciones de Big Data en el sector de la salud indican un alto potencial para mejorar la eficiencia y calidad de provisión de cuidados. En el estudio de Mc- Kinsey (McKinsey & Company, 2011) se afirma que si el sector de la salud en los Estados Unidos usara tecno- logías de Big Data de manera efectiva para producir calidad el sector podría crear más de 300 billones de dólares cada año y dos tercios de esto sería en forma de reducción de gastos de salud en alrededor de un 8%. IBM proporciona cifras igualmente alarmantes en el informe de Korster y Seider de 2010, donde se analiza la ineficiencia del sistema de salud americano en 2,5 trillones de dólares malgastados anualmente y donde el grado de eficiencia se podría mejorar hasta un 35%, si se compara con otros grandes sectores industriales. En concreto en España, el gasto en Tecnologías de Infor- mación y Comunicaciones (TIC) en la sanidad pública en 2013 ascendió a 624 millones de euros, lo que sig- nifica que menos del 1,20% del gasto sanitario público total se dedicó a las TIC. Estos datos proceden del último informe Índice SEIS (2), el cual recoge de forma objetiva datos reales del sector sobre el gasto TIC en sanidad en España. Del estudio se desprende que, en la fecha del estudio, las TIC se estaban utilizando para almacenar la información generada por el sistema sanitario de salud, pero no se estaba utilizando dicha información para mejorar la atención a los pacientes y la gestión y eficien- cia de los servicios sanitarios. La Historia Clínica Digital del Sistema Nacional de Salud (HCDSNS) surge para garantizar a los ciudadanos y a los profesionales sanitarios el acceso a la información clíni- ca relevante para la atención sanitaria de un paciente desde cualquier lugar del SNS. La implantación de la Historia Clínica genera una enorme cantidad de datos no estructurados, casi 40 millones de Historias Clínicas ERNESTINA MENASALVAS CONSUELO GONZALO ALEJANDRO RODRÍGUEZ-GONZÁLEZ Universidad Politécnica de Madrid 88 >Ei405 Electrónicas que se registraron en España en el 2013 y más de un 1 millón de GB que contienen las imá- genes generadas en exploraciones médicas. A fe- cha de febrero de 2017, el informe de situación del proyecto (HCDSNS) refleja que los Servicios de Salud que tienen activado el perfil emisor (emite los distintos tipos de informes clínicos contenidos en el Conjunto Mínimo de Datos de los Informes Clínicos (CMDIC) para todos sus ciudadanos y se facilita el acceso al sistema a sus ciudadanos para la totalidad de los ser- vicios disponibles) son 17 sobre un total de 18, con una cobertura de población con referencias HCDSNS en cifras absolutas de 35.726.423 ciudadanos que en relación con la población TSI (tarjeta sanitaria indivi- dual) supone un 77,48%. Como consecuencia del almacenamiento de estos datos, los hospitales cuentan con una ingente canti- dad de información no estructurada en forma textual o visual, que puede ser explotada con tecnologías de Big Data. Y es que Big Data representa el paradig- ma perfecto para el desarrollo de lo que se conoce como medicina basada en la evidencia. La Medici- na Basada en la Evidencia es una expresión que se ha generalizado en castellano como equivalente a la expresión inglesa Evidence-Based Medicine (EBM). La definición clásica de EBM es «el uso consciente, explícito y juicioso de las mejores y más actuales evi- dencias o pruebas en la toma de decisiones sobre el cuidado de los pacientes». Es un mecanismo efecti- vo no sólo para mejorar la calidad de los cuidados de salud, sino también para reducir los errores clíni- cos y la variabilidad en la práctica clínica, e influye directamente en la capacitación para la aplicación de lo que se denomina medicina personalizada. Para llevar a cabo la EBM, es necesario que se integre la experiencia clínica de los profesionales y las mejores evidencias disponibles procedentes de la investiga- ción científica, siempre teniendo en cuenta las ca- racterísticas y valores de cada paciente. No obstante, la aplicación de técnicas de Big Data en el sector salud todavía tiene que afrontar algunos retos tecnológicos causados por los avances de los mecanis- mos de almacenamiento y gestión de datos, computa- ción en la nube y por los resultados derivados del IoT (3) (Internet de las cosas) que permite adquirir, almacenar y procesar datos de todo tipo (sensores, clínica, compor- tamiento, genómica, proteómica, imagen, texto, …). Solo por mencionar algunos de estos retos, destacamos aquí: 1. las necesidades de integración de información; 2. las necesidades de documentar de manera digital sin que se requiera un esfuerzo extra a los profesio- nales de la salud; 3. análisis de contenidos de datos no estructurados de salud (imagen, texto, ...) que se tendrán que mejorar con anotaciones semánticas; 4. silos de datos cuya integración habrá que afron- tar; 5. medios técnicos y legales que aseguren la com- partición y el intercambio de datos; 6. medios para asegurar la calidad. En este artículo cubrimos algunos de los aspectos que suponen hoy en día un reto en salud. En particular abor- damos, en primer lugar, un análisis del problema de descubrimiento de conocimiento en bases de datos; con posterioridad analizamos el reto de las redes so- ciales en salud y después abordaremos algunos de los retos que la explotación de la información contenida en la imagen médica conlleva. BIG DATA EN SALUD Desde la introducción del concepto Big Data se han asociado una serie de características clave que lo de- finen, llamadas las «V» de Big Data. Inicialmente, estas características eran tres: volumen, velocidad y variedad. Posteriormente se han añadido otras características, como la veracidad de los datos, añadiendo así cuatro dimensiones y marcando las características que tradi- cionalmente se están asociando a Big Data, y otra quin- ta dimensión, el valor de los datos, que se ha añadido recientemente, generando así las denominadas cinco V del Big Data. Esta definición es válida en todos los sectores en los que se dé la confluencia de esta serie de características en mayor o menor medida, y así ocurre en el dominio de la salud, por lo que estos términos también son relevantes en el sector. En el campo de la medicina el enorme volumen de da- tos de asistencia sanitaria existente incluye registros mé- dicos personales, imágenes médicas, datos de ensayos clínicos, altas, datos a nivel genético, las secuencias ge- nómicas de datos de población, etc. Más recientemen- te, están alimentando este exponencial crecimiento las imágenes en 3D, así como las lecturas de los sensores biométricos o los dispositivos wearables. Afortunada- mente, los avances en la gestión de datos, en particular la virtualización y el Cloud Computing, están facilitando el desarrollo de plataformas para la captura más eficaz, almacenamiento y manipulación de estos grandes vo- lúmenes de datos (Bonnie Feldman, Ellen M. Martin, & Tobi Skotnes, 2012). Por otra parte, la mayor parte de datos de la saludhan sido tradicionalmente estáticos: registros médicos, rayos X, pruebas de laboratorio, etc. Pero esta tendencia está cambiando y ahora la velocidad de generación va en aumento con datos como por ejemplo los relacionados con la supervisión periódica, tales como mediciones de glucosa en diabéticos (control continuo por las bombas de insulina), la presión arterial, electrocardiogramas, y toda la monitorización realizada en las unidades de cui- dados intensivos, por mencionar sólo algunos ejemplos. El análisis de estos datos en tiempo real podría servir para identificar y aplicar los tratamientos adecuados que po- drían ayudar a reducir la morbilidad y la mortalidad de los pacientes e incluso prevenir los brotes hospitalarios. E. MENASALVAS / C. GONZALO / A. RODRÍGUEZ-GONZÁLEZ 405 >Ei 89 BIG DATA EN SALUD: RETOS Y OPORTUNIDADES En la misma medida en la que evoluciona la naturaleza de los datos de salud lo tienen que hacer las técnicas de análisis. Ya no podemos hablar solo de los datos estructurados como los recogidos en los historiales mé- dicos electrónicos. Cada vez más, los datos están en formatos multimedia y no están estructurados. La enor- me variedad de datos estructurada, no estructurada y semi-estructurada es lo que hace que los datos de salud sean al mismo tiempo interesantes y desafiantes. Los datos estructurados son aquellos que se pueden almacenar, consultar, analizar y manipular por orde- nador fácilmente. Históricamente, en la asistencia sanitaria, los datos estructurados y semi-estructurados incluyen las lecturas de los dispositivos, y los datos de la historia clínica digital. Se generaban también datos no estructurados (que se siguen generando allí donde no se ha adoptado la historia clínica digital): los registros médicos de la oficina, notas manuscritas, ingresos en el hospital, así como los registros de altas, las recetas de papel, las radiografías, Imagen por Resonancia Magnética (MRI) (4), Tomografía Computarizada (CT) (5) y otras imágenes. Hoy en día, además de todos estos datos, el sector médico se inunda cada día con los datos generados por dispositivos móviles, la genética y la genómica, los medios sociales, literatura y otras fuentes. Sin embargo, relativamente pocos de estos datos en la actualidad se pueden adquirir, almacenar y organizar de tal manera que se pueda analizar por los ordenadores para obte- ner información útil. Se precisan técnicas y herramientas más eficientes que permitan combinar y convertir todos estos datos en datos estructurados para su posterior análisis. Los datos estructurados de los registros médicos digitales incluyen datos como el nombre del paciente, datos de nacimiento, dirección, nombre, nombre del hospital del médico y dirección, tratamientos u otras informaciones relativamente sencillas de codificar y automatizar en bases de datos. Pero la historia clínica digital contiene información en lenguaje natural cuyo análisis podría desvelar información de interés. El potencial de Big Data en la asistencia sanitaria radica en la combinación de datos tradicionales con las nuevas formas de datos, tan- to de forma individual como poblacional. Por otra parte, hemos de hablar también de la calidad de los datos. Los problemas de calidad de datos son especialmente importantes en el sector de la salud por dos razones: las decisiones de vida o muerte dependen de tener la información precisa, y la calidad de los datos de salud, especialmente de datos no estructurados, es altamente variable y con demasiada frecuencia inco- rrecta o incompleta. La veracidad asume escalabilidad en granularidad y en el rendimiento de las arquitecturas y plataformas, algoritmos, metodologías y herramientas para que responda a las exigencias de Big Data. Se re- quieren nuevas arquitecturas para procesar los datos y nuevos algoritmos. Finalmente, con la evolución surgida especialmente en los últimos años, se considera muy relevante que todos los proyectos de Big Data tengan como enfoque el aporte de valor durante o al final del proceso elaborado como parte del proyecto. De esta forma, los proyectos Big Data no sólo se enfocan en el análisis de grandes cantidades de datos, que se generan rápidamente, con unas características muy heterogéneas y que sean correctos, sino que además el análisis de estos datos debe arrojar un beneficio para las entidades implica- das. En el caso del dominio sanitario, los beneficios pue- den ser económicos por reducción de costes, eficien- cia en la gestión de farmacia, disminución del número de ingresos o estancias hospitalarias, disminución en el número de consultas sucesivas o una mayor capaci- dad y mejor calidad de atención de pacientes. Con el conocimiento de estas características, se ob- serva que la mejora en el punto de recogida de datos para tratar de evitar errores en la propia recogida y redu- cir costes son cruciales, pero el aumento de variedad y de alta velocidad obstaculizan la capacidad de limpiar los datos antes de analizarlos y consiguientemente im- pactan a la toma de decisiones puesto que se pone en duda la «confianza» de los mismos. No obstante, si las cinco V analizadas son un punto de partida apropiado para una discusión acerca del aná- lisis de grandes volúmenes de datos en la asistencia sanitaria, no debemos olvidar otras cuestiones como ar- quitecturas y plataformas, herramientas, metodologías y la necesidad de interfaces construidas por y para los profesionales de la salud. Todos estos temas se deben abordar para aprovechar y maximizar el potencial del análisis de datos en la asis- tencia sanitaria. DATA MINING El campo de la Informática de la Salud está en la cús- pide de su período más emocionante hasta la fecha, entrando en un nueva era donde la tecnología está empezando a manejar grandes volúmenes de datos, dando lugar a un potencial ilimitado para el crecimien- to de la información. La minería de datos y análisis de datos grandes están ayudando a tomar decisiones re- lativas a diagnóstico, tratamiento, … Y todo finalmente enfocado a una mejor atención al paciente. El uso de minería de datos en Estados Unidos en salud puede ahorrar a la industria de la salud hasta 450 mil mi- llones de dólares cada año (Basel Kayyali, David Knott, & Steve Van Kuiken, 2013). Esto se debe a los volúme- nes crecientes de datos generados y de las tecnologías para analizarlos. El explosivo crecimiento de datos generó, ya en la dé- cada de los 80, la aparición de un nuevo campo de investigación que se denominó KDD (Knowledge Dis- covery in Databases). Bajo estas siglas se esconde el proceso de descubrimiento de conocimiento en gran- des volúmenes de datos (Fayyad, Piatetsky-Shapiro, & Smyth, 1996). El proceso de KDD ha servido para unir a investigadores de áreas como la inteligencia artificial, la 90 >Ei405 E. MENASALVAS / C. GONZALO / A. RODRÍGUEZ-GONZÁLEZ estadística, las técnicas de visualización, el aprendizaje automático o las bases de datos en la búsqueda de técnicas eficientes y eficaces que ayuden a encontrar el potencial conocimiento que se encuentra inmerso en los grandes volúmenes de datos almacenados por las organizaciones diariamente. Si bien el nombre con el que apareció esta área de in- vestigación fue el de KDD, en la actualidad este nombre ha sido sustituido por el de Data Mining. En un principio, Data Mining fue tan sólo usado para referirse a la etapa del proceso en la que se aplican las técnicas y algorit- mos de descubrimiento, no obstante, ahora se usa para referirse al proceso global de descubrimiento. Aunque no hay una única definición de Data Mining, la siguiente es, posiblemente, la más aceptada: «Pro- ceso de extracción de información desconocida con anterioridad, válida y potencialmente útil de grandes bases de datos para usarla con posterioridad para to- mar decisiones importantes de negocio» (Ian H. Witten, Eibe Frank, & Mark A. Hall, 2011). El término proceso implica que la extracciónde conoci- miento es la conjunción de muchos pasos repetidos en múltiples iteraciones. Se dice, por otra parte, que es no trivial, porque se supone que hay que realizar algún tipo de proceso complejo. Los patrones deben ser válidos, con algún grado de certidumbre, y novedosos, por lo menos para el sistema y, preferiblemente, para el usua- rio, al que deberán aportar alguna clase de beneficio (útil). Por último, está claro que los patrones deben ser comprensibles, si no de manera inmediata, sí después de ser pre-procesados. Como consecuencia de la complejidad del desarrollo de proyectos de minería de datos, a comienzos de los 90 surge el estándar de modelo de proceso denomi- nado CRISP-DM que divide el proceso en las siguientes fases: • Comprensión del negocio: Se pretende aquí com- prender los objetivos del proyecto y sus requerimien- tos desde la perspectiva del negocio, convirtiendo este conocimiento en un problema de Data Mining y un plan preliminar para cumplir dichos objetivos. • Comprensión de los datos: Se cuenta en un princi- pio con una colección de datos, se deben identifi- car los problemas de calidad de los datos, detec- tar subconjuntos de interés, etc. • Preparación de los datos: Mediante esta fase se construye el conjunto de datos final obtenido de la colección inicial de datos que será proporcionada a las herramientas de modelado. • Modelado: Se seleccionan y aplican varias técni- cas de modelado, ajustándolas para obtener va- lores óptimos. • Evaluación: Una vez construido un modelo se debe evaluar y revisar los pasos ejecutados para construir un modelo que consiga los objetivos de negocio. • Desplegado: Generalmente se deben aplicar mo- delos en procesos de toma de decisiones de una organización. Los problemas que se pueden abordar desde la pers- pectiva de Data Mining a menudo se agrupan en las siguientes categorías: 1. Los problemas predictivos cuyo objetivo es pre- decir el valor de un atributo en particular basado en los valores de otros atributos. El atributo que se predice se denomina comúnmente como atribu- to objetivo (o variable dependiente), mientras que los atributos que se utilizan para la predicción son conocidos como atributos explicativos (o variables independientes). Destacan aquí los problemas de clasificación o de estimación de valor y como téc- nicas podemos destacar los enfoques basados en estadística, regresión, árboles de decisión y redes neuronales. 2. Los problemas descriptivos cuyo objetivo es derivar patrones (correlaciones, tendencias, agrupaciones o clústeres, trayectorias y anomalías) que resuman las características inherentes a los datos. Dentro de este grupo, cabe destacar el análisis de reglas de asociación para el que el algoritmo «A priori» es el más conocido, así como los problemas de seg- mentación o clustering. BIG DATA Y SOCIAL MEDIA EN SALUD La evolución de la Web ha sufrido un cambio dramático en los últimos años que ha dado lugar a la explosión de los datos. El inicio de esta transformación viene de la evolución de la web 1.0 a la 2.0. En la web 1.0 hablá- bamos de una web prácticamente estática, donde los contenidos eran generados principalmente por corpo- raciones, y donde los usuarios finales apenas genera- ban contenido, solo lo consumían. En la web 2.0 el modelo empieza a cambiar, dando lugar a una generación de contenido por parte de los usuarios y con lo que sería la explosión de los datos en Internet. Este fenómeno comienza a pequeña escala con la introducción de elementos como los blogs o los foros, primeros antecesores de las redes sociales moder- nas, y se convierte finalmente en un elemento de es- cala global con la generación de redes sociales como Facebook, Twitter o Instagram por destacar algunas de las principales. La combinación de uso de este tipo de redes socia- les ha hecho que el volumen de datos que se genera cada día haya crecido de forma exponencial, dando lugar a que las cantidades de datos que se generan sean inmensas. Algunos de estos números pueden vi- sualizarse en la infografía publicada por DOMO llamada Data Never Sleeps (6). Ejemplos de eventos que suce- den cada minuto son: Google realiza casi 70 millones de traducciones de palabras; Instagram recibe casi 2,5 millones de ‘likes’ a los posts de sus usuarios; Siri respon- de casi 100.000 peticiones; los usuarios suben más de 405 >Ei 91 BIG DATA EN SALUD: RETOS Y OPORTUNIDADES 800.000 nuevos ficheros a Dropbox; se publican casi 10.000 tweets con emojis, etc. Estos números son solo una pequeña muestra de las cantidades de datos que son generadas por las redes sociales. En realidad, estos volúmenes de datos son mayores ya que ni contem- plan todas las redes sociales ni todos los tipos de datos concretos que son susceptibles de análisis o gestión. Redes sociales y salud Dentro del entorno de salud, las redes sociales han emer- gido con un fuerte y claro propósito: compartir informa- ción de salud y conectar con otros enfermos, doctores o profesionales de la salud. Las personas tienen cada vez un expertise mayor en el uso de las nuevas tecnologías lo que da lugar a la proliferación de este tipo de redes sociales orientadas al campo de la salud. Aunque exis- ten diferentes tipos de redes sociales en salud, según su orientación o tipo de usuarios registrados se pueden dividir fundamentalmente entre tres tipos: redes socia- les orientadas a profesionales (conectan profesionales de salud entre sí mismos), redes sociales orientadas a pacientes (conectan pacientes entre sí mismos) y redes mixtas (conexión paciente-médico). Un estudio realizado por AMN Healthcare (7) estimó que aproximadamente un tercio de los profesionales de la salud usan redes sociales específicas. Sin embargo, los datos reflejados el informe de AMN Healthcare solo hablan del uso de las redes sociales por parte de los profesionales médicos, y tal y como analiza la infografía se centra en un uso muy concreto de estas redes socia- les por parte de éstos. No obstante, el uso de este tipo de redes por parte de los propios profesionales es más que interesante y relevante de cara a los datos que se comparten en ella. Algunos ejemplos de este tipo de redes sociales y del potencial que se puede derivar de los datos que contienen son iniciativas como Doximity (8), una red social que permite a los profesionales de la medicina comunicarse entre ellos con el objetivo de compartir información sobre posibles diagnósticos. Do- ximity contiene más de 250.000 miembros en Estados Unidos, que representan aproximadamente el 40% de los médicos de este país. Otra red social de interés similar dentro de los Estados Unidos es Sermo (9), que se autodefine en su propia pá- gina web como la red social de médicos más grande del país, y actualmente, del mundo. Esta red también permite, al igual que Doximity, las discusiones sobre cualquier tema relacionado con la salud de una forma abierta y colaborativa. Otras redes sociales de temática similar a nivel interna- cional son Figure 1 (10) (enfocada en diagnóstico co- laborativo), SharePractice (11) (similar a Figure 1 pero orientada a tratamientos), WeMedUp (12) o Doc2Doc (13) entre muchas otras. A nivel nacional o que puedan tener una orientación al mercado hispano hablante destacan iniciativas como Ippok (14), red social orientada a profesionales de la sa- lud que pueden pedir u ofrecer consejos o ayuda en tér- minos de tratamientos, casos clínicos o similar, además de acceder a documentos y ofertas de trabajo; Doctor- Dice (15) considerada como la red social exclusiva para médicos más grande de México y que permite el inter- cambio de todo tipo de información clínica dentro de la misma; MedCenter (16) que es un portal dirigido a la comunidad médica con un objetivo prioritario centrado en la educación o Medicalia (17). Aparte de estas inicia- tivas existen muchas otras con orientaciones similares a las ya descritas. En lo que se refiere a redes socialesorientadas a pacien- tes hay diferentes alternativas y con diferentes ámbitos. Las redes sociales de este tipo pueden buscar diferentes objetivos: desde simplemente compartir experiencias con la idea de buscar apoyo o recomendaciones ha- cia determinadas enfermedades o tratamientos, hasta buscar segundas opiniones o alternativas incluso de tra- tamiento en base a las opiniones o recomendaciones de otros usuarios. De cualquier forma, lo que las une es la interacción paciente-paciente, sin que el rol del profesional de la medicina tenga por qué estar nece- sariamente presente como elemento principal de la red social. Existen diferentes redes sociales que comparten el objetivo de conectar pacientes, siendo una de las principales y más importantes PatientsLikeMe (18). El objetivo con el que se define esta red social es el de permitir a sus usuarios compartir tratamientos o sínto- mas de sus respectivas enfermedades con el fin de poder hacer un seguimiento y aprender de los resul- tados de otros. Esta red social tiene diferentes comu- nidades para diferentes enfermedades entre las que destacan algunas patologías como la Esclerosis La- teral Amiotrófica (ELA), la Esclerosis Múltiple (EM), par- kinson, fibromialgia, VIH, síndrome de fatiga crónica o trastorno de ánimo entre algunas de las más habitua- les, aunque también dispone de comunidades para algunas enfermedades raras. Otras redes sociales con objetivos similares, pero en mu- chas ocasiones muy focalizadas a una patología con- creta son por ejemplo tudiabetes.org (19), stupidcancer (20), curetogether (21) o Aorana (22) entre otras. Finalmente, en el grupo mixto que conecta a pacien- tes y médicos, aunque este tipo de redes sociales están más limitadas, existen iniciativas como RareShare (23), orientada a las enfermedades raras. BIG DATA EN REDES SOCIALES Y SALUD PÚBLICA La salud pública es la disciplina que se encarga de la protección y mejora de la salud de la población hu- mana. Cuando se habla de salud pública se habla de grandes poblaciones de individuos, en vez de centrarse en casos o personas concretas. La salud pública puede gestionarse a diferentes niveles en cuanto a sus tama- ños de población se refiere, en función de este preciso tamaño, ya que no es lo mismo gestionar poblaciones a niveles municipales, provinciales, estatales o interna- cionales. 92 >Ei405 E. MENASALVAS / C. GONZALO / A. RODRÍGUEZ-GONZÁLEZ En este contexto, Big Data encaja muy bien dentro de lo que se refiere a la creación de datos que puedan afectar a grandes conjuntos de personas o grandes poblaciones. El propio concepto de Big Data nace por la generación de grandes cantidades de datos, pero estas grandes cantidades de datos pueden ser gene- radas de dos formas: entidades que producen gran- des cantidades de datos (muchas o pocas entidades), o gran número de entidades que generan pequeñas cantidades de datos. Al final, todo se reduce a una es- cala en el nivel de generación de los datos: quién los crea (cuántos actores están involucrados) y qué canti- dades genera cada actor. En el entorno, por lo tanto, de salud pública, Big Data emerge mediante unas poblaciones que representan a gran cantidad de individuos generadores de pequeñas cantidades de datos, pero que en bloque suponen una gran cantidad de información. Los usuarios, por tanto, son generadores de datos a pequeña escala, pero el conjunto de todos esos usua- rios que generan datos crean el Big Data. El ejemplo más claro está precisamente en la infografía de DOMO mencionada previamente, donde los datos generados son enormes, pero son generados precisamente por di- ferentes personas, por un inmenso número de personas. Cambia en este contexto el modelo de generación de datos por un modelo en cierto modo distribuido y donde por lo tanto las redes sociales son una fuente de datos de información de salud pública a tener muy en cuenta, tal y como se ha analizado previamente (Evika Karamagioli, 2015; Kass-Hout & Alhinnawi, 2013). De los 500 millones de tweets que se generan al día, se estiman que alrededor de 1 millón están relacionados con la temática de salud. Además, los números de las redes sociales orientadas a la salud, como las descritas anteriormente, cuentan con espectaculares números en cuanto al contenido publicado, dando lugar a ge- neración de datos plenamente orientados al dominio médico. HealthBoards.com se estima que pueda tener publicados alrededor de 4.6 millones de posts, con al menos 1 millón de miembros. CancerForums.net alre- dedor de 150.000 posts y Drugs-Forum alrededor de medio millón de posts (24). La generación de estos datos por parte de los usuarios puede ser de especial relevancia dentro de la salud pú- blica. Un claro ejemplo de la importancia de la relación existente entre Big Data, redes sociales y salud pública es precisamente la última convocatoria del programa en retos sociales del programa europeo H2020, tal y como se vio reflejado en el programa de trabajo para el año 2016-2017 con el tópico «Big Data supporting Pu- blic Health policies (SC1-PM-18-2016)» (25). Pero la importancia de esta temática no finaliza solo en esta convocatoria de la unión europea. Otro ejem- plo claro de la importancia de esta temática es la fa- mosa conferencia internacional de la WWW en cuya edición de 2013 en Rio de Janeiro se organizó un wor- kshop sobre redes sociales, Big Data y salud pública (26). El mismo año, se publicó un número especial de la revista Journal of Biomedical Informatics sobre la in- formación biomédica en entornos de redes sociales (Rodríguez-González, Mayer, & Fernández-Breis, 2013) y más recientemente se ha organizado un special track sobre análisis de datos médicos y datos sociales en la conferencia IEEE Computer Based Medical Systems (CBMS) (27). Son muchas las iniciativas que apuestan por esta línea de investigación. Existen diferentes estu- dios e investigaciones ya llevadas a cabo tanto a nivel nacional como internacional sobre el análisis de datos a gran escala provenientes de fuentes de informa- ción de tipo social. Algunos de estas investigaciones incluyen por ejemplo la investigación llevada a cabo por la escuela universitaria de enfermería de Indiana y ChaCha (28), una red social de preguntas-respuestas con el objetivo de analizar mediante técnicas de pro- cesamiento de lenguaje natural y herramientas de ex- ploración de datos en tiempo real aquellas preguntas y respuestas relacionadas con salud y bienestar. Otras investigaciones se han centrado en el enlace entre los datos extraídos de las redes sociales y los registros mé- dicos publicados en estas redes (Padrez et al., 2015) o para directamente analizar la información pública de las redes sociales con el objetivo de poder identificar posibles brotes de epidemias o condiciones patológi- cas (Asamoah, Sharda, & Kumarasamy, 2015; Capurro et al., 2014; Nambisan, Luo, Kapoor, Patrick, & Cisler, 2015; Paul & Dredze, 2011; Xie et al., 2013) tal y como hacen ya plataformas existentes como HealthMap (29) mediante el análisis masivo de información de redes sociales y noticias, o como hizo en su momento Goo- gleFlu (30) mediante el análisis y geolocalización de búsquedas relacionadas con la gripe. Otros estudios se han centrado por ejemplo en el análisis de grupos de Facebook en cuanto a elementos de bienestar y salud como es la alimentación saludable (Leis et al., 2013),grupos relacionados con el cáncer de mama (Bender, Jimenez-Marroquin, & Jadad, 2011) o estudios sobre el uso de Facebook para contestar a preguntas de medicina en la página de una conocida revista de medicina (Rodríguez-González, Menasalvas-Ruiz, & Pu- jadas, 2016) entre muchos otros estudios de la misma índole. Algunos proyectos europeos como TrendMiner (31) incluían en sus casos de uso precisamente el aná- lisis de las redes sociales en el entorno de salud, en este caso concretamente para la búsqueda de interaccio- nes entre fármacos (Segura-Bedmar,Martínez, Revert, & Moreno-Schneider, 2015). El crecimiento tanto de las redes sociales de propósito general (Facebook, Twitter, Instagram, etc.) como las de uso específico (entre las que destacan las analizadas previamente) ha dado lugar a un boom en lo que se refiere a la generación de información relacionada con la salud. Las redes sociales de uso específico, en las que se realiza un intercambio de la información relacionada con determinadas patologías y sus tratamientos entre pacientes, son una fuente muy importante de datos que puedan servir para extraer datos de gran utilidad como efectos adversos, nuevas opciones de tratamien- to o incluso para poder detectar casos de errores en prescripciones clínicas entre otra información interesan- te a extraer. 405 >Ei 93 BIG DATA EN SALUD: RETOS Y OPORTUNIDADES Las redes sociales de profesionales permiten también, además de extraer información relacionada con la descrita para el caso de redes sociales de tipo pacien- te-paciente, la extracción y análisis de diagnósticos de forma colaborativa. Finalmente, las redes sociales de propósito general son junto con las anteriores una fuente de información dis- tribuida geográficamente de gran calidad. Los datos a extraer de estas redes permitirán aplicar políticas de salud pública. IMAGEN MÉDICA La imagen médica constituye hoy una de las principales fuentes de información utilizadas por el médico para el diagnóstico y terapia. Se pueden considerar una venta- na del cuerpo humano, que, de una manera práctica- mente inocua, permite la caracterización de diferentes enfermedades, facilitando su diagnóstico y tratamiento. Como consecuencia, todas las tecnologías relaciona- das con la imagen médica han evolucionado notable- mente en las últimas décadas. En este artículo nos vamos a referir principalmente a 4 de las V’s que, desde el punto de vista de Big Data, ca- racterizan a la imagen médica: variabilidad, volumen, velocidad de generación y sobre todo el valor que se extrae de ellas. La variabilidad viene dada principal- mente por el gran número de modalidades de imagen médica, como queda representado en la Figura 1. En cuanto al volumen, por un lado, hay que considerar la cantidad de imágenes que se generan diariamente en cada centro asistencial y ese número extrapolarlo a nivel regional, nacional y supra-nacional. La Figura 2 muestra, a modo ilustrativo, la evolución de este volu- men de datos para dos de las modalidades más utili- zadas, Resonancia Magnética y Tomografía Compute- rizada, desde el año 2010 al 2014 en España. Como se puede apreciar, la suma de este número de pruebas en el año 2014 superó las 8.000.000 pruebas, exacta- mente fueron 8.278.465. Ahora bien, para realmente entender el volumen de da- tos que es preciso almacenar y procesar en el ámbito de la imagen médica, se debe tener presente que una imagen 2-D (Figura 3) de tamaño medio, está forma- da por más de un millón de unidades de información (pixeles); y que la mayoría de las imágenes médicas son 3-D e incluso 4-D. En este sentido, existen estudios que consideran que el grado de complejidad del procesa- do de las imágenes médicas, estimado en número de píxeles es equiparable a la complejidad del análisis de datos genómicos. Respecto a la velocidad de generación de los datos, que a su vez está muy relacionada con el volumen, un buen indicador es la experiencia personal de cualquier persona que acude a un servicio de urgencias, pero para dar algunos datos objetivos, citaremos los datos correspondientes a un hospital de la red pública de la Comunidad de Madrid del año 2013 (33) (último año del que se dispone de datos). Los valores medios diarios de Ecografías, Tomografía Computerizada, Resonancia Magnética y Radiografías registradas fueron de 11, 85, 53, 600, respectivamente. Un aspecto muy importante a tener en cuenta es que para explotar la información FIGURA 1 TAXONOMÍA DE DIFERENTES MODALIDADES DE IMAGEN MÉDICA SEGÚN EL TIPO DE RADIACIÓN UTILIZADA EN SU REGISTRO Fuente: Adaptada de (Dhawan, 2013) 94 >Ei405 E. MENASALVAS / C. GONZALO / A. RODRÍGUEZ-GONZÁLEZ de este volumen de datos a una velocidad equiparable a la que se producen, son necesarias técnicas y herra- mientas que permitan un procesado y análisis de las imágenes de forma automática o cuasi-automática. Solo disponiendo de estas técnicas, realmente se po- dría extraer todo el valor asociado a la imagen médica. Por lo tanto, uno de los grandes retos es el desarrollo de nuevos algoritmos y metodologías para el procesado, análisis e interpretación del enorme volumen de datos que este tipo de imágenes representan, con objeto de ayudar a los profesionales sanitarios a explotar toda la información contenida en las mismas. Dado que la ex- tracción de la información de estas imágenes depen- de de muchos factores como, por ejemplo: modali- dades, condiciones de registro, dispositivos, etc., no es posible disponer de procedimientos generales para localizar y/o identificar objetos tales como estructuras anatómicas o lesiones, sino que es preciso desarrollar métodos particulares para cada tipo de imagen y/o patología. Una vez que se ha extraído de cada imagen parti- cular la información deseada, el siguiente paso con- FIGURA 2 EVOLUCIÓN DEL NÚMERO DE RESONANCIAS MAGNÉTICAS Y TOMOGRAFÍAS COMPUTERIZADAS REALIZADAS EN ESPAÑA DESDE EL AÑO 2010 HASTA EL 2014 (32) FIGURA 3 IMAGEN MÉDICA 2-D, CON DIFERENTES NIVELES DE AMPLIACIÓN DE UNA ZONA Y REPRESENTACIÓN DE LOS VALORES ASOCIADOS A LOS PÍXELES DE DICHA ZONA 2010 2011 2012 2013 2014 Tomografía Computerizada 3991238 4121958 4229630 4481070 4708807 Resonancia Magnetica 2775004 2945049 3019026 3241275 3569658 Tomografia por Emisión de Positrones (PET) 90843 96145 97068 108890 119363 0 1000000 2000000 3000000 4000000 5000000 6000000 7000000 8000000 9000000 2010 2011 2012 2013 2014 Pruebas anuales en España Tomogra<a Computerizada Resonancia MagneEca Fuente: Elaboración propia Fuente: Elaboración propia 405 >Ei 95 BIG DATA EN SALUD: RETOS Y OPORTUNIDADES siste en asociar este conocimiento a las imágenes (anotación semántica de imágenes), de forma que, una vez almacenadas en grandes bases de datos, sea posible llevar a cabo búsquedas semánticas de las mismas o, en otras palabras, búsquedas por con- ceptos. La anotación consiste en un conjunto de pa- labras capaces de describir la información conteni- da en la imagen. Tradicionalmente, la anotación de las imágenes se ha llevado a cabo manualmente por personal especializado. Sin embargo, este pro- ceso tiene algunas desventajas, tales como el coste de tiempo y la subjetividad del operador. Aunque el mismo operador delimite y anote la misma imagen en momentos diferentes, la anotación no será ne- cesariamente la misma. El enfoque alternativo es la anotación automática o semiautomática realizada por un algoritmo. La mayor parte de las aproxima- ciones que se encuentran en la literatura se basan en técnicas de aprendizaje automático (Menasalvas & Gonzalo 2016). Un problema que se ha detectado para poder pasar a la aplicación clínica de los estudios más teóricos es la necesidad de disponer de grandes bases de datos que permitan de una forma objetiva y rigurosa determinar y validar cuales son los mejores algorit- mos a utilizar para cada aplicación. En este sentido, es de gran interés, las competiciones propuestas en los últimos años (34), en las cuales se han propor- cionan datos anotados de casos reales de los que se conoce la información realidad-terreno, y se ha establecido un protocolo de validación común. De este modo, se asegura que los resultados propor- cionan por diferentes algoritmos son técnicamente comparables y fiables para su aplicación clínica. CONCLUSIONES La aplicación del paradigma de Big Data al entor- no de la salud supondrá una mejora de magnitud aún no predecible en la calidad de la atención a los pacientes,así como en la prevención, diagnóstico y tratamiento de enfermedades, unido a una reduc- ción notable en los costes de sanidad. Para alcanzar estos logros es fundamental la integración de todos los datos procedentes de muy diferentes fuentes, así como el desarrollo de nuevas tecnologías que permitan la explotación de dichos datos. No obs- tante, el verdadero valor de Big Data en salud se conseguirá solo si los diferentes actores implicados en el proceso (administraciones públicas, empresas privadas, hospitales, médicos, centros de investiga- ción, universidades, …) se comprometen en este proyecto de forma conjunta para llevar el ámbito sanitario a una nueva era. Esto solo se podrá llevar a cabo en el marco de un ecosistema de Big Data en salud en el que se integre conjuntamente con la tecnología, políticas adecuadas sobre privacidad y confidencialidad, infraestructuras y una cultura de uso compartido de los datos. Todo ello conlleva una serie de retos que hay que afrontar desde diferentes perspectivas y grado de profundidad. NOTAS [1] Del inglés, Electronic Health Record. [2] Informe Índice SEIS http://www.seis.es/html/INDICE%20 2013%20DEFINITIVO%20ver%202%20SECURED.pdf [3] Del inglés, Internet of Things. [4] Del inglés, Magnetic Resonance Imaging. [5] Del inglés, Computed Tomography. [6] https://www.domo.com/blog/data-never-sleeps-4-0/ [7] https://www.amnhealthcare.com/uploadedFiles/ MainSite/Content/Healthcare_Industry_Insights/Indus- try_Research/final.pdf [8] Doximity https://www.doximity.com/ [9] Sermo http://www.sermo.com/ [10] Figure 1 https://figure1.com/ [11] SharePractice https://sharepractice.com/ [12] WeMedUp http://www.wemedup.com/ [13] Doc2Doc http://doc2doc.bmj.com/ [14] Ippok http://www.ippok.com/ [15] DoctorDice http://www.doctordice.com/ [16] MedCenter http://www.medcenter.com/ [17] Medicalia http://medicalia.ning.com/ [18] PatientsLikeMe https://www.patientslikeme.com/ [19] Tudiabetes.org http://www.tudiabetes.org/ [20] Stupidcancer http://stupidcancer.org/ [21] Curetogether http://curetogether.com/ [22] Aorana http://www.aorana.com/ [23] RareShare http://www.rareshare.org/ [24] Estadísticas de post publicados en temas de salud. http://www.naccho.org/topics/infrastructure/informa- tics/resources/upload/dredze-naccho-webinar.pdf [25] Informe Big Data supporting Public Health policies https://ec.europa.eu/research/participants/portal/ desktop/en/opportunities/h2020/topics/2442-sc1- pm-18-2016.html [26] Conferencia internacional WWW de 2013. http:// www2013.org/2013/04/25/social-networks-and-big- data-meet-public-health/ [27] Social data and medical data analytics special track. IEEE Computer-Based Medical Systems 2017 (CBMS 2017). http://midas.ctb.upm.es/sdma [28] IU School of Nursing and ChaCha partner to con- duct interdisciplinary Big-Data research about health and wellness http://news.iupui.edu/releases/2015/02/ News%20Release.shtml [29] HealthMap http://www.healthmap.org/en/ [30] GoogleFlu https://www.google.org/flutrends/about/ [31] TrendMiner http://www.trendminer-project.eu/ [32] http://stats.oecd.org/Index.aspx?DataSetCode=HEAL- TH_HCQI [33] h t t p : / / w w w . m a d r i d . o r g / c s / S a t e l l i t e ? cid=1142475426064&language=es&pagena- me=HospitalPuertaHierroMaja%2FPage%2FHPHM_ contenidoFinal [34] http://www.miccai.org BIBLIOGRAFÍA AGGARWAL, C. C., HAN, J., WANG, J., & YU, P. S. (2003). «A Framework for Clustering Evolving Data Streams». In Pro- ceedings of the 29th International Conference on Very Lar- ge Data Bases - Volume 29 (pp. 81–92). Berlin, Germany: 96 >Ei405 E. MENASALVAS / C. GONZALO / A. RODRÍGUEZ-GONZÁLEZ VLDB Endowment. Retrieved from http://dl.acm.org/citation. cfm?id=1315451.1315460 AGUILAR-RUIZ, J. S., & GAMA, J. (2005). «Data Streams». Journal of Universal Computer Science, 11(8), 1349–1352. ASAMOAH, D., SHARDA, R., & KUMARASAMY, A. T. (2015). «Can Social Media Support Public Health? Demonstrating Disease Surveillance using Big Data Analytics». AMCIS 2015 Proceedings. Retrieved from http://aisel.aisnet.org/am- cis2015/HealthIS/GeneralPresentations/12 BASEL KAYYALI, DAVID KNOTT, & STEVE VAN KUIKEN. (2013). «The big-data revolution in US health care: Accelerating value and innovation». In McKinsey Company. McKinsey Company. Retrieved from http://www.mckinsey.com/insi- ghts/health_systems_and_services/the_big-data_revolu- tion_in_us_health_care BENDER, J. L., JIMENEZ-MARROQUIN, M.-C., & JADAD, A. R. (2011). «Seeking Support on Facebook: A Content Analysis of Breast Cancer Groups». Journal of Medical Internet Re- search, 13(1). https://doi.org/10.2196/jmir.1560 BONNIE FELDMAN, ELLEN M. MARTIN, & TOBI SKOTNES. (2012). «Big Data in Healthcare Hype and Hope». Retrieved from http://www.west-info.eu/files/big-data-in-healthcare. pdf CAPURRO, D., COLE, K., ECHAVARRÍA, M. I., JOE, J., NEO- GI, T., & TURNER, A. M. (2014). «The Use of Social Networking Sites for Public Health Practice and Research: A Systematic Review». Journal of Medical Internet Research, 16(3), e79. https://doi.org/10.2196/jmir.2679 CUNNINGHAM, H. (2002). «GATE, a General Architecture for Text Engineering». Computers and the Humanities, 36(2), 223–254. https://doi.org/10.1023/A:1014348124664 DEY, N., KARÁ¢ A, W. B. A., CHAKRABORTY, S., BANERJEE, S., SALEM, M. A., & AZAR, A. T. (2015). «Image mining framework and techniques: a review». International Journal of Image Mining, 1(1), 45-64. DHAWAN, A. P. (2013). «Medical Image Analysis», Volu- men 31 de IEEE Press Series on Biomedical Engineering, John Wiley & Sons DOMINGOS, P., & HULTEN, G. (2000). «Mining High-speed Data Streams». In Proceedings of the Sixth ACM SIGKDD In- ternational Conference on Knowledge Discovery and Data Mining (pp. 71–80). New York, NY, USA: ACM. https://doi. org/10.1145/347090.347107 EVIKA KARAMAGIOLI. (2015). «Social media as a big pu- blic health data source: review of the international bibliogra- phy». PeerJ Preprint. FAYYAD, U. M., PIATETSKY-SHAPIRO, G., & SMYTH, P. (1996). «From data mining to knowledge discovery: an overview». In U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, & R. Uthuru- samy (Eds.), Advances in Knowledge Discovery and Data Mining (pp. 1–34). Menlo Park, CA, USA: American Associa- tion for Artificial Intelligence. Retrieved from http://dl.acm. org/citation.cfm?id=257938.257942 FERNÁNDEZ BAIZÁN, C., MENASALVAS RUIZ, E., MARBÁN GALLEGO, Ó., & PEÑA SANCHEZ, J. M. (2001). «Minimal De- cision Rules Based on the A Priori Algorithm». International Journal of Applied Mathematics and Computer Science, 11(3), 671–704. FERRUCCI, D., & LALLY, A. (2004). UIMA: «An Architectural Approach to Unstructured Information Processing in the Cor- porate Research Environment». Nat. Lang. Eng., 10(3–4), 327–348. https://doi.org/10.1017/S1351324904003523 GABER, M. M., KRISHNASWAMY, S., & ZASLAVSKY, A. (2005). «On-board Mining of Data Streams in Sensor Networks». In Advanced Methods for Knowledge Discovery from Com- plex Data (pp. 307–335). Springer London. https://doi. org/10.1007/1-84628-284-5_12 IAN H. WITTEN, EIBE FRANK, & MARK A. HALL. (2011). Data Mining: Practical Machine Learning Tools and Techniques, Third Edition (3 edition). Burlington, MA: Morgan Kaufmann. KASS-HOUT, T. A., & ALHINNAWI, H. (2013). «Social media in public health». British Medical Bulletin, 108(1), 5–24. https:// doi.org/10.1093/bmb/ldt028 LEIS, Á., MAYER, M. Á., TORRES NIÑO, J., RODRÍGUEZ-GON- ZÁLEZ, A., SUELVES, J. M., & ARMAYONES, M. (2013). «Grupos sobre alimentación saludable en Facebook: características y contenidos». Gaceta Sanitaria, 27(4), 355–357. https:// doi.org/10.1016/j.gaceta.2012.12.010 LOPER, E., & BIRD, S. (2002). NLTK: «The Natural Language Toolkit». In Proceedings of the ACL-02 Workshop on Effective Tools and Methodologies for Teaching Natural Language Processing and Computational Linguistics - Volume 1 (pp. 63–70). Stroudsburg, PA, USA: Association for ComputationalLinguistics. https://doi.org/10.3115/1118108.1118117 MENASALVAS, E. & GONZALO-MARTÍN, C., (2016). Machine Learning for Health Informatics, Volume 9605 of the series Lecture Notes in Computer Science pp 221-242. NAMBISAN, P., LUO, Z., KAPOOR, A., PATRICK, T. B., & CIS- LER, R. A. (2015). «Social Media, Big Data, and Public Health Informatics: Ruminating Behavior of Depression Revealed through Twitter». In 2015 48th Hawaii International Confe- rence on System Sciences (HICSS) (pp. 2906–2913). https:// doi.org/10.1109/HICSS.2015.351 PADREZ, K. A., UNGAR, L., SCHWARTZ, H. A., SMITH, R. J., HILL, S., ANTANAVICIUS, T., … MERCHANT, R. M. (2015). «Lin- king social media and medical record data: a study of adults presenting to an academic, urban emergency de- partment». BMJ Quality & Safety, bmjqs-2015-004489. ht- tps://doi.org/10.1136/bmjqs-2015-004489 PAUL, M. J., & DREDZE, M. (2011). «You Are What You Tweet: Analyzing Twitter for Public Health». In Fifth Interna- tional AAAI Conference on Weblogs and Social Media. Retrieved from https://www.aaai.org/ocs/index.php/ICWSM/ ICWSM11/paper/view/2880 RODRÍGUEZ-GONZÁLEZ, A., MAYER, M. A., & FERNÁN- DEZ-BREIS, J. T. (2013). «Biomedical information through the implementation of social media environments». Journal of Biomedical Informatics, 46(6), 955–956. https://doi.or- g/10.1016/j.jbi.2013.10.006 RODRÍGUEZ-GONZÁLEZ, A., RUIZ, E. M., & PUJADAS, M. A. M. (2016). «Automatic extraction and identification of users’ responses in Facebook medical quizzes». Computer Me- thods and Programs in Biomedicine, 127, 197–203. https:// doi.org/10.1016/j.cmpb.2015.12.025 SEGURA-BEDMAR, I., MARTÍNEZ, P., REVERT, R., & MORE- NO-SCHNEIDER, J. (2015). «Exploring Spanish health social media for detecting drug effects». BMC Medical Informa- tics and Decision Making, 15(Suppl 2), S6. https://doi.or- g/10.1186/1472-6947-15-S2-S6 SEIFERT, S., KELM, M., MOELLER, M., MUKHERJEE, S., CA- VALLARO, A., HUBER, M., & COMANICIU, D. (2010, March). «Semantic annotation of medical images». In SPIE medical imaging (pp. 762808-762808). International Society for Op- tics and Photonics. 405 >Ei 97 BIG DATA EN SALUD: RETOS Y OPORTUNIDADES XIE, Y., CHEN, Z., CHENG, Y., ZHANG, K., AGRAWAL, A., LIAO, W.-K., & CHOUDHARY, A. (2013). «Detecting and Trac- king Disease Outbreaks by Mining Social Media Data». In Proceedings of the Twenty-Third International Joint Con- ference on Artificial Intelligence (pp. 2958–2960). Beijing, China: AAAI Press. Retrieved from http://dl.acm.org/citation. cfm?id=2540128.2540556 ZHANG, D., ISLAM, M. M., & LU, G. (2012). «A review on automatic image annotation techniques». Pattern Recog- nition, 45(1), 346-362.
Compartir