Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Universidad Politécnica de Madrid Escuela Técnica Superior de Ingenieros Informáticos Grado en Ingeniería Informática Trabajo Fin de Grado Validación de Datos Clínicos de Pacientes con Cáncer de Mama Autor: Nerea San Cristóbal Acera Tutor: Antonio Jesús Díaz Honrubia Madrid, mayo 2023 Este Trabajo Fin de Grado se ha depositado en la ETSI Informáticos de la Universidad Politécnica de Madrid para su defensa. Trabajo Fin de Grado Grado en Ingeniería Informática Título: Validación de Datos Clínicos de Pacientes con Cáncer de Mama Mayo 2023 Autor: Nerea San Cristóbal Acera Tutor: Antonio Jesús Díaz Honrubia Lenguajes y sistemas informáticos e Ingeniería de Software ETSI Informático i Tabla de contenidos Capítulo 1. Introducción ..........................................................................1 1.1 Motivación y necesidad del proyecto ................................................... 1 1.2 Objetivos ............................................................................................ 1 1.3 Planificación ....................................................................................... 2 1.4 Estructura de la memoria ................................................................... 3 Capítulo 2. El cáncer de mama ................................................................4 2.1 Definición ........................................................................................... 4 2.2 Morfología de la mama ....................................................................... 4 2.3 Factores de riesgo............................................................................... 5 2.3.1 Historial previo de enfermedades de mama .................................. 5 2.3.2 Historial familiar de enfermedades de mama ................................ 5 2.3.3 Edad ............................................................................................ 5 2.3.4 Raza ............................................................................................. 5 2.3.5 Historial reproductivo y menstrual ............................................... 6 2.3.6 Exposición a radiación ................................................................. 6 2.3.7 Factores dietéticos ....................................................................... 6 2.4 Estadificación del cáncer de mama. .................................................... 7 2.4.1 Pruebas y estudios para el diagnóstico, decisión de tratamiento y clasificación del cáncer ............................................................................. 7 2.4.2 Estadificación clínica ................................................................. 10 2.4.3 Estadificación patológica ............................................................ 10 2.4.4 Neoadyuvancia ........................................................................... 10 2.4.5 Sistema TNM .............................................................................. 11 2.4.6 Otros factores que pueden afectar la etapa del cáncer: grado. Clasificación de Nottingham ................................................................... 12 2.4.7 Asignación de la etapa general. Estadiaje ................................... 13 2.5 Tipos de tumores .............................................................................. 14 2.5.1 Según el grado de invasión ......................................................... 14 2.5.2 Según su tipo histológico ........................................................... 14 2.6 Tratamientos .................................................................................... 15 2.6.1 Tratamientos locales .................................................................. 15 2.6.2 Tratamientos sistémicos ............................................................. 16 Capítulo 3. Tecnologías empleadas ........................................................ 17 3.1 Python .............................................................................................. 17 3.1.1 Django ....................................................................................... 17 3.2 Tecnologías Web ............................................................................... 18 3.2.1 HTML ......................................................................................... 18 ii 3.2.2 CSS y Bootstrap ......................................................................... 19 3.2.3 JavaScript y Ajax ....................................................................... 19 3.3 Bases de datos ................................................................................. 20 3.3.1 SQLite ........................................................................................ 20 3.3.2 MySQL ....................................................................................... 20 3.4 Sistemas de control de versiones ...................................................... 20 3.4.1 Gitlab ......................................................................................... 21 3.5 Visualización de datos ...................................................................... 21 3.5.1 Plotly .......................................................................................... 21 3.5.2 Lifelines ..................................................................................... 21 3.6 Prototipado ....................................................................................... 21 3.6.1 Figma ......................................................................................... 21 Capítulo 4. Validación de datos .............................................................. 22 4.1 ¿Qué es la validación de datos? ........................................................ 22 4.2 Campos que validar .......................................................................... 22 4.3 Dificultades encontradas .................................................................. 26 4.4 Ejemplo del proceso de validación .................................................... 26 Capítulo 5. Análisis de requisitos ........................................................... 28 5.1 Introducción a la Especificación de Requisitos. ................................ 28 5.1.1 Propósito .................................................................................... 28 5.1.2 Ámbito del sistema ..................................................................... 28 5.1.3 Definiciones y Acrónimos ........................................................... 28 5.1.4 Visión general del documento de ERS ........................................ 30 5.2 Descripción General ......................................................................... 31 5.2.1 Perspectiva del Producto ............................................................ 31 5.2.2 Funciones del Producto .............................................................. 31 5.2.3 Características de los Usuarios .................................................. 31 5.2.4 Restricciones .............................................................................. 31 5.2.5 Suposiciones y Dependencias .................................................... 31 5.3 Requisitos Específicos ...................................................................... 32 5.3.1 Requisitos Funcionales .............................................................. 32 5.3.2 Requisitos de Interfaces Externos .............................................. 35 5.3.3 Requisitos de Rendimiento ......................................................... 37 5.3.4 Requisitos de Diseño .................................................................. 37 5.3.5 Requisitos de Atributos .............................................................. 38 Capítulo 6. Desarrollo de la aplicación ...................................................39 6.1 Arquitectura del sistema .................................................................. 39 6.2 Bases de datos ................................................................................. 40 6.2.1 Bases de datos de los pacientes ................................................. 40 iii 6.2.2 Bases de datos usuarios y cohortes............................................ 40 6.3 Funcionalidades desarrolladas ......................................................... 42 6.3.1 Conexión entre componentes MVT. ............................................ 42 6.3.2 Gestión de usuarios. .................................................................. 42 6.3.3 Gestión de cohortes.................................................................... 43 6.4 Implementación del sistema. Perspectiva del usuario ....................... 44 Capítulo 7. Implementación de la visualización ..................................... 54 7.1 Tipos de gráficas permitidas ............................................................. 54 7.2 Funcionalidades desarrolladas ......................................................... 54 7.3 Implementación del sistema. Perspectiva del usuario ....................... 55 7.3.1 Panel de selección ...................................................................... 55 7.3.2 Histogramas ............................................................................... 56 7.3.3 Gráficos circulares ..................................................................... 57 7.3.4 Caja de bigotes ........................................................................... 58 7.3.5 Kaplan Meier .............................................................................. 58 7.3.6 Panel superior de la visualización .............................................. 59 Capítulo 8. Pruebas ................................................................................ 61 8.1 Pruebas de autentificación de usuarios (login y logout) .................... 61 8.2 Pruebas del registro de usuarios ...................................................... 63 8.3 Pruebas del restablecimiento de contraseña ..................................... 66 8.4 Prueba logout ................................................................................... 69 8.5 Pruebas de super usuario................................................................. 70 8.6 Pruebas del panel de cohortes .......................................................... 72 8.7 Pruebas de las funcionalidades de los gráficos ................................. 74 8.8 Pruebas de la realización de cohortes ............................................... 77 8.9 Pruebas realización de gráficas ......................................................... 79 8.10 Pruebas del panel de gráficas ........................................................... 82 8.11 Pruebas de rendimiento .................................................................... 83 8.12 Pruebas del panel principal .............................................................. 84 Capítulo 9. Resultados y conclusiones .................................................. 86 Capítulo 10. Análisis de Impacto ........................................................... 87 Bibliografía. ........................................................................................... 88 iv ÍNDICE DE FIGURAS Figura 1. Morfología de la mama ..................................................................... 4 Figura 2. Mamografía normal [10] ................................................................... 7 Figura 3. Mamografía con cáncer de mama [11] .............................................. 8 Figura 4. Esquema de neoadyuvancia ........................................................... 11 Figura 5. Estadiaje del cáncer de mama ........................................................ 13 Figura 6. Esquema MVT ................................................................................ 18 Figura 7. Comparación modelo convencional y el proporcionado por Ajax ..... 20 Figura 8. Diagrama Entidad-Relación de la base de datos de pacientes......... 40 Figura 9. Diagrama Entidad-Relación de la base de datos de pacientes y cohortes ........................................................................................................ 41 Figura 10. Vista del login .............................................................................. 44 Figura 11. Ejemplo de Responsive ................................................................. 44 Figura 12. Vista de registro 1 ........................................................................ 45 Figura 13. Vista registro 2 ............................................................................. 45 Figura 14. Panel de administración Django ................................................... 46 Figura 15. Panel de administración de Django. Usuarios. ............................. 46 Figura 16. Personalización del panel. Opción Active ...................................... 46 Figura 17. Correo de activación ..................................................................... 47 Figura 18. Panel de recuperación de contraseña 1 ........................................ 47 Figura 19. Correo de recuperación de contraseña ......................................... 47 Figura 20. Panel de recuperación de contraseña 2 ........................................ 48 Figura 21. Éxito en cambio de contraseña .................................................... 48 Figura 22. Vista principal ............................................................................. 49 Figura 23. Panel de navegación ..................................................................... 49 Figura 24. Vista de logout ............................................................................. 50 Figura 25. Datos de la muestra ..................................................................... 50 Figura 26. Paneles de información ................................................................ 51 Figura 27. Desplegable cohorte ..................................................................... 51 Figura 28. Filtro dos tumores ductales .......................................................... 52 Figura 29. Opciones de filtrado cuantitativas ................................................ 52 Figura 30. Calendario filtro ........................................................................... 52 Figura 31. Cabecera tabla de filtrado ............................................................ 53 Figura 32. Tabla de mis cohortes .................................................................. 53 Figura 33. Panel de visualización .................................................................. 55 Figura 34.Histograma de nacimientos ........................................................... 56 Figura 35. Histograma de abortos ................................................................. 56 Figura 36. Gráfico circular con valor absoluto ............................................... 57 Figura 37. Gráfico circular con valor porcentual ........................................... 57 Figura 38. Gráfico caja de bigotes ................................................................. 58 Figura 39. Gráfica Kaplan Meier ................................................................... 58 Figura 40. Query número de pacientes ......................................................... 59 Figura 41. Ejemplo de grafica sobre datos de pacientes ................................ 59 Figura 42. Query número de tumores ........................................................... 60 Figura 43. Ejemplo de grafica sobre datos de tumores .................................. 60 Figura 44. ODS 3. Salud y Bienestar ............................................................ 87 v ÍNDICE DE TABLAS Tabla 1. Diagrama de Gantt............................................................................ 2 Tabla 2. Campos validados en el proceso de validación de datos ................... 22 Tabla 3. Ejemplo de notas médicas ............................................................... 26 Tabla 4. Ejemplo de validación de datos ........................................................ 27 Tabla 5. Definiciones ERS ............................................................................. 29 Tabla 6. Acrónimos ERS ............................................................................... 30 Tabla 7. Requisitos funcionales ..................................................................... 32 Tabla 8. Requisitos de Interfaces Externos .................................................... 35 Tabla 9. Requisitos de Rendimiento .............................................................. 37 Tabla 10. Requisitos de Diseño ..................................................................... 37 Tabla 11. Requisitos de Atributos ................................................................. 38 Tabla 12. Prueba login correcto ..................................................................... 61 Tabla 13. Prueba login usuario inexistente ................................................... 62 Tabla 14. Prueba de login incorrecto con una contraseña incorrecta ............. 62 Tabla 15. Prueba de registro con datos correctos .......................................... 63 Tabla 16. Prueba de registro sin coincidir la repetición de contraseña .......... 63 Tabla 17. Prueba de registro sin completar campos obligatorios del formulario ..................................................................................................................... 64 Tabla 18. Prueba de registro con contraseña inferior a 8 caracteres .............. 64 Tabla 19. Prueba de registro de usuario con campo de correo erróneo .......... 65 Tabla 20. Prueba de registro con usuario repetido ........................................ 65 Tabla 21. Prueba de registro con un correo ya existente ................................ 66 Tabla 22. Prueba de restablecimiento de contraseña con credencial correcto 66 Tabla 23. Prueba de restablecimiento de contraseña con un correo inexistente en la base de datos ....................................................................................... 67 Tabla 24. Prueba de restablecimiento de contraseña con token correcto ....... 68 Tabla 25. Prueba de restablecimiento de contraseña con token correcto, pero sin coincidir contraseñas .............................................................................. 68 Tabla 26. Prueba de restablecimiento de contraseña con token incorrecto .... 69 Tabla 27. Prueba de logout ........................................................................... 69 Tabla 28. Prueba de acceso al panel super usuario ....................................... 70 Tabla 29. Prueba de activación de una cuenta a través del panel de administración .............................................................................................. 70 Tabla 30. Prueba de acceso al panel super usuario sin ser administrador..... 71 Tabla 31. Prueba de acceso al panel super usuario sin ser administrador..... 71 Tabla 32. Prueba de eliminación de una cohorte ........................................... 72 Tabla 33. Prueba de eliminación de todas las cohortes.................................. 73 Tabla 34. Prueba sobre las cohortes para ver si están asociados a un único usuario ......................................................................................................... 73 Tabla 35. Prueba de descarga de un gráfico .................................................. 74 Tabla 36. Prueba de zoom en un gráfico ........................................................ 74 Tabla 37. Prueba de autoescalado de un gráfico ............................................ 75 Tabla 38. Prueba del botón de valor absoluto en gráficos circulares .............. 75 Tabla 39. Prueba del botón de valor en porcentaje de los gráficos circulares . 76 Tabla 40. Prueba de excluir un valor en el gráfico circular ............................ 76 Tabla 41. Prueba de volver a admitir el valor excluido en el gráfico circular .. 77 Tabla 42. Prueba de cohorte sin nombre ....................................................... 77 Tabla 43. Prueba de una cohorte con una variable ........................................ 78 Tabla 44. Prueba de cohorte con varias variables del mismo grupo ............... 78 Tabla 45. Prueba de cohorte con varias variables de distintas caras del desplegable ................................................................................................... 79 Tabla 46. Prueba de funcionamiento histograma .......................................... 79 vi Tabla 47. Diagrama del funcionamiento del gráfico circular .......................... 80 Tabla 48. Prueba de funcionamiento del diagrama de cajas y bigotes ............ 81 Tabla 49. Prueba de funcionamiento de la gráfica Kaplan Meier .................... 81 Tabla 50. Prueba de funcionamiento de la gráfica Kaplan Meier .................... 82 Tabla 51. Prueba de funcionamiento de la gráfica Kaplan Meier .................... 82 Tabla 52. Prueba de rendimiento creación de tabla de una cohorte ............... 83 Tabla 53. Prueba de rendimiento de creación de una gráfica ......................... 83 Tabla 54. Prueba de rendimiento entre cambio de pantallas ......................... 84 Tabla 55. Prueba de panel general de estadísticas......................................... 84 Tabla 56. Prueba de paneles informativos ..................................................... 85 Tabla 57. Prueba del panel lateral ................................................................. 85 vii Agradecimientos Quisiera aprovechar la oportunidad que se me brinda para expresar mi gratitud a todas las personas que me han apoyado en este periodo. En primer lugar, quería dar las gracias a mi familia, en especial a mi madre. Ha sido siempre mi principal apoyo y motor para conseguir todo aquello que me he propuesto, sin ella no hubiese sido posible, ni sería la persona que soy hoy en día. A mi hermana, a mi sobrina y a mi padre por estar siempre allí para todo lo que necesitase y brindarme apoyo en momentos complicados. A mi pareja Alberto, por dedicarme tanta paciencia, cariño y dedicación. Por apoyarme en todo este proceso y por brindarme su mano siempre que la he necesitado. Sin duda, ha sido un gran apoyo en los casi nueve años que he tenido la suerte de tenerle a mi lado y espero que sean muchos más. A mi tutor Antonio y al Centro de Tecnología Biomédica por permitirme realizar este Trabajo de Fin de Grado. A mis compañeros (y amigos), con los que he tenido la oportunidad de trabajar durante la carrera. Sin duda, ha sido una experiencia en la que he podido aprender mucho. ¡Muchas gracias a todos! viii Resumen El cáncer de mama es la proliferación descontrolada y anormal de las células en el tejido mamario. La incidencia de esta enfermedad en España ha aumentado y supone el 28,9% del total de cánceres en las mujeres según la Red Española de Registros de Cáncer (REDECAN) y la Sociedad Española de Oncología Médica (SEOM) [1]. Normalmente, los datos sobre el cáncer se pueden percibir en los informes e historiales clínicos. El cáncer es una enfermedad compleja que requiere la comprensión de muchas variables que lo afectan, sin embargo, no se dispone de un sistema que pueda agrupar toda esta información y poder visualizarla de forma gráfica. Este Trabajo de Fin de Grado trata de cubrir esa necesidad proporcionando un sistema que permita hacer gráficas de cada una de las variables, tanto cuantitativas como cualitativas, que puedan afectar a la enfermedad mediante un estudio de cohortes. El sistema es provisto de un conjunto de datos extraídosde las historias clínicas mediante técnicas de Procesamiento del Lenguaje Natural y validación de los mismos, asegurando su completitud y veracidad. Este sistema, ha sido implementado como una plataforma web interactiva, que permite al usuario realizar unas determinadas cohortes y después realizar distintas gráficas sobre ellos. En resumen, este Trabajo de Fin de Grado presenta el desarrollo de un sistema innovador tras un proceso de validación de datos para mostrarlos de forma gráfica, teniendo el potencial de proporcionar información valiosa a los investigadores y profesionales de la salud desde una perspectiva visual. ix Abstract Breast cancer is the uncontrolled and abnormal proliferation of cells in breast tissue. The incidence of this disease in Spain has increased and represents 28.9% of total cancers in women according to the Spanish Network of Cancer Registries (REDECAN) and the Spanish Society of Medical Oncology (SEOM) [1]. Normally, data on cancer can be found in reports and medical records. Cancer is a complex disease that requires understanding of many variables that affect it. However, there is no system available that can group all this information and visualize it graphically. This Bachelor's Thesis aims to cover that need by providing a system that allows for the creation of graphs for each of the variables, both quantitative and qualitative, that may affect the disease through a cohort study. The system is provided with a set of data extracted from medical records using Natural Language Processing techniques and validation of the data, ensuring its completeness and accuracy. This system has been implemented as an interactive web platform that allows users to create specific cohorts and then generate different graphs based on them. In summary, this Bachelor's Thesis presents the development of an innovative system after a data validation process to display it graphically, with the potential to provide valuable information to researchers and healthcare professionals from a visual perspective. 1 Capítulo 1. Introducción En este capítulo se tratará la motivación y necesidad por las que se vuelve necesario este Trabajo de Fin de Grado. Se expondrán los objetivos a alcanzar y la estructura que tendrá el resto de la memoria del proyecto. 1.1 Motivación y necesidad del proyecto El presente proyecto surge de la necesidad de disponer de un sistema de visualización gráfica de marcadores tumorales y factores de pronóstico. Este sistema proporcionará una aplicación Web a aquellos profesionales de la salud que con dicha herramienta podrá tener una rápida visualización de estas para poder realizar una evaluación más detallada de una manera ágil. La principal motivación para el desarrollo de este sistema son los alarmantes datos sobre el cáncer de mama que se han podido observar en los últimos años. La incidencia de esta enfermedad en España ha aumentado y supone el 28,9% del total de cánceres en las mujeres según la Red Española de Registros de Cáncer (REDECAN) y la Sociedad Española de Oncología Médica (SEOM) [1]. De este modo, un profesional de la salud que quisiese visualizar estos datos debería leerse una a una las historias clínicas de los pacientes, lo que lo convierte en una tarea prácticamente imposible debido a la complejidad y el tiempo que requiere. Además, si los datos siguen la misma tendencia que los últimos años se volverá una tarea aún más complicada debido al aumento de volumen de historias clínicas que contendrán datos de dicha enfermedad. 1.2 Objetivos En base a la motivación anterior, el objetivo principal de este Trabajo Fin de Grado es la validación de datos de pacientes con cáncer de mama asegurando su precisión, completitud y fiabilidad. Este objetivo principal puede descomponerse en los siguientes objetivos secundarios. 1. Familiarización con la terminología clínica del cáncer de mama (estadiaje, histología propia, qué tipos de estudios inmunohistoquímicos propios de este tipo de tumores…). 2. Realización de una aplicación que permita exponer estos datos de una forma gráfica, todo ello con el lenguaje de programación Python, el framework Django, HTML, CSS, Bootstrap, Ajax, JavaScript, librerías que permitan la visualización de estos datos tales como Plotly. 3. Familiarización con estas tecnologías. 2 1.3 Planificación El trabajo ha sido dividido en las siguientes fases: 1. Familiarización con terminología del cáncer de mama: esta fase consiste en el aprendizaje de aquellos términos relacionados al campo de oncología tales como la clasificación TNM o la histológica. 2. Validación de datos: en esta fase se validaron datos de los procesos oncológicos de las pacientes ubicadas en la base de datos proporcionada por el Centro de Tecnología Biomédica, para asegurar una completitud y veracidad de estos. 3. Desarrollo de la aplicación: este proceso consiste en el desarrollo de la aplicación cómo tal, la definición de cómo se harán las cohortes y la lógica por detrás del programa. En esta sección también se comprende la lógica de usuarios: panel de administración con super usuarios, validación de cuentas, restablecimiento de contraseña… 4. Visualización de datos: es la que permite crear gráficas de distintos tipos (histograma, gráfico circular y diagrama de bigotes) con los datos anteriores de modo que se puedan visualizar las cohortes anteriormente creadas. 5. Pruebas: en este último proceso se harán diversas pruebas sobre toda la aplicación para comprobar que en su conjunto funciona correctamente. Las tareas que se han realizado son: 1. Estudio de los datos con los que se trabajará y familiarización con la terminología clínica propia del cáncer de mama 2. Validación de datos 3. Estudio del lenguaje de programación Python, el framework Django, HTML, CSS, Bootstrap, Ajax, JavaScript y librerías que permitan la visualización de estos datos tales como Plotly. 4. Desarrollo de la aplicación 5. Implementación de técnicas de visualización de datos 6. Pruebas de la aplicación 7. Escritura de la memoria 8. Preparación de la defensa A continuación, en la Tabla 1 se muestra el diagrama de Gantt de estas tareas: Tabla 1. Diagrama de Gantt S e m a n a 1 S e m a n a 2 S e m a n a 3 S e m a n a 4 S e m a n a 5 S e m a n a 6 S e m a n a 7 S e m a n a 8 S e m a n a 9 S e m a n a 1 0 S e m a n a 1 1 S e m a n a 1 2 S e m a n a 1 3 S e m a n a 1 4 Tarea 1 Tarea 2 Tarea 3 Tarea 4 Tarea 5 Tarea 6 Tarea 7 Tarea 8 3 1.4 Estructura de la memoria El resto de la memoria de este proyecto se estructura de la siguiente forma: • Capítulo 2. El cáncer de mama. En este capítulo se trata la terminología propia de la enfermedad para después comprender dichos aspectos en posteriores capítulos. • Capítulo 3. Tecnologías empleadas. En este apartado se tratarán aquellas tecnologías que han sido utilizadas para la validación de datos, desarrollo de la aplicación y visualización de las variables. • Capítulo 4. Análisis de Requisitos. En este capítulo se expondrá la especificación de requisitos software siguiendo el estándar IEEE 830. • Capítulo 5. Validación de datos. Se expresará el proceso de validación de datos que ocupa la segunda fase del proyecto. • Capítulo 6. Desarrollo de la aplicación. En este capítulo se expondrá el desarrollo de aplicación, así como la gestión de usuarios. • Capítulo 7. Implementación de la visualización. Esta sección recoge el proceso mediante el cual, una vez ya creados los filtros y la implementación de la lógica de la aplicación, se muestran los resultados de forma gráfica. • Capítulo 8. Pruebas. Una vez terminada todala implementación, se probará el sistema para comprobar que no tiene ningún fallo y que puede ser utilizada sin problemas con un buen tratamiento de los datos clínicos cuya naturaleza es muy sensible. • Capítulo 9. Resultados y conclusiones. Se muestran los resultados obtenidos y las conclusiones del Trabajo de Fin de Grado. • Capítulo 10. Análisis de Impacto. Recoge el análisis de impacto del proyecto y la afectación que podría tener en los distintos campos. 4 Capítulo 2. El cáncer de mama En el siguiente capítulo se presentan los conocimientos a modo general del cáncer de mama para comprender mejor cómo funciona el sistema desarrollado, así como su terminología y variables clínicas que se van a validar y analizar en siguientes capítulos. 2.1 Definición El cáncer de mama es una enfermedad en la cual las células de la mama cambian y crecen sin control. Este crecimiento descontrolado puede llevar a que se extienda a otros tejidos u órganos desplazándose del tumor original, pasando por el sistema linfático o circulatorio, originando lo que conocemos como metástasis. 2.2 Morfología de la mama Figura 1. Morfología de la mama En la Figura 1 se muestran las estructuras que forman la mama. La mama tiene una estructura interna arbórea y contiene unos 15 a 20 lóbulos mamarios que desembocan cada uno en un conducto, denominado galactóforo conectado con el pezón. En los lóbulos se encuentran los lobulillos que son glándulas encargadas de la producción de la leche. Bajo la aréola, los conductos se ensanchan formando unos depósitos de leche llamados senos lactíferos. En su mayoria, la mama está formada por tejido adiposo (graso) y tejido glandular. Los ganglios linfáticos no son una parte integral de la mama, pero son un factor importante a tener en cuenta pues muchos de ellos se ven afectados por enfermedades como el cáncer invadiendo el sistema linfático y aumentando el riesgo de propagación a otras partes del cuerpo [2]. 5 2.3 Factores de riesgo Los factores de riesgo son aquellas condiciones, características o situaciones que aumentan la predisposición a que una persona sufra una enfermedad o cualquier otro factor negativo para su salud. En el caso del cáncer de mama son muchos los factores de riesgo. Algunos de estos se analizan en las siguientes secciones [3]. 2.3.1 Historial previo de enfermedades de mama Los antecedentes personales de cáncer de mama aumentan en gran medida el riesgo de desarrollar la enfermedad. Es más probable que la segunda aparición se clasifique como invasiva y ductal (estos términos serán explicados en el apartado 2.5). Por este motivo es muy importante que mujeres con antecedentes personales de la enfermedad lleven una monitorización propia realizándose autoexámenes de la zona y por parte de los profesionales de la salud mediante mamografías. Conocemos por recidiva cuando una paciente desarrolla en el mismo pecho de nuevo la enfermedad tras un tiempo de haberla sufrido con anterioridad y haber tenido un periodo de convalecencia. Un cáncer de mama contralateral (en el pecho contrario al primer cáncer) no es considerada recidiva, pero sigue siendo un antecedente personal de cáncer de mama. 2.3.2 Historial familiar de enfermedades de mama El cáncer tiene un alto componente genético. Se conocen una serie de genes defectuosos que son los responsables del desarrollo de un tipo de cáncer en particular. El hecho de tener antecedentes familiares de cáncer de mama aumenta el riesgo, aunque esto depende del tipo de familiar afectado. De este modo, cuanta más relación estrecha haya con el individuo que lo ha sufrido, más posibilidades hay de que comparta los mismos genes, por lo tanto, en caso de familiares directos, el riesgo es mayor. También aumenta con el número de familiares afectados, cuantos más individuos afectados, mayor será el riesgo. 2.3.3 Edad El riesgo de cáncer de mama aumenta con la edad. Antes de los 30 años el riesgo es menor y se estabiliza a la edad de 80. 2.3.4 Raza Las mujeres de raza negra tienen más posibilidades de ser diagnosticadas con cáncer de mama de inicio temprano, esto quiere decir, que la edad a diagnóstico es menor a 45 años. Sin embargo, en edades superiores a los 50 las mujeres blancas tienen más probabilidad de sufrir la enfermedad que las afroamericanas. La edad a diagnóstico es un factor importante pues las tasas de supervivencia son muy diferentes dependiendo de la etapa en la que se detecta el cáncer. Los cánceres que aparecen a edades tempranas son generalmente más agresivos que aquellos que se detectan en etapas más tardías de la vida. 6 Por tanto, aunque las mujeres de raza negra tienen menor prevalencia en la enfermedad, sufren cánceres más agresivos y con una mayor tasa de mortalidad. Las causas aún no se saben con certeza, pero algunos posibles factores que afectan podrían ser las diferencias socioeconómicas, diferencias biológicas [4], el limitado acceso a atención médica y ensayos clínicos o el alto costo del tratamiento puede indicar una mayor tasa de mortalidad. 2.3.5 Historial reproductivo y menstrual Para comprender esta sección es importante conocer algunos conceptos previos. Terminología relativa a la menstruación: • Menarquía: primera menstruación de una mujer • Menopausia: última menstruación de una mujer Hormonas responsables de la menstruación: • Estrógenos: son hormonas que se producen en el ovario en distintas cantidades durante todo el ciclo menstrual. Su función es aumentar el grosor del endometrio (revestimiento del útero) durante la primera fase del ciclo. Después se produce la ovulación. • Progesterona: es una hormona que se produce en el ovario y que casi no tiene presencia hasta después de la ovulación. Es la responsable de la maduración del endometrio [5]. Con esto, hay una serie de factores que aumentan el riesgo de desarrollar cáncer de pecho. Aquellas mujeres que tienen una menarquía temprana (antes de los de los doce años) o empiezan la menopausia a una edad tardía (55 años o más), están en un mayor riesgo de desarrollar cáncer de mama. La exposición a ciertos fármacos como el dietilestilbestrol (DES) [6], un estrógeno fabricado por el hombre que fue utilizado de los años 1947 a 1971, para tratar complicaciones asociadas al embarazo, aumenta el riesgo. También algunas terapias como pueda ser la de reemplazo hormonal utilizada para controlar síntomas menopáusicos aumenta la probabilidad de sufrir cáncer de mama. Esta terapia puede incluir estrógenos únicamente o una combinación de estrógenos y progesterona. 2.3.6 Exposición a radiación La exposición a la radiación incrementa el riesgo de padecer cáncer de mama de por vida en una mujer. En algunas terapias se aplica radiación como pueda ser en el linfoma de Hosgkin. El riesgo no es algo fijo pues depende de la dosis, tiempo y edad a la que se produjo la irradiación. Las mujeres que han recibido irradiación a edades tempranas (antes de los 30 años) son más propensas a sufrirlo. Ha habido grandes avances en cuanto a las dosis que se aplican a la hora de realizar un tratamiento, ahora se precisan de cantidades menores y, además, la región que se expone a dicha radiación es menor. 2.3.7 Factores dietéticos Se han encontrado dos principales factores dietéticos que pueden aumentar el riesgo de sufrir cáncer de mama, estos son el alcohol y las carnes recocidas. En 7 el caso del alcohol, se ha demostrado que el consumo elevado de este aumenta en gran medida el riesgo. Las carnes recocidas también están correlacionadas de modo que la exposición a grandes cantidades de aminas heterocíclicas (sustancias químicas que se forman en el proceso de cocción de productos cárnicos) crean una mayor probabilidad de padecer cáncer de mama. 2.4 Estadificación del cáncer de mama. La estadificación del cáncer es una forma de saberla medida del cáncer y en qué grado de diferenciación se encuentra para poder determinar la opción de tratamiento más adecuada para cada paciente. También sirve para determinar un pronóstico o predicción más probable que tendrá el cáncer [7]. 2.4.1 Pruebas y estudios para el diagnóstico, decisión de tratamiento y clasificación del cáncer Hay diferentes tipos de pruebas médicas que se pueden utilizar para determinar una estadificación del cáncer. 2.4.1.1 Palpación mamaria Debido a los cambios fisiológicos que se producen en la mama debidos a la edad, cambios hormonales, embarazo o lactancia es importante conocer la anatomía del pecho pues nos puede ayudar a detectar cualquier masa anormal y buscar un diagnóstico y tratamiento precoz en caso de que se necesitase. Para ello y cada vez más, se proporciona información a la población de cómo realizar autoexploración de mamas para detectar cualquier anomalía. Es común también que un profesional de la salud lo realice en caso de que la paciente haya notado alguna sintomatología que sea compatible con esta patología [8]. 2.4.1.2 Mamografía Es el método de diagnóstico más utilizado en el caso de la detección de cáncer de mama. Es importante la realización de esta prueba diagnóstica pues puede detectar la enfermedad antes de padecer algún síntoma. Es una prueba de baja radiación en la que la paciente coloca su mama sobre una placa de plástico, cubriéndola con otra placa y realizando una radiografía [9]. Figura 2. Mamografía normal [10] 8 Después de este proceso, se dará una imagen de la mama. En la Figura 2 podemos observar una mamografía de una mama sin cáncer. En el caso de la Figura 3 podemos observar una masa en la parte superior de la mama que es lo que corresponde al cáncer. En este caso, se realizó la mamografía previamente a un tratamiento neoadyuvante, explicado en el apartado 2.4.4. Figura 3. Mamografía con cáncer de mama [11] El uso de la Inteligencia Artificial combinado con la realización de mamografías está tomando relevancia en el campo de la investigación. Científicos del MIT han desarrollado un sistema para predecir el riesgo que tiene una paciente de sufrir cáncer de mama. Esto los ha llevado a poder predecir cánceres cinco años antes de que aparezcan. Incluso ha llegado a eliminar el sesgo entre mujeres blancas y negras pues el modelo se ha entrenado con una gran variedad de datos [12]. 2.4.1.3 Biopsias Las biopsias son aquellas pruebas mediante las cuales un médico obtiene células del área sospechosa o confirmada de cáncer para una posterior examinación por parte del anatomopatólogo en un laboratorio, determinando si hay células cancerosas. Existen varios tipos de biopsias que se hacen para determinar si hay cáncer de mama [13]: • Biopsia por aspiración con aguja fina (FNA): se utiliza una aguja hueca y muy fina para extraer (aspirar) mediante una jeringa una porción del tejido que parece ser sospechoso. • Biopsia por punción con aguja gruesa: es la más utilizada. Se utiliza una aguja gruesa más grande para tomar muestras de la zona donde el médico palpó la masa, o bien se visualizó por ecografía, mamografía o resonancia. • Biopsia quirúrgica: se analiza toda la masa que ha sido extraída mediante cirugía. • Biopsia de ganglios linfáticos: se realizan para determinar si hay propagación del cáncer al sistema linfático. Se puede hacer con aguja o analizando el ganglio linfático centinela y/o una disección de los ganglios linfáticos axilares. El ganglio linfático centinela es aquel que está más cercano al tumor. 9 2.4.1.4 Ultrasonido Mediante el ultrasonido se realizan una serie de ondas sonoras para crear un eco. Estos ecos se transforman en una imagen que puede ser vista mediante un monitor. Pueden ser útiles para encontrar determinadas masas, o determinar una serie de factores de dicha masa como pueda ser el contorno, forma o tamaño. También se utilizan para guiar procedimientos como biopsias. 2.4.1.5 Imagen Molecular de Mama (MBI) / Imagen Gamma de Mama Específica (BSGI) En estas pruebas, se inyecta en vena un compuesto radioactivo en pequeñas dosis llamado trazador. Este marcador se adhiere a un tumor y mediante una cámara especial se visualiza si hay evidencia de un tumor. Se utiliza en casos de pacientes cuyos senos son más densos de lo normal o para quienes un examen físico o mamografía es difícil de interpretar. También se utiliza para las que previamente se han sometido a una cirugía de mama. 2.4.1.6 Imagen de Resonancia Magnética (MRI) La resonancia magnética mide las señales electromagnéticas normales mediante el uso de imanes y ondas de radio. Se puede utilizar para medir el tamaño del cáncer o diagnosticar una serie de tumores. 2.4.1.7 Pruebas de inmunohistoquímica La inmunohistoquímica es un método bioquímico que trata de determinar la presencia y el nivel de ciertas proteínas celulares. En el caso de la proteína receptor de estrógenos (ER) determina un factor de crecimiento que se adhiere al estrógeno para estimular la división celular de las células del pecho. En el caso de la proteína receptor de progesterona (PR) determina el pronóstico de la enfermedad [14]. Estos factores son importantes a tener en cuenta por el médico, pues dan datos para determinar si es probable que el cáncer responda a tratamiento hormonal. En el caso de que el cáncer no tenga receptores hormonales, las terapias de este tipo no serán muy efectivas. También sirven para realizar una predicción sobre si el cáncer pasa a perder estos receptores o puede llegar a tenerlos con el tiempo [15]. En la mayoría de los casos, se muestra mediante un porcentaje de entre 0 y 100, aunque es bastante común ver el término “negativo” si dicho porcentaje toma el valor de cero [15]. 2.4.1.8 Ki-67 test El Ki67 es una proteína que ha demostrado tener un papel importante en la regulación del ciclo celular. Es una forma de medir la proliferación celular del tumor. El valor que puede tomar esta prueba como factor de pronóstico o predictivo es dudoso y controvertido. Sin embargo, sí sirve para predecir la respuesta a un tratamiento adyuvante o quimioterapia (esta última, eficaz en valores altos). Altos niveles de Ki67 están relacionados con mayor probabilidad de recaída en cáncer en estadios tempranos. Se suele medir con un porcentaje de entre el 0 y el 100 por cien [16]. 10 2.4.1.9 HercepTest En algunos casos de cáncer de mama, se muestran unos niveles altos de una proteína llamada HER2. Esta proteína promueve el crecimiento de todas las células mamarias, por lo que indica un factor de crecimiento. En líneas generales, se utiliza para administrar distintos tratamientos, en el caso de valores altos de HER2 en los que se suele tratar con un medicamento llamado Herceptin ® [14]. 2.4.2 Estadificación clínica La etapa clínica es una estimación de cómo el cáncer está de extendido en base a los resultados preoperatorios, estos pueden ser bien exámenes médicos, estudios por imágenes (mamografía) y biopsias del tumor. Se suelen utilizar para tener una idea de cuál podría ser la prognosis1 del paciente. Veremos más adelante, en el capítulo dedicado a la validación de datos (Capítulo 0) que vendrá denotado como “C”. 2.4.3 Estadificación patológica La etapa patológica es aquella que se determina tras la extracción (cirugía) del tumor. A menudo, la etapa patológica da distintos resultados a la clínica, esto puede venir dado por numerosos factores como pueda ser la dispersión del tumor en la diferencia de tiempo entre una u otra, el limitado alcance de las pruebas por imagen o los tratamientos con terapias de neoadyuvancia (esto vendrá dado en el apartado 2.4.4). En el apartado de validación de datos vendrá denotado como “P”. 2.4.4 Neoadyuvancia A menudo, antes del tratamiento principal (en el caso de los cánceres de mama lo más común es que sea cirugía)se dan una serie de terapias antes de la extirpación del tumor. Es a lo que llamamos terapias neoadyuvantes [17]. Estas terapias suelen afectar a todo el cuerpo, cómo la quimioterapia, la terapia hormonal o un agente dirigido para poder llegar a las células cancerosas que se encuentran en circulación o tejidos distantes que no se ven en pruebas de imagen o en la cirugía. Su objetivo principal es evitar la dispersión del tumor (metástasis). En algunos casos, también se utilizan para reducir el tumor antes de la cirugía mediante radioterapia. La estadificación clínica y patológica aquí juega un papel importante pues nos proporcionará información de cómo está funcionando estas terapias, al tener unos indicativos previos y posteriores a su aplicación. 1 Prognosis: pronóstico de una enfermedad basado en un conjunto de datos e información 11 A veces, después del tratamiento primario se realizarán otros tratamientos llamados adyuvantes. Estas decisiones se pueden basar en cómo la terapia neoadyuvante ha funcionado. Si el primer enfoque no fue tan exitoso cómo se esperaba, se podrá usar otra terapia para la adyuvante. El principal fundamento para aplicar terapia adyuvante es que, con ella, las probabilidades de que el paciente se haya curado aumentan. Figura 4. Esquema de neoadyuvancia A normas generales, podemos decir que en una línea de tiempo se aplicaría primero la neoadyuvancia, después la cirugía y después el tratamiento adyuvante cómo se puede observar en la Figura 4. Sin embargo, no todas las pacientes tienen terapias neoadyuvantes o de adyuvancia. Ni si quiera tienen por qué tener cirugía cómo es el caso de algunas pacientes en estado terminal, a las que se les prefiere no hacer tratamientos invasivos. 2.4.5 Sistema TNM Hay diferentes tipos de sistemas de estadificación. El más común y utilizado por los profesionales de la salud dedicados a ello es el sistema TNM. Viene dado por el American Joint Committee (AJCC) y el International Union for Cancer Control (UICC). Estas dos importantes entidades proveen a los médicos una serie de normas a seguir para poder determinar la etapa del cáncer y poder establecer un consenso. En líneas generales, se provee una letra y un número (o letras) para describir tres aspectos del cáncer: el tumor principal, los ganglios linfáticos y la metástasis. Todo ello viene dado en los siguientes subapartados. 2.4.5.1 El tumor primario (categoría T) Para saber en qué medida se ha propagado el tumor principal en el cuerpo los médicos han de conocer el lugar donde surgió el cáncer inicial. Para ello se utilizará la categoría T acompañada de un número o una serie de letras que nos proveen de información para describir el tumor. • TX. La letra X se utilizará en casos donde no hay información sobre el tumor primario o su análisis ha sido imposible. Esto quiere decir que el tumor no ha podido ser evaluado en cuanto a su tamaño o extensión. • T0. Si la letra T viene acompañada de un 0 es que no se encuentra evidencia del tumor primario. • Tis. Si nos encontramos con “is” quiere decir que es un tumor “in situ”. Este aspecto viene explicado en el apartado 2.5.1, pero a modo de resumen significa que las células cancerosas se están reproduciendo en una capa más superficial sin invadir tejidos más profundos. • Acompañado de cualquier número del 1 al 4. Los números del uno al cuatro describen el tamaño del tumor o cuánto se ha propagado hacia estructuras cercanas del cuerpo. Cuanto más mayor sea el número, más extensión tiene el tumor. 12 2.4.5.2 Los ganglios linfáticos (categoría N) La categoría N es aquella que indica si en la proximidad al tumor primario hay ganglios linfáticos afectados. Los ganglios linfáticos son estructuras conformadas por una agrupación de células inmunitarias. El hecho de que el cáncer se extienda hasta ellos puede provocar que la enfermedad pueda afectar a otras partes del cuerpo. Las categorías que podemos asignar a la N son: • NX. Indica que no hay información sobre si el cáncer a alcanzado a los ganglios linfáticos cercanos. • N0. Es un buen indicador pues muestra que los ganglios linfáticos cercanos no contienen cáncer. • La N seguida de un número entre 1-3. Indica que los ganglios linfáticos cercanos han sido afectados y además su propagación, siendo uno el número que indica que hay menor extensión y 3 el que más. 2.4.5.3 La metástasis (categoría M) En el caso de la M, sirve para indicar si hay extensión a otras partes del cuerpo. Esta categoría puede tomar dos valores únicamente: • M0. Indica que no hay propagación distante • M1. Indica que hay propagación hacia otros tejidos u órganos que son distantes al lugar dónde se encontró el cáncer principal. A veces, hay un pequeño número de células cancerosas que se han diseminado, pero no puede ser considerado metástasis porque la extensión y el número de células es muy reducido. Es a lo que llamamos micrometástasis. 2.4.6 Otros factores que pueden afectar la etapa del cáncer: grado. Clasificación de Nottingham El grado del cáncer de mama es un medidor de que tanto se parecen las células cancerosas a las células normales. De algún modo funciona de indicador para clasificar qué tan agresivo puede ser un tumor. La clasificación de Nottingham es un sistema de puntuación para evaluar este grado. El patólogo (profesional de la salud encargado de analizar muestras de tejidos, células y fluidos corporales) examina las células de cáncer bajo un microscopio y da una puntuación sobre tres a las siguientes tres características: • Formación de túbulos: qué tanto se parece el tumor a la estructura celular normal. • Pleomorfismo nuclear: qué tan diferentes se ven las células tumorales de las normales • Actividad mitótica: qué tan rápido se están dividiendo o reproduciendo las células. Como se ha comentado, se le asigna a cada una, una puntuación de 1 a 3 a cada una de las tres características, siendo la 1 la más cercana a la normalidad y la 3 la que más comportamiento anormal tiene. La suma de estas cantidades lleva a la obtención de la puntuación para la clasificación Nottingham. Como se puede deducir de esto, la puntuación más pequeña será de 3 (1 túbulos + 1 pleomorfismo nuclear + 1 actividad mitótica) y la más grande será de 9 (3 túbulos + 3 pleomorfismo nuclear + 3 actividad mitótica). 13 La puntuación total tiene un grado asignado: • Grado I. Para puntuaciones de entre 3 a 5. Es a lo que llamamos “bien diferenciado”. • Grado II. Para puntuaciones de 6 y 7. Es a lo que llamamos “moderadamente bien diferenciado”. • Grado III. Es para puntuaciones de 8 y 9. Es a lo que llamamos “escasamente diferenciado”. Este grado es de gran utilidad a la hora de determinar si se utiliza radiación después de la cirugía. Por ejemplo, en el caso de tumores de alto grado se precisa tratar a la paciente con radioterapia tras la tumorectomía o mastectomía (extirpación del tumor, o de la mama completa) pues tiene un mayor riesgo de recurrencia [18]. 2.4.7 Asignación de la etapa general. Estadiaje El estadio del tumor proporciona información útil sobre las características del cáncer como pueda ser su tamaño o su extensión. Estos datos que nos proporciona el estadiaje sirven para proponer un tratamiento más adecuado en función de estos parámetros y cada caso. Dependiendo de este se puede determinar su peor o mejor pronóstico. Son cuatro: Figura 5. Estadiaje del cáncer de mama En la Figura 5 podemos observar las distintas categorías que puede tomar el cáncer según su extensión. A continuación, se explica cada una: • Estadio I. El tumor es inferior a dos centímetros. El tumor aún no se ha extendido y tiene una tasa de supervivencia relativa a cinco años de un 98% • Estadio II. Se incluyen los siguientes tipos de tumores: o El tamaño es inferior a dos centímetros, pero está afectando a los ganglioslinfáticos de la axila. o El tamaño está entre dos y cinco centímetros, y puede haberse propagado o no a otras zonas. o El tamaño supera los cinco centímetros, pero no ha afectado a los ganglios de la axila. En estos tipos de tumor se espera una supervivencia relativa de entre un 76 y 88 por ciento a cinco años. 14 • Estadio III. Se distinguen dos tipos: o IIIA: se incluyen tumores inferiores a cinco centímetros con diseminación a ganglios linfáticos unidos entre sí o a otras estructuras y tumores como los de tamaño superior que han afectado a los ganglios linfáticos axilares. La tasa de supervivencia relativa a cinco años se sitúa entre el 56 por ciento. o IIIB: el tumor se ha propagado a otros tejidos relativos al pecho o ganglios linfáticos situados en la pared torácica. Su índice de supervivencia es de 46 por ciento. En ambos casos y cómo podemos observar en la Figura 5 tienen afectación ganglionar. • Estadio IV. Es el más avanzado pues el cáncer se ha extendido a otras partes del cuerpo. La tasa de supervivencia relativa a cinco años es del 16 por ciento. Los órganos a los que más suele afectar son los huesos, pulmones, hígado o cerebro. También puede haber afectado localmente a la piel [19]. 2.5 Tipos de tumores Podemos encontrar distintos tipos de tumores según el criterio a seguir. 2.5.1 Según el grado de invasión El grado de invasión es la capacidad de un tumor para invadir y crecer en tejidos cercanos, pudiendo ser órganos. Mide el nivel de agresividad que tiene un tumor y sirve para planificar el tratamiento a aplicar. Siguiendo este criterio podemos determinar tres tipos de tumores: • In situ: cuando la invasión tumoral se encuentra dentro de los conductos mamarios que conducen la leche hasta el pezón. • Infiltrante: cuando la invasión tumoral ha invadido, a parte de los conductos mamarios, la grasa de la mama que rodea a estos. Este tipo de tumor es más agresivo pues supone que puede llegar a pequeños vasos sanguíneos y linfáticos de la mama. Estos tumores tienen peor pronóstico que el anterior debido a que aumenta el riesgo de que se formen metástasis en otras partes del cuerpo. • Infiltrante junto a un tumor in situ asociado: es la situación en la que se encuentra un cáncer invasivo junto con un carcinoma in situ asociado. 2.5.2 Según su tipo histológico Según la histología de las células observadas en el microscopio la clasificación es: • Ductal: el conducto de la mama está rodeado de células anormales. • Lobular o lobulillar: se origina en los lobulillos. Como hemos mencionado antes, en el apartado de Morfología de la mama, son las glándulas productoras de leche. • Mixto: tumores que tienen características celulares de ambos, ductal y lobular. • Otros tipos: existen otros tipos teniendo en cuenta el lugar de afectación. En esta clasificación estarían, por ejemplo, los carcinomas mucinosos. Estos últimos son un subtipo de tumor que se caracterizan por la 15 producción de moco por las células afectadas, dando lugar a la presencia de un líquido viscoso. Sin embargo, dada su poca prevalencia no se han tenido en cuenta para la validación de datos que se explicará más adelante. • No especificado: se clasifica como no especificado cuando no se encuentren características específicas que permitan incluirlo en un subtipo específico de cáncer de mama. 2.6 Tratamientos En esta sección se expondrán los tratamientos del cáncer de mama. Aunque hay una gran variedad, en este apartado se mostrará una recopilación de los más utilizados y a modo genérico para luego comprender los otros procesos cómo la visualización de determinados gráficos más adelante [20]. 2.6.1 Tratamientos locales Los tratamientos locales tratan de aplicar una terapia sólo en el área donde se encuentra el tumor, sin afectar al resto del cuerpo. En muchas ocasiones se aplican cirugías combinadas con otros tratamientos que no tienen por qué ser locales. Podemos encontrar dos tipos de tratamientos locales. 2.6.1.1 Cirugía A la cirugía que trata de conservar el seno la llamamos cirugía con conservación. Este tipo de cirugía trata de extirpar solamente la parte del seno que tiene cáncer. También se la llama tumorectomía, cuadrantectomía o mastectomía parcial. El caso en el que se decide extirpar el pecho totalmente se llama mastectomía. En este caso se extrae todo el tejido mamario y algunos tejidos cercanos. En algunos casos algunas mujeres se someten a una mastectomía doble para extirpar ambos senos en casos de estética, mujeres con cáncer en ambas mamas o posibles apariciones futuras de cáncer en el otro seno. Normalmente, las pacientes con cáncer de mama no sólo se someten a la extirpación del cáncer como tal, sino que también se les efectúa una cirugía para extirpar ganglios linfáticos adyacentes. Esto se realiza para examinar en el laboratorio si los ganglios linfáticos axilares han sido afectados y hay riesgo de metástasis. Si bien esto no es un tratamiento si no una prueba diagnóstica, que es a menudo utilizada para la determinación de la etapa del tumor. Esto fue visto con anterioridad en el apartado 2.4.1.3 en la biopsia de ganglios linfáticos. 2.6.1.2 Radioterapia La radioterapia es un tratamiento con partículas de alta energía que se utilizan para destruir las células cancerosas. Se suele utilizar como tratamiento junto con otros como pueda ser la mastectomía, cirugía con conservación del seno o si se ha propagado a otras partes del cuerpo. Se puede aplicar en todo el pecho si se ha realizado una cirugía con conservación, o a la pared torácica, cicatriz y lugares donde salía cualquier drenaje tras la operación en caso de haber aplicado una mastectomía. También se puede aplicar radiación en los ganglios linfáticos axilares si tras una biopsia se han encontrado hallazgos malignos. 16 2.6.2 Tratamientos sistémicos Aquellos tratamientos que se usan para tratar el cáncer de mama pero que pueden llegar a las células cancerosas en casi todo el cuerpo son llamados tratamientos sistémicos. Diferenciamos cuatro tipos: 2.6.2.1 Quimioterapia Podemos diferenciar entre dos terapias, que son distinguidas dependiendo del periodo de la enfermedad en el que se realice el tratamiento. La terapia que utiliza quimioterapia después de la cirugía es la nombrada como adyuvante. Trata de eliminar las células cancerosas que puedan haber quedado o propagado y que no pueden verse. Es una forma de evitar la aparición de metástasis. Por otra parte, aquella quimioterapia que se usa previa a la cirugía se la llama neoadyuvante (término antes estudiado en el apartado 2.4.4). Se utiliza para reducir el tamaño del tumor de modo que se pueda extirpar realizando una cirugía menos extensa y por lo tanto menos dolorosa e invasiva. Cabe destacar que la quimioterapia también se puede utilizar para casos en los que el cáncer de seno es muy avanzado y hubiese provocado metástasis. Esto se realiza para intentar eliminar esa propagación. La quimioterapia se administra en ciclos, seguido de un periodo de descanso. La duración de cada ciclo suele estar entorno a dos o tres semanas y se realizarán tantos ciclos como la paciente necesite, dependiendo del cáncer que sufra y de los medicamentos utilizados. 2.6.2.2 Hormonoterapia La terapia hormonal a menudo se utiliza tras la cirugía (cómo terapia adyuvante) para reducir el riesgo de una recidiva, aunque a veces se puede usar previa a la cirugía como terapia neoadyuvante. Es un tratamiento de larga duración que se administra entorno al rango de cinco a diez años. Estos medicamentos actúan sobre los receptores hormonales evitando el crecimiento de células. 2.6.2.3 Terapia dirigida La terapia dirigida es aquella en la que se utilizan medicamentos que funcionan de manera distinta a aquellos administrados en la quimioterapia. Algunos ejemplos son los anticuerpos monoclonalesutilizados para tratar cánceres con HER2 positivo, las cuales son proteínas del sistema inmunitario que se unen a la proteína HER2 para detener el crecimiento de las células. Otros tratamientos incluidos en la terapia dirigida serían los inhibidores de cinasas o los conjugados de anticuerpos y medicamentos. 2.6.2.4 Inmunoterapia La inmunoterapia es aquella que utiliza diversos medicamentos para estimular el sistema inmunitario de la paciente, de este modo el propio cuerpo destruirá las células cancerosas con más eficacia. 17 Capítulo 3. Tecnologías empleadas Una vez presentadas las variables más típicas del cáncer de mama, en este capítulo se procede a la explicación de las tecnologías que han sido precisadas para la creación y ejecución de esta aplicación, que hace uso de dichas variables para su visualización. Se presentarán las herramientas y se expondrá la razón de su elección en lugar de otras opciones similares. Para ello, se ha considerado aspectos importantes de estas tecnologías como la eficiencia, accesibilidad, estabilidad y escalabilidad que proporcionan. Asimismo, se describirá para qué se han utilizado y cómo todas ellas se integran en el proyecto alcanzando los objetivos propuestos inicialmente. 3.1 Python Python es un lenguaje de programación de alto nivel creado por un programador de computación llamado Guido Van Rossum en 1989. Es ampliamente utilizado en las aplicaciones web, desarrollo de software, ciencia de datos y Machine Learning. Sus principales características son [21]: • Es un lenguaje interpretado: el código se ejecuta línea por línea y se detiene si hay un error en el código. • Es un lenguaje fácil de utilizar: es intuitivo y prescinde del uso de llaves, utilizando en su lugar sangrías. • Es un lenguaje tipado dinámicamente: no hace falta determinar el tipo de las variables, lo que lo vuelve más flexible. • Es un lenguaje de alto nivel: es más cercano al lenguaje natural que otros lenguajes de programación. Abstrae al programador de funcionalidades subyacentes como la arquitectura o la administración de memoria. • Es un lenguaje orientado a objetos: Python considera todo como un objeto, aunque también permite la programación estructurada y funcional. La decisión de elegir Python frente a otros lenguajes de programación como Java o C para este proyecto es que cuenta con un gran potencial y herramientas para el procesamiento de grandes conjuntos de datos. Esto viene de que cuenta con frameworks, librerías y medios de visualización muy útiles para el desarrollo web y manejo de datos; estas se mostrarán más adelante. 3.1.1 Django Django es un software que permite desarrollar aplicaciones web de forma rápida y eficiente. Permite implementar una redefinición del Modelo-Vista-Controlador (MVC) llamado MVT (Model-View-Template) 18 Figura 6. Esquema MVT El MVT ofrece una serie de ventajas para el desarrollo web. Cómo se puede observar en la Figura 6 el desarrollo se divide en varias secciones llamadas modelos, plantillas y vistas. Esto facilita la programación con ello, abstrae al programador de las conexiones entre estas clases y facilita las tareas de programación. Además, cabe destacar el potencial de Django en otras funciones como la gestión de usuarios pues ofrece un panel de administración y una serie de funciones para ello. Django ofrece también funcionalidades en cuanto a seguridad, como es el ejemplo de cuando un usuario se registra automáticamente la contraseña se almacena mediante un algoritmo de hash SHA256, el cual ofrece más seguridad a aquellos datos que se almacenan del profesional de la salud que se registra en el sistema [22]. Se ha decidido utilizar Django por varios motivos. El empleo de Python condiciona el uso de este framework pues es un marco de trabajo de este lenguaje. Otro de los motivos es que, aunque otras herramientas como Spring de Java ofrecen modelos parecidos (Modelo-Vista-Controlador), son más complejos de aprender y al tener un tiempo reducido, la curva de aprendizaje con Django es menor por lo que se obtendrán resultados mejores con esta tecnología. Sin duda se han tenido en cuenta las funcionalidades aparte de la arquitectura que son de gran utilidad. 3.2 Tecnologías Web Debido a la accesibilidad y la facilidad de mostrar actualizaciones se ha optado a diseñar una aplicación web. A continuación, se mostrarán aquellas tecnologías utilizadas para su desarrollo. 3.2.1 HTML HTML fue inventado por Tim Berners-Lee en 1991 como un sistema hipertexto con el único objetivo de servir como medio de transmisión de información entre los científicos [23]. Es el formato de los documentos de la World Wide Web, por tanto, es perfecto para ser utilizado para crear páginas web. Sus principales características que lo hacen perfecto para el proyecto son: 19 • Es un lenguaje estandarizado, reconocido por la mayoría de los navegadores web. • Es multiplataforma, es decir, puede ser visualizado por cualquier sistema operativo que tenga acceso a un navegador. • Es un lenguaje de etiquetado fácil de aprender. Junto con las herramientas que se encuentran dentro de este epígrafe 3.2, lo convierten en la tecnología ideal para este proyecto. 3.2.2 CSS y Bootstrap En cuanto a realizar una interfaz atractiva, intuitiva y que sea de fácil aprendizaje para el profesional de la salud que la esté utilizando podemos hablar de CSS y Bootstrap. CSS es un lenguaje que da diseño y presentación a las páginas web. Funciona junto con HTML. Bootstrap es un framework o marco de trabajo de CSS de modo que ofrece una serie de elementos diseñados y mejorados de tal forma que ya sean creados de forma “Responsive2”, de este modo se adapta al minimizarlo, maximizarlo, utilizarlo en otro dispositivo como pueda ser un móvil o entre dos monitores de distintas resoluciones. Mediante la combinación de Bootstrap y la edición de los fragmentos de código CSS que contiene se le dará un aspecto a la página web, cuya estructura viene determinada por HTML. 3.2.3 JavaScript y Ajax Ajax es un conjunto de técnicas de desarrollo web que permiten que las aplicaciones web funcionen de manera asíncrona, procesando cualquier solicitud al servidor en segundo plano. Es una combinación de JavaScript con XML de tal forma que permite gestionar el contenido dinámico de un sitio web. Esto es de gran utilidad para mostrar desplegables que se vayan mostrando según el usuario interactúa con la página web sin necesidad de recargar la página. Vuelve a la página web más interactiva, dinámica y atractiva. Al no necesitar recargar la página, lo convierte también en un proceso que no carga innecesariamente el servidor. La comparación entre el modelo convencional y el que proporciona Ajax viene dado por la Figura 7. Cómo podemos observar, para evitar cargas innecesarias y que la página responda de una manera dinámica se precisa el uso de Ajax [24]. 2 Responsive: accesible y adaptable en cualquier dispositivo 20 Figura 7. Comparación modelo convencional y el proporcionado por Ajax 3.3 Bases de datos En nuestra aplicación necesitamos las bases de datos para tres principales motivos: almacenar los usuarios, las cohortes y por último se debe permitir el acceso a una base de datos ubicada en un servidor del Centro de Tecnología Biomédica para acceder a los datos de los pacientes. Las dos primeras son gestionadas por SQLite y la tercera por MySQL. Para ello se ha necesitado el uso de SQL para realizar las consultas a la base de datos. 3.3.1 SQLite SQLite es un gestor de bases de datos integrado con Django. Provee una base de datos ligera basada en disco que no requiere un proceso de servidor separado y permite acceder a la base de datos usando una variación no estándar del lenguaje de consulta SQL [25]. Para la visualización de esta base de datos se ha utilizado la herramienta DBBrowser. 3.3.2 MySQL MySQL es un gestor de bases de datos relacionales potente, versátil y muy utilizado. Es el sistema gestor de bases de datos más popular de internet y open source [26]. Se ha utilizado para el acceso a la base de datos proporcionada por el CTB en el que se almacenan todos los datos de los pacientes con cáncer de mama. 3.4 Sistemas de control de versiones Ante la edición de código simultáneamente por varios desarrolladores, se ha precisado el uso de una plataforma en la que se pudiese tener un control de versiones y trabajar de forma paralela. La elección de esta herramienta ha sido Gitlab. 21 3.4.1 Gitlab Gitlab es una plataforma de control de versiones que mejora la colaboración y visibilidad a la hora de trabajar con un equipo. Esto permite recuperar código funcional y mantener una visión general de cómo evoluciona el código. El hecho de elegirla frente a otras plataformas como pudiese ser Github se debe a que todo el equipo estaba familiarizado con Gitlab y las diferencias entre una herramienta y la otra son demasiado pequeñas para considerar las mejoras que pudiesen ofrecer las alternativas. 3.5 Visualización de datos La necesidad de crear gráficos para poder mostrar los datos de los pacientes de una forma que los médicos o investigadores tuviesen una mejor visualización de estos llevó a la investigación de herramientas para dicha función. 3.5.1 Plotly Plotly es una librería de Python que proporciona gráficos de alta calidad e interactivos. Tiene una gran variedad de tipos de gráficos donde elegir, lo que lo hace una herramienta muy útil. Al permitir mostrar los datos de distintas formas (porcentaje, valor numérico) y además de una forma interactiva la convierte en la elección frente a otras librerías de visualización como Matpotlib que crea archivos png por defecto, sin hacer que el usuario pueda recortar, seleccionar datos o hacer filtros del propio gráfico. 3.5.2 Lifelines Lifelines es una librería de Python que proporciona gráficos de curva de supervivencia [27]. Esta ha sido utilizada para realizar las gráficas de Kaplan Meier. Al ser una tarea tan específica, el abanico de herramientas que ofrecen este tipo de gráficas es muy reducido y combinado con Plotly podía graficar elementos interactivos, por lo que ha sido la mejor elección para esta tarea. 3.6 Prototipado Previo al desarrollo se decidió realizar un prototipo para ver si las funcionalidades eran las pedidas. En ingeniería es de gran utilidad la realización de prototipos pues muestra una idea general del producto final. A continuación, se muestra la herramienta utilizada para dicho prototipado. 3.6.1 Figma Figma es una herramienta que incluye la realización de prototipos de alta fidelidad tanto para smartphone como para diseño web en ordenador. Es de fácil uso y la realización del prototipo e intuitivo. No requiere descargar ningún software a diferencia de otras tecnologías como pueda ser “justinmind”. 22 Capítulo 4. Validación de datos En este capítulo se va a exponer el proceso de validación, así como aquellos campos que se han decidido incluir y sus criterios para su evaluación. Todos ellos después serán introducidos en la base de datos del servidor para su posterior visualización en la aplicación desarrollada. 4.1 ¿Qué es la validación de datos? La validación de datos es el proceso mediante el cual se asegura de que los datos introducidos en la base de datos son completos, correctos y precisos. En este proceso de validación se ha accedido a la historia clínica de un conjunto de pacientes para ver unos determinados datos y poder extraerlos para su posterior volcado en la base de datos ubicada en el servidor del CTB (Centro de Tecnología Biomédica). De este modo, al estar en tablas, es más fácil acceder a ellos para una posterior visualización. Se ha establecido un consenso a la hora de recoger esta información para que toda ella se encuentre de forma uniforme y poder trabajar a la hora de visualizarla. La muestra de pacientes validados es de 389, mientras que el de tumores es 456. 4.2 Campos que validar Los datos que van a ser validados en este aparto, previamente han sido extraídos mediante técnicas de Procesamiento del Lenguaje Natural (fuera del alcance de este trabajo). Sin embargo, se detectaron incongruencias que han llevado a este proceso de validación para asegurar su veracidad. En la Tabla 2 se exponen aquellos campos que han sido validados, su significado y los valores posibles que pueden tomar. Tabla 2. Campos validados en el proceso de validación de datos Nombre del campo Significado del campo Valores posibles ehr Identificador único de paciente 0 ≤ ehr ≤ n, ehr ∈ ℤ n_tumor Identificador único del tumor dentro del paciente 0 ≤ n_tumor ≤ n, n_tumor ∈ ℤ date Fecha de diagnóstico. Suele coincidir con la fecha del informe anatomopatológico date ∈ {fechas} Siendo fechas, aquellas comprendidas entre el nacimiento de la paciente y, dependiendo de si la paciente ha fallecido o no, fecha de defunción o fecha actual. 23 side Es la mama afectada por el cáncer. side ∈ {R, L} siendo R la mama derecha y L la mama izquierda neoadjuvant Indica si la paciente ha tenido tratamiento neoadyuvante, concepto anteriormente explicado en 2.4.4 neoadjuvant ∈ {yes, no} t_prefix En la notación TNM, (esta notación vino explicada en el apartado 2.4.5) el prefijo de la t se refiere a si el hallazgo del tumor ha sido clínico o patológico. Esto viene explicado en los apartados 2.4.2 y 2.4.4 t_prefix ∈ {C, P} siendo C “clínico” y P “patológico” t Es el valor de la t e indica el tamaño del tumor o su localización en el caso de ser in situ. t ∈ {IS, 0,1,2,3,4} Siendo IS “in situ” y la numeración la relativa al tamaño. 0 indica que no hay tumor primario y del 1 al 4 se expresa el tamaño de este siendo 1 el tamaño más pequeño y el 4 el más grande. n_prefix Se siguen los mismos criterios que para t_prefix n_prefix ∈ {C, P} siendo C “clínico” y P “patológico” n Mide la afectación a los ganglios linfáticos. n ∈ {0,1,2,3} siendo 0 la expresión utilizada para indicar que no hay afectación ganglionar y del 1 al 3 para expresar una menor o mayor afectación correspondientemente n_sub Se utiliza para indicar si hay presencia de micrometástasis n_sub ∈ {MI, Ø}. Si hay presencia de micrometástasis, se indica con “MI”. Si no hay nada, el campo se deja vacío. m Se utiliza para indicar si hay presencia de metástasis m ∈ {0,1}. El valor de 0 indica la no presencia de metástasis, mientras que el uno indica que hay hallazgos de extensión 24 t_prefix_neo Sigue los mismos criterios que t_prefix, pero son aquellos extraídos tras el tratamiento neoadyuvante. t_prefix_neo ∈ {C, P} siendo C “clínico” y P “patológico” t_neo Sigue los mismos criterios que t, pero son aquellos extraídos tras el tratamiento neoadyuvante. t_neo ∈ {IS, 0,1,2,3,4} Siendo IS “in situ” y la numeración la relativa al tamaño. 0 indica que no hay tumor primario y del 1 al 4 se expresa el tamaño de este siendo 1 el tamaño más pequeño y el 4 el más grande. n_prefix_neo Sigue los mismos criterios que n_prefix, pero son aquellos extraídos tras el tratamiento neoadyuvante. n_prefix_neo ∈ {C, P} siendo C “clínico” y P “patológico” n_neo Sigue los mismos criterios que n, pero son aquellos extraídos tras el tratamiento neoadyuvante. n ∈ {0,1,2,3} siendo 0 la expresión utilizada para indicar que no hay afectación ganglionar y del 1 al 3 para expresar una menor o mayor afectación correspondientemente n_sub_neo Sigue los mismos criterios que n_sub, pero son aquellos extraídos tras el tratamiento neoadyuvante. n_sub ∈ {MI, Ø}. Si hay presencia de micrometástasis, se indica con “MI”.
Compartir