Logo Studenta

Diagnóstico de Neumonía en Neonatos

¡Este material tiene más páginas!

Vista previa del material en texto

DIAGNÓSTICO DE NEUMONÍA EN NEONATOS CON 
INTELIGENCIA ARTIFICIAL A TRAVÉS DE RADIOGRAFÍAS 
DE TÓRAX 
 
 
 
 
 
DAVID SANTIAGO RESTREPO VALENCIA 67000104 
 
 
 
TRABAJO DE GRADO 
 
 
 
 
ASESOR: VERONICA CASTRO MUNAR 
 
 
 
 
UNIVERSIDAD CATOLICA DE COLOMBIA 
FACULTAD DE INGENIERIA 
PROGRAMA INGENIERIA DE SISTEMAS Y COMPUTAICON 
TRABAJO DE INVESTIGACION Y TECNOLOGIA 
BOGOTA D.C 
2021 
 
 
 
 
 
 
 
 
 
DIAGNÓSTICO DE NEUMONÍA EN NEONATOS CON 
INTELIGENCIA ARTIFICIAL A TRAVÉS DE RADIOGRAFÍAS 
DE TÓRAX 
 
 
 
Autor 
DAVID SANTIAGO RESTREPO VALENCIA 
 
 
Propuesta de Trabajo de grado presentado como requisito 
para optar al título de 
INGENIERO DE SISTEMAS Y COMPUTACIÓN 
 
Asesor: Verónica Castro Munar 
 
 
Co-Asesores: 
Md Luis Carlos Méndez Córdova 
 
 
INGENIERÍA DE SISTEMAS Y COMPUTACIÓN 
FACULTAD DE INGENIERÍA 
UNIVERSIDAD CATÓLICA DE COLOMBIA 
BOGOTÁ, 
2021 
 
 
https://creativecommons.org/licenses/by/4.0/deed.es 
 
https://creativecommons.org/licenses/by/4.0/deed.es
 
 
 
AGRADECIMIENTOS 
 
 
Agradezco principalmente a Dios por la oportunidad y privilegio de poder estudiar y 
culminar mi estudio profesional, a mi familias, amigos y conocidos que estuvieron 
presentes en todo el proceso de crecimiento y que nos dieron lo mejor de ellos para 
avanzar hasta el final. 
 
De la misma manera a mi madre Diana valencia, y a mi tío Andrés Valencia por ser 
los principales promovedores del cumplimiento de mis metas y mis sueños, por 
confiar plenamente en mis capacidades: Agradecer por los valores, principios y 
consejos que me han formado e instruido para hoy ser la persona quien soy. 
 
Agradecimientos los docentes de la Universidad Católica de Colombia, por haber 
compartido sus conocimientos en el transcurso y preparación como profesional, 
Dar gracias a la ingeniera Verónica Castro Munar por apoyar nuestra idea y 
compartir sus conocimientos. Y finalmente pero no menos importante agradecer de 
manera especial al Doctor Luis Carlos Méndez Córdoba quien fue el apoyo en el 
área de la medicina, donde guio, instruyo con paciencia para trasferir sus 
conocimientos y habilidades aportando todo lo mejor para este proyecto de 
investigación. 
 
 
 
DEDICATORIA 
 
Dedico este trabajo principalmente a Dios, por haberme dado la vida y permitirme 
haber llegado hasta este momento que es tan importante para mi vida, y como 
formación profesional. 
 
Además, Este trabajo lo dedico a mi familia por ser mi apoyo incondicional para 
culminar mi carrera como ingeniero de sistemas y computación con éxito. A mi 
madre Paola Valencia que me dio su apoyo en todo momento y sus palabras de 
aliento, a mi tío Andrés Valencia por su concejos incondicionales y apoyo moral, a 
mi abuelita Leonor Rojas por su acompañamiento permanente en esta etapa, y final 
mente a mi abuelo Carlos Valencia por comprensión y respaldo en este proceso. 
 
 
 
 
 
 
 
RESUMEN ............................................................................................................. 18 
ABSTRACT ............................................................................................................ 19 
INTRODUCCION ................................................................................................... 20 
1. PROBLEMA DE INVESTIGACION ................................................................. 23 
1.1. Planteamiento del problema ..................................................................... 23 
1.2. Formulación de la pregunta problema ...................................................... 24 
1.3. Sistematización del problema ................................................................... 24 
2 OBJETIVOS .................................................................................................... 26 
2.1. Objetivo general ........................................................................................ 26 
2.2. Objetivos específicos ................................................................................ 26 
3 JUSTIFICAION ................................................................................................ 27 
4 MARCO DE REFERENCIA ............................................................................. 28 
4.1. Marco teórico ............................................................................................ 28 
4.1.1. Machine learning, deep learning y inteligencia artificial ...................... 28 
4.1.2. Machine learning ................................................................................ 28 
4.1.3. Deep learning y aprendizaje profundo ................................................ 29 
4.1.4. Convolucional Neuronal Networks (CNN) .......................................... 29 
4.2. Marco conceptual ..................................................................................... 40 
4.2.1. Desarrollo funcional del aparato respiratorio ...................................... 40 
4.2.2. Embriología y sistema respiratorio ..................................................... 40 
4.2.3. Desarrollo pulmonar fetal o prenatal .................................................. 41 
4.3. Estado del arte .......................................................................................... 52 
4.4. Herramientas de software utilizado ........................................................... 55 
4.4.1. Python ................................................................................................ 55 
4.4.3. React .................................................................................................. 56 
4.4.4. Visual Studio Code: ............................................................................ 56 
4.4.5. Portman .............................................................................................. 56 
4.4.6. Google Colab ..................................................................................... 56 
4.4.7. Bootstrap ............................................................................................ 57 
4.4.8. C# ....................................................................................................... 57 
5 METODOLOGÍA .............................................................................................. 58 
 
 
 
5.1. Fase 1: Estructuración e interpretación de datos ...................................... 58 
5.2. Fase 2: Construcción y entrenamiento del modelo ................................... 59 
5.3. Fase 4: Evaluación del algoritmo .............................................................. 62 
5.4. Fase 5: Desarrollo de aplicativo web ........................................................ 63 
6 RECOPILACION DE DATOS .......................................................................... 65 
6.1. Dataset elegidos ....................................................................................... 65 
6.2. Dataset Final ............................................................................................. 66 
7 DEFINICION DE VARIABLES DE ENTRADA Y DE SALIDA .......................... 68 
7.1. Selección de características ..................................................................... 69 
7.2. Variables de entrada ................................................................................. 69 
7.3. Variables de salida ................................................................................... 70 
8 MODELOS CONSTRUIDOS ........................................................................... 71 
8.1. Modelos base ........................................................................................... 71 
8.2. Modelo por algoritmo AlexNet ................................................................... 72 
8.3. Modelo por algoritmo VGG16 ................................................................... 74 
8.4. Comparación de resultados obtenidos......................................................76 
8.5. Validación del modelo ............................................................................... 81 
9 CONSTRUCCIÓN PÁGINA WEB ................................................................... 83 
9.1. Modelado funcional ................................................................................... 83 
9.1.1. Definición del producto a obtener ....................................................... 83 
9.1.2. Requerimientos específicos de interfaces .......................................... 83 
9.1.3. Caracterización del producto de software .......................................... 84 
9.2. Modelado Estructural .............................................................................. 102 
9.2.1. Diagrama de clases .......................................................................... 102 
9.2.2. Diccionario de clases ....................................................................... 102 
9.2.3. Modelo de persistencia .................................................................... 105 
10. CASO CLINICO ......................................................................................... 109 
11. CONCLUSIONES ...................................................................................... 113 
12. RECOMENDACIONES A TRABAJOS FUTUROS ..................................... 114 
13. REFERENCIAS .......................................................................................... 115 
14. ANEXOS .................................................................................................... 121 
 
 
 
 
 
TABLA DE FIGURAS 
 
 
Figura 1. Ejemplo de radiografías de tórax, con hallazgos de los bronquiolos ...... 21 
Figura 2. Radiografía de tórax en proyección antero - posterior y lateral............... 25 
Figura 3. Intelligence Artificial, Machine Learning y Deep Learning ....................... 28 
Figura 4 Convolucional Neuronal Networks ........................................................... 29 
Figura 5. Estructura red nuronal artificial ............................................................... 30 
Figura 6. Esquema de una Red Neuronal (Pesos, Función de activacion) ........... 31 
Figura 7. Convolución que alimenta a la siguiente capa de entrada ...................... 32 
Figura 8. Esquema general de CNN ...................................................................... 33 
Figura 9. Depth and stride ...................................................................................... 34 
Figura 10. Arquitectura modelo LeNet-5 ................................................................ 35 
Figura 11. Arquitectura modelo AlexNet ................................................................ 35 
Figura 12. Arquitectura VGG16 con parametros de entrada y salida ..................... 36 
Figura 13. Arquitectura del modelo VGG16 ........................................................... 37 
Figura 14. Arquitectura de ResNet ......................................................................... 39 
Figura 15. Mapa de activación de clases para modelos de aprendizaje ................ 40 
Figura 16. Desarrollo pulmonar .............................................................................. 41 
Figura 17. Período pseudoglandular ...................................................................... 42 
Figura 18. Alveolo .................................................................................................. 43 
Figura 19. Trabajo respiratorio ............................................................................... 45 
Figura 20. Tórax ..................................................................................................... 45 
Figura 21. Faringe .................................................................................................. 46 
Figura 22. Tráquea................................................................................................. 47 
Figura 23. Laringe .................................................................................................. 47 
Figura 24. Neumonía en pulmones ........................................................................ 48 
Figura 25. Radiografía de tórax ............................................................................. 51 
Figura 26. Diagnóstico por radiografía ................................................................... 52 
Figura 27. Detección de neumonía en una imagen por recuadros ........................ 54 
Figura 28. Metodología .......................................................................................... 58 
Figura 29. Librerías de Python. .............................................................................. 59 
Figura 30. Esquema de la arquitectura propuesta para la implementación de modelo
 ............................................................................................................................... 60 
Figura 31. Diagrama de bloques del algoritmo ...................................................... 61 
Figura 32. Configuración de entorno en Google Colab. ......................................... 61 
Figura 33. Arquitectura de funcionamento de aplicativo web ................................. 63 
Figura 34. Arquitectura de los archivos del dataset con cantidad de imágenes 
disponibles por carpeta .......................................................................................... 66 
Figura 35. Árbol de diagrama de entrada de imagen por dos modelos.................. 68 
Figura 36. Cambio de imagen de rescala de entrada ............................................ 70 
Figura 37. Parametros de salida ............................................................................ 70 
 
 
 
Figura 38. Arquitectura simpre de una red neuronal .............................................. 71 
Figura 39. Perceptron red neuronal ....................................................................... 72 
Figura 40. Maquetacion Grafica del modelo de AlexNet ........................................ 72 
Figura 41 Modelo AlexNet implementado en google colab mostrando la arquitectura 
de la red neuronal .................................................................................................. 73 
Figura 42 Maquetacion Grafica del modelo de VGG16 .......................................... 74 
Figura 43 Modelo VGG16 implementado en google colab mostrando la arquitectura 
de la red neuronal .................................................................................................. 75 
Figura 44. Grafica de Accuracy vs épocas Alexnet ................................................ 77 
Figura 45. Grafica de Loss vs Epocas Alexnet ...................................................... 77 
Figura 46. Grafica de Loss vs Epocas VGG16 ...................................................... 78 
Figura 47. Grafica de Accuracy vs épocas VGG16 ................................................ 79 
Figura 48 Tiempo de ejecución .............................................................................. 79 
Figura 49. Comparacion de modelos ..................................................................... 80 
Figura 50. Parametros de visualizacion del modelo ............................................... 82 
Figura 51. Actres del sistema ................................................................................. 85 
Figura 52. Ejecucion de la aplicacion web ............................................................. 85 
Figura 53. Seleccionar patología ........................................................................... 86 
Figura 54. Cargar la imagen .................................................................................. 86 
Figura 55. Ver predidcion del modelo .................................................................... 87 
Figura 56. Iniciar sesión .........................................................................................96 
Figura 57. Registrarse ............................................................................................ 97 
Figura 58. Cerrar sesion ........................................................................................ 98 
Figura 59. Menu de patologias ............................................................................... 99 
Figura 60. Neumonía ........................................................................................... 100 
Figura 61. Cargar imagen .................................................................................... 100 
Figura 62. Generar diagnostico ............................................................................ 101 
Figura 63. Diagrama de clases ............................................................................ 102 
Figura 64. Mapa de navegacion del aplicativo web.............................................. 106 
Figura 65. Costo de la app service....................................................................... 108 
Figura 66. Componentes app Service .................................................................. 108 
Figura 67. Radiografias de torax caso clinico ...................................................... 110 
Figura 68. Radiografia 1 caso clinico con dictamen medico. ............................... 111 
Figura 69. Radiografia 2 caso clinico complicacion.............................................. 111 
 
 
 
 
ÍNDICE DE TABLAS 
 
Tabla 1. Comparación de los cinco mejores modelos de clasificación de 
arquitecuras de red clásicas con pruebas ILSVRC ............................................... 37 
Tabla 2. Tamaño de datasets encontrados, definidos por carpetas. ...................... 66 
Tabla 3. Metricas de evaluacion Alexnet ................................................................ 76 
Tabla 4. Metricas de evaluacion de algotimo VGG16 ............................................ 78 
Tabla 5. Comparación resultados .......................................................................... 80 
Tabla 6. Falsos positivos ........................................................................................ 81 
Tabla 7. Requerimientos funcionales ..................................................................... 84 
Tabla 8. Iniciar sesión ............................................................................................ 88 
Tabla 9. Registrar usuario ...................................................................................... 89 
Tabla 10. Cerrar sesión .......................................................................................... 90 
Tabla 11. Seleccionar patología ............................................................................. 91 
Tabla 12. Seleccionar neumonia ............................................................................ 92 
Tabla 13. Cargar imagen ....................................................................................... 93 
Tabla 14. Generar diagnostico ............................................................................... 94 
Tabla 15. Ver resultados ........................................................................................ 95 
Tabla 16. Clase usuario ....................................................................................... 103 
Tabla 17. Clase sesión ......................................................................................... 103 
Table 18. Clase Diagnostico ................................................................................ 104 
 
 
 
 
 
 
TABLA DE ECUACIONES 
Ecuación 1. Sumatoria salida de neurona .............................................................. 31 
Ecuación 2. Sensibilidad ........................................................................................ 62 
Ecuación 3. Precision ............................................................................................. 63 
Ecuación 4. Sensibilidad ........................................................................................ 81 
Ecuación 5. Especificidad ...................................................................................... 81 
 
 
 
 
 
 
TABLA DE ANEXOS 
 
Anexo 1. Conjunto de datos: ............................................................................... 121 
Anexo 2. Repositorio de código modelo 1, basado en arquitectura VGG16 ........ 121 
Anexo 3. Repositorio de código modelo 2, basado en arquitectura AlexNet ........ 121 
Anexo 4. Repositorio de código del API ............................................................... 121 
Anexo 5. Repositorio de código del BackEnd ...................................................... 121 
Anexo 6. Repositorio de código del FrontEnd ...................................................... 121 
Anexo 7. Reunion caso clinico doctor Luis Carlos Mendez Cordoba ................... 122 
 
 
 
PERIODO: 2021-3 
PROGRAMA ACADÉMICO: Ingeniería de sistemas y computación 
ESTUDIANTE: 
NOMBRE: David Santiago Restrepo Valencia CÓDIGO: 67000104 
CORREO: dsrestrepo04@ucatolica.edu.co 
 
DIRECTOR SUGERIDO: Verónica Castro Munar 
ALTERNATIVA: Trabajo de investigación 
 
 
TÍTULO 
Diagnóstico de neumonía en neonatos con inteligencia artificial a través de 
radiografías de tórax 
 
ALTERNATIVA 
Teniendo en cuenta Acuerdo 265/2018: “Por el cual se aprueban los lineamientos 
y las opciones de grado para los programas académicos de la Facultad de 
Ingeniería de la Universidad Católica de Colombia”. Se elige la alternativa de 
trabajo de investigación. 
 
LÍNEA DE INVESTIGACIÓN 
Modelos estocásticos. Modelo Deep learning basado en la arquitectura VGG16 
para detección de neumonía a través de imágenes de radiografías de tórax en 
pacientes neonatales. 
 
EJE TEMÁTICO 
La temática principal abarca generar un modelo de aprendizaje profundo que 
permita identificar neumonía infantil por medio de imágenes de radiografías de 
tórax, apoyando en la al diagnóstico del especialista tratante. Además, proporcionar 
un sistema de telemedicina que permita reconocer el modelo, y generar 
predicciones. 
 
 
 
 
 
 
 
RESUMEN 
 
 
La neumonía infantil es la causante de la muerte de alrededor de 700.000 niños 
cada año sin respetar el orden, género o razón social. [1] Las radiografías de tórax 
son utilizadas para el diagnóstico de esta patología. Sin embargo, para un radiólogo 
que no cuente con la experticia se puede tornar complicado diagnosticar esta 
enfermedad. Además de esto en las zonas rurales muchas veces no se cuenta con 
la presencia de un especialista para detectar a tiempo la enfermedad pulmonar. En 
este trabajo se propone un algoritmo eficiente para la detección temprana y 
oportuna de la neumonía, entrenado por imágenes de radiografía digital de tórax, 
esto podría ayudar significativamente a los radiólogos con la toma de decisiones y 
más aun presentando ayuda a los centros médicos en lugares apartados ya que no 
cuentan con los equipos médicos y el personal calificado. 
 
El algoritmo propuesto está a la vanguardia de los modelos de aprendizaje 
modernos de última generación contando con AlexNet, GoogleNet, VGGNet y 
ResNet [2]. Esto da una orientación del algoritmo con un aprendizaje supervisado 
en el cual la red neuronal va a arrojar el resultado o predicción con respecto al 
conjunto de datos utilizado este tipo de aprendizaje se distingue por el tipo de 
variable que se usará. ya que el modelo se implementa de tipo categórico. 
 
Finalmente, el modelo se evaluará con respecto al porcentaje de salida del 
accuracy y la valoración del médico Md Luis Carlos Méndez Córdoba neumólogo 
del Hospital Cardio Infantil, el cual evaluará la predicción del modelo para certificar 
que el algoritmo ya que se puede utilizar para el diagnóstico rápido de la neumonía 
neonatal y que puede ayudar a los radiólogos en el proceso retrasado del 
diagnóstico. 
 
Teniendoen cuenta de que se presentan tiempos de validación de por parte del 
personal médico de 15 minutos en promedio teniendo en cuenta la pericia del 
radiólogo datos proporcionados por el Medico tutor de la tesis, en promedio el 
algoritmo está contando de un procesamiento por imagen de 0.75 segundos de la 
cual valida la radiografía y envía un parámetro de salida que es, la predicción 
computacional obtenida. 
 
 
Palabras clave: X-ray, Inteligencia artificial, reconocimiento de formas, Sistema 
experto, análisis cuantitativo de imágenes, Deep convolucional neural, Conv2D 
 
 
 
 
 
ABSTRACT 
 
Childhood pneumonia is the cause of the death of around 700,000 children each 
year without respecting order, gender, or social reason. Chest X-rays are used for 
the diagnosis of this pathology. However, for a radiologist who does not have the 
expertise, it can become difficult to diagnose this disease. In addition to this, in rural 
areas, the presence of a specialist is often not available to detect lung disease in 
time [1]. This work proposes an efficient algorithm for the early and timely detection 
of pneumonia, trained by radiography images digital chest, this could significantly 
help radiologists with decision-making and even more by presenting help to medical 
centers in remote locations since they do not have the medical equipment and 
qualified personnel. 
 
The proposed algorithm is at the forefront of the latest generation modern learning 
models with AlexNet, GoogleNet, VGGNet, and ResNet [2].This gives an orientation 
of the algorithm with supervised learning in which the neural network will give the 
result or prediction with respect to the data set used, this type of learning is 
distinguished by the type of variable that will be used. since the model is 
implemented of a categorical type. 
 
Finally, the model will be evaluated with respect to the percentage of accuracy 
output and the assessment of the physician Md Luis Carlos Méndez Córdoba 
pulmonologist at the Hospital Cardio Infantil, who will evaluate the prediction of the 
model to certify that the algorithm can be used for diagnosis. of neonatal pneumonia 
and that can help radiologists in the delayed process of diagnosis. 
 
Taking into account that validation times are presented by the medical staff of 15 
minutes on average taking into account the expertise of the radiologist data provided 
by the medical tutor of the thesis, on average the algorithm is counting on an image 
processing of 0.75 seconds from which it validates the radiograph and sends an 
output parameter that is, the computational prediction obtained 
 
 
 
Keywords: X-rays, Artificial intelligence, shape recognition, Expert system, image 
quantitative analysis, Deep Convolutional Neural, conv2D. 
 
 
 
 
 
 
 
 
 
INTRODUCCION 
 
La neumonía es una infección respiratoria aguda que es catalogada como una de 
las enfermedades a neonatos más silenciosa y mortal, esta proporciona un gran 
porcentaje de defunciones de neonatos en el mundo. [1] La neumonía se toma la 
vida de más de 800.000 niños menores de 5 años [3], estas cifras que nos arrojan 
la organización mundial de la salud aclaran que es una enfermedad con más 
muertes neonatales por año debidas a infecciones respiratorias en los países en 
vías de desarrollo. [4] De los cuales hay un estimado de 3.9 a 10.8 millones de 
defunciones anuales en neonatos, dicha patología es la causante del 20 al 38% de 
las muertes en la primera 48 horas de vida del neonato, esta cifra hace referencia 
a la neumonía temprana, la cual comprende a los primeros 7 días de vida y es la 
más mortal. Además, se comprende también la neumonía tardía la cual abarca 
desde el día 8 al 28 de vida. [5] 
 
En América Latina según la asociación colombiana de neumología pediátrica, el 
94% de las muertes ocurren en catorce países, los cuales tienen un TMI (tasa de 
mortalidad infantil) mayor de 30/1000(treinta sobre mil nacidos vivos) nacidos vivos. 
 
Colombia está entre el grupo intermedio de países con un TMI entre 20 y 
30/1000(veinte y treinta sobre mil nacidos vivos) nacidos vivos, cercano a 28 que 
corresponde a 27.675 muertes por año. Por otro lado, según la organización 
panamericana de salud en 2003, Colombia tiene una tasa de mortalidad de 
menores de cinco años de 31 es decir que en el país mueren 48 niños diariamente 
por enfermedades prevenibles o fácilmente curables en su curso inicial. De estas 
muertes, 10%, es decir, al menos cuatro niños, son por neumonía [6]. 
 
Las infecciones respiratorias mantienen un riesgo elevado, esencialmente en 
enfermedades infecciosas transmisibles, principalmente las patologías que afectan 
el tracto respiratorio y el árbol pulmonar [7]. Pero la neumonía es una enfermedad 
que con el reconocimiento precoz o la identificación rápida se puede realizar el 
tratamiento oportuno. suministrando el uso de medicamentos y el procedimiento 
adecuado para el neonato. De esta manera se puede ayudar a reducir la mortalidad 
neonatal [8] que se presentan en el mundo. 
 
Generalmente el diagnóstico de una enfermedad depende casi exclusivamente de 
la experiencia del médico que ante un posible caso de neumonía y tras una 
valoración clínica inicial debe realizar necesariamente una radiografía de tórax 
(RxT) para establecer el diagnóstico más preciso. La necesidad de un diagnóstico 
eficaz y certero para identificar esta patología se contrasta con la repetitividad de 
los casos y la dificultad de identificar, entre múltiples anomalías pulmonares se 
torna complejo. A la hora de interpretar una radiografía de tórax por parte de un 
 
 
 
especialista su capacidad y su experiencia son claves [9] y más aun teniendo en 
cuenta que en regiones de nuestro país es complicado tener un radiólogo a la 
mano. Ver Figura 1. 
 
Figura 1. Ejemplo de radiografías de tórax, con hallazgos de los bronquiolos 
 
Fuente: Revista Clin, 
 
Mientras tanto los avances tecnológicos como la biomedicina y la inteligencia 
artificial o más específicamente el aprendizaje profundo se define como una ciencia 
e ingeniería para la fabricación de máquinas inteligentes y algoritmos capaces de 
procesar datos para tomar decisiones con respecto a un aprendizaje diseñado [10]. 
A través del uso de la misma se han llevado varios prototipos que generan 
resultados prometedores con respecto a los actores del sistema de salud como 
(laboratorios, prestadores de servicios, seguros y pacientes), generando optimizar 
significativamente el dinero y tiempo de los centros asistenciales de salud. 
 
El presente documento especifica el desarrollo de un algoritmo usando radiografías 
de tórax de neonatos obtenida como parámetro de entrada en el cual se usará las 
redes neuronales convolucionales para evaluar la detección de la infección 
pulmonar en neonatos o mejor llamada neumonía. 
 
El capítulo 1 define el problema de investigación, el capítulo 2 fija los objetivo tanto 
general cómo especifica, el capítulo 3 justifica la importancia del proyecto al 
determinas las ventajas que traería su correcta implementación, El capítulo 4 define 
los conceptos y métodos empleados, además de contextualizar, el capítulo 5 
precisa todas las actividades a ser desarrolladas, el capítulo 6 ilustra cómo se 
recolectaron los datos recolectados en el trabajo de investigación, el capítulo 7 
explica las entradas y salidas de los modelos, posteriormente en el capítulo 8 
detalla los procedimientos seguidos del algoritmo de redes neuronales 
convolucionales y la arquitectura utilizada para el modelo 1 VGG16 y el modelo 2 
de comparación AlexNet. En el capítulo 9 se describe los componentes, las 
herramientas y el funcionamiento de la aplicación web desarrollada para facilitar el 
uso y comprensión del modelo de inteligencia artificial. En el capítulo 10 se 
 
 
 
describirá un caso clínico, llevando a cabo la ejecución del modelo en un ambiente 
real. Finalmente,en el capítulo 11 se presenta las conclusiones, adicionalmente se 
incluye un anexo que contiene el manual de uso del aplicativo, además muestra la 
interfaz gráfica de este. 
 
23 
 
1. PROBLEMA DE INVESTIGACION 
 
1.1. Planteamiento del problema 
 
La neumonía es un problema de salud mundial que no entiende de estratos 
sociales ni culturales provocando millones de muertes cada año. Según datos 
de la UNICEF afirma que cada 39 segundos muere un niño por neumonía en 
todo el mundo. la neumonía es una enfermedad que mata a varios niños que 
cualquier otra infección [11], pero la mayor parte del riesgo de mortalidad 
infantil [12] se encuentra por la neumonía que en la infancia se encuentra en 
el período neonatal. Esta causa entre 700.000 y 1,2 millones de muertes de 
recién nacidos cada año, lo que representa el 10% de la tasa mundial de 
mortalidad infantil [13] ocurren en los países en desarrollo incluyendo 
Colombia que está en el grupo intermedio de países con el TMI (tasa de 
mortalidad infantil) cercano a 28% de muertes por año [6]. 
Por lo tanto, las radiografías de tórax se convierten en un método fundamental, 
las cuales sustituyen a las pruebas complejas cómo la oximetría y que también 
revelan el diagnóstico de esta enfermedad. Además, hay que mencionar que, 
al ser un intento de radiografía a un neonato, hace que la complejidad sea 
mayor, ya que es muy difícil lograr colocar al neonato en una posición ideal. 
Otro factor que también afecta es el sistema de salud, el cual tiene diferentes 
problemáticas presentes hoy en día, las cuales comprende a diferentes 
factores como la falta de personal calificado en zonas rurales y urbanas, el 
funcionamiento del sistema de salud, falta de historial médico, falta de 
infraestructura en zonas rurales y urbanas. 
En las zonas rurales hay una fuerte barrera a un sistema de salud digno. Según 
el ministerio de salud de Colombia estimó que en el 2017 había 869 
especialistas en radiología y 3.398 especialistas en pediatría. De los cuales la 
mayoría ejerce en Bogotá, Antioquia y Valle del Cauca, mientras que en 
departamentos alejados cómo Vichada y Vaupés no se reportó su presencia y 
son los departamentos con mayor tasa de mortalidad en menores de 5 años. 
Así mismo, teniendo en cuenta, que desde que se presenta los signos de una 
neumonía, un centro médico debe realizar el siguiente procedimiento: 
exploración física, radiografía de tórax, análisis de sangre, pulsioximetría y 
pruebas de esputo [14] que en promedio puede tardar 20 minutos y el 
tratamiento con antibiótico debe iniciarse después de 4 horas [15] desde el 
diagnóstico de la neumonía, se puede inferir que en el Distrito Capital de 
Bogotá se es eficiente en el tratamiento y diagnóstico de la neumonía en recién 
nacidos. 
 
 
24 
 
Considerando esto según el Ministerio de Salud de Colombia la diferencia 
abismal que presenta las zonas dispersas cómo Amazonas, Vaupés, Chocó y 
la Guajira. Al momento que los neonatos presentan signos y la aparición de 
tirones de pecho en el niño como una afección grave y buscaron un 
establecimiento médico donde pueda ser detectado, el tiempo transcurrido 
desde el inicio de la enfermedad hasta la búsqueda de atención en el 
establecimiento de salud fue de alrededor de dos días y medio [16]. Esta tasa 
de mortalidad por Infección respiratoria es un 88% más alta en el primer quintil 
de pobreza comparado con el último en Colombia, es decir, que se producen 
47.270 mil muertes más por (IRA) por cada 100.000 menores de cinco años 
en los departamentos con mayor pobreza multidimensional [17]. 
Teniendo en cuenta las cifras de defunciones de menores y las problemáticas 
que rodean esta enfermedad pulmonar, se tiene en cuenta que la detección 
temprana de esta patología es vital para salvaguardar la vida de los menores 
de 5 años [18]. Esta detección temprana en zonas rurales está condicionada 
por los retrasos del diagnóstico y del tratamiento, esto lleva que es necesario 
una reducción en el tiempo entre la toma de la radiografía de tórax y un apoyo 
al diagnóstico del pediatra que trate el caso. Por tanto, se propone 
implementar un modelo de Deep learning para hacer un diagnóstico de 
neumonía temprano a partir de radiografías de tórax asistiendo al diagnóstico 
del pediatra. 
 
1.2. Formulación de la pregunta problema 
Para el desarrollo de este trabajo se plantea la siguiente pregunta de 
investigación 
¿Cómo apoyar el proceso de diagnóstico de neumonía a través del aprendizaje 
profundo? 
 
1.3. Sistematización del problema 
 
Durante el planteamiento del problema y el análisis de la pregunta de 
investigación surgieron preguntas cómo: 
 
• ¿Es posible detectar todas las patologías asociadas a la neumonía con 
estas radiografías? 
• ¿Cómo caracterizar, o verificar la validez de la predicción del algoritmo? 
• ¿Es posible parametrizar todas las características en un mismo 
algoritmo? 
 
25 
 
• ¿Cuáles son los resultados obtenidos al implementar sistemas e-Health, 
o de predicción de enfermedades en hospitales? 
 
Entre otros elementos a tener en cuenta, se considera que en el análisis debe 
involucrar variables como lo son los la disposición de las radiografías por 
neonato como lo son en radiografías anteroposterior y posteroanterior como lo 
muestra en la figura #, teniendo en cuenta que el modelo que procesamos solo 
está el conjunto de datos con radiografías posteroanterior, estos datos que 
pueden recopilar los radiólogos pueden generar más entrada de datos, y ubica 
la patología en diferentes ángulos [19]. Ver Figura 2. Radiografía de tórax en 
proyección antero - posterior y lateral. 
 
Figura 2. Radiografía de tórax en proyección antero - posterior y lateral. 
 
Fuente: Caso clínico-radiólogo pediátrico 
Cabe destacar que, para el desarrollo de modelos de predicción de aprendizaje 
profundo con la implementación de redes neuronales convolucionales, en 
trabajos investigados, se pudo identificar la patología con un solo tipo de 
imagen de radiografía, entre otros elementos a tener en cuenta, se considera 
que en el análisis debe involucrar variables como lo son los parámetros y cada 
uno de los lineamientos que realiza un radiólogo al momento de interpretar una 
radiografía de tórax neonatal, como lo son el tamaño de los pulmones no son 
iguales a los de un adulto, en que proceso del desarrollo pulmonar se 
encuentra el neonato. Cabe recalcar que en trabajos de investigación se 
tomaron algunos parámetros de estos a tener en cuenta, pero la base principal 
de estos estudios son la disposición y la estructura del dataset, ya que, si se 
tiene imágenes de radiografías limpias, con buena calidad y con la patología 
definida. La probabilidad de predicción correcta es más alta. Finalmente, este 
trabajo de investigación tuvo un porcentaje de precisión del 91% en el modelo 
de redes neuronales propuesto. 
 
 
 
26 
 
 
 
2 OBJETIVOS 
 
 
2.1. Objetivo general 
 
Implementar una técnica basada en radiografías de tórax para identificar 
neumonía en neonatos en estadios tempranos. 
 
2.2. Objetivos específicos 
 
- Categorizar los parámetros más influyentes en la detección de 
neumonía. con el fin de obtener información y proceder a la selección de 
una técnica de aprendizaje profundo para implementar el algoritmo. 
 
- Crear un conjunto de datos de imágenes de rayos x de tórax para el 
reconocimiento de anomalías pulmonares. 
 
- Desarrollar un algoritmo para la identificación de neumonía en recién 
nacidos mediante la técnica de red neural convolucional. 
 
- Evaluar la calidad del algoritmo mediante radiografías de tórax con la 
patología de neumonía diagnosticada. 
 
 
 
 
 
 
 
 
 
 
 
27 
 
 
3 JUSTIFICAION 
 
La neumonía infantil es la causante de millones de defunciones de menores de 
cinco años en todo el mundo. Sabiendo aun que esta enfermedad es 
prevenible con vacuna ycurable en la mayoría de los casos, los procesos de 
valoración y diagnóstico de la neumonía a través de radiografías de tórax toma 
bastante tiempo en zonas rurales del país. Esto se representa por múltiples 
factores cómo la falta de personal, de insumos y equipo hospitalario, que, a la 
hora de presentar casos, el tiempo es indispensable para empezar un 
tratamiento y salvaguardar la vida de los neonatos. En una escala general en 
zonas rurales en promedio se tardaban dos días y medio en diagnosticar la 
neumonía, según el ministerio de salud. 
 
De acuerdo con la necesidad expresada anteriormente, en este proyecto se 
plantea una solución, con la implementación de un algoritmo de inteligencia 
artificial para análisis de radiografías de tórax implementando redes 
neuronales la cual permite procesar imágenes a gran escala con un nivel alto 
eficacia, el cual será capaz de reducir el tiempo entre la toma del examen y el 
diagnóstico. El uso de estos algoritmos es una de las alternativas de 
prevención a los neonatos de zonas rurales ya que ellos son los principales 
beneficiados. Teniendo en cuenta que los pacientes identificados con 
neumonía podrían iniciar tratamiento con antibiótico, u hospitalización. 
 
Por otro lado, el apoyo que brinda este algoritmo es al personal médico que se 
encarga de hacer el análisis de estas radiografías de tórax y a los centros de 
salud de zonas rurales, son estas herramientas que permiten tener 
disponibilidad de múltiples diagnósticos o valoraciones alternas, asistiendo al 
dictamen del pediatra tratante del caso. Además, esta herramienta podrá 
realizar múltiples procesos de diagnóstico, es decir que se pueda hacer una 
selección rápida de los neonatos con urgencia. 
 
 
28 
 
 
4 MARCO DE REFERENCIA 
 
A continuación, se describirá el marco conceptual y el marco teórico. 
4.1. Marco teórico 
 
4.1.1. Machine learning, deep learning y inteligencia artificial 
 
Machine Learning, el Deep Learning y la Inteligencia Artificial, son conceptos 
que están ligados entre sí cómo sub conjuntos que muestra la figura (Chollet, 
2018). 
Figura 3. Intelligence Artificial, Machine Learning y Deep Learning 
 
Fuente: Chollet, 2018 
 
4.1.2. Machine learning 
 
El ML es una parte de la inteligencia artificial, la cual tiene la capacidad de 
aprender a través de datos y mejora su precisión con el tiempo. Dentro del 
machine learning tenemos tres tipos de enfoques [20]. 
▪ Aprendizaje Supervisado: Este tipo de aprendizaje está basado en un 
rango de datos etiquetados, del cual va a aprender para resolver 
problemas futuros. 
▪ Aprendizaje no supervisado: Este tipo de aprendizaje es el indicado 
cuando no se tienen suficientes datos etiquetados, entonces se le 
brindan una serie de indicaciones que ayudarán a resolver los problemas 
[21]. 
 
29 
 
▪ Reforzamiento de aprendizaje: Estos tipos de aprendizaje permiten 
aprender de acuerdo a éxitos y fracasos que tenga 
 
4.1.3. Deep learning y aprendizaje profundo 
 
Se basa en usar una red neuronal artificial que se compone de un número de 
niveles jerárquicos. En el nivel inicial de la jerarquía la red aprende algo simple 
y luego envía esta información al siguiente nivel. El siguiente nivel toma esta 
información sencilla, la combina, compone una información algo un poco más 
compleja, y se lo pasa al tercer nivel, y así sucesivamente Deep Learning es 
un conjunto de técnicas y procedimientos algorítmicos basados en Machine 
Learning para lograr que una máquina aprende de la misma forma que lo haría 
un ser humano. Siendo más precisos, hablamos de una familia de algoritmos 
cuyo propósito es simular el comportamiento que lleva a cabo nuestro cerebro 
para reconocer imágenes, palabras o sonidos. 
4.1.4. Convolucional Neuronal Networks (CNN) 
 
Las redes neuronales convolucionales fueron creadas, al igual que las redes 
neuronales artificiales, basándose en la estructura de las neuronas de la 
corteza visual de los mamíferos. Las CNNs son de los algoritmos más 
populares en el paradigma del Deep Learning, cuando se trata de 
reconocimiento de objetos en imágenes visuales. basadas en la arquitectura 
de peso compartido de los núcleos y filtros de la convolución. estas 
proporcionan respuestas equivalentes que se conocen cómo mapa de 
características [22]. 
 
Figura 4 Convolucional Neuronal Networks 
 
Fuente: Rendimiento de aprendizaje profundo (Malek Ben Romdhane) 
 
 
 
30 
 
4.1.4.1.1. Estructura 
La arquitectura se puede ver para una red neuronal, donde la entrada la salida 
se comunica con otras neuronas. Se llama nudo, se encuentra con el nudo. 
Organización estrechamente relacionada Dependiendo de las estaciones es 
así [23]: 
▪ Capa de entrada: Estos son los botones reciben información del 
exterior, la reciben Cada número en la lista dada. 
▪ Capa de salida: Estos son nodos transferir información una vez que la 
red en la que está haciendo sus cálculos transmitirá el resultado, 
también en forma de lista entre números. 
▪ Capa oculta: Estos botones no tienen conexión con el exterior y el único 
intercambio comunicarse con otros nodos de la red, que Un contrato 
obtiene valor de un contrato La capa de entrada se modifica en un 
archivo. Es por eso que el proceso se llama aprendizaje. Cómo saber 
qué entrada es la más importante o Relacionados, estos botones 
contienen cuentas corredoras de redes. 
 
Figura 5. Estructura red nuronal artificial 
 
Fuente: Autoría propia, Edward Camilo Villota Taramela 
 
4.1.4.1.2. Funcionamiento 
 
Cada neurona o nodo artificial es Recibe una serie de procesamiento de 
señales multiplica la entrada con un peso dado peso de sinapsis llamado (W), 
cálculo de nodo La suma del producto de cada artículo y su peso. El valor 
correspondiente y la función de activación se aplican al valor resultante del 
valor resultante Salida u otra, dependiendo de si la suma La señal y el peso 
superan un cierto umbral [23] [24]. La arquitectura mencionada anteriormente 
se puede visualizar Figura 6. Esquema de una Red Neuronal (Pesos, Función 
de activacion), 
 
 
31 
 
 
Figura 6. Esquema de una Red Neuronal (Pesos, Función de activacion) 
 
Fuente: Autoría propia, Edward Camilo Villota Taramuel 
 
En donde sus estos parámetros pueden ser: 
▪ X1, X2, …, Xn: Los datos de entrada del nodo o neurona, los cuales 
también pueden ser el producto de la salida de otro nodo de la red. 
▪ X0: Unidad de sesgo, es un valor constante que se le suma a la entrada 
de la función de activación del nodo, por lo general lleva el valor de 1. 
Este valor permite cambiar la función de activación de izquierda a 
derecha, otorgando más flexibilidad en el momento de aprender del 
nodo o neurona. 
▪ W0, W1, W2, …, Wn: Son los pesos relativos o pesos sinápticos de cada 
entrada. También a la unidad de sesgo le corresponde un peso. 
▪ 𝑓: Es la función de activación de la neurona, esta función es la que les 
otorga la flexibilidad a las redes neuronales. 
▪ S: Es la salida de la neurona, que se calcula de la siguiente manera: 
 
Ecuación 1. Sumatoria salida de neurona 
𝑺 = f (∑ 𝑊𝑖 ∗ 𝑋𝑖
𝑛
𝑖=0
) 
Fuente: Autoría propia, Edward Camilo Villota Taramuel 
 
 
Las redes neuronales están organizadas en capas de neuronas. Cada capa 
procesa la información de la capa anterior, y la complejidad de la nobleza que 
la red puede resolver está determinada por Tipo de capa y función de disparo. 
 
 
 
 
32 
 
4.1.4.1.3. Topología de las (CNN) 
En primera instancia lo que hace diferenciar que en la CNN y la mayoría de las 
otras redes es que cada una de las neuronas es que tienen conexiones 
parecidas, esto quiere decir que las neuronas tienen los mismos parámetros 
de entradas. para especificar la implementación de las CNN. inicialmente se 
procesa las imágenes por nodos específicos. a cada uno de esos nodos se 
asigna un subconjunto de la imagen de incide, en este subconjuntose 
especifica de 3x3 píxeles esto permite tener una cobertura de la imagen sin 
supervisión. 
 
En los parámetros de salida se alinean por una segunda capa de nodos. 
Generalmente se toma un subconjunto de 6x6 píxeles de la imagen original, 
esto quiere decir que tiene un campo repetitivo que cubre las salidas de todos 
los nodos de la capa superior. 
 
Figura 7 Convolución que alimenta a la siguiente capa de entrada 
 
Fuente: Autor 
 
4.1.4.1. Arquitectura 
 
Están compuestas por una capa de input y una de output además de varias 
capas ocultas de las cuales son capas convolucionales con su función de 
activación, estas capas se caracterizan cómo pooling y capas conectadas. 
Como red de clasificación, comienza con la etapa de extracción de 
características, que se compone de neuronas convolucionales y neuronas de 
reducción de muestras. Se encuentra una neurona perceptrón simple al final 
de la red y finalmente se clasifican las características extraídas. La etapa de 
extracción de características es similar al proceso de estimulación en las 
células de la corteza visual [25]. Ver Figura 8 Esquema general de CNN 
 
 
 
 
 
33 
 
 
Figura 8 Esquema general de CNN 
 
Fuente: Modelo basado en CNN para opacidad extracción de frames 
 
 
4.1.4.2. Capas de convolución (Convolución layes) 
 
Las capas convolucionales se usan para evitar que cada nodo recepción o 
aprenda un conjunto imprescindible de parámetros libres cómo lo son los 
pesos de una capa que se comparte cómo lo son filtros que estos se deslizan 
a través del conjunto de datos de entrada cada filtro si está sujeto a estos 
parámetros: El parámetro(size), la profundidad(depth), la zancada(stride) y el 
relleno de ceros(zero-padding). 
 
4.1.4.2.1. El parámetro (SIZE) 
 
Es el área que se tiene entre el filtro que recorre la imagen y un filtro en donde 
se filtran por componentes únicos. estos filtros más grandes tendrán que 
superponerse sobre la imagen, de esta se precisa para aumentar el tamaño 
del filtro creará salidas cada vez más grandes; por lo que, administrar el 
tamaño de los resultados de las capas convolucionales es un factor importante 
para controlar la eficiencia de una red [26]. 
 
4.1.4.2.2. La profundidad (DEPTH) 
 
La profundidad se define en el número de nodos por capa. la profundidad 
generalmente se conoce cómo la dimensión y casi está relacionada con la 
calidad de la imagen para procesar y desplegar en la dimensión. este 
contenido está llevado a términos de calidad de los canales necesarios para 
describirla con precisión y establecer el parámetro con profundidad [27]. 
 
 
 
34 
 
4.1.4.2.3. La zancada (STRIDE) 
 
Es principalmente una medida de los espacios entre cada nodo de la 
dimensión. El valor de stride permite que cada elemento de entrada para la 
imagen, pertenece al píxel sea dentro del filtro. esencialmente esto se conoce 
cómo un alto grado de superposición y resultados en mayoría. En el siguiente 
diagrama se presenta gráficamente tanto la profundidad cómo la zancada [28]. 
 
Figura 9. Depth and stride 
 
Fuente: Profundidad y zancada, Lasse Rouhiainen 
 
 
4.1.4.3. Modelo de clasificación de imágenes 
Cómo se ha evidenciado en los conceptos de un modelo de red neuronal 
convolucional se presenta fácil para el entendimiento y funcionamiento de este. 
La combinación de las capas a nivel de la longitud y de profundidad en modelos 
más complejos es parte del uso de las redes neuronales convolucionales en el 
uso de estas es cómo diseñar arquitecturas que utilizan los modelos. 
 
4.1.4.3.1. Arquitectura de red clásica 
 
4.1.4.3.1.1. LeNet-5 
Es una arquitectura que fue exitosa y conocida en las redes neuronales 
convolucionales. esta arquitectura fue descrita por et al. (1998). La arquitectura 
de LeNet-5 CNN se compone de 7 capas. La composición de capas consta de 
3 capas convolucionales, 2 capas de submuestreo y 2 capas completamente 
conectadas [29]. Como muestra Figura 10 Arquitectura modelo LeNet-5 [30]. 
 
 
 
 
 
 
35 
 
 
 
 
 
Figura 10 Arquitectura modelo LeNet-5 
 
Fuente: Arquitectura LeNet-5, (Richmond Alake, 2020) 
 
4.1.4.3.1.2. AlexNet 
Es una arquitectura de red neuronal convolucional (CNN), que ha tenido una 
gran importancia en las últimas décadas, teniendo una gran influencia en el 
campo de aprendizaje automático en el área de la detección de imágenes en 
la visión artificial [31]. De esta arquitectura de red se pueden especificar 
algunos puntos clave: 
▪ La función de activación de capas ‘ReLU’ las cuales permiten agregar 
linealización al modelo, así llevar la aceleración del modelo 6 veces 
mayor. 
▪ Utiliza los parámetros de deserción en lugar de la regulación para hacer 
más sólida la predicción. 
▪ La supervisión de agrupaciones en la arquitectura de la red, esto reduce 
la taza de error top-1 y top-5 en un 0.4%. 
 
Figura 11 Arquitectura modelo AlexNet 
 
Fuente: Arquitectura AlexNet, (Muneeb Hassan,2018) 
 
36 
 
 
 
Para presentar la arquitectura AlexNet como se muestra en la figura 8, esta 
arquitectura en particular tiene 8 capas con pesos definidos, de las cuales las 
primeras 5 convoluciones, de las cuales las tres convoluciones complementan, 
la red neuronal. Además, tiene una capa de tipo ReLU de las cuales se 
aplicada después de la segunda capa. Para los casos de implementación de 
esta red neuronal, se tiene que tener en cuenta el conjunto datos que vamos a 
procesar sabiendo que vamos a proporcionar un conjunto de parámetros de 
entradas para la arquitectura ImageNet para la tarea de clasificación de 
imágenes. 
 
 
4.1.4.3.1.3. VGG16 
 
Es considerada una de las mejores arquitecturas de red de modelos de 
clasificación de imágenes, es usar previamente pre entrenadas con bases de 
datos grandes se destaca por el uso de capas de convolución de filtros, capas 
completamente conectadas y con una capa de salida. Este modelo alcanza 
una precisión de prueba de alrededor de 92.7% entre los 5 primero de 
ImageNet [32]. Figura 12 Arquitectura VGG16 con parametros de entrada y 
salida 
 
Figura 12 Arquitectura VGG16 con parametros de entrada y salida 
 
Fuente: VGG16 – Convolutional Network for Classification and Detection 
 
Para realizar la configuración del modelo, Todas las redes se definen con el 
nombre de (AE). Todas las configuraciones sigan el diseño genérico de la 
arquitectura y se diferencia solo en la profundidad de las capas 11 hasta 19 
capas de peso de red, El ancho de las convoluciones empieza por 64 bits en 
la primera capa y luego aumentando en el factor de 2 por cada capa de 
agrupación. 
 
Además, Todas las capas ocultas se generan como capas equipadas con la 
no linealidad de rectificación (Relu), esta normalización no mejora el 
rendimiento del conjunto de datos propuesto para el modelo, pero si origina el 
 
37 
 
mayor consumo de recursos de procesamiento del modelo [24]. Ver Figura 13 
Arquitectura del modelo VGG16 
 
 
Figura 13 Arquitectura del modelo VGG16 
 
Fuente: implementación se realizará en el conjunto de datos 
 
 
4.1.4.3.1.4. Clasificación con redes neuronales clásicas 
 
El tipo de clasificación que se desea obtener está planeado hacia el 
reconocimiento visual de todos los factores que componen una imagen de 
radiografía, El modelo propuesto está pensando para la clasificación de 
imágenes que están compuesta por una escala de grises donde se reconoce 
a la vista humana de un especialista, la patología presentada por un paciente. 
 
En el tema de clasificación existen varios modelos para clasificar clasificador 
de native Bayes, máquinas de soporte vectorial arboles de decisión, 
regresiones lineales, etc. En el ámbito te reconocimiento de imágenes 
procesadas tenemos las redes neuronales en donde se pueden presentar 
variedad de modelos donde se presenta en la arquitectura con respecto a las 
pruebas ILSVRC. Ver Tabla 1. Comparación de los cinco mejores modelos de 
clasificación de arquitecuras de red clásicas con pruebas ILSVRC [33]. 
 
Tabla 1. Comparaciónde los cinco mejores modelos de clasificación de 
arquitecuras de red clásicas con pruebas ILSVRC 
Arquitectura Top 5-err (test) 
ResNet (ILSVRC) 3.57 
BN-Inception [30] 4.82 
 
38 
 
PReLu-ne [26] 4.94 
GoogleNet (ILSVRC) 6.66 
VGG (ILSVRC ‘16) 7.32 
Fuente: errores de tipo I y tipo II 
 
En este cuadro se pueden resaltar la métrica top-5-error, se comprueba si a la 
etiqueta de destino en donde con una de 5 predicciones superiores (los 5 con 
las probabilidades más altas). En los papers en donde se plantean la 
clasificación de imágenes a través de ImageNet- las tasas de error top-1 y top-
5 son unidades importantes para medir el éxito del algoritmo [34]. 
 
 
4.1.4.3.2. Arquitectura de red Moderna 
 
4.1.4.3.2.1. ResNet 
ResNet sigue la completa 3×3 diseño de capa convolucional. El bloque residual 
tiene dos 3×3 capas convolucionales con el mismo número de canales de 
salida. A cada capa convolucional le sigue una capa de normalización por lotes 
y una función de activación de ReLU. Luego, omitimos estas dos operaciones 
de convolución y agregamos la entrada directamente antes de la función de 
activación de ReLU final. Este tipo de diseño requiere que la salida de las dos 
capas convolucionales tenga la misma forma que la entrada, para que se 
puedan sumar. Si queremos cambiar el número de canales, necesitamos 
introducir un adicional 1×1 capa convolucional para transformar la entrada en 
la forma deseada para la operación de adición. Echemos un vistazo al código 
a continuación. 
La función residual crea un duplicado de la entrada dada nombrada como 
acceso directo para preservar la salida anterior de las posibles 
transformaciones desastrosas. Puede ver que después de almacenar el valor 
original de Y, se somete a una serie de operaciones de convolución mientras 
intenta maximizar el aprendizaje [35]. 
 
 
39 
 
Figura 14. Arquitectura de ResNet 
 
Fuente: Arquitectura ResNet [36] 
 
 
4.1.4.3.2.2. Mapas de activación de clases 
 
Los mapas de activación de clases (CAM) [37] Estos pueden ayudar a 
desmitificar los resultados de los modelos de aprendizaje profundo. 
Tradicionalmente, los métodos basados en el aprendizaje profundo se 
consideran un enfoque de caja negra. Para la toma de decisiones clínicas, es 
necesario que se puedan interpretar los resultados del modelo de aprendizaje 
profundo. Las CAM pueden ayudar a identificar las partes de la imagen en las 
que se enfoca el modelo mientras se hace la predicción final y, por lo tanto, 
pueden proporcionar información sobre el funcionamiento del modelo. Dicho 
análisis puede ayudar aún más en el ajuste de hiper parámetros y comprender 
la razón detrás del fracaso del modelo. 
https://developer.ridgerun.com/wiki/images/f/f5/Resnet_architecture.png
 
40 
 
Figura 15. Mapa de activación de clases para modelos de aprendizaje 
 
Fuente: Detección de neumonía en imágenes de rayos X (Mohammad 
Farukh Hashmi) [38] 
 
4.2. Marco conceptual 
 
A continuación, se presentan algunos conceptos involucrados en el presente 
trabajo de investigación. 
4.2.1. Desarrollo funcional del aparato respiratorio 
Generalidades. La patología respiratoria está catalogada como una de las 
enfermedades con más mortalidad infantil. Al mismo tiempo, más dificultades 
de interpretación clínica, lo que induce el abuso de sus diagnósticos, la 
incertidumbre durante un pronóstico correcto y los errores terapéuticos que se 
deben tanto al déficit como al exceso. Esto es debido en gran parte, al 
insuficiente conocimiento de las características anatomo-fisiológicas del 
aparato respiratorio en los distintos periodos de la infancia y, por otro lado, a 
las dificultades de la exploración clínica y funcional en el niño. 
4.2.2. Embriología y sistema respiratorio 
La formación del aparato respiratorio se inicia en la tercera semana de vida 
intrauterina, que corresponde a la quinta semana de embarazo, cuando el 
embrión solo mide unos 3-4 mm de longitud. Se forma a partir del tubo 
digestivo. Primero aparece una pequeña evaginación [39] divertículo en la 
pared anterior del intestino, a la que se denomina hendidura laringotraqueal. 
Este espacio desaparece progresivamente al irse formando un tabique que los 
independiza. Este tabique se denomina traqueoesofágico, se extiende a lo 
largo de la evaginación en sentido cráneo-caudal (de la cabeza a los pies), y 
va a independizar el primitivo dispositivo respiratorio del esófago [40]. 
 
41 
 
• El intestino anterior se ha separado en dos porciones: una anterior, que 
corresponde al esbozo respiratorio y otra dorsal o posterior, que va a dar 
lugar al esófago. En este momento del desarrollo, el futuro aparato 
respiratorio está formado por un verdadero fondo de saco, en donde 
encontramos: 
• En primer lugar, y ocupando una posición más superior, el esbozo 
laríngeo. 
• El cuerpo del saco laríngeo que corresponde al esbozo traqueal y ocupa 
una posición media. 
Ocupando la porción más inferior, la parte correspondiente al fondo del saco y 
que va dar lugar a los pulmones. Es la bolsa pulmonar o divertículo pulmonar. 
4.2.3. Desarrollo pulmonar fetal o prenatal 
En esta fase del desarrollo dura hasta el momento del nacimiento se establece 
3 estadístico periodos de desarrollo: 
Figura 16 Desarrollo pulmonar 
 
Fuente: Esquema vía aérea con su respectivo epitelio regional. [41] 
 
 
 
42 
 
4.2.3.1 Periodo embrionario 
 
Este periodo de edad gestacional o postnatal abarca la semana 3 a 7. El 
primordio respiratorio crece hacia la región caudal y se separa definitivamente 
del intestino anterior. Se forma un tubo mediano tráquea [41], que se bifurca 
en evaginaciones laterales llamadas yemas pulmonares. El epitelio de todo el 
árbol respiratorio, desde las vías aéreas (VA) centrales hasta los neumocitos 
que recubren los alvéolos, se deriva de este brote, mientras que el cartílago, 
músculo liso, tejido conectivo y maculatura pulmonar tienen su origen en la 
mesénquima. 
4.2.3.2. Período pseudoglandular 
 
Este periodo abarca la semana 7 y 17. La aparición de circulación pulmonar 
(vasculogénesis) y desarrollo del árbol bronquial hasta nivel de bronquiolos 
terminales (pre acinar). Esta etapa deriva del aspecto glandular en los estudios 
histológicos, ya que los bronquiolos terminan en forma ciega en el estroma 
primitivo. Desde la mesénquima se desarrollan las células de la pared 
bronquial [42] que darán origen al cartílago, músculo liso. sacos distales 
adelgazándose en la medida que se relacionan estrechamente con los 
capilares. Hacia las 24 semanas de gestación, ya se ha establecido la barrera 
alveolo-capilar, con un grosor similar al del adulto y el área disponible para el 
intercambio gaseoso permite que algunos prematuros extremos puedan 
sobrevivir [43]. 
Figura 17 Período pseudoglandular 
 
Fuente: Vías respiratorias [44] 
 
 
43 
 
4.2.3.1.1 Periodo canalicular 
 
Este periodo abarca de la semana 17 a 27. Los bronquiolos terminales se 
dividen para formar los bronquiolos respiratorios [45] y ductos alveolares [46] 
en forma de sacos, los que constituyen las estructuras acinares. Ocurre un 
progresivo adelgazamiento del epitelio, con aproximación de los capilares que 
yacen justo por debajo de este. 
Las células de tipo I son las encargadas del intercambio gaseoso, son planas 
y alargadas y cubren el 95% de la superficie alveolar. Las células tipo II son 
cuboidales, están implicadas principalmente en la producción, 
almacenamiento, secreción y recirculación de surfactante, cuya función es la 
estabilización de la superficie alveolar y la prevención del colapso durante la 
espiración. Los capilares en esta etapa se forman por angiogénesis (brote de 
vasos sanguíneos desde vasos preexistentes) y las células en división se 
encuentran en los túbulos capilares más que en la mesénquima indiferenciada. 
4.2.3.1.2 Periodo Alveolar 
 
El inicio de esta etapa estásegmentado en la semana 36 a 2 años postnatal. 
Se define por la aparición de pequeñas prominencias a ambos lados de las 
paredes saculares, en los puntos donde se depositaron fibras elásticas. Estas 
crecen en forma perpendicular al espacio aéreo, dividiendo los sáculos en 
forma incompleta en unidades menores, los alvéolos. los que también se 
formarán en menor medida en bronquiolos respiratorios y en los ductos 
transitorios. Estos septos secundarios consisten en una doble asa capilar 
separada por una vaina de tejido conectivo [47]. En este período tiene lugar 
una marcada proliferación de todos los tipos celulares. Las células 
mesenquimáticas proliferan, depositando la matriz extracelular necesaria y los 
neumocitos tipo I y II aumentan su número para delinear las paredes 
alveolares, donde aproximadamente un 85-90% de la superficie estará 
recubierta de neumocitos tipo I. 
Figura 18 Alveolo 
 
Fuente: Neumocito [46] 
 
44 
 
4.2.3.1.3 Surfactante 
Está formado por fosfolípidos y proteínas en porción relativamente estable. Hay 
dudas sobre si los carbohidratos también intervienen, aunque en porciones 
mínimas. Destacan 17 la lecitina y fosfatidilcolina, pero también forman parte 
otras lipoproteínas: fosfatidilglicerol 4%, fosfatidiletanolamina 5%, 
fosfatidilinositol, colesterol, ácidos grasos y glicéridos 12%, proteínas del 
surfactante 10% esfingomielina 3%. La proporción principal corresponde, por 
tanto, a la dipalmitoilfosfatidilcolina 66% y los fosfolípidos 78%. Se acumula 
sobre la superficie de los alvéolos, disminuye la tensión superficial e impide 
que se colapse durante la espiración completa. 
4.2.3.1.3.1 Biosíntesis del surfactante 
A las 26 – 28 semanas se pone en marcha. El surfactante no es una sustancia 
químicamente pura, sino una mezcla (emulsión) de lípidos, es decir, de 
fosfolípidos, proteínas y carbohidratos. Los lípidos constituyen 
aproximadamente el 90% del total, mientras que las proteínas comprenden el 
10% restante. La presencia de surfactante en el líquido amniótico permite el 
diagnóstico prenatal de la maduración pulmonar mediante: a) relación lecitina 
esfingomielina. Cuando es superior a 2 indica maduración pulmonar. Por el 
contrario, valores inferiores a 1.5 significa inmadurez pulmonar, y por tanto 
existe el riesgo de membrana hialina. b) fosfatada-colina. Su valoración está 
indicada cuando es posible la determinación anterior (madre diabética) 
4.2.3.2 Inicio de la respiración 
Los movimientos respiratorios prenatales aparecen a partir del 7mo mes de 
vida intrauterina. Con ellos penetra líquido amniótico en las vías respiratorias, 
siendo bien tolerado cuando no contiene gérmenes o meconio. Los pulmones, 
aparte de aspirar líquido amniótico, contribuyen también a su producción; se 
calcula que 1\3 de este es originado por secreción pulmonar. Los pulmones 
durante la vida intrauterina constituyen un gran depósito de glucógeno sin 
función respiratoria, pero en cuanto sale a la luz el feto y se liga el cordón 
umbilical, se distiende el pulmón en pocos minutos, proporcionando al RN todo 
el oxígeno necesario para su intenso metabolismo [48]. 
4.2.3.3 Trabajo respiratorio 
En la respiración normal tranquila, la contracción de los músculos respiratorios 
solo ocurre durante la inspiración, mientras que la espiración es un proceso 
pasivo ya que se debe a la relajación muscular. En consecuencia, los músculos 
respiratorios normalmente solo trabajan para causar la inspiración y no la 
espiración [49]. Los dos factores que tienen la mayor influencia en la cantidad 
de trabajo necesario para respirar son: la expansibilidad o compliancia de los 
 
45 
 
pulmones y la resistencia de las vías aéreas al flujo del aire. Ver Figura 19 
Trabajo respiratorio 
 
Figura 19 Trabajo respiratorio 
 
Fuente: Sistema respiratorio. 
 
4.2.3.4 Clasificación del tórax 
El sistema respiratorio está conformado por órganos y tejidos que te ayudan a 
respirar. Las partes principales de este sistema son las vías respiratorias, los 
pulmones y los vasos sanguíneos, además de los músculos como el 
diafragma, que hacen posible la respiración [50].Ver Figura 20 Tórax 
Figura 20 Tórax 
 
Fuente: Cómo funciona sistema ventilatorio 
 
 
46 
 
4.2.3.4.1 Faringe 
La faringe es una parte del cuerpo ubicada en el cuello, que se ubica en la 
boca y se une al sistema respiratorio y digestivo. Tiene varias funciones entre 
el sistema respiratorio y digestivo y los separa una estructura denominada 
epiglotis [51]. Ver Figura 21 Faringe 
Figura 21 Faringe 
 
Fuente: La faringe, [52] 
 
4.2.3.4.2 Tráquea 
 
La tráquea es una parte del aparato respiratorio el cual es un tubo que conecta 
la nariz y la boca con los bronquios y los pulmones. Este tubo cuando obtiene 
el aire inspirado, llega hasta los bronquios y pulmones y ofrece un camino al 
exterior desde los pulmones, por lo que esta parte es fundamental [53]. Ver 
Figura 22 Tráquea. 
 
47 
 
Figura 22 Tráquea 
 
Fuente: La tráquea en el aparato respiratorio 
4.2.3.4.3 Laringe 
 
La laringe es el órgano de la voz, pero además constituye parte importante de 
la vía aérea y es también su mecanismo de protección pues evita el pasaje de 
los alimentos con el reflejo de tos y la dinámica de protección de la epiglotis 
[54].Ver Figura 23 Laringe. 
Figura 23 Laringe 
 
Fuente: Laringe, Dr. Justo Leyva Moncada 
 
 
 
48 
 
 
4.2.3.4.4 Bronquio 
 
Los bronquios principales son dos tubos formados por anillos incompletos de 
cartílago hialino, uno para cada pulmón, y se dirigen hacia abajo y afuera desde 
el final de la tarea hasta los hilios pulmonares por donde penetran en los 
pulmones. El bronquio principal derecho es más vertical, corto y ancho que el 
izquierdo, lo que explica que sea más probable que un objeto aspirado entre 
en el bronquio principal derecho. Una vez dentro de los pulmones, los 
bronquios se dividen continuamente, de modo que cada rama corresponde a 
un sector definido del pulmón [55]. 
4.2.3.4.5 Diafragma 
 
Es un tejido muscular tendinoso encargado de la respiración. Cuando se 
inhala, el diafragma se contrae y el espacio disponible en la cavidad torácica 
se agranda. Los músculos externos intercostales también ayudan a agrandar 
la cavidad torácica, permitiendo que el aire entre a los pulmones [56]. 
4.2.3.4.6 Neumonía 
La neumonía es una infección respiratoria aguda que es causada por virus, 
bacterias y hongos. Es un proceso infeccioso e inflamatorio pulmonar, la cual 
afecta a personas de cualquier edad [57]. Pero hay varias causas no 
infecciosas que a veces es preciso tener en cuenta. Estas causas no 
infecciosas son, entre otras: la aspiración de alimentos, de jugo gástrico, de 
cuerpos extraños, de hidrocarburos y de sustancias lipoideas; reacciones de 
hipersensibilidad; y las neumonitis inducidas por fármacos o por radiación. Ver 
Figura 24 Neumonía en pulmones 
Figura 24 Neumonía en pulmones 
 
Fuente: Sociedad española de medicina interna 
 
 
 
49 
 
 
 
4.2.3.4.6.1 Epidemiología 
 
Se estima que más de 150 millones de episodios de neumonía ocurren cada 
año entre los niños menores de 5 años en países en desarrollo, quienes 
cuentan con el 95% de todos los casos nuevos en el ámbito mundial. Entre 11 
y 20 millones de niños con neumonía requerirán hospitalización y más de 2 
millones morirán por esta enfermedad. 
Asia del Sur y África Sub - Sahariana llevan el peso de más de la mitad del 
número total de neumonía en el ámbito mundial, así como el 84% del total de 
las muertes causadas por neumonía en niños de este grupo de edad. Tres 
cuartas partes de todos los episodios de neumonías en niños menores de 5 
años ocurren sólo en 15 países, dos de los cuales pertenecen a Centro y 
América del Sur. Asimismo, en Latino América y el Caribe se reporta una 
incidencia de 0.22 casos por niño por año, siendo el promedio de 0.26 en el 
ámbito mundial,0.29 para los países en desarrollo y de 0.03 en los países 
industrializados [58]. 
4.2.3.4.6.2 Pediatría 
 
La pediatría es la rama de la medicina que promueve, vigila y cuida de la salud 
de las personas durante la fase de desarrollo. Esta etapa va desde el 
nacimiento hasta la adolescencia. Los profesionales de esta área realizan 
diagnósticos y tratamiento de las patologías propias de estas edades, además 
coordinan actividades de promoción y prevención que permiten realizar una 
asistencia médica integral y si es necesario brindan atención continúa cuando 
se encuentra alguna anormalidad en el desarrollo [59]. 
4.2.3.4.6.3 Imagenología 
 
La imagenología o imagen médica, por lo tanto, se utiliza para revelar, 
diagnosticar y examinar enfermedades o para estudiar la anatomía y las 
funciones del cuerpo. La radiología, la termografía médica, la endoscopia, la 
microscopía y la fotografía médica forman parte de estas técnicas. Otros 
procedimientos que permiten obtener datos que pueden representarse como 
mapas o esquemas (como la electroencefalografía) también pueden incluirse 
dentro de la imagenología [60]. 
4.2.3.4.6.4 Radiólogo 
 
Médico que tiene una formación especial para crear e interpretar imágenes de 
partes internas del cuerpo. Las imágenes se producen por medio de rayos X, 
ondas de sonido u otros tipos de energía [61]. 
 
50 
 
 
4.2.3.4.6.5 Factores de riesgo 
 
Se definen los factores de riesgo que ponen en riesgo la vida del neonato y 
que son fáciles de detectar y de tener presentes para la prevención y 
tratamiento estos pueden ser: 
 
▪ Prematuridad 
▪ No recibir lactancia materna 
▪ Periodo neonatal 
▪ Malnutrición 
▪ Bajo nivel socioeconómico 
▪ Asistencia a guardería 
▪ Defectos congénitos 
▪ Tiempo 
 
4.2.3.4.6.6 Diagnóstico 
 
la detección de la neumonía es de causa bacteriana se basa en el juicioso 
análisis y un conjunto de los componentes clínicos, de laboratorio general, 
radiológicos y microbiológicos [62]. 
4.2.3.4.6.6.1 Componentes clínicos 
Es una semiología orientadora a una etiología bacteriana puede ser muy 
categórica (con mayor facilidad y frecuencia se encontrará en el escolar) o muy 
inespecífica. Es un desafío aún mayor reconocer la sobreinfección bacteriana 
en el curso de una neumonía viral (particularmente en lactantes). 
4.2.3.4.6.6.2 Laboratorio General 
Reactantes de fase aguda clásicos descritos como propios de una infección 
bacteriana son la leucocitosis (según edad), neutrofilia y proteína C reactiva 
(PCR) elevada. 
4.2.3.4.6.6.3 Radiológicos 
Evaluaciones protocolizadas efectuadas entre expertos para la interpretación 
por medio de los radiólogos a través de las imágenes radiológicas de tórax, en 
pacientes con infección respiratoria baja, llevaron a dos conclusiones 
fundamentales [63]: 
 
51 
 
▪ Que establecer la naturaleza bacteriana de una NAC a través de 
imágenes radiológicas es sumamente difícil, en especial, en el caso de 
infecciones virales sobre infectadas. 
▪ Que las descripciones de los hallazgos y las interpretaciones de los 
mismos, son usualmente variables entre radiólogos (lo que también se 
observa entre los médicos tratantes). 
 
 
4.2.3.4.6.6.4 Radiografía de tórax (RXT) 
 
Son dosis muy pequeñas de radiación ionizante para producir imágenes del 
interior del tórax. Se utiliza para evaluar los pulmones, el corazón y la pared 
del pecho, y se puede utilizar para diagnosticar la presencia de líquidos dentro 
de los pulmones o alrededor de ellos, o la presencia de aire rodeando a los 
pulmones [64].Ver Figura 25. Radiografía de tórax. 
Figura 25. Radiografía de tórax 
 
Fuente: Rayos X de tórax señaladas (Mayo clinic) 
 
 
4.2.3.4.6.6.5 DICOM 
 
DICOM es un formato de almacenamiento de imágenes médicas que aparece 
como solución a los problemas de interoperabilidad entre tipos de dispositivos. 
Este formato contiene además de la imagen, información del paciente, lo cual 
la hace muy útil a la hora de toma de decisiones en diagnósticos que se hacen 
en la rama de la medicina [65]. 
 
 
 
52 
 
4.2.3.4.6.6.6 Diagnostico por imágenes 
 
Los rayos x, radiografías de tórax entre otros exámenes producen imágenes 
médicas, las cuales son utilizadas para detectar, diagnosticar y tratar 
enfermedades. La especialidad comienza siendo únicamente de diagnóstico. 
Es decir, interpretar las imágenes que han sido resultado del uso de las 
distintas modalidades [66].Ver Figura 26 Diagnóstico por radiografía. 
Figura 26 Diagnóstico por radiografía 
 
Fuente: Diagnóstico por imagen [67] 
4.3. Estado del arte 
 
El uso de herramientas donde plantean y desarrollan soluciones 
correspondientes a la detección temprana de enfermedades pulmonares, ha 
sido, un tema de gran impacto en el mundo médico científico, especialmente 
porque se basa en el punto de salvaguardar la vida de los neonatos en el 
mundo. para este trabajo se tomó papers con año de publicación menor a 
2018. Estos documentos proporcionan herramientas de aprendizaje 
automático y profundo se encarga de “recopilar, elaborar y evaluar” los 
algoritmos que brindan este tipo de soluciones. 
 
En primer lugar, el paper “Efficient Pneumonia Detection in Chest X-ray Images 
Using Deep Transfer Learning” publicado por Hashmi et al., en el año 2020, 
describe una técnica basada en diagnóstico por imagen basado en capas 62 
En este trabajo se propone un modelo eficiente para la detección de neumonía 
entrenado en imágenes de radiografía digital de tórax, este utiliza un 
clasificador ponderado, que combina las predicciones ponderadas de los 
modelos de aprendizaje profundo. El aprendizaje por transferencia se utiliza 
para ajustar los modelos de aprendizaje profundo a fin de obtener una mayor 
precisión en el entrenamiento y la validación. de última generación como 
ResNet 18, Xception, InceptionV3, DenseNet121 y MobileNetV3 de manera 
óptima. Finalmente, el modelo se evalúa, no solo en términos de precisión de 
la prueba, sino también en la puntuación AUC significa "área bajo la curva 
ROC" El modelo final de clasificador ponderado propuesto puede lograr una 
 
53 
 
precisión de prueba del 98,43% y una puntuación AUC de 99,76 en los datos 
no vistos del conjunto de datos de neumonía del Centro Médico de Mujeres y 
Niños de Guangzhou. [68] . 
 
Por otra parte, según lo indican los autores el autor Moritz Schwyzer, MD et al., 
utilizaron un protocolo de imágenes de TC y reconstrucción de imágenes de 
las cuales exportaron un total de 3948 archivos DICOM, además para la 
validación cruzada de 10 veces, se crearon 10 subconjuntos y cada uno 
contenía imágenes DICOM de 7 u 8 pacientes sin consolidaciones pulmonares 
y 2 o 3 pacientes con consolidaciones pulmonares. Para realizar la clasificación 
de imágenes binarias se utilizó la biblioteca de aprendizaje profundo fast.ai 63 
y un Res-Net-3464 previamente entrenado [69]. 
 
En el documento investigativo del año 2018 publicado por Arata Saraiva et al., 
“Transfer Learning with Deep Convolutional Neural Network (CNN) for 
Pneumonia Detection using Chest X-ray” interpretar la radiografía de tórax, 
buscará manchas blancas en los pulmones para detectar neumonía mediante 
la red neuronal. primero es el entrenamiento de una red neuronal convolucional 
(CNN), en la parte de la prueba lo realizará con imágenes no conocidas por 
CNN. Para la comprobar del algoritmo se implementó una validación cruzada 
en los resultados del algoritmo arrojó que se obtuvo una precisión de 96,6%, 
con una sensibilidad del 97,8%, una especificidad del 97,4%. En la 
comparación de radiografías de tórax con neumonía versus normal, obtuvo una 
precisión de 92,8% [70]. 
 
Por otra parte, el documento “Augmenting the National Institutes of Health 
Chest Radiograph Dataset with Expert Annotations of Possible Pneumonia” 
publicado el año 2019, George shihm, en donde su investigación hace énfasis 
que la

Continuar navegando