1007430317 2021

•
Teodoro Olivares

rongoloalcantara
30/3/2024
¡Este material tiene más páginas!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Geografía

190.086 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
Evaluación de escalas pronósticas en 
sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores 
de mortalidad en pacientes 
críticamente enfermos de un hospital 
general de Bogotá, año 2019 
 
 
 
Pablo Guillermo Hernández Almonacid 
 
 
 
Universidad Nacional de Colombia 
Facultad de Medicina 
Departamento de Medicina Interna 
Especialidad de Medicina Interna 
Bogotá, Colombia 
2020
 
Evaluación de escalas pronósticas en 
sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores 
de mortalidad en pacientes 
críticamente enfermos de un hospital 
general de Bogotá, año 2019 
 
 
 
 
Pablo Guillermo Hernández Almonacid 
 
 
 
 
Tesis o trabajo de investigación presentada(o) como requisito parcial para optar al título 
de: 
Especialista en Medicina Interna 
 
 
 
Director (a): 
MD, IM, CCM, Esp José Guillermo Ruiz Rodríguez 
Codirector (a): 
MD, IM, CCM, Esp, Carmelo José Espinosa 
 
 
 
 
 
Universidad Nacional de Colombia 
Facultad de Medicina 
Departamento de Medicina Interna 
Especialidad de Medicina Interna 
Bogotá, Colombia 
2020
 
 
 
 
 
 
 
 
 
 
A las personas cercanas y a las ausentes, a 
las palabras de ánimo y de desasosiego, a los que 
fueron apoyo y fundamento, padres, maestros, 
amigos y compañeros. 
 
 
Declaración de obra original 
Yo declaro lo siguiente: 
He leído el Acuerdo 035 de 2003 del Consejo Académico de la Universidad Nacional. 
«Reglamento sobre propiedad intelectual» y la Normatividad Nacional relacionada al 
respeto de los derechos de autor. Esta disertación representa mi trabajo original, excepto 
donde he reconocido las ideas, las palabras, o materiales de otros autores. 
Cuando se han presentado ideas o palabras de otros autores en esta disertación, he 
realizado su respectivo reconocimiento aplicando correctamente los esquemas de citas y 
referencias bibliográficas en el estilo requerido. 
Por último, he sometido esta disertación a la herramienta de integridad académica, definida 
por la universidad. 
 
________________________________ 
Nombre: Pablo Guillermo Hernández Almonacid 
Fecha 01/12/2020 
 
 
Agradecimientos 
Al Dr. Carmelo Espinosa por su invaluable e incansable colaboración desde el nacimiento 
de la idea hasta su plena ejecución en este trabajo de investigación. 
 
 
 
 
 
Resumen y Abstract IX 
 
Resumen 
Desde la actualización de la definición de sepsis, diversos estudios han tratado de validar 
el rendimiento del SOFA y qSOFA para predecir mortalidad. Los resultados han sido 
variables en cada población. Es importante seleccionar un sistema de predicción que 
demuestre buena discriminación y calibración en la población de interés. El propósito del 
estudio es establecer el sistema pronóstico con mayor rendimiento en predicción de 
mortalidad entre pacientes que ingresan a UCI con sospecha de infección, comparando 
(SIRS, qSOFA, SOFA, APACHE II, APACHE IV). Métodos: estudio observacional, 
analítico, retrospectivo. Se realiza un análisis de subgrupo de pacientes con diagnóstico 
oncológico activo. Resultados: se seleccionaron 290 pacientes. Se registraron 80 
decesos, para una mortalidad global del 27.5%. El AUROC para cada sistema fue SIRS 
0.53 (IC 95% 0.4-0.6), qSOFA 0.68 (IC 95% 0.62-0.75), SOFA de 0.8 (IC 95% 0.75-0.86), 
APACHE II 0.81 (IC 95% 0.76-0.86) y APACHE IV de 0.85 (IC 95% 0.80-0.90). La REM 
para SOFA fue del 0.95, APACHE II de 1.2 y APCHE IV de 1.47. La CITL fue de -0.09 
para el SOFA, 0.13 para APACHE II y 0.71 para APACHE IV. Las curvas de calibración 
mostraron una buena concordancia para el SOFA, las curvas de los sistemas APACHE 
muestran tendencia a subestimar eventos. En el grupo de pacientes oncológicos los 
AUROC fueron comparables y no hay una adecuada calibración. Conclusiones: el SOFA 
score muestra una buena discriminación y calibración para predicción de mortalidad. Los 
sistemas APACHE tienen buena discriminación, pero no están calibrados a la población. 
SIRS y qSOFA tienen una mala AUROC como predictores de mortalidad. 
 
Palabras clave: sepsis, mortalidad, SOFA, APACHE, SIRS, AUROC, calibración. 
 
 
 
 
 
 
X Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, SIRS y 
APACHE IV como predictores de mortalidad en pacientes críticamente enfermos de 
un hospital general de Bogotá, año 2019 
 
 
 
Abstract 
Evaluation of prognostic severity scores in sepsis: assessment of SOFA, qSOFA, 
SIRS and APACHE IV as predictors of mortality in critically ill patients of a general 
hospital in Bogotá,2019 
 
Introduction: Since the last update on sepsis definition, various studies have aimed to 
validate the performance of SOFA and qSOFA to predict mortality, with variable results in 
each population. This higlights the importance of selecting a prediction system with 
efficient discrimination capacity and calibration that suits the target population. 
Objective: Evaluate and compare the ability of SIRS, qSOFA, SOFA, APACHE II and 
APACHE IV to predict mortality in patients with suspected infection admitted to ICU 
Methods: Retrospective observational analytic study. An additional analysis of oncological 
patients was also made. Discrimination was assessed using the area under the receiver 
operating characteristic curve (AUROC). 
Results: Among 290 selected patients, 80 died (global mortality 27,5%). AUROC for 
each prognosis system was established as follows: SIRS 0.53 (IC 95% 0.4-0.6), qSOFA 
0.68 (IC 95% 0.62-0.75), SOFA de 0.8 (IC 95% 0.75-0.86), APACHE II 0.81 (IC 95% 
0.76-0.86), APACHE IV de 0.85 (IC 95% 0.80-0.90). Standardized mortality ratio (SMR) 
for SOFA was 0.95, APACHE II 1.2 and APACHE IV 1.47. Calibration in the large (CITL) 
was -0.09 for SOFA, 0.13 for APACHE II and 0.71 for APACHE IV. Calibration curves 
showed suitable concordance of predicted and real mortality for SOFA, while APACHE 
tended to underestimate events. In oncological patients each AUROC was comparable, 
without appropriate calibration. 
Conclusion: SOFA score disclosed adequate discrimination capacity and calibration to 
predict mortality. Although APACHE systems discriminate well enough, they lack 
calibration for our population. SIRS and qSOFA do not discriminate mortality 
 
Key words: sepsis, mortality, SOFA, APACHE, SIRS, AUROC, calibration
Contenido XI 
 
Contenido 
Pág. 
Resumen ........................................................................................................................ IX 
Lista de figuras ............................................................................................................ XIII 
Lista de tablas ............................................................................................................. XIV 
Lista de Símbolos y abreviaturas ................................................................................ XV 
Introducción .................................................................................................................... 1 
1. Sepsis: definición y evolución histórica conceptual .....¡Error! Marcador no definido. 
1.1 Epidemiologia ..................................................................................................... 4 
1.2 Escalas pronósticas en cuidado crítico ............................................................... 5 
1.2.1 Sistema APACHE ............................................................................................ 7 
1.2.2 SOFA score ..................................................................................................... 8 
1.2.3 Quick SOFA (qSOFA) ...................................................................................... 8 
1.2.4 SIRS (systemic inflammatory response syndrome) .......................................... 9 
1.3 Comparación de escalas pronósticas ................................................................. 9 
1.3.1 Comparación en sepsis .................................................................................10 
2. Metodología ............................................................................................................ 13 
2.1 Diseño del Estudio ........................................................................................... 13 
2.2 Objetivos .......................................................................................................... 13 
2.3 Población ......................................................................................................... 13 
2.4 Lugar ................................................................................................................ 14 
2.5 Criterios de Inclusión ........................................................................................ 14 
2.6 Criterios de Exclusión ....................................................................................... 14 
2.7 Características de las bases de datos .............................................................. 14 
2.8 Desenlaces del estudio .................................................................................... 14 
2.9 Tamaño de Muestra y Tipo de Muestreo .......................................................... 15 
2.10 Procedimientos del estudio .............................................................................. 15 
2.11 Definición de variables ..................................................................................... 16 
2.12 Procesamiento y análisis de datos ................................................................... 16 
2.13 Métodos de reclutamiento ................................................................................ 16 
2.14 Consideraciones éticas .................................................................................... 17 
2.15 Hipótesis .......................................................................................................... 17 
3. Resultados .............................................................................................................. 19 
3.1 Características de la cohorte ............................................................................ 20 
3.2 Evaluación capacidad de discriminación sistemas de predicción ..................... 22 
XII Título de la tesis o trabajo de investigación 
 
3.3 Evaluación de calibración de los sistemas de predicción .................................. 23 
3.4 Rendimiento en subgrupo de pacientes con diagnóstico oncológico activo....... 26
 
4. Conclusiones y recomendaciones ....................................................................... 29 
4.1 Conclusiones .................................................................................................... 29 
4.2 Recomendaciones ............................................................................................ 33 
A. Anexo 1: Tabla de operacionalización de variables ............................................ 34 
Bibliografía .................................................................................................................... 41 
 
 
 
 
 
Contenido XIII 
 
Lista de figuras 
Pág. 
 
Figura 3-1: Flujograma de pacientes . .......................................................................... 19 
Figura 3-2: Curvas ROC de discriminación de mortalidad . ........................................... 23 
Figura 3-3: Curva de calibración SOFA score............................................................... 24 
Figura 3-4: Curva de calibración APACHE II. ............................................................... 25 
Figura 3-5: Curva de calibración APACHE IV. .............................................................. 25 
Figura 3-6: Curva de calibración SOFA score en pacientes con cáncer hematológico. 27 
Figura 3-7: Curva de calibración APACHE II en pacientes con cáncer hematológico. .. 27 
Figura 3-8: Curva de calibración APACHE IV en pacientes con cáncer hematológico. . 28 
 
 
 
 
 
 
 
 
 
 
 
 
Contenido XIV 
 
Lista de tablas 
Pág. 
 
Tabla 1-1: Estudios comparativos de escalas en sepsis. ................................................ 11 
Tabla 3-1: Caracteristicas demográficas y clínicas población . ....................................... 21 
Tabla 3-2: AUROC discriminación de mortalidad en poblacion total . ............................. 22 
Tabla 3-3: Parámetros de calibración de los sistemas de predicción . ............................ 24 
Tabla 3-4: Capacidad de discriminación en pacientes con cancer hematológico . .......... 26 
Tabla 3-5: Parámetros de calibración en pacientes con cancer hematológico . ............. 26 
 
 
 
 
 
 
 
 
 
Contenido XV 
 
Lista de Símbolos y abreviaturas 
Abreviaturas 
 
Abreviatura Término 
APACHE Acute Physiology and Chronic Health Evaluation 
AUROC Area under the receiver operating characteristic 
CITL Calibration-in-the-large 
EWS Early Warning Score 
FEVI Fracción de eyección del ventrículo izquierdo 
IRT Inhibitory-resistant TEM type 
SAMR Staphylococcus aureus resistente a la meticilina 
qSOFA Quick SOFA 
Relación E:O Relación esperado: observado 
REM Razón estandarizada de mortalidad 
ROC Receiver Operating Characteristic 
RR Riesgo relativo 
SAPS Simplified Acute Physiologic Score 
SIRS Systemic Inflammatory Response Syndrome 
SOFA Sequential (sepsis-related) Organ Failure Assessment 
SSS Sepsis Severity Score 
UCI Unidad de Cuidados Intensivos 
VIH Virus de inmunodeficiencia humana 
 
 
 
 
 
 
 
 
 
 
Introducción 
 
La sepsis es definida como una disfunción orgánica que amenaza la vida secundaria a una 
respuesta no regulada a la infección, su verdadera incidencia es desconocida y varía de 
acuerdo con los criterios diagnósticos utilizados. Desde la última definición de sepsis en el 
tercer consenso ha habido controversia acerca de los criterios utilizados, en el que se hace 
especial énfasis a la predicción de mortalidad, utilizando como herramienta diagnostica en 
pacientes que ingresan a UCI el SOFA y/o qSOFA como definidores de la entidad. Las 
discrepancias radican en la capacidad de generalizar las recomendaciones dado que se 
derivan de un único estudio en pacientes en países de alto ingreso, planteando dudas de 
su aplicabilidad en otras poblaciones en países de menores ingresos. 
 
En el contexto del cuidado critico existen muchos sistemas y puntajes de predicción 
pronostica, que tratan de predecir la severidad de la enfermedad y predecir un desenlace 
clínico, siendo el más medido la mortalidad. Se han realizado diversos estudios para tratar 
de validar la capacidad pronóstica de las escalas propuestas en la tercera definición (SOFA 
y qSOFA) con resultados heterogéneos, igualmente se ha estimado la capacidad de otras 
escalas en el contexto de sepsis con rendimientos incluso superiores, y específicamente 
para el escenario de Colombia es importante aclarar si los nuevos sistemas como qSOFA 
son verdaderamente útiles y aplicables. 
 
La importancia de definir la escala de mejor rendimiento, recae en la utilidad de estos 
sistemas para estandarizar pacientes, facilitar su comparación y su posible inclusión en 
estudios clínicos, evaluar la calidad de atención y permitir un análisis comparativo con 
otras unidades de cuidado intensivo o estándares nacionales, considerando previamente 
que para su uso es importante seleccionar un sistema que haya sido evaluado y que 
demuestre precisión en la predicción de desenlaces en la población de interés. El propósito 
del presente estudio es establecer la escala de predicción pronóstica con mayor 
rendimiento en predicción de mortalidad, en nuestro medio entre pacientes que ingresan a 
2 Introducción 
 
la unidad de cuidado crítico con sospecha de infección, haciendo énfasis en comparar 
sistemas tradicionalmente usados como SIRS y APACHE para compararlos con las nuevas 
propuestas de la definición del SEPSIS 3. 
 
 
 
 
 
1. Sepsis: definición y evolución histórica 
conceptualLa sepsis es definida como una disfunción orgánica que amenaza la vida secundaria a una 
respuesta no regulada a la infección.(1) Este síndrome representa uno de los retos más 
importantes en salud pública a nivel mundial dada su alta incidencia y su asociación a una 
alta mortalidad, su dificultad para un diagnostico oportuno, y muchas veces la necesidad 
de un tratamiento urgente y de alta complejidad.(2) Su definición ha presentado cambios 
en el tiempo; desde su primera definición en el año 1991, por consenso se desarrolló un 
primer concepto de sepsis enfocando este como un síndrome respuesta inflamatoria 
sistémica (SIRS) secundario a infección, y de acuerdo a su severidad con compromiso 
multisistémico o cardiovascular, se establecieron términos tales como sepsis severa, 
hipotensión inducida por sepsis y choque séptico. En 2001 se revisaron estas definiciones 
y aunque se amplió la lista de criterios diagnósticos, los conceptos no fueron modificados. 
(3) Esto fue hasta que en 2016, se llevó a cabo un tercer consenso para modificar la 
definición que había permanecido vigente por más de dos décadas, llamada Sepsis-3, esta 
fue motivada por las limitaciones del concepto previo en cuanto a su especificidad y se dio 
énfasis a la sepsis como una respuesta no homeostática a la infección; así mismo, se 
simplificó la misma, eliminando el concepto de sepsis severa al considerársele redundante 
y por ende el termino sepsis lleva implícita una disfunción orgánica. Operativamente esta 
disfunción es identificada con la escala de SOFA (del inglés Sequential Organ Failure 
Assessment) y se considera positiva con un cambio en el puntaje de 2 o más en la misma. 
Adicionalmente se eliminó el termino hipotensión inducida por sepsis y se refinó el 
concepto de choque séptico como un subtipo en el cual se aumenta la mortalidad por 
alteraciones circulatorias y celulares y que clínicamente se identifica por el requerimiento 
de soporte vasopresor para mantener una presión arterial media (PAM) de 65 mmHg, y un 
lactato sérico mayor a 2 mmol en ausencia de hipovolemia.(1) El mismo grupo de consenso 
identificó las dificultades para calcular el SOFA en un entorno fuera de cuidado crítico, por 
tal motivo se desarrolló un modelo de tres variables clínicas, llamado qSOFA (del inglés 
quick SOFA) para identificar pacientes con alto riesgo de mortalidad o de estancia 
prolongada en UCI en sospecha de infección y se considera positivo con al menos dos 
variables presentes. Desde su formulación el mismo grupo desarrollador planteó las 
posibles limitaciones para la generalización por extraerse dichas definiciones de bases de 
4 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
datos de países de alto ingreso, y que la negatividad de las escalas no descarta 
completamente la sepsis. 
 
1.1 Epidemiologia 
La incidencia real de la sepsis es desconocida, y esta varía de acuerdo con los criterios 
diagnósticos utilizados.(4) Se ha descrito que cada año mueren 2.8 millones de personas 
por sepsis en países desarrollados y en 2001 se reportaron solo en Estados Unidos 750000 
casos por año (300/100000 habitantes-año). De los pacientes ingresados a UCI, la sepsis 
representa el 27% y el 12% de todas las admisiones en Reino Unido y EEUU, 
respectivamente. (2) A nivel regional en Brasil, durante el seguimiento a una UCI en el año 
2005, el 40,3 % de los ingresos tenían diagnóstico de sepsis, y de acuerdo con su 
severidad la mortalidad se situó en 30% para sepsis y ascendió hasta un 72% para choque 
séptico. (5). En el caso de Colombia una descripción de la epidemiologia en unidad de 
cuidados intensivos, realizada en 4 ciudades del país, con seguimiento por 6 meses, 
describió que el 12% de todos los ingresos correspondió a un diagnóstico de sepsis, de 
estos el 51% la había desarrollado en comunidad, un 30 % del total presentó al menos una 
afectación orgánica y la mortalidad global fue del 33,6%. (6) Entre los factores 
demográficos descritos en diversas series, las mujeres tienen una menor incidencia de 
sepsis, aunque no parece modificar la mortalidad respecto a los hombres.(7) La edad 
aumenta la probabilidad de desarrollar sepsis como lo demostró un estudio multicéntrico 
en el que se demostró que hasta el 65% de todos los casos de sepsis se da entre mayores 
de 65 años, y que este mismo grupo etáreo tiene una mayor probabilidad de morir de hasta 
2.3 veces, independiente de otros factores como severidad de la infección o 
comorbilidades.(8) 
 
Las condiciones crónicas que alteran el funcionamiento del sistema inmune, tales como 
infección por VIH, cirrosis, asplenia, cáncer sólido o neoplasia hematológica e incluso 
enfermedades autoinmunes, están altamente representadas en estudios de prevalencia de 
sepsis.(9) Otros factores de riesgo descritos son el consumo de alcohol, tabaquismo y la 
no vacunación.(7) 
Capítulo 1 5 
 
Respecto a la etiología descrita, en uno de los estudios más grandes realizado en cuidado 
crítico, el EPIC II, incluyo cerca de 14000 pacientes de 1265 UCI de 75 países, en este de 
los pacientes clasificados como infectados, el foco infeccioso más frecuente fue el 
pulmonar (64%) seguido del abdominal (20%) la bacteriemia (15%), y en cuarto lugar 
infecciones del tracto urinario y pielonefritis (14%). Si bien la posibilidad de aislamiento de 
gérmenes específicos se ve afectada por muchos factores, en el mismo estudio en el 70% 
de los pacientes con sospecha de infección con aislamiento microbiológico positivo, el 62% 
de los cultivos reporto gérmenes gram negativos (20% Pseudomonas spp y 16% 
Escherichia coli), 47% fueron gram positivos (20% Staphylococcus aureus) y el 19% fueron 
hongos.(10) 
 
1.2 Escalas pronósticas en cuidado crítico 
En el contexto del paciente critico se han desarrollado sistemas de puntaje predictivo, los 
cuales miden la severidad de la enfermedad para tratar de establecer y predecir un 
desenlace clínico, el más frecuentemente estimado es el de mortalidad. Consisten 
básicamente de dos elementos, el primero un puntaje de severidad que aumenta cuanto 
más severo sea el compromiso y, segundo un estimado de la probabilidad de morir. Estos 
sistemas predictivos pueden ser clasificados de acuerdo con las variables que cuantifican, 
los de más amplio uso son puntajes órgano específicos como el SOFA (sepsis related 
organ failure assessment), o de valoración fisiológica tales como el APACHE (acute 
physiology and chronic health evaluation) y el SAPS (simplified acute physiology score). 
Existen otros puntajes de tipo anatómico, terapéutico y enfermedad específicos.(11) La 
utilidad de estos sistemas recae en estandarizar pacientes para facilitar su comparación y 
su posible inclusión en estudios clínicos, evaluar la calidad de atención en la UCI respecto 
a sus procesos internos especialmente en mortalidad, con la medición de su desempeño 
en el tiempo y finalmente permitir una evaluación comparativa con otras unidades de 
cuidado intensivo o estándares nacionales.(12)(13) Para poder adoptar estos modelos es 
necesario realizar una evaluación y validación del desempeño de las distintas escalas a 
una institución o grupo de pacientes específicos, para lo cual debe valorarse la capacidad 
de discriminación y la calibración de la escala; (11) la primera hace referencia a la 
capacidad de diferenciar los pacientes que fallecen de los que sobreviven, es decir su 
sensibilidad y especificidad, las cuales constituyen una matriz de evaluación que es 
cuantificada mediante el área bajo la curva de las características de funcionamiento del 
6 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general deBogotá, año 2019 
 
receptor o AUROC. De manera concreta un ROC de 0.5 no es mejor que el azar para 
discriminar, mientras que valores mayores a 0.7,0.8 y 0.9 son considerados aceptables, 
excelentes y excepcionales, respectivamente.(14) 
 
En cuanto a la calibración, la cual es evaluada menos frecuentemente que la 
discriminación, mide el grado de correspondencia entre la probabilidad de mortalidad 
estimada y la realmente observada. Para su evaluación se plantean cuatro niveles: medio, 
débil, moderado y fuerte. La calibración media, emplea la CITL (calibration in the large) 
comparando los eventos promedio predichos con la tasa general de eventos. El nivel débil, 
evalúa la capacidad del sistema para no subestimar o sobreestimar los eventos, sin dar 
valores muy extremos, en este aspecto usa la pendiente y el intercepto como parámetros 
de evaluación; una pendiente con un valor <1 sugiere que los estimados son muy 
extremos. A su vez el intercepto tiene como nivel meta el 0, valores negativos sugieren 
sobrestimación y valores positivos subestimación de los eventos. Finalmente, la calibración 
moderada estima que los riesgos estimados corresponden con las proporciones 
observadas y es evaluada con el uso de curvas de calibración, en la que se compara en 
un plano cartesiano el eje de las x (eventos predichos) con el eje de las y (proporción 
observada), el nivel de concordancia de la curva elaborada respecto a una línea diagonal 
de referencia indica la adecuada calibración del sistema.(15) También se describen otras 
herramientas como el uso de un test de ajuste, el más frecuentemente aplicado es la C 
estadística de Hosmer–Lemeshow, la metodología empleada suele dividir la población total 
en deciles de riesgo en los que se evalúa el numero esperado y observado de eventos de 
cada subgrupo y da un valor P como indicador, sin embargo, existen muchas críticas a su 
utilidad. (14) . Como medida de estandarización, se cuenta con la razón estandarizada de 
mortalidad, que se calcula dividiendo el número de decesos registrados sobre los 
predichos por algún sistema empleado, generalmente es empleado como indicador de 
calidad, ya que, si es menor a la unidad, indica una mortalidad menor a la predicha. (16) 
El desempeño global relaciona las características de discriminación y calibración, 
evaluando la distancia media cuadrática matemática entre lo predicho y lo observado, 
cuanto más corta la distancia, se asume que el sistema tiene un mejor desempeño, una 
de las medidas corresponde al puntaje de Brier, que aunque es el más empleado, muestra 
Capítulo 1 7 
 
desventajas en casos donde el desenlace de interés tiene una baja prevalencia o en 
pruebas dicotómicas. (17) 
 
Siempre deben tenerse en cuenta las posibles fuentes de sesgos que podrían inducir una 
aplicación inadecuada de los puntajes de severidad tales como la pérdida de datos, la 
medición incorrecta de los mismos, el uso de puntajes inadecuados en poblaciones 
específicas y otros aspectos relacionados con el tiempo y las intervenciones realizadas 
previo al ingreso a UCI, el lugar de atención inicial y la reserva fisiológica del paciente que 
podrían también alterar el desempeño del sistema pronostico. (11–14) 
 
1.2.1 Sistema APACHE 
El sistema APACHE (del inglés, Acute Physiology and Chronic Health Evaluation), parte 
de la premisa que las intervenciones en cuidado critico tratan la enfermedad y mantienen 
la homeostasis fisiológica, así la medición de las anormalidades fisiológicas se convierte 
en un método objetivo y reproducible para medir la severidad de una enfermedad. 
APACHE aporta dos datos, primero un puntaje de severidad de enfermedad y segundo, la 
predicción del desenlace con una serie de ecuaciones que generan un estimado de la 
mortalidad en UCI e intrahospitalaria.(18) Para dichos cálculos emplea los datos que se 
generan en el primer día de estancia en la unidad de cuidado intensivo. Desde su 
desarrollo inicial en 1981 ha tenido varias actualizaciones para mantener su aplicabilidad, 
modificando el número de variables a cuantificar, las ecuaciones del sistema y usando 
poblaciones cada vez más grandes en los nichos de derivación. La última generación es 
la del APACHE IV, publicada en el 2006, aunque es más compleja, por la expansión del 
número de enfermedades y la inclusión de nuevas variables, como por ejemplo el uso de 
ventilación mecánica en el primer día de ingreso, el uso de trombólisis, el impacto de la 
sedación o parálisis para cuantificar la escala de Glasgow(19); también difiere con sus 
predecesoras por la ecuación de regresión logística y el modelo estadístico que emplea. 
El rendimiento de esta versión ha sido evaluado demostrando que es más preciso como 
predictor de mortalidad a la versión APACHE III, y que como característica especial ha 
demostrado tener capacidad para predecir la estancia en UCI(20). Para el cálculo de la 
mortalidad intrahospitalaria la contribución de las variables varia, dando especial 
importancia a las variables fisiológicas agudas (66%) seguido por el diagnóstico (16%), la 
edad (9%) y las patologías crónicas (5%) y finalmente otras variables de admisión y el 
8 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
requerimiento de ventilación mecánica. Si bien esta herramienta tiene propiedad 
intelectual, es de libre acceso en la página 
http://www.cerner.com/public/Cerner_3.asp?id=27300, web en la cual se enseña a utilizar 
la escala con las instrucciones y cálculos para determinar la mortalidad y los días de 
estancia en UCI predichos.(18) 
 
1.2.2 SOFA score 
El sistema SOFA (del inglés, Sequential (sepsis-related) Organ Failure Assessment) fue 
desarrollado por la sociedad europea de medicina critica en el año 1994 y validado en 1996 
(21), se centra en cuantificar la severidad de la enfermedad basado en el grado de 
disfunción orgánica asociado a sepsis, aunque también se ha usado en otros grupos de 
pacientes tales como intoxicados con acetaminofén, falla hepática crónica y cáncer. Seis 
órganos son valorados : respiratorio, cardiovascular, sistema nervioso central, renal, 
coagulación e hígado; de acuerdo con el nivel de compromiso para cada sistema se asigna 
un valor entre 0 y 4, los cuales se suman dando como resultado un puntaje final entre 0 a 
24 puntos.(11) Este es calculado a las 24 horas de ingreso a la UCI y cada 48 horas. 
Actualmente es el sistema que operativiza el ultimo consenso de definición de sepsis, en 
el que un puntaje de 2 o un cambio respecto al basal de 2 o más es asociado con un 
aumento de la mortalidad más de un 10% (1). Aunque inicialmente no había una 
conversión directa del puntaje con mortalidad, estudios posteriores han tratado de 
establecer su correlación con el mismo (19)(22). Para ello se han tomado el puntaje inicial, 
el máximo y el delta SOFA, este último con definiciones variables en las que compara el 
cambio de puntaje de un día fijo respecto al basal y en otros el delta se establece por el 
puntaje máximo respecto del basal. De estas aproximaciones la que ha demostrado mejor 
poder predictivo de mortalidad es el delta SOFA (en su forma de día fijo) y el máximo SOFA 
(23). 
 
1.2.3 Quick SOFA (qSOFA) 
Este modelo clínico surgió en la tercera definición de sepsis, se desarrolló por regresión 
logística multivariable que identifico que la presencia de dos de tres variables clínicas 
ofrecía una buena validez predictiva. Los aspectos que puntúan son alteración del nivel de 
Capítulo 1 9 
 
conciencia (Glasgow coma score < 15), frecuencia respiratoria mayor o igual a 22, y 
presión sistólica menor o igual a 100. Su intención inicial es la identificación temprana de 
pacientes con sospecha de infección que pueden tener un mal pronóstico, en especial en 
el entornoprevio al ingreso a la UCI, donde en el estudio original demostró una AUROC 
de 0.81.(1)(24) Estudios posteriores de diferentes regiones han demostrado un amplio 
rango de precisión predictiva del qSOFA, un metaanálisis reciente, informo una AUROC 
0.71 en pacientes fuera de UCI y cuando se incluyó a pacientes de cuidado critico esta fue 
del 0.73; sin embargo ya que surgió como una herramienta de predicción temprana de mal 
desenlace, su sensibilidad global es de solo 54%, lo cual ha motivado cuestionamientos a 
su utilidad clínica.(25) 
 
1.2.4 SIRS (systemic inflammatory response syndrome) 
Comprende una seria de criterios desarrollados en 1992,(26) que han demostrado ser 
predictores de mortalidad en condiciones infecciosas y no infecciosas como trauma y 
pancreatitis. Comprende la medición del conteo de leucocitos, temperatura, frecuencia 
cardiaca y la frecuencia respiratoria y es positiva con al menos dos puntos. Estos reflejan 
la activación del sistema inmune sin importar su causa, por lo que se les ha considerado 
como muy poco específicos predictores de sepsis, ya que no indican necesariamente una 
respuesta desadaptativa del sistema inmune. Así mismo se ha establecido su poca 
capacidad discriminativa ya que pueden estar presentes en cualquier paciente 
hospitalizado sin que represente necesariamente un riesgo de mal desenlace. De manera 
opuesta hasta 1 de cada 8 pacientes con algún grado de disfunción orgánica asociado a 
infección puede no tener un SIRS positivo. (1)(25). Sin embargo, es precisamente su 
sensibilidad la fortaleza destacada por algunos autores para continuar empleando dicha 
herramienta, ya que su uso previo a la publicación del Sepsis-3, demostró que fue efectiva 
en reducir la mortalidad por que llevaba a una intervención más temprana.(27) 
 
1.3 Comparación de escalas pronósticas 
El escenario ideal para poder establecer que escala pronóstica es la mejor, requiere 
evaluar cada una de ellas en una población específica, sin embargo, muy pocas 
comparaciones entre puntajes están disponibles. Ninguna herramienta ha demostrado 
superioridad de manera consistente.(11) Adicionalmente al momento de seleccionar un 
sistema predictivo es importante seleccionar uno que haya sido evaluado y que demuestre 
10 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
precisión en la predicción de desenlaces en la población de interés. Es notable resaltar 
que en el medio colombiano son escasos los estudios que valoran del rendimiento 
pronóstico de las escalas mencionadas en el escenario de cuidado crítico. 
 
1.3.1 Comparación en sepsis 
En el contexto específico del uso de puntajes pronósticos en sepsis son pocos los estudios 
realizados para comparar su desempeño en este grupo de pacientes y más 
específicamente en el entorno de atención en UCI. (ver tabla 1.1) Como se mencionó 
previamente la tercera definición de sepsis baso sus recomendaciones en el estudio de 
derivación y validación original realizado por Seymour et al, en este se recolectaron datos 
retrospectivos de pacientes que ingresaron con sospecha de infección, y se hizo especial 
énfasis en la predicción de la mortalidad de cada uno de los puntajes diagnósticos 
empleados para establecer las recomendaciones. De manera resumida el SOFA tuvo una 
mejor discriminación, respecto a SIRS y al qSOFA como predictor de mortalidad 
intrahospitalaria en el entorno de UCI con una AUROC del 0.74, 0.64 y 0.66 
respectivamente.(24) Posteriormente se realizó una validación externa de dichos hallazgos 
por Raith et al, con un estudio multicéntrico de pacientes en UCI en Australia y Nueva 
Zelanda, con resultados similares.(28) 
 
Sin embargo, a pesar de dichos estudios ha habido controversias acerca de esta nueva 
definición y se han planteado dudas acerca de su verdadera validez, dado que no ha 
demostrado que mejore los desenlaces clínicos y pueda llevar a una identificación tardía 
de los pacientes en riesgo de complicación. Adicionalmente los estudios mencionados 
fueron realizados en poblaciones de países desarrollados, planteando dudas acerca de su 
generalización a otros entornos de países de ingreso bajo e intermedio. Otro de los 
interrogantes planteados es la utilidad del SOFA en pacientes con comorbilidades de base, 
ya que este puntaje evalúa alteraciones la función orgánica de manera aguda (27)(29)(30). 
 
Considerando dichas limitaciones se han realizado diferentes estudios tanto en el entorno 
de atención de urgencia como al ingreso a UCI, para evaluar el desempeño del SOFA, 
qSOFA y SIRS como predictor de mortalidad o desenlaces adversos con resultados 
variables y sin despejar las dudas del poder predictivo de los sistemas pronósticos 
Capítulo 1 11 
 
sugeridos en la tercera definición. Los estudios más cercanos a nuestro medio realizados 
en Latinoamérica han mostrado variabilidad en el desempeño del SOFA comparado con 
SIRS, el primero de ellos realizado en Brasil, incluyó pacientes con sospecha de infección 
que ingresaron a UCI, reportando un desempeño pobre y sin diferencia significativa 
respecto a discriminación de mortalidad entre SOFA y SIRS con una AUROC de 0.64 vs 
0.64 (31). De manera contraria el segundo estudio elaborado de manera multicéntrica en 
49 UCI de Argentina, concluyo que el SOFA tiene un desempeño superior con un AUROC 
de 0.74, en comparación con la AUROC de SIRS de tan solo 0.53. (32) 
 
Otros investigadores han orientado los esfuerzos en evaluar otros sistemas de predicción 
de severidad tales como APACHE en sus diferentes versiones, SAPS y el SSS (sepsis 
severity score), este último derivado de la base de datos del surviving sepsis (33). Los dos 
primeros han tenido amplio uso en el entorno de UCI de manera general en diversas 
patologías, pero con escasos estudios realizados específicamente en pacientes con 
diagnóstico de sepsis. Si bien estos han tenido una muestra menor, han reportado una 
función de discriminación de buena a excelente, con una AUC entre 0.80 a 0.94 para el 
APACHE II-IV, 0.90 para SAPS II y 0.89 para SSS; aunque con una calibración deficiente 
en algunos de ellos para sus respectivas poblaciones. La tabla 1.1 muestra los resultados 
de algunos estudios seleccionados. 
 
Tabla 1.1: estudios comparativos escalas en sepsis 
Autor población país 
Tipo 
seguimiento 
Variables 
principales 
Scores 
usados 
RO
C 
calibración otros 
Georgescu et 
al. 2014 (34) 
56 pacientes 
Choque 
séptico 
UCI 
Rumania 
 
 
 
prospectivo mortalidad APACHE II 
SOFA 
SAPS II 
En primeras 
24 horas 
0.62 
0.57 
0.70 
 
NA 
Dabhi AS. 
2014 (35) 
84 
Sepsis 
severa-
choque 
séptico 
Arabia 
Saudita 
prospectivo mortalidad APACHE IV 
SAPS II 
NA Radio 
estandarizad
o 
De 
mortalidad 
APACHE-IV 
1.60 y 
SAPS-II, 
0.83. 
Mala 
calibración 
de ambas 
escalas 
Seymour et al. 
2016 (cohorte 
derivación y 
validación 
sepsis 3)(24) 
148907 
(general)50/5
0 
UCI: 7932 
EEUU retrospectivo Mortalidad 
hospitalaria 
2°: mortalidad 
o estancia en 
UCI > 3 dias. 
SIRS 
qSOFA 
SOFA 
LODS 
No UCI: 
qSOFA 
SOFA 
SIRS 
0.64 
0.66 
0.74 
0.75 
 
0.81 
0.79 
0.76 
Curvas de 
calibración 
para qSOFA, 
con mala 
congruencia 
en deciles 
extremos de 
riesgo 
Simplicida
d sobre 
validez 
predictiva. 
-
condicione
s crónicas 
previas? 
 
12 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
April M et al. 
2016 (36) 
214 
Pacientes 
urgencias 
admitidos a 
UCI 
USA retrospectivo Mortalidad SIRS 
qSOFA 
0.65 
0.66 
 
Chen et al. 
2016 (37) 
496 China 
Multicéntric
o (6 UCI) 
Retrospectivo/ 1 año 
Mortalidad a 
28 dias. 
SIRS 
SOFA 
0.55 
0.69 
 
Raith et al. 
2017 (28) 
184 875( 12 
años). 
Australia 
Nueva 
Zelanda 
Retrospectiv
o, 
Cohorte 
original no 
tenía como 
objetivo este 
estudio 
(valoración 
APACHE III) 
Mortalidad 
hospitalaria 
2°: mortalidad 
o estancia en 
UCI > 3 dias. 
SOFA 
SIRS 
qSOFA 
0.75 
0.58 
0.60 
Curvas de 
calibración 
con mala 
congruencia 
en deciles 
extremos de 
riesgo 
 
Sadaka F et al. 
2017 (38) 
2054 USA Retrospectiv
o 
5 años 
Mortalidad 
hospitalaria 
APACHE II 
APACHE III 
0.80 
0.83 
 
Siddiqui S et 
al. 2017(39) 
58 Singapur retrospectivo Mortalidad 
estancia en 
UCI 
qSOFA 
SIRS 
EWS 
Previo a 
ingreso 
0.74 
0.77 
0.90 
 2.53 (1.10–
5.82) 
2.82 (1.09–
7.25) 
1.92 (1.24–
2.96) 
Fang X et al 
2017(40) 
21491 en 
hospitalizació
n incluye 
general y 
UCI 
China retrospectivo Mortalidad 
comparando 
sepsis 1-
sepsis 3// 
comorbilidad 
previa o no 
No 
comorbilida
d 
SIRS 
SOFA 
Comorbilida
d 
SIRS 
SOFA 
 
 
 
0.58 
0.69 
 
 
0.60 
0.70 
 Sensibilida
d global 
para 
mortalidad: 
SIRS 95.6 
SOFA 94.6 
 
No 
Comparabl
e SIRS no 
es escala 
pronostica 
Khwannimit et 
al. 2017 (41) 
913 sepsis y 
choque por 
sepsis 3 
Tailandia retrospectivo mortalidad SSS 
APACHE II 
APACHE III 
APACHE IV 
SAPS II 
SAPS 3 
 
0.89 
0.91 
0.93 
0.94 
0.91 
0.90 
Ninguno 
adecuada 
calibración 
 
Rosa G et al. 
2017 (31) 
1487 Brasil Retrospectiv
o 
7 años 
Mortalidad 
VM 
Estancia en 
UCI 
SIRS 
SOFA 
0.64 
0.64 
 
Khwannimit et 
al. 2018 (42) 
2350 Tailandia Retrospectiv
o 
10 años 
Mortalidad 
Disfunción 
orgánica 
SOFA 
qSOFA 
SIRS 
0.83 
0.81 
0.58 
 
Estenssoro E 
et al. 2018(32) 
809 Argentina Prospectivo, 
multicéntrico 
(49 UCI) 3 
meses 
Mortalidad 
intrahospitalari
a 
SIRS 
SOFA 
0.53 
0.74 
Hosmer-
Lemeshow 
test: 
p = 0.27 
 
 
 
https://www.ncbi.nlm.nih.gov/pubmed/?term=Estenssoro%20E%5BAuthor%5D&cauthor=true&cauthor_uid=29742584
 
 
 
 
2. Metodología 
 
2.1 Diseño del Estudio: Cohorte retrospectiva. 
 
2.2 Objetivos 
2.2.1 objetivo general 
Establecer el sistema de predicción pronostica con mejor rendimiento y capacidad de 
discriminación para predicción de mortalidad entre pacientes con sospecha de infección 
que ingresan a la Unidad de Cuidados Intensivos del Hospital Universitario 
Nacional(escalas qSOFA, SOFA, SIRS, APACHE II y APACHE IV) 
 
2.2.2 objetivos específicos 
 
• Realizar una descripción general de las características clínicas y socio 
demográficas de la población de pacientes con sospecha de infección que ingresan 
a la UCI del HUN. 
 
• Caracterizar epidemiológicamente la población de pacientes con diagnóstico final 
de sepsis (criterios sepsis 3), haciendo énfasis en el tipo de infección, aislamientos 
y principales patrones de resistencia bacteriana encontrados. 
 
• Iniciar y consolidar la base de datos de pacientes con diagnóstico de sepsis de la 
unidad de cuidados intensivos del HUN, con el objeto de contribuir al desarrollo de 
nuevos proyectos de investigación y la evaluación de indicadores en calidad. 
 
• Diferenciar el rendimiento de las diferentes escalas en el subgrupo de pacientes 
con diagnóstico de cáncer activo 
 
2.3 Población 
 Pacientes adultos con sospecha de infección al ingreso en UCI. 
 
14 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
2.4 Lugar 
Unidad de cuidados intensivos Hospital Universitario Nacional (HUN). 
 
2.5 Criterios de Inclusión 
● Ser adulto mayor de 17 años 
● Tener a 24 horas del ingreso la sospecha de infección por historia clínica 
● Ingresar a la unidad en las primeras 48 horas del inicio del cuadro clínico 
● Solo se tomará el primer ingreso a la UCI dentro de su proceso terapéutico 
 
2.6 Criterios de Exclusión 
● Registros de información inapropiados en la historia. 
● Mujeres embarazadas o en la fase de puerperio temprano. 
● Pacientes con limitación de esfuerzo terapéutico o terminales al ingreso. 
● Pacientes que presenten mortalidad muy temprana en las primeras 4 horas. 
 
2.7 Características de las bases de datos 
La base de datos comprende información epidemiológica, diagnostica y paraclínica de los 
pacientes que han ingresado a la unidad de cuidado intensivo/intermedio del hospital 
universitario, es diligenciada y actualizada por auxiliares de epidemiologia capacitadas 
para tal fin. 
 
2.8 Desenlaces del estudio 
• Desenlace primario: 
mortalidad global: comprende todas las causas de mortalidad intrahospitalaria. 
• Desenlace secundario 
Predicción de mortalidad global en análisis por subgrupos: diagnostico oncológico activo 
 
 
 
Capítulo 2 15 
 
2.9 Tamaño de Muestra y Tipo de Muestreo 
El cálculo del tamaño muestral para la obtención de los individuos mínimos con el 
desenlace corresponde a la comparación de dos proporciones independientes que 
incluyen a verdaderos positivos (Sensibilidad) y falsos positivos (1 - especificidad). 
Asumiendo que el mejor sistema pronostico tiene una sensibilidad del 80% con una 
especificidad del 40% y usando un nivel alfa de 0.05 con una potencia del 80% el estudio 
requiere de por lo menos 82 individuos con el desenlace. Dado a que se estima una 
mortalidad del 30% en la muestra, el número mínimo de individuos sin el desenlace 
corresponde a 191 individuos, por lo que el total mínimo corresponde a 273 pacientes (n = 
82 + 191) (43)(44)(45). 
 
2.10 Procedimientos del estudio 
La unidad de cuidado crítico del Hospital Universitario Nacional comprende dos áreas una 
de cuidado intensivo, la cual cuenta con 32 camas y otra área de cuidado intermedio, que 
cuenta con 15 camas. Allí ingresan de acuerdo con el nivel de complejidad y cuidado 
requeridos por el paciente. Los pacientes ingresados a la unidad tienen dos orígenes, 
remitidos de otras instituciones (incluyendo áreas de urgencias, hospitalización y otras 
UCI) y aquellos que se encuentran en área de hospitalización general de la institución que 
en su estancia requieren internación en cuidado crítico. 
Cada uno de los pacientes que ingresa a la unidad es consignado en la base de datos 
específica del servicio de Cuidados intensivos del Hospital Universitario (plataforma de 
Google Drive) en el que se diligencian las historias clínicas previo a su ingreso al sistema 
hospitalarios. Así mismo se cuenta con una segunda base de datos en la que se han 
consignado los pacientes con fecha y consecutivo de ingreso, en esta misma se especifica 
el diagnóstico de ingreso. Una tercera fuente de datos corresponde al software 
administrativo Hosvital, utilizado en la institución. 
 
De esta revisión se tomaron los datos de registros que cumplían con los criterios de 
inclusión, posteriormente se retiraron los pacientes con criterios de exclusión y de esa 
forma se ensambló la cohorte. En cada paciente se realizó un nuevo cálculo de los 
sistemas de puntuación en las primeras 24 horas de la terapia y luego de ello se realizó un 
16 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
seguimiento a la hospitalización con el objeto de verificar el desenlace de mortalidad 
intrahospitalaria. 
 
2.11 Definición de variables 
Ver anexo N°1: Tabla de operacionalización de variables 
 
2.12 Procesamiento y análisis de datos 
La base de datos fue desarrollada y construida en la plataforma de RedCap, previa 
aprobación por miembro institucional de dicha aplicación. Su procesamiento y análisis se 
llevó a cabo en el software estadístico STATA 12.0. Todos los pacientes en principioeran 
considerados expuestos a la presencia de infección confirmada o probable, sin embargo, 
para efectos de la descripción de la base de datos se crearon dos grupos comparativos 
entre aquellos que presenten el desenlace muerte o no. Las variables cualitativas fueron 
resumidas en porcentajes, las variables cuantitativas en medias, medianas y desviaciones 
estándar. Las comparaciones entre grupos se realizaron usando una prueba t - Student 
para variables cuantitativas dependiendo de la presencia de normalidad. Para las variables 
cualitativas se usó un test de Chi2 o una prueba exacta de Fisher según los valores 
esperados en cada caso. El nivel de significancia se determinó a dos colas con un valor p 
menor de 0.05 o por la presencia de intervalos de confianza del 95%. 
 
Se realizó para cada individuo el cálculo de cada uno de los sistemas de puntuación 
evaluados (SIRS, qSOFA, SOFA, APACHE II y APACHE IV) usando tablas elaboradas 
desde la plataforma de ingreso de datos, para ello se tomarán los valores anormales de 
las variables fisiológicas encontradas en la historia clínica durante las primeras 24 horas 
de estancia. El rendimiento de los modelos se evaluó a través de 3 medidas; 
discriminación, calibración y estandarización. La capacidad del modelo para discriminar 
entre pacientes sobrevivientes y no sobrevivientes fue probado a través del área bajo la 
curva de características operativas del receptor (AUROC), las pruebas de hipótesis y 
comparaciones se harán a través del cálculo de los intervalos de confianza del 95%.(40,42) 
La calibración se evaluó a través del grado de correspondencia entre el riesgo de 
mortalidad predicho y el real observado, para ello se realizó una curva de calibración que 
Capítulo 2 17 
 
comparó en cada uno de los deciles de mortalidad la relación entre la correspondencia 
perfecta y la observada en cada caso. Finalmente, el grado de estandarización fue 
evaluado a través del cálculo de la razón de mortalidad estandarizada (RMS), este valor 
se obtuvo de dividir la media de mortalidad observada sobre la media de mortalidad 
predicha en cada sistema de puntuación. 
 
2.13 Métodos de reclutamiento 
Se seleccionaron pacientes que hayan ingresado durante el año 2019 a la unidad de 
manera secuencial, que cumplan los criterios de inclusión y que hayan sido registrados en 
la base de datos de seguimiento, por tratarse de un estudio retrospectivo basado en 
registros clínicos de intervenciones ya realizadas, se considera está exento de 
consentimiento informado. 
 
2.14 Consideraciones éticas: 
Este estudio fue revisado, aprobado y monitoreado por el comité de Ética institucional del 
Hospital Universitario Nacional de Colombia y de la facultad de medicina de la Universidad 
Nacional de Colombia, y fue realizado bajo las Guías Internacionales para Investigación 
Biomédica en Humanos, Declaración de Helsinki, enmienda 2008, ICH – Buenas Prácticas 
Clínicas. 
 
Según la normativa actual de la resolución 8430 de 1993 del ministerio de Salud, el 
presente estudio se clasifica como investigación sin riesgo, por ser de tipo documental 
retrospectivo y no tiene como fin ninguna intervención ni realización de procesos asociados 
a la atención. Dado que no se obtendrá información directamente de los pacientes, no 
requiere consentimiento informado. La información es tratada de manera confidencial, con 
la protección absoluta de la identidad de los pacientes incluidos, sin considerarse esta en 
el análisis ni en la publicación de resultados. La custodia de la información estuvo a cargo 
del investigador principal de acuerdo con los procesos y normativas descritas previamente. 
 
2.15 Hipótesis 
Con el presente estudio se espera realizar una medida comparativa objetiva de las escalas 
pronósticas más utilizadas en nuestro medio en los pacientes con sospecha de infección, 
y evaluar si son herramientas con un adecuado perfil de rendimiento y con una adecuada 
18 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
calibración en la población de interés. Con este conocimiento se podrá orientar dichas 
herramientas para estudios posteriores que puedan evaluar tanto pronóstico como 
intervenciones específicas. 
 
Hipótesis nula: No hay diferencias en predicción de mortalidad, todas son iguales, 
establecido por curva ROC, no hay diferencia significativa entre sí. 
 
AUCSOFA = AUCSIRS = AUCqSOFA = AUCAPACHE II = AUCAPACHE IV 
 
Hipótesis alterna: Las AUC son diferentes entre sí, se empleará como patrón comparador 
la AUC de SOFa, por ser desarrollada específicamente para sepsis y ser el estándar 
establecido en la última definición de sepsis. 
 
AUC SIRS ≠ AUC qSOFA ≠ AUC SOFA ≠ AUC APACHE IV. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3. Resultados 
Durante el periodo de tiempo comprendido entre marzo de 2019 a febrero de 2020 
ingresaron 3025 pacientes a la unidad de cuidados intensivos del Hospital Universitario 
Nacional. De estos pacientes fueron no elegibles todos aquellos sin sospecha de 
infección (n= 2528), quedando para su evaluación 497 pacientes con diagnóstico de 
infección probable. Se excluyeron (n=207) por diversos motivos lográndose una muestra 
final de 290 individuos (flujograma 3.1), entre los cuales se presentaron 80 casos de 
mortalidad (27.5%). Entre el grupo seleccionado final se confirmó la infección con un 
aislamiento positivo por cultivo en 113 pacientes (39,1%), los restantes completaron 
tratamiento antibiótico sin un aislamiento definitivo (n=177 (60,9%)), pero con diagnóstico 
final de infección como problema principal de tratamiento en la UCI.. 
Figura 3.1 Flujograma de pacientes incluidos 
 
20 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
3.1 Características de la cohorte 
Dentro de las características demográficas y clínicas de la población (n=290), la edad 
promedio fue de 62.6 años (SD +/- 18.9), con una mayor frecuencia de hombres (55.1%). 
Cumplían la definición de sepsis-3 279 (96,2%) pacientes. Los antecedentes más 
frecuentes encontrados fueron hipertensión arterial sistémica en 154 (53.1%) individuos y 
diabetes mellitus tipo 2 en 79 (27.04%) pacientes, siendo menos frecuentes la cirrosis 
con solo 6 (2.07%) casos y la infección por VIH en 10 (3.45%) individuos, también 61 
(21.03%) individuos tenían historia de falla cardiaca con FEVI deprimida. Respecto al 
subgrupo de interés 31 (10.62%) pacientes cursaban con una neoplasia hematológica y 
24 (8.2%) tenían una neoplasia solida activa o en tratamiento. 
Los focos infecciosos más frecuentes fueron la infección de origen respiratorio con 80 
(27.5%) casos e intraabdominal en 77 (26.5%), siendo menos frecuentes el urinario n=66 
(22.4%) y los tejidos blandos con 30 (10.4%) casos; en una importante proporción de 
pacientes no se pudo establecer un foco n=17 (5.86%), los restantes focos descritos 
fueron bacteriemia en 10 (3.4%), infección del sistema nerviosos central en 2 (0.69%) y 
otras diversas en 9 (3.1%) casos. Se logró obtener un aislamiento microbiológico en 113 
casos (39.1%), en los que los gérmenes gram negativos fueron los más frecuentes con 
100 (81.3%) aislamientos, con una importante proporción de expresión de algún 
mecanismo de resistencia antibiótica en 65 (65%) reportes, siendo los mecanismos 
reportados AMPC n=17 (13.7%) y BLEE n=14 (11.29%) los más frecuentes, destacando 
una alta frecuencia de carbapenem resistente n=12 (9.68%) e IRT en 13 (10.4%). 
Respecto a los gérmenes gram positivos correspondieron a solo un 12% (n=15) de todos 
los aislamientos, con reporte de MRSA en solo 3 casos. Hubo una baja frecuencia deotros gérmenes dados por hongos n=7 (5.69%) y un solo caso de aislamiento de 
micobacterias. (0.81%). 
En cuanto a las intervenciones y soportes requeridos en UCI, 125 (43.1%) pacientes 
tuvieron ventilación mecánica invasiva, con un tiempo promedio de 2.11 (SD +/- 4.5) 
días. Un 51.38% (n=149) de los pacientes tuvo requerimiento de soporte vasopresor y 37 
(12.7%) pacientes necesitaron terapia de reemplazo renal. Respecto a los factores 
pronósticos, el nivel promedio de lactato en la población fue 2.45 mmol/L (SD +/- 2.29), 
Capítulo 3 21 
 
279 (79.3%) pacientes cumplían criterios de SIRS al ingreso, el qSOFA solo fue positivo 
en 230 (45.5%), el SOFA promedio fue de 6.32 (SD +/- 3.6), el APACHE II promedio fue 
de 14.7 (SD +/- 7.1) y del APACHE IV fue 55.9 (SD +/- 24.9) puntos en la población.. 
Comparando el grupo de pacientes supervivientes con aquellos con un desenlace mortal, 
entre estos últimos el único antecedente con significancia estadística corresponde al de 
falla cardiaca con FEVI deprimida (p = 0.0084). Adicionalmente tuvieron en promedio 
más dias de ventilación mecánica 3.4 (SD +/- 4.6) y una gran proporción requirió soporte 
vasopresor n=65 (81.2%) y TRR en 21 (26.2%) casos. Entre los casos de mortalidad las 
variables de predicción fueron significativamente más altas con un lactato de 3.6 mmol/L 
(SD +/- 3.2), SOFA 9.32 (SD +/- 3.6), APACHE II 20.08 (SD +/- 6.8) y APACHE IV de 
79.1 (SD +/- 25.3) puntos. Para una mejor referencia de las características entre los 
grupos ver la Tabla 3.1 
Tabla 3.1. Características demográficas y clínicas población incluida 
Característica 
Todos los 
pacientes 
(n=290) 
Sobrevivientes 
(n=210) 
Mortalidad 
intrahospitalaria 
(n=80) 
Valor P 
Demográfico 
Hombre (%) 160 (55,1) 51% 63% 0.069 
Edad años (media+/-DE) 62.63 (18,9) 61,57 (18,6) 65,41 (19,5) 0.12 
Criterios Sepsis-3 279 (96,21) 199 (94,7) 80 (100) 0.03 
Antecedentes 
Hipertension arterial (%) 154 (53,1) 118 (56,1) 36 (45) 0.08 
Diabetes mellitus tipo 2 (%) 79 (27,24) 59 (28,5) 20 (25) 0.59 
Falla cardiaca (FEVI <50%) 
(%) 
61 (21,03) 36 (17,1) 25 (31,25) 0.0084 
EPOC (%) 43 (14,83) 32 (15,2) 11 (13,7) 0.74 
Enfermedad renal crónica 
(KDIGO 5) (%) 
39 (13,49) 27 (12,9) 12 (15) 0,64 
Cirrosis (%) 6 (2,07) 2 (0,9) 4 (5) 0.03 
Cáncer (%) 54 (18,62) 32 (15,2) 22 (27,5) 0.0165 
Infección por VIH (%) 10 (3,45) 4 (2,3) 6 (6,2) 0.1 
Variables clínicas 
ventilación mecánica 125 (43,1) 64 (30,4) 61 (76,2) <0,001 
Dias de ventilación mecánica 
(dias +/- DE) 
2,11 (4,5) 1,60 (4,4) 3,425 (4,6) 0.0023 
Dias de estancia en UCI (dias 
+/-DE) 
4,77 (4,7) 4,42 (4,4) 5,68 (5,3) 0.04 
Terapia de reemplazo renal 37 (12,76) 16 (7,6) 21 (26,2) <0.001 
Soporte vasopresor 149 (51,38) 84 (40) 65 (81,2) <0.001 
Lactato mmol/L (media +/- 
DE) 
2,45 (2,29) 1,99 (1,57) 3,64 (3,27) <0.001 
Variables de predicción 
SIRS (2 o más puntos) 230 (79,3) 165 (78,57) 65 (81,2) 0.61 
qSOFA (2 o más puntos) 132 (45,5) 80 (38,09) 52 (65) <0.001 
SOFA (puntos +/- DE) 6,32 (3,63) 5,18 (2,90) 9,32 (3.67) <0.001 
APACHE II (puntos +/- DE) 14,4 (7,18) 12,23 (6.06) 20,08 (6.80) <0.001 
22 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
APACHE IV (puntos +/- DE) 55,96 (24,99) 47,10 (18.31) 79,21 (25.33) <0.001 
 
3.2 Evaluación capacidad de discriminación sistemas de 
predicción 
En la evaluación de desempeño de los diferentes sistemas de predicción al desarrollo de 
mortalidad, cumplir con criterios de SIRS tiene un AUROC de 0.53 (IC 95% 0.4-0.6), 
puntos de qSOFA presento un AUROC de 0.68 (IC 95% 0.62-0.75), el sistema SOFA 
tuvo AUROC de 0.8 (IC 95% 0.75-0.86), APACHE II 0.81 (IC 95% 0.76-0.86) y APACHE 
IV de 0.85 (IC 95% 0.80-0.90), ver tabla 3.2. Las curvas ROC son representadas en el 
gráfico. 
Tabla 3.2 AUROC discriminación de mortalidad en la población total 
 AUROC Error estándar Intervalos de confianza (IC 95%) 
SIRS 0.53 0.03 0.46 - 0.60 
qSOFA 0.68 0.03 0.62 - 0.75 
SOFA 0.80 0.02 0.75 - 0.86 
APACHE II 0.81 0.02 0.76 - 0.86 
APACHE IV 0.85 0.02 0.80 - 0.90 
 
Capítulo 3 23 
 
Figura 3.2 Curvas ROC discriminación de mortalidad
 
 
3.3 Evaluación de calibración de los sistemas de 
predicción. 
Solo los sistemas diseñados para la predicción de mortalidad pudieron ser evaluados en 
su calibración (Ver tabla 3.3). La SMR para SOFA fue 0.95 muy cercana al 1; los 
sistemas APACHE II y APCHE IV, registraron una SMR de 1.2 y 1.47 respectivamente, 
reflejando una subestimación. El CITL (calibration-in-the-large) fue de -0.09 para el 
SOFA, 0.13 para APACHE II y 0.71 para APACHE IV, siendo nuevamente mejor para 
SOFA. Las pendientes de las gráficas de calibración fueron de 0.8, 1.23 y 1.52, para 
SOFA, APACHE II y APACHE IV respectivamente. Al observar con detalle las gráficas, 
SOFA (figura 3.3) muestra una alta concordancia con la línea de referencia, con un 
discreto descenso en los deciles de población en las que se predice una de mortalidad 
mayor al 80%. Respecto a las gráficas de APACHE II (figura 3.4) como APACHE IV 
(figura 3.5), son congruentes con el nivel de referencia en los deciles de bajo riesgo, sin 
0
.0
0
0
.2
5
0
.5
0
0
.7
5
1
.0
0
S
e
n
s
it
iv
it
y
0.00 0.25 0.50 0.75 1.00
1-Specificity
SIRS - AUC: 0.534 qSOFA - AUC: 0.688
SOFA - AUC: 0.807 APACHE II - AUC: 0.816
APACHE IV - AUC: 0.854 Reference line
24 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
embargo, se desvían en los deciles medios y alto de mortalidad, los cuales reflejan una 
tendencia a subestimar la mortalidad predicha. 
Tabla 3.3 Parámetros de calibración de los sistemas de predicción 
Modelo 
evaluado 
Brier 
score 
Media de 
probabilidad 
de mortalidad 
observada 
Media de 
probabilidad 
de mortalidad 
predicha 
Razón de 
mortalidad 
estandarizada 
(SMR) 
Relación 
E:O 
CITL Pendiente 
SOFA 0.14 
0,27 
0.28 0.95 1.04 -0.09 0.8 
APACHE 
II 
0.16 0.22 1.20 0.92 0.13 1.23 
APACHE 
IV 
0.13 0.18 1.47 0.66 0.71 1.52 
 
Figura 3.3 Curva de calibración SOFA score
 
1
0
E:O = 1.049
CITL = -0.099
Slope = 0.800
AUC = 0.798
0
.2
.4
.6
.8
1
O
b
s
e
rv
e
d
0 .2 .4 .6 .8 1
Expected
 Reference
 Groups
 95% CIs
 Lowess
Curva de calibración - SOFA score
Capítulo 3 25 
 
Figura 3.4 Curva de calibración APACHE II
 
Figura 3.5 Curva de calibración APACHE IV
 
1
0
E:O = 0.920
CITL = 0.133
Slope = 1.231
AUC = 0.815
0
.2
.4
.6
.8
1
O
b
s
e
rv
e
d
0 .2 .4 .6 .8 1
Expected
 Reference
 Groups
 95% CIs
 Lowess
Curva de calibración - APACHE II
1
0
E:O = 0.660
CITL = 0.714
Slope = 1.527
AUC = 0.900
0
.2
.4
.6
.8
1
O
b
s
e
rv
e
d
0 .2 .4 .6 .8 1
Expected
 Reference
 Groups
 95% CIs
 Lowess
Curva de calibración - APACHE IV
26 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
3.4 Análisis rendimiento en subgrupo de pacientes con 
diagnóstico oncológico activo 
En el subgrupo de pacientes con diagnóstico oncológico, la capacidad de discriminación 
para predicción de mortalidad establecida con la AUROC fue para el SIRS de 0.56 (IC 95% 
0.41-0.72), qSOFA 0.60 (IC 95% 0.45-0.74), subóptimos considerando el punto de 
referencia de 0.7. Para los sistemas SOFA 0.71 (IC 95% 0.57-0.85), APACHE II 0.76 (IC 
95% 0.63-0.89) y APACHE IV 0.75 (IC 95% 0.61-0.89), en un nivel aceptable de capacidad 
de discriminación en este subgrupo. (Tabla 3.4) En cuanto a la calibración (Tabla 3.5) tanto 
media como débil, el CITL correspondió en SOFA a 0.59, APACHE II 0.907 y APACHE IV 
0.65. Las pendientes fueron 0.83, 1.17 y 1.15 paraSOFA, APACHE II y APACHE IV 
respectivamente. Las gráficas de calibración son representadas (figuras 3.5, 3.6 y 3.7) 
reflejando una baja congruencia con los tres sistemas de predicción en todos los deciles 
de mortalidad predicha. 
 
 
Tabla 3.4 Capacidad de discriminación en subgrupo de pacientes con cáncer 
 AUROC Error estándar Intervalos de confianza (IC 95%) 
SIRS 0.56 0.07 0.41 - 0.72 
qSOFA 0.60 0.07 0.45 - 0.74 
SOFA 0.71 0.07 0.57 - 0.85 
APACHE II 0.76 0.06 0.63 - 0.89 
APACHE IV 0.75 0.07 0.61 - 0.89 
 
Tabla 3.5 Parámetros de calibración en subgrupo de pacientes con cáncer 
 CITL Pendiente E:O 
SOFA 0.59 0.87 0.76 
APACHE II 0.90 1.17 0.58 
APACHE IV 0.65 1.15 0.71 
 
 
Capítulo 3 27 
 
Figura 3.6 Curva de calibración SOFA score en paciente con cáncer 
 
Figura 3.7 Curva de calibración APACHE II score en paciente con cáncer 
 
1
0
E:O = 0.769
CITL = 0.591
Slope = 0.873
AUC = 0.706
0
.2
.4
.6
.8
1
O
b
s
e
rv
e
d
0 .2 .4 .6 .8 1
Expected
 Reference
 Groups
 95% CIs
 Lowess
Curva de calibración - población cáncer - SOFA
1
0
E:O = 0.588
CITL = 0.907
Slope = 1.171
AUC = 0.726
0
.2
.4
.6
.8
1
O
b
s
e
rv
e
d
0 .2 .4 .6 .8 1
Expected
 Reference
 Groups
 95% CIs
 Lowess
Curva de calibración - población cáncer - APACHE II
28 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
Figura 3.8 Curva de calibración APACHE IV score en paciente con cáncer 
 
 
1
0
E:O = 0.719
CITL = 0.659
Slope = 1.157
AUC = 0.764
0
.2
.4
.6
.8
1
O
b
s
e
rv
e
d
0 .2 .4 .6 .8 1
Expected
 Reference
 Groups
 95% CIs
 Lowess
Curva de calibración - población cáncer - APACHE IV
 
 
 
4. Conclusiones y recomendaciones 
4.1 Conclusiones 
La sepsis es uno de los motivos principales de ingreso a la unidad de cuidados 
intensivos, se asocia a una alta mortalidad a pesar de las múltiples intervenciones(1); 
como en otras patologías, es importante contar con sistemas que permitan predecir 
adecuadamente el desenlace de mortalidad, para lograr una adecuada estandarización 
de grupos de riesgo con el fin de definir intervenciones, su posible inclusión en estudios y 
medir variables de calidad de atención. (12) De los sistemas evaluados en el presente 
trabajo se ha descrito una variabilidad significativa de su rendimiento entre diversas 
poblaciones, lo que recalca la importancia de contar con una herramienta 
adecuadamente evaluada para su uso en la práctica diaria en una población especifica. 
Como primera conclusión del presente estudio se puede decir que el SOFA score es la 
escala de predicción pronóstica de elección para usar entre pacientes sépticos de 
nuestro medio y válida los criterios de sepsis 3 en nuestra población. El SOFA demostró 
una buena capacidad de discriminación; adicionalmente reveló una adecuada calibración, 
demostrada tanto en las medidas de desempeño global, en el radio estandarizado de 
mortalidad y con las gráficas de calibración que muestran una congruencia casi perfecta 
en la mayoría de los deciles de riesgo. Los sistemas APACHE tanto en su versión II 
como IV, a pesar de que muestran una excelente discriminación, no se encuentran 
calibrados en nuestra población, lo cual limita de manera significativa la posibilidad de 
uso en la práctica. 
Como antecedentes de estudios comparativos similares realizados a nivel mundial para 
evaluar la capacidad de discriminación, el SOFA es la escala más ampliamente utilizada, 
en su estudio de derivación de los criterios de sepsis-3, este mostro una AUROC de 0.7 y 
su versión simplificada el qSOFA uno de 0.66 en pacientes de UCI.(24) Luego de este la 
aplicación en otras poblaciones del primer mundo y de Asia mostraron rendimientos 
similares.(28)(37)(40)(42) En el caso Latinoamericano en una cohorte de UCI de Brasil, 
30 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
no encontró ninguna diferencia en capacidad de predicción de mortalidad comparando 
SOFA con SIRS. (31) No obstante, una reciente publicación de origen argentino 
multicéntrica mostró un AUROC de 0.74 para SOFA, en su capacidad de discriminación 
de mortalidad. (32) Respecto a los otros sistemas evaluados, el uso de APACHE II es de 
amplia difusión en el medio y de acuerdo con sus autores desde su actualización en la 
versión IV, se recomienda el abandono de versiones anteriores a este, sin embargo, se 
tiene pocos datos de su utilidad el grupo de pacientes con infección, contando con 
algunos estudios realizados en poblaciones europeas y asiáticas en las que logra un 
rendimiento excelente con AUROC mayores de 0.8 en algunos de estos.(34)(35)(38)(41). 
De los sistemas evaluados en el presente trabajo tanto el SOFA, como los sistemas 
APACHE, mostraron un muy buen rendimiento en capacidad de discriminación en 
nuestra población con AUROC todos superiores a un corte de 0.8, con lo que se puede 
considerar que el SOFA y el APACHE II - IV tienen rendimientos similares. Así mismo las 
curvas ROC son consistentes en la superioridad de estos sistemas respecto a SIRS y 
qSOFA. 
No obstante, al evaluar la calibración, en los estudios precedentes realizados 
específicamente en pacientes sépticos, muy pocos evaluaron como objetivo del estudio 
la adecuada calibración de cada puntaje a su población, y adicionalmente cada estudio 
realizo diferentes medidas lo cual limita su comparabilidad. El estudio de Seymour et 
al(24) sólo incluyo la elaboración de graficas de calibración, en la que por lo menos para 
el qSOFA, tiene una amplia desviación de su congruencia de predicción en los deciles de 
riesgo extremos (bajo y alto riesgo); este hallazgo fue replicado por Raith et al (28) y 
otros sistemas como el SIRS y el SOFA también comparten el mismo problema en los 
deciles extremos. En el caso argentino, Estenssoro et al (32) sólo realizó el test de 
Hosmer- Lemeshow para el sistema SOFA, arrojando una p= 0.27, la cual muestra que 
no hay un pobre ajuste de este sistema para la predicción de mortalidad. De los estudios 
que evaluaron el sistema APACHE de los disponibles como los realizados por Dabhi AS 
et al (35) y Khwannimit et al (41), evaluaron la razón estandarizada de mortalidad la cual 
se encontraba muy por fuera de rango para considerarlo como adecuado. El presente 
estudio se orientó el análisis de la calibración de manera integral y global del SOFA, 
APACHE II y APACHE IV, ya que son los únicos que brindan una predicción de 
Capítulo 4 31 
 
mortalidad de tipo numérico. Respecto al rendimiento global, establecida principalmente 
con el Brier score, se puede evidenciar que no hay diferencias notables entre los 
diferentes puntajes. La razón estandarizada de mortalidad que permite una comparación 
de los eventos observados sobre los predichos mostró que el SOFA (SMR 0.95) está 
cercano al límite de referencia de 1. Los sistemas APACHE tienden a subestimar los 
eventos significativamente. En el resto de las pruebas que dan una información más 
integral de la calibración entre los diferentes deciles de riesgo, en la CITL el SOFA fue 
significativamente superior respecto al APACHE; así mismo en las curvas de calibración 
existe una concordancia casi perfecta del sistema SOFA a la línea de referencia, solo 
desviándose ligeramente en los grupos de más alto riesgo con mortalidad predichas de 
más del 80%. Respecto a las curvas de los sistemas APACHE II y IV, existe una notable 
desviación respecto al nivel de referencia con una significativa tendencia a subestimar los 
eventos de mortalidad, tanto en los deciles de riesgo moderado y alto de mortalidad. En 
la variable de calibración débil, proveída por la pendiente, tanto el SOFA como el 
APACHEII, tienen tendencia a un discreto efecto de desviación, sin embargo, el 
APACHE IV mostraría una alteración significativa en este aspecto. Con esto se concluye 
que el único sistema con adecuada calibración para nuestra población es el SOFA. 
Respecto al papel del SIRS y del qSOFA en el escenario de cuidado crítico, es 
importante evaluar estos en diferentes escenarios, a pesar de que su formulación inicial 
es para identificar pacientes en atención de urgencias y en el ámbito prehospitalario. Un 
reciente metaanálisis realizado por Serafim et al, evaluó su rendimiento en pacientes 
tanto de urgencias como de ingreso a UCI, estos últimos representado casi el 80.6% de 
la población incluida, llegando a la conclusión que los criterios de SIRS son más 
sensibles para el diagnóstico de sepsis (RR, 1.32; 95% CI, 0.40-2.24; P < .0001; I2 
100%), sin embargo, el qSOFA es más específico (97.3%; 95% CI, 92.1-99.4) y tiene 
mejor capacidad de predicción de mortalidad según el RR ([RR], 0.03; 95% CI, 0.02-0.05; 
P .002; I2 48%) de las diversos AUROC comparadas. (46) Es de notar sin embargo que 
en otros estudios solo un 63,5% de los ingresos a UCI tienen un puntaje qSOFA mayor o 
igual a 2 a pesar de cursar con choque séptico.(47) En nuestro estudio SIRS no tiene 
ninguna utilidad para predicción de desenlaces adversos por su pobre rendimiento 
discriminativo (AUROC: 0.53). Igualmente, solo un 45% de los pacientes tenían un 
qSOFA mayor o igual a 2 al ingreso a la unidad de cuidado intensivo. Como en otras 
publicaciones el AUROC del qSOFA para mortalidad fue de solo 0.68, considerándose 
32 Evaluación de escalas pronósticas en sepsis: valoración de SOFA, qSOFA, 
SIRS y APACHE IV como predictores de mortalidad en pacientes críticamente 
enfermos de un hospital general de Bogotá, año 2019 
 
como subóptimo para pacientes en cuidado critico; con esto se concluye que ni el SIRS, 
ni el qSOFA deberían ser elementos que guíen la clasificación de riesgo de pacientes 
que ingresan por sospecha de infección a la unidad de cuidado intensivo. 
 
En cuanto a las características de la población del estudio, es de destacar que en una 
gran proporción satisfacían los criterios de sepsis-3, con unas pocas excepciones en el 
grupo de supervivientes y con un cumplimiento completo entre todos aquellos con 
desenlace de mortalidad. No hubo una asociación a mayor mortalidad ni por edad o 
antecedentes, exceptuando tener historia de falla cardiaca con FEVI deprimida. Como es 
de esperar el requerimiento de soportes avanzados como de ventilación mecánica, 
soporte vasopresor o terapia de reemplazo renal también se asocian a mayor mortalidad 
de manera significativa. La epidemiologia de las infecciones no difiere al de otras 
poblaciones respecto al foco respiratorio y abdominal como los de mayor importancia y al 
papel preponderante de las bacterias gram negativas entre los aislamientos reportados 
en los pacientes sépticos. (10) Finalmente, la mortalidad global en nuestra población 
(27,5%) es significativamente superior los estudios de derivación de la definición actual 
de sepsis-3, como el de Seymour et al (17%) y Raith et al 18,7%.(24)(28), sin embargo 
es inferior a la reportada en el estudio multicéntrico colombiano realizado por Ortiz et al la 
cual fue del 33,6%.(6) 
En pacientes con diagnóstico oncológico activo, la sepsis es más frecuente como motivo 
de ingreso respecto a la población general, adicionalmente la mortalidad intrahospitalaria 
es mayor en esta población, en especial ante un diagnóstico de cáncer activo, un origen 
hematológico de la neoplasia o un mayor estadio clínico. El cáncer se asocia también a 
mayores complicaciones como lo son infecciones polimicrobianas, mayor compromiso 
multiorgánico y a una mayor proporción de pacientes que requieren de soporte 
avanzados como ventilación mecánica y soporte vasopresor.(48) Nathan et al evaluó 
entre 353 pacientes con diagnóstico oncológico activo, la capacidad de discriminación del 
SOFA, qSOFA y SIRS, con un AUROC de 0.74 (95% IC 0.68-0.79), 0.65 (95% IC 0.59-
0.70), y 0.58 (95% IC 0.52-0.63) respectivamente.(49) En otra población coreana el 
AUROC fue de 0.66 para qSOFA y de 0.79 para el SOFA. (50) En otro estudio se 
determinó con el APACHE II es predictor de mortalidad con OR ( 1.07; 1.03-1.11). (51)En 
Capítulo 4 33 
 
el caso de Colombia existe un estudio previo Rojas et al, concluyo que el APACHE IV 
tiene un AUROC de 0.95 con buena calibración entre 238 pacientes. (52) En nuestro 
análisis de este subgrupo el cual es de interés, por ser un grupo de atención frecuente en 
la institución, no hubo diferencias en el pobre papel del SIRS y del qSOFA. Respecto a 
los otros sistemas se podrían considerar su capacidad de discriminación como similar al 
de la población general. Sin embargo, la calibración fue pobre para todos los sistemas, 
este hallazgo se podría atribuir al tamaño de muestra obtenido que no permite evaluar 
con un adecuado número los deciles de riesgo. 
El presente estudio tiene múltiples limitaciones dadas por su carácter retrospectivo, así 
mismo en una importante proporción de pacientes no fue medida la albumina (n=108 -
37%), la cual es un paraclínico requerido en el APACHE IV, aunque no consideramos 
que modifique significativamente el puntaje atribuido a cada paciente y con ello los 
hallazgos del presente estudio. A pesar de lograrse la muestra requerida para una 
evaluación optima en la población general, un mayor tamaño muestral habría dado más 
precisión en los hallazgos en el análisis de subgrupo de pacientes oncológicos. Como 
fortalezas del estudio se realizó una revisión amplia de todas las variables requeridas 
para realizar un nuevo cálculo de cada sistema; adicionalmente se evaluó de manera 
conjunta la discriminación y la calibración, de lo que adolecen muchos estudios 
precedentes, lo que da significancia a las conclusiones del estudio. La población descrita 
es comparable a la de otros estudios, tanto externos como del medio colombiano, lo cual 
facilitaría su generalización. No obstante, se deberían realizar estudios de carácter 
multicéntrico, incluyendo ciudades de otras regiones, para evaluar la replicabilidad de los 
presentes hallazgos. 
4.2 Recomendaciones 
En nuestro medio en pacientes que ingresan a la unidad de cuidado crítico con sospecha 
de infección la escala que debe utilizarse como predictora de mortalidad es el SOFA 
score. Los sistemas APACHE necesitan un ajuste en su calibración para poder ser 
considerados como de utilidad en la práctica clínica en el contexto evaluado. SIRS y 
qSOFA no deberían emplearse en la clasificación de riesgo de los pacientes que 
ingresan a la UCI con sospecha de infección.
 
 
 
A. Anexo 1: Tabla de operacionalización de variables 
 
Categoria Variable Definicion 
unidad 
de 
medida 
Tipo de 
Variable relacion Nivel operativo 
Varabes 
demograficas 
Edad 
Numero de años 
cumplidos al 
ingreso Años Cuantitativa independiente numero absoluto 
Sexo 
Genero registrado 
en documento de 
identidad NA Nominal independiente 
Masculino : 0 
Femenino:1 
Antecedentes 
reportados en 
ingreso del 
paciente a la 
institucion 
Hipertension 
presion arteial 
>140/90 o toma de 
medicacion 
antihipertensiva 
registrado en 
historia clinica NA Nominal independiente no: 0 si: 1 
EPOC 
esprimoetria con 
FEV1 <70%, no 
reversible con 
antecedente 
exposicional a 
tabaco o biomasa o 
uso de inhaladores 
previamente, 
registrado en 
historia clinica 
NA Nominal independiente no: 0 si: 1 
Diabetes 
Hb glicosilada > a 
6.5%, glucemia al 
azar mayor a 200 
mg/dL, o uso de 
medicacion 
antidiabetica oral o 
insulinas, registrado 
en historia clinica 
NA Nominal independiente no: 0 si: 1 
Falla cardicaca 
Ecocardiograma 
con FEVI menor a 
50%, o mayor con 
evidencia de 
disfuncion diastólica 
grado II en 
adelante, registrado 
en historia clinica 
NA Nominal independiente