Logo Studenta
¡Este material tiene más páginas!

Vista previa del material en texto

NUEVOS MODELOS PREDICTIVOS DE 
ENFERMEDAD CARDIOVASCULAR 
 
 
Antonio Palazón Bru 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
www.ua.es
www.eltallerdigital.com
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
1 
 
UNIVERSIDAD DE ALICANTE 
 
Departamento de Matemática Aplicada 
Escuela Politécnica Superior 
 
 
 
NUEVOS MODELOS PREDICTIVOS DE ENFERMEDAD 
CARDIOVASCULAR 
 
Antonio Palazón Bru 
 
Programa de Doctorado en Métodos Matemáticos y Modelización en 
Ciencias e Ingeniería 
 
Tesis presentada para aspirar al grado de 
DOCTOR/DOCTORA POR LA UNIVERSIDAD DE ALICANTE 
 
 
DIRIGIDA POR LOS PROFESORES: 
Dra. Dña. Isabel Vigo Aguiar Dr. D. Vicente Francisco Gil Guillén 
Catedrático de Escuela Universitaria Profesor Titular de Universidad 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
2 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
3 
 
 
 
A mis padres y a mi abuelo por su apoyo y cariño incondicional 
en este proyecto. 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
4 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
5 
 
 
 
A mis directores de tesis por su colaboración en la realización de esta 
tesis doctoral. 
 
Al profesor doctor D. Ramón Ángel Durazo por sus enseñanzas en la 
predicción de enfermedades cardiovasculares. 
 
Al profesor doctor D. Julio Antonio Carbayo Herencia, por su valiosa 
ayuda en todas las publicaciones pertenecientes a esta tesis doctoral. 
 
A D. Ian Jonstone, por su ayuda a lo largo de estos años de trabajo, ya 
que sus comentarios y consejos han contribuido de forma sustancial en 
mi carrera profesional, además de su apoyo lingüístico en los artículos 
científicos integrados en esta tesis doctoral. 
 
Al grupo GEVA por permitir hacerme partícipe del proyecto para construir 
la escala de riesgo cardiovascular. 
 
A Dña. Maria Repice por su contribución en la traducción de los artículos 
científicos presentados en esta tesis doctoral. 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
6 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
7 
 
 
 
 
 
 
 
 
 
 
“Ninguna investigación humana puede ser denominada ciencia si no pasa 
a través de pruebas matemáticasi 
Leonardo Da Vinci 
 
 
 
 
 
 
 
i This image (or other media file) is in the public domain because its copyright has expired. 
This applies to Australia, the European Union and those countries with a copyright term of life of the 
author plus 70 years. 
Nuevos modelos predictivos de enfermedad cardiovascular. 
8 
Nuevos modelos predictivos de enfermedad cardiovascular. 
9 
ÍNDICE 
1. SÍNTESIS DE LAS PUBLICACIONES PRESENTADAS........................... 11
1.1. Antecedentes y estado actual del tema. ............................................ 13 
1.2. Justificación. ...................................................................................... 16 
1.3. Objetivos. ........................................................................................... 16 
1.4. Artículos presentados. ....................................................................... 17 
1.5. Métodos. ............................................................................................ 18 
1.5.1. Modelos básicos empleados en las mejoras propuestas. ............. 18 
1.5.2. Predicciones a corto, medio y largo plazo. ................................... 23 
1.5.3. Determinación de la mejor combinación de variables para predecir 
un evento cardiovascular. ......................................................................... 26 
1.5.4. Construcción, validación y utilización de un sistema de puntos con 
medidas repetidas de los factores de riesgo cardiovascular. .................... 29 
1.6. Resultados. ........................................................................................ 33 
1.6.1. Predicciones a corto, medio y largo plazo. ................................... 33 
1.6.2. Determinación de la mejor combinación de variables para predecir 
un evento cardiovascular. ......................................................................... 38 
1.6.3. Construcción, validación y utilización de un sistema de puntos con 
medidas repetidas de los factores de riesgo cardiovascular. .................... 38 
1.7. Discusión. .......................................................................................... 56 
1.8. Referencias. ....................................................................................... 60 
2. TRABAJOS PUBLICADOS. ...................................................................... 67
3. CONCLUSIONES. ...................................................................................107
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
10 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
11 
 
 
 
 
 
 
 
 
 
 
1. SÍNTESIS DE LAS PUBLICACIONES 
PRESENTADAS. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
12 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
13 
 
1.1. Antecedentes y estado actual del tema. 
 
Puesto que las enfermedades cardiovasculares en la actualidad constituyen 
una de las principales causas de mortalidad en el mundo (WHO, 2014), es 
lógico que sea de gran interés el desarrollo de modelos de predicción con el 
objetivo de conocer sobre qué factores de riesgo podemos intervenir para 
disminuir la probabilidad de que un paciente desarrolle una enfermedad 
cardiovascular (Molinero, 2003). 
El modelo más sencillo para realizar predicciones de un suceso dicotómico, 
como es la enfermedad cardiovascular, es el modelo de regresión logística 
binaria (Hosmer & Lemeshow, 2000), que produce una ecuación en la que 
conocidos los valores de los diferentes factores de riesgo, se puede evaluar la 
probabilidad de aparición de la enfermedad. Sin embargo, este tipo de modelos 
no tiene en cuenta el tiempo de exposición. Esto es precisamente lo que se 
hace en los modelos de supervivencia, los cuales analizan el tiempo de 
ocurrencia de un evento determinado, siendo el método más conocido el 
modelo de regresión de Cox (Hosmer & Lemeshow, 2008). Sin embargo, no es 
la única alternativa posible, existiendo otros posibles métodos de 
supervivencia, denominados paramétricos, debido a que suponen un tipo 
concreto de distribución, como la de Weibull, que fue utilizada por el proyecto 
SCORE (Conroy et al., 2003). Por otra parte, el estudio Framingham (National 
Heart, Lung, and Blood Institute, 2015) ha utilizado tanto modelos de regresión 
logística como modelos de supervivencia (paramétricos y no paramétricos). 
Como referencia se utiliza en Europa la tabla de riesgo SCORE y en Estados 
Unidos la del estudio Framingham. Estas tablas de riesgo están basadas en un 
tiempo de seguimiento de 10 años, por lo que no permiten obtener predicciones 
precisas a corto o medio plazo (Cooney, Dudina & Graham, 2009). Ésta es una 
cuestión clínicamente relevante, ya que si conocemos que un paciente tiene 
una alta probabilidad de desarrollar una enfermedad cardiovascular a corto 
plazo (por ejemplo 2 años), se debería someter a una terapia farmacológica y 
no farmacológica más intensa, ya que de no hacerlo es posible que el paciente 
experimente una enfermedad cardiovascular. 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
14 
 
Junto con los modelos predictivos de Framigham y SCORE, se han 
desarrolladootros modelos que también se utilizan en la práctica clínica en 
menor medida, como por ejemplo el Reynolds risk score and the WHO/ISH 
score (Cooney, Dudina & Graham, 2009). Todos estos modelos tienen un 
objetivo común: la realización de predicciones de enfermedad cardiovascular 
en un periodo de 10 años, pero en la modelización del problema utilizan 
diferentes modelos matemáticos (Cox y Weibull) y consideran diferentes 
outcomes (morbimortalidad de enfermedades coronarias, mortalidad de 
enfermedades coronarias, morbimortalidad cardiovascular o mortalidad 
cardiovascular). Esto permite tomar decisiones a largo plazo para los 
pacientes. Finalmente, destacamos que las guías de práctica clínica 
recomiendan la utilización de estos modelos predictivos para la estratificación 
del riesgo cardiovascular de los pacientes. Por ejemplo, la guía clínica europea 
sobre la prevención de las enfermedades cardiovasculares, indica que un 
sistema de estimación del riesgo, como SCORE, puede ayudar a la toma de 
decisiones y de esa forma evitar tanto el exceso como el defecto del 
tratamiento (Perk et al., 2012). En otras palabras, los clínicos siguen las guías 
clínicas para mejorar su toma de decisiones con el objetivo de prevenir una 
enfermedad cardiovascular, y son estas guías las que indican la utilización de 
estos modelos predictivos, lo que produce que tengan gran relevancia en la 
práctica clínica habitual. 
En lo referente a la elección de las variables incluidas en los modelos 
predictivos, generalmente los estudios cardiovasculares han recogido multitud 
de variables que podrían influir en el pronóstico de cada paciente. Sin embargo, 
en la práctica no todas ellas pueden ser incluidas en el modelo, ya que 
aumentaría su complejidad y podría no existir la convergencia en la estimación 
de sus parámetros (Hosmer & Lemeshow, 2008). Por ese motivo, la mayoría de 
estudios han realizado modelos por pasos basados en algún test estadístico, 
como puede ser el likelihood ratio test o el score test. Sin embargo, en estos 
pasos es posible que obviemos alguna combinación de variables que produzca 
un mejor pronóstico de la enfermedad cardiovascular, ya que podría ocurrir que 
una variable por sí sola no fuera estadísticamente significativa, pero cuando se 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
15 
 
combina con otro grupo de variables la predicción de la enfermedad 
cardiovascular mejorase (López-Bru et al., 2015; Ramírez-Prado et al., 2015). 
Dada la complejidad de estos modelos matemáticos, se ha aplicado un 
algoritmo que permite al clínico comprenderlo de forma sencilla, aunque se 
pierda precisión en la estimación de la probabilidad de enfermedad 
cardiovascular (Sullivan, Massaro & D'Agostino, 2004). Para ello se han 
transformado dichos modelos matemáticos en tablas de riesgo de colores que 
pueden ser empleadas en la práctica clínica de forma sistemática. No obstante, 
dichas tablas están basadas en modelos que manejan variables clínicas en la 
situación basal del paciente (Conroy et al., 2003; Cooney, Dudina & Graham, 
2009; National Heart, Lung, and Blood Institute, 2015), por lo que no tienen en 
cuenta la variabilidad de las mismas a lo largo del tiempo, ya que los 
parámetros biológicos están siendo considerados constantes a lo largo del 
tiempo de seguimiento, cuando tienen gran variabilidad y el facultativo puede 
intervenir mediante tratamiento farmacológico y disminuirlos o aumentarlos de 
forma acelerada (NCEP, 2002; American Diabetes Association , 2014; James 
et al., 2014; Stone et al., 2014). 
Existen modelos predictivos de supervivencia de otro tipo de enfermedades, 
que sí tienen en cuenta la variabilidad temporal de un único marcador biológico, 
además de variables basales. Éstos son conocidos como Joint Models for 
Longitudinal and Time-to-Event Data y están estructurados en dos partes: (i) Se 
aplica un modelo lineal mixto para determinar la trayectoria del parámetro 
longitudinal y (ii) a partir de un modelo de supervivencia se relacionan las 
variables basales y el parámetro longitudinal con la aparición de un evento. 
Este tipo de modelos pueden aplicarse para realizar predicciones más precisas 
del desarrollo de una enfermedad (Rizopoulos, 2012). Sin embargo, dada su 
complejidad, no se emplean en la práctica clínica habitual. Además, la 
modelización conjunta cuando la parte de supervivencia está formada por una 
función lineal con múltiples parámetros longitudinales (modelización habitual en 
el análisis de supervivencia clásico aplicado a las ciencias de la salud), sólo se 
ha abordado de forma teórica y en la actualidad sigue siendo un completo 
desafío computacional, lo que no ha permitido que se desarrollen algoritmos 
para realizar predicciones como en el caso univariado (Rizopoulos, 2011). 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
16 
 
1.2. Justificación. 
 
Es necesario dotar a los modelos predictivos de enfermedad cardiovascular ya 
existentes de mejoras que puedan ser de gran utilidad para los profesionales 
sanitarios, de forma que se mejore el pronóstico del paciente y no se pierda la 
sencillez de los sistemas de puntos, tan empleados en la práctica clínica 
habitual. Estas mejoras deberán aplicarse tanto a los conjuntos de datos que 
sólo contengan información en la situación basal, como a aquéllos que 
contengan medidas repetidas de los factores de riesgo cardiovascular a lo largo 
del tiempo. 
 
1.3. Objetivos. 
 
El objetivo general es mejorar los modelos predictivos de enfermedad 
cardiovascular que se utilizan en la actualidad en la práctica clínica habitual. 
Para ello se plantean los siguientes objetivos específicos: 
 
1. Detallar una metodología que permita construir y validar un modelo 
predictivo de enfermedad cardiovascular con sólo información basal, 
para obtener predicciones a corto, medio y largo plazo, para reducir la 
incidencia de enfermedad cardiovascular en la población, ya que hemos 
de tener en cuenta que los sistemas de puntos actuales no permiten 
obtener probabilidades a corto o medio plazo. 
 
2. Detallar cómo seleccionar las variables explicativas de un modelo 
predictivo de enfermedad cardiovascular, teniendo en cuenta todas las 
posibles combinaciones de variables que pueda soportar el modelo que 
se construye. 
 
3. Detallar una metodología para construir modelos predictivos de 
enfermedad cardiovascular que puedan aplicarse de forma sistemática 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
17 
 
en la práctica clínica habitual (sin perder los sistemas de puntos, tan 
utilizados en la actualidad) y que determine con la mayor precisión 
(teniendo en cuenta la variabilidad temporal de todos los factores de 
riesgo cardiovascular) el riesgo de desarrollo de la misma. 
 
1.4. Artículos presentados. 
 
Los objetivos planteados han sido desarrollados dando lugar a tres 
publicaciones científicas en revistas de alto de impacto del JCR (Science Ed.): 
 
1. Artigao-Ródenas LM, Carbayo-Herencia JA, Palazón-Bru A, Divisón-
Garrote JA, Sanchis-Domènech C, Vigo-Aguiar I, Gil-Guillén VF; GEVA 
(Group of Vascular Diseases from Albacete). 2015. Construction and 
validation of a 14-year cardiovascular risk score for use in the general 
population: the PURAS-GEVA chart. Medicine (Baltimore) 94: e1980. 
 
Medicine es una revista científica que aborda todas las especialidades y 
subespecialidades médicas con un factor de impacto de 5.723 (JCR 
2014), situada en la posición número 15 de un total de 153 en la 
categoría de MEDICINE, GENERAL & INTERNAL. 
 
2. Ramírez-Prado D, Palazón-Bru A, Folgado-de la Rosa DM, Carbonell-
Torregrosa MÁ, Martínez-Díaz AM, Martínez-St John DR, Gil-Guillén VF. 
2015. A four-year cardiovascular risk score for type 2 diabetic inpatients. 
PeerJ 3: e984. 
 
3. Palazón-Bru A, Carbayo-Herencia JA, Vigo-Aguiar I, Gil-Guillén VF. 
2016. Amethod to construct a points system to predict cardiovascular 
disease considering repeated measures of risk factors. PeerJ 4: e1673. 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
18 
 
PeerJ es una revista científica con un factor de impacto de 2.112, 
situada en la posición decimotercera en MULTIDISCIPLINARY 
SCIENCES, la cual engloba a un total de 57 revistas científicas. 
 
1.5. Métodos. 
 
En esta sección detallaremos las mejoras propuestas para la creación de 
nuevos modelos predictivos de enfermedad cardiovascular, pero antes de ello 
se realizará una síntesis de los modelos básicos empleados en dichas mejoras 
(modelo de supervivencia de Cox con variables tiempo-dependientes, cómo 
elaborar un sistema de puntos con la metodología del Framingham Heart 
Study, Joint Models for Longitudinal and Time-to-Event Data, y predicciones 
dinámicas utilizando Joint Models). 
 
1.5.1. Modelos básicos empleados en las mejoras propuestas. 
 
Modelo de supervivencia de Cox con variables tiempo dependientes 
Sea 𝑇 una variable aleatoria no negativa denotando el tiempo de supervivencia, 
que es el mínimo valor entre el verdadero tiempo hasta el evento 𝑇∗ y el tiempo 
de censura 𝐶 (censura no informativa por la derecha). En otras palabras, 
𝑇 = min(𝑇∗,𝐶). Además, definimos 𝛿 como el indicador del evento, que toma el 
valor 1 si 𝑇∗ ≤ 𝐶 y 0 en otro caso. Por otro lado, sea 𝑾 el vector de covariables 
basales e 𝒀(𝑡) el vector de covariables tiempo-dependientes que tiene valores 
definidos siempre para 𝑡 ≥ 0. Con estos datos, el modelo de Cox con 
covariables tiempo-dependientes toma la siguiente forma (función de riesgo): 
 
ℎ�𝑡|𝒘,𝒚(𝑡)� = ℎ0(𝑡) exp{𝜸𝑇𝒘 + 𝜶𝑇𝒚(𝑡)}, 
 
donde ℎ0(𝑡) es la función de riesgo en la situación basal, 𝜸 y 𝜶 son los vectores 
de los coeficientes de la regresión para las covariables basales y tiempo 
dependientes respectivamente (Andersen & Hill, 1982). 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
19 
 
La estimación de los parámetros del modelo está basada en la función de 
verosimilitud parcial (Andersen & Hill, 1982). Por otro lado, tenemos que 
corroborar si la forma funcional de cada una de las covariables en el modelo es 
lineal. Esto deberá hacerse mediante métodos gráficos (gráfico cartesiano 
enfrentando a los residuos de Martingala frente a la covariable de interés). 
Finalmente, debemos valorar si el modelo ajusta nuestros datos de forma 
correcta, a través del análisis de los residuos de Cox-Snell (test gráfico). 
El modelo clásico de Cox (sin variables tiempo-dependientes), elimina 𝜶 e 𝒚(𝑡) 
de la expresión anterior. Además, el modelo tiene que verificar la siguiente 
condición (hipótesis de riesgos proporcionales): 
 
log�
ℎ(𝑡|𝒘)
ℎ0(𝑡)
� =𝜸𝑇𝒘. 
 
Elaboración de un sistema de puntos desde un modelo de supervivencia de 
Cox mediante la metodología del Framingham Heart Study 
Vamos a resumir los pasos principales para adaptar un modelo de regresión de 
Cox con 𝑝 covariables a sistema de puntos, mediante la metodología elaborada 
por los investigadores del Framingham Heart Study (Sullivan, Massaro & 
D'Agostino, 2004): 
 
1) Estimar los parámetros del modelo: 𝜸�. 
 
2) Organizar los factores de riesgo en categorías y determinar valores de 
referencia: 
 
a. Factor de riesgo continuo (ejemplo: la edad): realizar 
agrupamientos contiguos del factor y determinar valores de 
referencia para cada agrupamiento. Ejemplo para la edad: 18-30 
[24], 30-39 [34.5], 40-49 [44.5], 50-59 [54.5], 60-69 [64.5] y ≥70 
años [74.5]. En corchetes se indican cada uno de los valores de 
referencia. Los investigadores del Framingham Heart Study 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
20 
 
recomiendan el punto medio de cada intervalo como un valor 
adecuado para la referencia, y para la primera y última categoría 
la media entre el valor extremo y el percentil 1 (primera categoría) 
o el percentil 99 (última categoría). 
 
b. Factores de riesgo binarios (ejemplo el sexo: 0 mujer y 1 hombre): 
los valores de referencia son 0 y 1. 
 
𝑊𝑖𝑗 denotará el valor de referencia para la categoría 𝑗 y el factor de 
riesgo 𝑖, donde 𝑖 = 1, . . . ,𝑝 y 𝑗 = 1, . . . , 𝑐𝑖 (número total de categorías para 
el factor de riesgo 𝑖). 
 
3) Determinar la categoría base para cada factor de riesgo: la categoría 
base será aquélla que otorgue 0 puntos en el sistema y será denotada 
por 𝑊𝑖𝑅𝐸𝐹, 𝑖 = 1, … ,𝑝. 
 
4) Determinar cuántas unidades de regresión se separa cada categoría de 
la categoría base: calcular 𝜸�𝑖 · �𝑊𝑖𝑗 −𝑊𝑖𝑅𝐸𝐹�, 𝑖 = 1, . . . ,𝑝 y 𝑗 = 1, . . . , 𝑐𝑖. 
 
5) Fijar la constante 𝐵: el número de unidades de regresión equivalentes a 
1 punto en el sistema. En el Framingham Heart Study se utiliza el 
incremento de 5 (ó 10) años de edad. 
 
6) Determinar el número de puntos para cada categoría de todos los 
factores de riesgo: el número entero más cercano a 𝜸�𝑖 · �𝑊𝑖𝑗 −𝑊𝑖𝑅𝐸𝐹�/
𝐵. 
 
7) Determinar el riesgo asociado con la puntuación total (la suma de todas 
las puntuaciones asociada a cada uno de los factores de riesgo): 
1 − �̂�0(𝑡)exp�∑ (𝜸�𝑖·𝑊𝑖𝑅𝐸𝐹)𝑝
𝑖=1 +𝐵·𝑃𝑢𝑛𝑡𝑜𝑠−∑ 𝜸�𝑖·𝒘�𝚤�
𝑝
𝑖=1 �, donde �̂�0(𝑡) se calcula a 
través del estimador de Kaplan-Meier. 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
21 
 
Joint Models for Longitudinal and Time-to-Event Data 
Utilizando la notación anterior, nosotros tenemos el vector de variables 
aleatorias {𝑇,𝑾,𝑌(𝑇)}, donde 𝑌(𝑇) es una única variable tiempo-dependiente 
(parámetro longitudinal), que tiene sus valores definidos de forma intermitente 
para 𝑡. En otras palabras, para un sujeto 𝑖 (𝑖 = 1, . . . ,𝑛), 𝑦(𝑡) está sólo definida 
para 𝑡𝑖𝑗 (𝑗 = 1, … ,𝑛𝑖), 𝑦𝑖�𝑡𝑖𝑗�, donde 0 ≤ 𝑡𝑖1 ≤ 𝑡𝑖2 ≤ ⋯ ≤ 𝑡𝑖𝑛𝑖 (𝑡𝑖𝑛𝑖 es el instante 
de tiempo máximo donde se ha recogido el parámetro longitudinal para el 
sujeto 𝑖). Ahora, vamos a denotar a 𝑚(𝑡) como el valor real y no observado del 
parámetro longitudinal en el instante de tiempo 𝑡 (𝑚𝑖(𝑡) para el sujeto 𝑖). Para 
valorar el efecto de 𝑚(𝑡) en el riesgo de evento, la opción estándar es ajustar 
un modelo de regresión de Cox con una única variable tiempo-dependiente: 
 
ℎ(𝑡|ℳ(𝑡),𝒘) = ℎ0(𝑡∗) exp{𝜸𝑇𝒘 + 𝛼𝑚(𝑡)}, 
 
donde ℳ(𝑡) para un sujeto 𝑖 se define como ℳ𝑖(𝑡) = {𝑚𝑖(𝑢); 0 ≤ 𝑢 < 𝑡}, que 
denota la historia del verdadero y no observado valor del parámetro longitudinal 
hasta el instante de tiempo 𝑡. El resto de parámetros de la expresión sigue la 
estructura del modelo de regresión de Cox con variables tiempo-dependientes, 
el cual se ha detallado anteriormente. Respecto a la función de riesgo basal, 
ésta puede dejarse no especificada o puede ser aproximada mediante splines o 
funciones definidas a trozos (Rizopoulos, 2012). 
En la expresión anterior, hemos utilizado 𝑚(𝑡) como el verdadero y no 
observado valor del parámetro longitudinal, sin embargo en nuestra muestra 
hemos recogido 𝑦(𝑡), por lo tanto estimaremos 𝑚(𝑡) utilizando 𝑦(𝑡) a través de 
un modelo lineal de efectos mixtos, con el objetivo de describir las evoluciones 
del parámetro longitudinal para cada uno de los sujetos: 
 
⎩
⎪
⎨
⎪
⎧ 𝑦𝑖(𝑡) = 𝑚𝑖(𝑡) + 𝜀𝑖(𝑡)
𝑚𝑖(𝑡) = 𝒙𝒊𝑇(𝑡)𝜷 + 𝒛𝒊𝑇(𝑡)𝒃𝒊
𝒃𝒊 ∼ 𝑁(𝟎,𝑫)
𝜀𝑖(𝑡) ∼ 𝑁(0,𝜎2)
, � 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
22 
 
donde 𝜷 y 𝒃𝒊 denotan los vectores de coeficientes de la regresión para los 
efectos fijos y para los efectos aleatorios respectivamente, 𝒙𝒊(𝑡) y 𝒛𝒊(𝑡) denotan 
los vectores fila de las matrices del diseño para los efectos fijos y para los 
efectos aleatorios respectivamente, y 𝜀𝑖(𝑡) es el error que tiene una varianza 
𝜎2. Finalmente, 𝒃𝒊 sigue una distribución normal con media 𝟎 y matriz de 
varianzas-covarianzas 𝑫, e independente de 𝜀𝑖(𝑡) (Rizopoulos, 2012).La estimación de los parámetros del modelo está basada en la maximización 
de la función de verosimilitud del modelo conjunto (Rizopoulos, 2012). 
Respecto a los supuestos del modelo, nosotros tenemos que verificarlos para 
ambos submodelos (longitudinal y supervivencia), utilizando los gráficos de 
residuos. Para la parte longitudinal, nosotros representaremos los residuos 
específicos de cada sujeto frente a los valores ajustados por el modelo, el 
gráfico Q-Q de los residuos específicos de cada sujeto, y los residuos 
marginales frente a los valores ajustados. Por otro lado, para la parte de 
supervivencia, nosotros representaremos en un gráfico cartesiano los valores 
ajustados de los parámetros longitudinales contra los residuos de Martingala, y 
finalmente determinaremos gráficamente si los residuos de Cox-Snell siguen 
una distribución (censurada) exponencial con parámetro la unidad (Rizopoulos, 
2012). Respecto la última componente del modelo conjunto sobre la que hemos 
indicado un supuesto (efectos aleatorios), otros autores han mostrado que los 
modelos lineales de efectos mixtos son robustos a la falta de especificación de 
esta distribución (Verbeke & Lesaffre, 1997). 
 
Predicciones de los parámetros longitudinales utilizando Joint Models for 
Longitudinal and Time-to-Event Data 
Sea una muestra aleatoria �𝑡𝑖, 𝛿𝑖,𝒘𝑖 ,𝑦𝑖�𝑡𝑖𝑗�, 0 ≤ 𝑡𝑖𝑗 ≤ 𝑡𝑖, 𝑗 = 1, … ,𝑛𝑖�, 𝑖 = 1, … ,𝑛 
del vector de variables aleatorias {𝑇, Δ,𝑾,𝑌}, utilizando la notación anterior. 
Supongamos también que hemos ajustado un joint model como el que el que 
se ha detallado anteriormente. Ahora, estamos interesados en predecir el valor 
esperado del parámetro longitudinal en un instante de tiempo 𝑢 > 𝑡 para un 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
23 
 
nuevo sujeto 𝑖, que tiene una historia hasta el tiempo 𝑡 del valor observado del 
parámetro longitudinal 𝒴𝑖(𝑡) = {𝑦𝑖(𝑠); 0 ≤ 𝑠 < 𝑡}: 
 
𝜔𝑖(𝑢|𝑡) = 𝐸𝑌{𝑦𝑖(𝑢)|𝑡𝑖∗ > 𝑡,𝒴𝑖(𝑡),𝒘𝒊;𝜽}, 
 
donde 𝜽 denota el vector de parámetros del joint model (Rizopoulos, 2011). 
Rizopoulos desarrolló una aproximación de Monte Carlo para realizar esta 
tarea, basada en formulación Bayesiana. Él obtuvo el siguiente algoritmo de 
simulación (Rizopoulos, 2011): 
 
Paso 1: Simular 𝜽(𝑙)~𝒩�𝜽�, 𝑣𝑎𝑟� �𝜽���. 
 
Paso 2: Simular 𝒃𝒊
(𝑙)~�𝒃𝒊|𝑡𝑖∗ > 𝑡,𝒴𝑖(𝑡),𝒘𝒊;𝜽(𝑙)�. 
 
Paso 3: Calcular 𝜔𝑖
(𝑙)(𝑢|𝑡) = 𝒙𝒊𝑇(𝑢)𝜷(𝑙) + 𝒛𝒊𝑇(𝑢)𝒃𝒊
(𝑙) 
 
Este algoritmo deberá ser repetido 𝐿 veces. La estimación del parámetro 
longitudinal será la media (o la mediana) de los valores calculados 
(𝜔𝑖
(𝑙)(𝑢|𝑡), 𝑙 = 1, … , 𝐿) y el intervalo de confianza estará formado por los 
percentiles (95%: percentiles 2.5 y 97.5%) (Rizopoulos, 2011). 
Nosotros destacamos que estas predicciones tienen naturaleza dinámica, ya 
que conforme se registra información del paciente, las predicciones se 
actualizan con dicha información. 
 
1.5.2. Predicciones a corto, medio y largo plazo. 
 
Una vez hemos adaptado los coeficientes de un modelo de supervivencia a un 
sistema de puntos construido mediante la metodología del estudio de 
Framingham (Sullivan, Massaro & D'Agostino, 2004), dispondremos de los 
siguientes elementos: 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
24 
 
1) Estimación de los 𝑝 coeficientes asociados a nuestros factores de riesgo 
(𝒘) del modelo de regresión: 𝜸�. 
 
2) Valor de ∑ 𝜸�𝑖 · 𝒘�𝚤�
𝑝
𝑖=1 . 
 
3) Todas las variables explicativas categorizadas. Por ejemplo, en una 
variable cuantitativa, como puede ser la edad en años, supongamos que 
disponemos de un rango para esta variable de 30-79 años, de forma que 
podemos utilizar las categorías de edad 30-39, 40-49, 50-59, 60-69, 70-
79 años. Por otra parte, si un factor está modelado por un conjunto de 
variables binarias, como puede ser el ser fumador, la categorización 
será: ausente (el sujeto no es fumador) y presente (el sujeto sí que es 
fumador). 
 
4) Cada categoría dispone de una puntuación asociada. Por ejemplo, en 
las categorías de edad anteriores, se podría dar el siguiente esquema de 
puntuaciones: 
 
a. 30-39 años → 0 puntos. 
b. 40-49 años → 2 puntos. 
c. 50-59 años → 4 puntos. 
d. 60-69 años → 6 puntos. 
e. 70-79 años → 8 puntos. 
 
Mientras que para la variable del tabaquismo, las puntuaciones podrían 
tener la siguiente forma: 
 
a. No fumador → 0 puntos. 
b. Fumador → 3 puntos. 
 
Sumando la puntuación asociada a cada categoría, obtenemos la 
puntuación total de cada sujeto. 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
25 
 
5) La estimación de la probabilidad de supervivencia, obtenida a través del 
estimador de Kaplan-Meier, para todos los instantes de tiempo recogidos 
durante el estudio. 
 
6) La constante 𝐵. 
 
7) Valores de referencia para cada uno de los factores de riesgo: 𝑊𝑖𝑅𝐸𝐹. 
 
A continuación, empleando toda esta información, podemos calcular la 
probabilidad de evento para un sujeto con una puntuación P en un instante de 
tiempo t, empleando la siguiente expresión: 
 
1 − �̂�0(𝑡)exp�∑ (𝜸�𝑖·𝑊𝑖𝑅𝐸𝐹)𝑝
𝑖=1 +𝐵·𝑃−∑ 𝜸�𝑖·𝒘�𝚤�
𝑝
𝑖=1 � 
 
 
Tanto los investigadores del Framingham Heart Study, como los del proyecto 
SCORE, han utilizado siempre un valor de 10 años para t, lo cual no permite 
obtener predicciones a corto o medio plazo, tal como se ha comentado 
anteriormente en el punto de Antecedentes y estado actual del tema. Sin 
embargo, la expresión anterior permite sustituir en cualquier valor de t 
contenido en el rango de seguimiento del estudio. Esto nos permite obtener 
predicciones a corto y medio plazo, así como a largo plazo (10 años). Por 
ejemplo, podríamos sustituir en 𝑡 = 2, 4, 6, 8, 10 años y obtendríamos la 
probabilidad cada dos años de evento cardiovascular, dependiendo 
exclusivamente de la puntuación de cada nuevo sujeto y del tiempo de 
predicción, ya que el resto de parámetros serían constantes en el cálculo. 
Ahora, una vez construido nuestro sistema de puntos con predicciones en 
varios puntos de corte en el tiempo, se nos presenta una dificultad, que es 
cómo validar el sistema de puntos para determinar si existen diferencias entre 
los eventos cardiovasculares observados y aquéllos pronosticados por nuestro 
sistema. 
La clave del cálculo de los eventos observados reside en que debemos de 
tener en cuenta que un sujeto que ha padecido un evento cardiovascular en el 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
26 
 
seguimiento, lo habrá padecido a partir de un instante fijo 𝑡∗, por lo que si 
estamos calculando los eventos observados antes de dicho instante de tiempo, 
el sujeto deberá ser considerado como libre de evento cardiovascular, mientras 
que si el punto de corte del tiempo es considerado superior a 𝑡∗, 
consideraremos que el participante sí que ha experimentado un evento. 
Tras cálculo de eventos observados y esperados en cada instante de tiempo 
prefijado (corto, medio o largo plazo), sólo debemos de determinar si existen 
diferencias mediante la prueba de la χ2 de Pearson, cuyo valor será diferente 
según el punto de corte del tiempo escogido (en el ejemplo anterior: 2, 4, 6, 8 y 
10 años). 
 
1.5.3. Determinación de la mejor combinación de variables para predecir 
un evento cardiovascular. 
 
Supongamos que tenemos un total de 𝑚 variables explicativas para tratar de 
predecir un evento cardiovascular mediante un modelo de supervivencia, por 
ejemplo un modelo de regresión de Cox. Por otro lado, consideremos que 
podemos introducir un máximo de 𝑟 variables en el modelo, ya que debemos de 
tener mucho cuidado en la convergencia del mismo y en la razón entre el 
número de eventos y el número de variables explicativas introducidas en dicho 
modelo. 
La mayoría de trabajos han propuesto utilizar un método por pasos basado en 
un test estadístico, como puede serel likelihood ratio test o el score test. Este 
modelo por pasos suele ser hacia adelante (partir del modelo nulo e ir 
introduciendo variables según el test estadístico elegido) o hacia atrás [partir 
del modelo saturado (con todas las variables explicativas) e ir extrayendo 
variables según el test estadístico elegido]. También se han considerado 
métodos por pasos sucesivos, los cuales combinan los dos métodos anteriores 
(hacia adelante y hacia atrás). Sin embargo, a la hora de realizar una 
predicción, nos interesa aquel conjunto de variables que puede explicar mejor 
nuestra variable respuesta, es decir, la aparición de la enfermedad 
cardiovascular en el tiempo. 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
27 
 
En los modelos de supervivencia se ha propuesto un estadístico, conocido 
como estadístico 𝐶 (Pencina & D'Agostino, 2004), el cual mide la capacidad 
discriminante del modelo para la variable respuesta. Este estadístico se 
encuentra entre 0 y 1. La interpretación de su valor es la siguiente: cuanto más 
cercano a 1 esté, mayor discriminación tendrá el modelo. En otras palabras, 
tiene gran interés encontrar la combinación de variables que arroje un mayor 
estadístico 𝐶, ya que será aquélla que discrimine mejor entre los sujetos que 
padecerán una enfermedad cardiovascular y aquéllos que no, es decir, las 
predicciones serán mucho más precisas. 
Los métodos anteriores se basan en otro tipo de test estadísticos, por lo que no 
tienen en cuenta esta cuestión. Por ese motivo, vamos a detallar una 
metodología capaz de escoger la mejor combinación de variables para predecir 
la aparición de una enfermedad cardiovascular (aquélla con un estadístico 𝐶 
máximo). 
Como hemos indicado anteriormente, podemos seleccionar un máximo de 𝑟 
variables de un total de 𝑚. Planteamos el siguiente algoritmo: 
 
𝑖 = 𝑟: 
 
a. Calcular todas las posibles combinaciones de 𝑚 variables 
tomadas de 𝑟 en 𝑟 sin repetición, es decir, �𝑚𝑖 � = �𝑚𝑟 �. 
 
b. Determinar el estadístico 𝐶 para cada una de estas 
combinaciones de variables. 
 
𝑖 = 𝑟 − 1: 
 
a. Repetir el proceso, pero ahora tomando las combinaciones de 
𝑟 − 1 en 𝑟 − 1 sin repetición: �𝑚𝑖 � = � 𝑚
𝑟−1�. 
 
b. Calcular de nuevo el estadístico 𝐶 en cada combinación. 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
28 
 
… 
 
𝑖 = 1: 
 
a. Finalmente, calculamos todas las combinaciones de 𝑚 variables 
tomadas de 1 en 1 sin repetición, es decir, �𝑚𝑖 � = �𝑚1� = 𝑚. En 
otras palabras, probamos 𝑚 modelos, los cuales contienen una 
única variable, la cual es diferente en todos ellos. 
 
b. Calcular el estadístico 𝐶 en los 𝑚 modelos. 
 
 
Una vez hemos realizado todo este proceso, seleccionaremos aquella 
combinación que tenga un estadístico 𝐶 máximo, ya que será el modelo con 
mayor capacidad discriminante y aquél que tendrá predicciones de enfermedad 
cardiovascular más precisas. 
El número total de combinaciones probadas en este nuevo algoritmo es: 
 
�
𝑚
𝑟
� + �
𝑚
𝑟 − 1
� + �
𝑚
𝑟 − 2
� + ⋯+ �
𝑚
2
� + �
𝑚
1
�. 
 
Por ejemplo, si 𝑚 = 20 y 𝑟 = 8, el algoritmo corroborará un total de 263,949 
combinaciones y se quedará con aquélla que tenga un estadístico 𝐶 más 
elevado (máximo de los valores). 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
29 
 
1.5.4. Construcción, validación y utilización de un sistema de puntos con 
medidas repetidas de los factores de riesgo cardiovascular. 
 
Construcción 
Queremos determinar la probabilidad de padecer una enfermedad 
cardiovascular desde la situación basal (𝑡 = 0) hasta un instante de tiempo fijo 
�̃�, teniendo una serie de factores de riesgo medidos durante el seguimiento y 
en la situación basal. Para lograr este objetivo realizaremos los siguientes 
pasos: 
 
1) Ajustar un modelo de regresión de Cox con variables tiempo 
dependientes en la muestra recogida. Al no poder estimar un modelo 
conjunto con múltiples parámetros longitudinales (Rizopoulos, 2012), 
emplearemos el modelo de Cox extendido clásico (sin estructura 
compartida), el cual necesita conocer los valores de todos los 
parámetros longitudinales en todos los instantes de tiempo. Como esto 
no es conocido porque los parámetros se recogen de forma intermitente, 
tomaremos el último valor en el tiempo como referencia. 
 
2) Emplear la metodología del estudio Framingham para adaptar los 
coeficientes del modelo obtenido a un sistema de puntos y determinar 
las probabilidades de enfermedad cardiovascular de cada puntuación 
hasta el instante �̃� (Sullivan, Massaro & D'Agostino, 2004). A través de 
estas probabilidades construir grupos de riesgo que sean sencillos de 
entender para el clínico (por ejemplo, en múltiplos de 5%). 
 
3) Ajustar un joint model for longitudinal and time-to-event data para cada 
parámetro longitudinal recogido en el seguimiento. Además, éstos 
incluirán todas las variables basales. Estos modelos son construidos con 
el objetivo de realizar predicciones de los parámetros longitudinales 
sobre nuevos pacientes (validación o utilización tras validación). 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
30 
 
Validación estadística a través de simulación 
Una vez construido el sistema de puntos, queremos ver si sobre otro conjunto 
diferente de sujetos (muestra de validación), el modelo determina de forma 
precisa la aparición de la enfermedad cardiovascular. De esta muestra de 
validación conoceremos en la situación basal la historia de los marcadores 
longitudinales hasta el instante 𝑡 = 0 [registro de los factores de riesgo 
cardiovascular en la historia clínica (𝑡 < 0)] y el valor de las variables basales. 
Con esta información determinaremos la probabilidad que tiene cada sujeto de 
experimentar un evento y la compararemos con lo que realmente ha pasado, 
es decir, determinar si es válido el modelo. Para determinar esta validez 
seguiremos los siguientes pasos: 
 
1) Determinar 𝐿 simulaciones de los parámetros longitudinales en el 
instante de tiempo �̃� mediante los modelos elaborados en el paso 3) de 
la construcción, a través de su historia (𝑡 < 0) y de las variables basales 
(𝑡 = 0). Mediante estos valores simulados, construiremos una 
distribución de la puntuación para cada sujeto de la muestra, es decir, 
cada sujeto tendrá 𝐿 valores de la variable puntuación (basta con 
evaluar el sistema de puntos utilizando los valores simulados y las 
variables basales). Por otra parte, también para cada simulación 𝑙-ésima 
cada paciente tendrá un valor de puntuación. En otras palabras, cada 
simulación tendrá una distribución de la variable de puntuaciones. 
 
2) Para cada simulación 𝑙-ésima ajustar un modelo de Cox clásico (sin 
variables tiempo-dependientes), utilizando como única variable 
explicativa la puntuación obtenida. De cada uno de estos 𝐿 modelos, 
determinar el valor del estadístico 𝐶 (estadístico de Harrell) (Pencina & 
D'Agostino, 2004). Esto nos dará una distribución de valores para este 
estadístico, de los cuales calcularemos la media (o la mediana), así 
como los percentiles 2.5 y 97.5% (Rizopoulos, 2011). De esta forma 
construiremos un intervalo de confianza para este estadístico, el cual 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
31 
 
nos indicará la capacidad discriminante del sistema de puntos para 
determinar qué pacientes desarrollaran una enfermedad cardiovascular. 
 
3) Para cada paciente de la muestra de validación, calcular la mediana de 
su distribución de puntuaciones. Notar que no empleamos la media, 
debido a que podría tener decimales y esto no tiene sentido a la hora de 
aplicar el sistema de puntos. Utilizando estas medianas, clasificar a cada 
paciente en un grupo de riesgo y comprobar si existen diferencias entre 
la tasa de acontecimientos predichos por el sistema de puntos en cada 
grupo con la observada.El test empleado para este proceso será el de 
la χ2 de Pearson. 
 
En la literatura se ha descrito que el estadístico 𝐶 tiene varias limitaciones 
(Lloyd-Jones, 2010). Primeramente, no compara si los riesgos observados y 
estimados son similares en los sujetos. Debido a ello hemos añadido el análisis 
de las diferencias entre los eventos observados y esperados, lo cual minimiza 
el problema propuesto. Finalmente, en segundo lugar, es muy sensible a 
valores de hazard ratios grandes (≥9). Sin embargo, debemos de tener en 
cuenta que al tratarse todas las variables de forma cuantitativa (no 
categorizando), los valores de los hazard ratio no superan este umbral. En 
definitiva, mediante el análisis conjunto del índice de concordancia de Harrell y 
las diferencias de eventos observados con los eventos esperados, disponemos 
de una forma satisfactoria para validar estadísticamente por simulación el 
modelo propuesto. 
 
Utilización potencial 
Una vez validado estadísticamente a través de simulación el sistema de 
puntos, el clínico está en condiciones de aplicar dicho sistema para determinar 
en un nuevo paciente su riesgo cardiovascular y posibles intervenciones para 
su disminución. Hemos de tener en cuenta que el profesional sanitario tendrá 
información histórica de los parámetros longitudinales (𝑡 < 0) e información en 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
32 
 
la situación basal del nuevo paciente (𝑡 = 0). Los pasos que debe de seguir el 
clínico son los siguientes: 
 
1) Determinar el valor de cada uno de los parámetros longitudinales en el 
instante �̃�. Para ello aplicaremos los modelos obtenidos en el paso 3) de 
la construcción sobre el histórico del nuevo paciente y sobre la 
información basal, con el objetivo de determinar 𝐿 simulaciones de cada 
parámetro longitudinal, de forma análoga al proceso de validación. En 
cada simulación 𝑙-ésima determinar la puntuación correspondiente al 
perfil de factores de riesgo cardiovascular obtenido (valores simulados e 
información basal). Esto nos construirá una distribución de la puntuación 
para el nuevo paciente. 
 
2) Determinar la mediana y los percentiles 2.5 y 97.5% del vector de 
puntuaciones construido en el paso anterior. La mediana será la 
estimación de la puntuación del nuevo paciente y los percentiles 
definirán su intervalo de confianza (Rizopoulos, 2011). Por otro lado, 
como cada puntuación tiene un riesgo asociado, el profesional sanitario 
conocerá la probabilidad de enfermedad cardiovascular en un tiempo �̃�, 
junto con su intervalo de confianza. Finalmente, le indicaremos al clínico 
los valores de los parámetros biológicos en �̃� de la mediana del sistema 
de puntos, ya que de esta forma podrá ver cuáles de ellos tienen una 
puntuación por encima del nivel normal, es decir, conocerá los posibles 
puntos de intervención para disminuir el riesgo cardiovascular. 
 
3) Ahora que el clínico conoce el riesgo cardiovascular y qué parámetros 
otorgan una puntuación por encima del nivel normal, tiene que diseñar la 
mejor intervención de cara al paciente. Esto presenta un problema, ya 
que necesitamos conocer el valor de cada parámetro biológico en el 
instante �̃�, es decir, el clínico conoce una aproximación basada en 
simulaciones, que ha sido construida a través de la historia de su 
paciente, pero no sabe cómo afectarán sus intervenciones al riesgo 
cardiovascular. 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
33 
 
Del paso anterior el profesional sanitario conoce los parámetros sobre los que 
ha de intervenir y la historia de estos parámetros y su situación basal. En base 
a estas medidas el médico establecerá un objetivo realista para la próxima 
visita del paciente en un instante �̃̃� (0 < �̃̃� < �̃�). Ahora insertará los valores 
objetivo en �̃̃� en la historia del parámetro biológico y determinará su valor en el 
instante �̃�, es decir, determinará 𝐿 simulaciones de cada uno de los factores de 
riesgo cardiovascular a través de los modelos anteriores (paso 3 de la 
construcción), añadiendo un nuevo valor a la historia (�̃̃�). 
A través de estos cálculos obtendrá el beneficio de su intervención (estimación 
[media o mediana] del parámetro biológico en �̃�) y podrá visualizar en el 
sistema de puntos cómo disminuiría el riesgo del paciente. 
 
1.6. Resultados. 
 
Vamos a detallar los resultados que derivan de la aplicación de las mejoras 
propuestas a los modelos cardiovasculares ya existentes, clasificando dichos 
resultados según objetivos específicos alcanzados: 
 
1.6.1. Predicciones a corto, medio y largo plazo. 
En las Figuras 1 y 2 podemos observar cómo varían las probabilidades de 
enfermedad cardiovascular, conforme cambiamos el tiempo de predicción. 
Mientras que en la Figura 1 cambia cada año hasta un máximo de 4 (Ramírez-
Prado et al., 2015), en la Figura 2 se calcula la probabilidad de evento cada 2 
años hasta un máximo de 14 (Artigao-Ródenas et al., 2015). 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
34 
 
Figura 1: Escala de riesgo cardiovascular para pacientes diabéticos tipo 2 
hospitalizados (Ramírez-Prado et al., 2015). 
 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
35 
 
Figura 2: Modelo predictivo para determinar qué paciente sufrirá una 
enfermedad cardiovascular en un periodo máximo de 14 años. 
 
LVH, hipertrofia ventricular izquierda; PA, actividad física; SBP, tensión arterial sistólica. 
Definición de la actividad física (Food and Agriculture Organization of the United Nations & 
World Health Organization, 1973): 1) Actividad ligera: actividad de quien trabaja sentado en un 
despacho o detrás de un mostrador con instrumentos automatizados; 2) Actividad moderada: 
ligera actividad física continua, como en un trabajo ligero en la industria o en la agricultura fuera 
de estación; 3) Actividad intensa: trabajo pesado y, a veces, enérgico (producción agrícola, 
trabajo en minas o fundiciones). Si una persona no estaba trabajando se consideró que 
experimentaba una actividad ligera. 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
36 
 
Por otra parte, a la hora de validar el sistema de puntos con periodo máximo de 
predicción de 14 años (Figura 3), vemos cómo aumenta la tasa de eventos 
conforme aumenta el tiempo (cada 2 años). 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
37 
 
Figura 3: Diferencias entre los diferentes grupos de riesgo construidos en 
la muestra de validación (Artigao-Ródenas et al., 2015). 
 
 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
38 
 
1.6.2. Determinación de la mejor combinación de variables para predecir 
un evento cardiovascular. 
En el artículo incluido en esta tesis doctoral sobre la construcción de una 
escala de riesgo cardiovascular en pacientes diabéticos tipo 2 ingresados a 
través de un servicios de urgencias (Ramírez-Prado et al., 2015), se aplicó el 
algoritmo propuesto. Se disponía de un total de 15 posibles variables 
explicativas, de las cuales sólo podíamos seleccionar un máximo de 7, por lo 
que se comprobó un total de 16,383 combinaciones y la mejor combinación 
otorgó un estadístico 𝐶 al modelo predictivo de 0.734. 
 
1.6.3. Construcción, validación y utilización de un sistema de puntos con 
medidas repetidas de los factores de riesgo cardiovascular. 
Dado que no se disponía de datos reales para aplicar el nuevo método 
propuesto, se trabajo sobre datos simulados con el único objetivo de explicar al 
lector cómo utilizar el método propuesto. Notar, que se han llevado a cabo dos 
simulaciones dando lugar a dos conjuntos de datos simulados, uno se ha 
utilizado para construir el modelo y otro para su validación. Para que ambos 
conjuntos tengan plausibilidad biológica, hemos empleado estimacionesobtenidas en el estudio cardiovascular Puras-GEVA (Artigao-Ródenas et al., 
2015). 
Nuestros conjuntos incluyen los siguientes parámetros biológicos: edad (años), 
tensión arterial sistólica (SBP) (mmHg), hemoglobina glicada (HbA1c) (%), 
índice aterogénico, sexo (hombre o mujer) y tabaquismo (sí o no), de los cuales 
la SBP, HbA1c y el índice aterogénico estarán presentes en la situación basal 
(𝑡 = 0) y en el seguimiento para la muestra de construcción (𝑡 > 0) ó recogidos 
en la historia clínica para la muestra de validación estadística a través de 
simulación (𝑡 < 0). La elección de incluir estas variables se ha basado en las 
escalas de riesgo cardiovascular actuales (Conroy et al., 2003; National Heart, 
Lung, and Blood Institute, 2015), salvo la HbA1c, que se ha utilizado en lugar 
del diagnóstico de diabetes mellitus, con el objetivo de incluir otro parámetro 
tiempo-dependiente en el modelo final, además de que de esta forma 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
39 
 
podríamos valorar el control de la diabetes mellitus (HbA1c <6.5%) a la hora de 
prevenir una enfermedad cardiovascular. 
Respecto a la variable principal (tiempo hasta la enfermedad cardiovascular), 
vamos a suponer que nuestra cohorte se utiliza para predecir la aparición de 
una enfermedad cardiovascular con un seguimiento de 2 años. Notar que las 
escalas tradicionales de riesgo cardiovascular utilizan un tiempo de 10 años 
(Conroy et al., 2003; National Heart, Lung, and Blood Institute, 2015). Nosotros 
hemos tomado este valor inferior a dichas escalas, porque vamos a realizar 
predicciones de los parámetros longitudinales desde la situación inicial (𝑡 = 0) 
hasta el tiempo de predicción y si tomáramos un valor de predicción de 10 
años, las predicciones de los parámetros longitudinales tendrían una gran 
variabilidad y no permitirían realizar predicciones precisas de qué paciente 
desarrollará una enfermedad cardiovascular, lo que en consecuencia 
equivaldría a la falta de utilidad del método propuesto. Sin embargo, el hecho 
de que las predicciones de los parámetros longitudinales tengan carácter 
dinámico, permite determinar el riesgo a 2 años cada vez que el paciente entra 
en la consulta del profesional sanitario con una mayor precisión. No obstante, 
hemos de tener en cuenta que el método propuesto se ha desarrollado para un 
tiempo teórico �̃� y puede ser aplicado para cualquier valor, aunque los 
parámetros longitudinales tendrían por norma general mayor variabilidad en el 
tiempo, pero claramente esto dependerá de la naturaleza de los datos, tanto 
del individuo como de la población (Rizopoulos, 2012). 
El trabajo en el que se ha basado nuestro conjunto de datos simulado (Artigao-
Ródenas et al., 2015), desarrolló y validó un modelo predictivo de enfermedad 
cardiovascular (angina de cualquier tipo, infarto de miocardio, accidente 
cerebrovascular, enfermedad arterial periférica de los miembros inferiores, o 
muerte cardiovascular), para determinar el cálculo del riesgo a corto, medio y 
largo plazo ( el riesgo fue calculado para cada puntuación cada dos años hasta 
un máximo de catorce) en población general. En la Tabla 4 de este sistema de 
puntos se observa la importancia de esta cuestión. Por ejemplo, un paciente 
con 9 puntos presenta una probabilidad de enfermedad cardiovascular a los 2 
años de 0.67%, mientras que a los 10 años ésta asciende al 5.16% (Artigao-
Ródenas et al., 2015). Si calculamos de forma periódica el riesgo 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
40 
 
cardiovascular de nuestro paciente a los dos años y éste mantiene su 
puntuación, no tomaremos ninguna medida terapéutica (riesgo <1%), mientras 
que si sólo calculamos el riesgo una única vez cada 10 años, tomaremos 
medidas terapéuticas agresivas en el momento en el que el paciente ha 
entrado en nuestra consulta médica, ya que el riesgo se corresponde al punto 
de corte definido como alto por el proyecto SCORE (5%→ uno de cada veinte 
pacientes) (Conroy et al., 2003). En otras palabras, una predicción a corto 
plazo realizada de forma regular, podría significar un cambio en la toma de 
decisiones terapéuticas para la prevención de enfermedades cardiovasculares, 
siempre y cuando tengamos la posibilidad de calcular el riesgo de forma 
periódica. Por otra parte, dado que la tabla de riesgo del estudio Puras-GEVA 
incluye predicciones a 4, 6, 8, 10, 12 y 14 años, se ha seleccionado el punto de 
corte más bajo, debido a que si realizábamos predicciones con mayor tiempo, 
éstas podrían aumentar su dispersión (Rizopoulos, 2012). Por estos motivos se 
ha seleccionado este punto de corte para la simulación (2 años). 
En lo referente a las medidas longitudinales en el seguimiento (muestra de 
construcción), se ha supuesto que el paciente acude una vez cada 3 meses a 
la consulta del médico para poder medir SBP, HbA1c e índice aterogénico. 
Esto se realiza hasta el final del seguimiento de cada uno de los pacientes. Por 
otro lado, en la muestra de validación estadística a través de simulación, 
supondremos que tenemos cierta probabilidad de tener registradas en la 
historia clínica medidas de todos los parámetros longitudinales cada 3 meses 
durante 5 años de forma retrospectiva (𝑡 < 0). La probabilidad es diferente para 
cada una de las visitas y dependerá de cada paciente. En otras palabras, 
tendremos medidas intermitentes de todos estos parámetros desde 𝑡 = −5 
años hasta 𝑡 = 0. 
En el material suplementario del tercer artículo presentado en esta tesis 
doctoral (Palazón-Bru et al., 2015) se han detallado todas las fórmulas 
matemáticas empleadas para construir nuestros conjuntos de datos, siempre 
basándonos en el estudio Puras-GEVA (Artigao-Ródenas et al., 2015). 
Podría pensarse que al manejar un menor periodo de tiempo de 2 años no 
exista variabilidad en los factores de riesgo cardiovascular. Sin embargo, en el 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
41 
 
material suplementario observamos que los modelos utilizados presentan 
variabilidad temporal de los factores de riesgo (Palazón-Bru et al., 2015), ya 
que de no presentarse, éstos contendrían la constante con un error aleatorio 
muy pequeño. En otras palabras, tiene sentido utilizar este periodo de 
predicción. 
Se decidió simular un conjunto de datos, por no disponer en la actualidad de un 
conjunto de datos reales. Esta forma de explicar un nuevo método, ha sido 
desarrollada por otros autores que han trabajado con modelos conjuntos de 
supervivencia y datos longitudinales, ya que el único objetivo del conjunto de 
datos simulado, es lograr explicar al lector cómo aplicar el nuevo método 
(Faucett & Thomas, 1996; Henderson, Diggle & Dobson, 2000; Wang & Taylor, 
2001; Brown, Ibrahim & DeGruttola, 2005; Zeng & Cai, 2005; Vonesh, Greene 
& Schluchter, 2006; Rizopoulos & Ghosh, 2011). 
Construcción del sistema de puntos 
1) Estimamos el modelo multivariante de Cox con variables tiempo-
dependientes, definidas como el último valor registrado. Sus 
coeficientes quedan reflejados en la Tabla 1. 
 
Tabla 1: Parámetros (βs) del modelo de Cox multivariante. 
Variable β p-valor 
Edad (basal) (por 1 año) 0.0846 <0.001 
SBP (por 1 mmHg) 0.00874 <0.001 
HbA1c (por 1%) 0.188 <0.001 
Índice aterogénico (por 1 unidad) 0.191 <0.001 
Sexo hombre 0.479 0.001 
Fumador (basal) 0.721 <0.001 
Abreviaturas: SBP, systolic blood pressure; HbA1c, glycated haemoglobin. 
Goodness-of-fit (likelihood ratio test): χ2=912.3, p<0.001. 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
42 
 
En lo referente al análisis de los residuos de Martingala (Figura 4), observamos 
que todas las variables tienen forma lineal en el modelo, ya que la línea roja 
muestra una linealidad perfecta (la línea roja indica el ajuste lineal entre las dos 
variables presentes en el gráfico cartesiano). Esto era esperado, pueslos datos 
han sido simulados de esa forma. No obstante debemos de corroborarlo antes 
de continuar con el método propuesto. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
43 
 
Figura 4: Forma funcional de las covariables en el modelo. 
 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
44 
 
A continuación debemos de corroborar que el modelo ajusta bien los datos, 
mediante el análisis de los residuos de Cox-Snell (Figura 5). Como podemos 
observar, la línea roja (distribución exponencial de parámetro 1) se mantiene 
dentro de los intervalos de confianza, por lo que nuestro modelo cumple todas 
sus hipótesis básicas y estamos en condiciones de comenzar el paso 2) de la 
construcción. 
 
Figura 5: Análisis de los residues de Cox-Snell. 
 
 
2) Adaptamos los coeficientes obtenidos en el modelo multivariante 
a un sistema de puntos según la metodología del Framingham 
Heart Study. Dado que es una metodología ampliamente 
utilizada, simplemente daremos el resultado en forma de figura 
(Figura 6). No obstante, todos los cálculos se anexan en una hoja 
de cálculo Excel en el material suplementario donde se presenta 
la técnica (Palazón-Bru et al., 2015). Se ha decidido la utilización 
de una figura en vez de una tabla, para facilitar la lectura al 
usuario, ya que las celdas están más separadas y no otorgan 
confusión al clínico. Esta idea ha sido utilizado tanto por el 
proyecto SCORE como por el estudio Framingham. Notar que los 
grupos de riesgo se han construido como en el proyecto SCORE. 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
45 
 
Figura 6: Sistema de puntos para predecir enfermedad cardiovascular en 
2 años. 
 
Abreviaturas: SBP, tensión arterial sistólica; HbA1c, hemoglobina glicada; TC, colesterol total; 
HDL-c, colesterol HDL. 
 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
46 
 
3) Hemos ajustado los modelos conjuntos para cada uno de los 
parámetros longitudinales y sus coeficientes estimados quedan 
reflejados en la Tabla 2. No se ha especificado una función de 
riesgo basal. 
 
Tabla 2: Parámetros de los modelos conjuntos construidos. 
Variable 
SBP 
(mmHg) 
p-
valor 
HbA1c 
(%) 
p-
valor 
Índice 
aterogénico 
p-
valor 
Proceso del evento 
Sexo hombre 0.428 <0.001 0.475 <0.001 0.446 <0.001 
Edad (por 1 año) 0.0837 <0.001 0.0840 <0.001 0.0833 <0.001 
Fumador 0.731 <0.001 0.757 <0.001 0.775 <0.001 
Parámetro (por 1 unidad) 0.0085 <0.001 0.216 <0.001 0.195 <0.001 
Proceso longitudinal: efectos fijos 
1 133.557 <0.001 6.158 <0.001 4.602 <0.001 
T 0.0046 <0.001 0.0001 <0.001 0.0001 <0.001 
Proceso longitudinal: efectos mixtos 
1 21.683 N/A 1.346 N/A 1.324 N/A 
T 0.0358 N/A * * 0.0013 N/A 
Residuos 8.933 N/A 0.357 N/A 0.302 N/A 
Abreviaturas: SBP, tensión arterial sistólica; HbA1c, hemoglobina glicada; N/A, no aplica. *: 
término eliminado por problemas de convergencia. La estrategia fue eliminar de términos más 
complejos a términos más sencillos. 
Goodness-of-fit: 1) SBP: χ2=371,574.1, p<0.001; 2) HbA1c: χ2=210,881.1, p<0.001; 3) Índice 
aterogénico: χ2=121,118.0, p<0.001. 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
47 
 
Respecto a las hipótesis básicas de los modelos, primeramente podemos 
observar en la Figura 7, que no existe una tendencia entre los valores 
ajustados y los residuos específicos de cada individuo, ya que la línea roja 
(ajuste lineal entre las dos variables del eje cartesiano) se mantiene muy 
cercana a 𝑦 = 0. 
 
 
Figura 7: Gráficos de residuos específicos de cada sujeto frente a los 
valores ajustados por los modelo. 
 
 
 
Arriba: tensión arterial sistólica. Abajo a la izquierda: hemoglobina glicada. Abajo a la derecha: 
índice aterogénico. 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
48 
 
En lo referente a la normalidad de los residuos específicos, dado el volumen de 
datos que disponemos, podemos asumir normalidad asintótica. No obstante, en 
la Figura 8 se encuentran disponibles los gráficos Q-Q que comparan la 
distribución de los datos con una distribución normal. A raíz de estos gráficos 
también podemos concluir que nuestros residuos siguen una distribución 
normal. 
 
 
Figura 8: Gráficos Q-Q de los residuos específicos de cada sujeto. 
 
 
 
Arriba: tensión arterial sistólica. Abajo a la izquierda: hemoglobina glicada. Abajo a la derecha: 
índice aterogénico. 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
49 
 
En el análisis de los residuos marginales frente a los valores ajustados (Figura 
9), vemos que la línea roja (ajuste lineal entre las variables presentadas en el 
gráfico cartesiano) no establece un patrón fuera de 𝑦 = 0. En otras palabras, se 
han verificado todos los supuestos del submodelo longitudinal, por lo que ahora 
vamos a comprobar las hipótesis básicas del submodelo de supervivencia. 
 
 
Figura 9: Gráficos de los residuos marginales frente a los valores 
ajustados. 
 
 
 
Arriba: hemoglobina glicada. Abajo a la izquierda: tensión arterial sistólica. Abajo a la derecha: 
índice aterogénico. 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
50 
 
En la Figura 10 quedan reflejados ambos tipos de gráficos para corroborar las 
hipótesis básicas del submodelo de supervivencia. En la primera columna 
(valores ajustados de los parámetros longitudinales contra los residuos de 
Martingala), no se observa ninguna tendencia, ya que la línea roja (ajuste lineal 
entre ambas variables del gráfico) se asemeja a la recta 𝑦 = 0. Por otra parte, 
podemos asumir que los residuos de Cox-Snell siguen una distribución 
exponencial de parámetro la unidad (la línea roja se sitúa en los intervalos de 
confianza de la supervivencia). 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
51 
 
Figura 10: Gráficos para corroborar las hipótesis básicas del submodelo 
de supervivencia. 
Residuos de Martingala Residuos de Cox-Snell 
 
 
 
Arriba: tensión arterial sistólica. Centro: hemoglobina glicada. Abajo: índice aterogénico. 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
52 
 
Validación estadística por simulación 
La concordancia fue muy satisfactoria: 0.844 (IC 95%: 0.842-0.846). La 
comparación entre eventos observados y esperados no mostró diferencias 
estadísticamente significativas (Figura 11). 
 
 
Figura 11: Comparación entre proporción (%) de eventos observados y 
esperados en los diferentes grupos de riesgo. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
0.00 
5.00 
10.00 
15.00 
20.00 
25.00 
Low Medium High Very high 
Observed 0.46 3.17 10.78 24.63 
Expected 0.39 2.25 7.39 22.83 
p=0.555 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
53 
 
Utilización potencial 
Llega a nuestra consulta un nuevo paciente de las siguientes características: 
varón, 83 años, no fumador y tratamiento farmacológico (un antihipertensivo y 
un antidiabético oral) y no farmacológico (dieta y ejercicio). Por otra parte, se 
dispone del histórico de sus factores de riesgo cardiovascular (Tabla 3). 
 
Tabla 3: Parámetros recogidos en la historia clínica electrónica 
necesarios para aplicar nuestro sistema de puntos. 
Tiempo (días) SBP (mmHg) HbA1c (%) Índice aterogénico 
-360 152 5.1 3.56 
-330 135 5.3 3.23 
-270 164 4.7 3.45 
-180 153 4.4 4.12 
-90 170 5.0 4.15 
0 145 4.9 5.17 
Abreviaturas: SBP, tensión arterial sistólica; HbA1c, hemoglobina glicada. El tiempo tiene valor 
negativo porque se refiere a los valores recogidos antes de la situación basal (𝑡 = 0). 
 
 
Tras aplicar el modelo construido, se obtiene un histograma de la puntuación 
de riesgo cardiovascular obtenida por el paciente (Figura 12). En ella 
observamos un riesgo cardiovascularelevado, ya que la mayoría de 
simulaciones se concentra en 16 puntos. La estimación de la puntuación fue de 
16 (95% CI: 15-17). La mediana de la puntuación se correspondió con una SBP 
de 160 mmHg, una HbA1c de 4.9% y un índice aterogénico de 6.76. Teniendo 
en cuenta que existen factores del modelo sobre los cuales no podemos 
intervenir (sexo y edad), que dan al paciente un mínimo de 13 puntos, debemos 
de pensar estrategias que logren que el paciente no puntúe en el resto de 
categorías de la escala (Figura 6). 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
54 
 
Figura 12: Riesgo cardiovascular de un nuevo paciente teórico (situación 
pre-intervención). 
 
 
 
Ahora, el facultativo estima que si el paciente cumple con una serie de 
intervenciones [farmacológicas (añadir dos fármacos antihipertensivos → -20 
mmHg; prescribir una estatina → -40% índice atrogénico) y no farmacológicas 
(reducir la sal en las comidas → -5 mmHg)], sus parámetros longitudinales en 
un periodo de 3 meses serán: SBP 120 mmHg (145 – 2·10 – 5 = 120 mmHg), 
índice aterogénico 3.10 (5.17 – 40% = 3.10), y HbA1c 4.9% (mismo valor, pues 
no se ha realizado ninguna intervención). A continuación aplicamos de nuevo el 
modelo con este nuevo dato y obtenemos el riesgo cardiovascular a dos años 
(Figura 13). La estimación de la puntuación es de 15 (IC 95%: 14-15) y los 
valores que otorgan la puntuación mediana son: SBP 124 mmHg, índice 
aterogénico 4.85, y HbA1c 5.0%. De forma que el riesgo ha disminuido, ya que 
ahora generalmente el paciente tiene 14 puntos (Figura 6). 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
55 
 
Figura 13: Riesgo cardiovascular de un nuevo paciente teórico (situación 
post-intervención). 
 
 
 
 
 
 
 
 
 
 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
56 
 
1.7. Discusión. 
 
Sumario 
Esta tesis doctoral aporta posibles mejoras en la construcción de modelos 
predictivos de enfermedad cardiovascular ya existentes. Estas mejoras residen 
fundamentalmente en: 1) Obtener predicciones a corto y medio plazo; 2) 
Seleccionar la mejor combinación de variables para discriminar con mayor 
precisión, qué paciente desarrollará una enfermedad cardiovascular; 3) Detallar 
una metodología para construir modelos predictivos de enfermedad 
cardiovascular, teniendo en cuenta la variabilidad de los factores de riesgo 
cardiovascular y sin perder la simplicidad de los sistemas de puntos, que son 
ampliamente utilizados en la práctica clínica habitual a nivel mundial (Conroy et 
al., 2003; National Heart, Lung, and Blood Institute, 2015). 
 
Comparación con la literatura existente 
Si analizamos la primera mejoría propuesta, estamos dando a los clínicos la 
posibilidad de calcular el riesgo cardiovascular en periodos inferiores a 10 
años, lo que puede permitir mejorar la toma de decisiones, ya que si un 
paciente presenta alto riesgo cardiovascular en un periodo de tiempo muy 
corto, deberemos realizar una estrategia terapéutica mucho más agresiva. Los 
modelos de Framingham y SCORE no tienen esta característica (Conroy et al., 
2003; Cooney, Dudina & Graham, 2009; National Heart, Lung, and Blood 
Institute, 2015). No obstante, dado que tendrán realizado el cálculo de la 
supervivencia en todos los instantes de tiempo, es algo que podría 
implementarse y tratar de aplicarlo en futuras escalas de riesgo cardiovascular. 
En segundo lugar, el hecho de calcular todas las posibles combinaciones de 
variables explicativas, nos está ayudando a elegir el mejor modelo matemático 
para la obtención de la predicción más precisa en la enfermedad 
cardiovascular. Eso permite aumentar el valor de nuestro estadístico 𝐶 hasta el 
máximo posible. Esta estrategia en la elección de las variables no ha sido 
utilizada por los investigadores del estudio Framingham o los del proyecto 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
57 
 
SCORE (Conroy et al., 2003; Cooney, Dudina & Graham, 2009; National Heart, 
Lung, and Blood Institute, 2015). Puede ser que si aplicamos esta estrategia 
sobre los datos del proyecto SCORE o del estudio Framingham, obtengamos 
una diferencia pequeña con el estadístico 𝐶 anterior. No obstante, una 
ganancia de un 5%, puede equivaler a lograr identificar una mayor proporción 
de pacientes que sufrirán una enfermedad cardiovascular, lo que desembocaría 
en una menor morbimortalidad cardiovascular. 
Finalmente, en lo referente a la tercera mejora propuesta, las escalas de riesgo 
cardiovascular existentes no valoran la variabilidad temporal de los parámetros 
de control de los factores de riesgo, aunque como aspecto muy positivo, sí que 
tienen en cuenta la sencillez para su aplicación inmediata por parte de los 
profesionales sanitarios, que son los que realmente aplicarán estos modelos 
matemáticos (Conroy et al., 2003; Cooney, Dudina & Graham, 2009; National 
Heart, Lung, and Blood Institute, 2015). Por otra parte, los joint models 
actualmente utilizados, sí que tienen en cuenta la variabilidad en el tiempo de 
un único parámetro longitudinal (Rizopoulos, 2011), pero su interpretación no 
es tan sencilla como la de un sistema de puntos y no permite emplear varios 
parámetros longitudinales, cuestión clave por la etiología multifactorial de la 
enfermedad cardiovascular. Nosotros hemos tratado de fundir todas estas 
técnicas en un único algoritmo, manteniendo las virtudes de cada una de ellas 
(modelo de riesgos relativos, sistemas de puntos, predicciones dinámicas...). 
Si tratamos de comparar el método propuesto con las actuales escalas de 
riesgo cardiovascular, se nos presenta un problema, ya que nuestro modelo es 
más adecuado para hacer predicciones en un tiempo más corto, ya que 
conforme nos separamos de la situación basal (𝑡 = 0) a la hora de predecir, 
esto ocasiona un aumento de la variabilidad de las predicciones de los 
parámetros longitudinales (Rizopoulos, 2012). Este comportamiento se observa 
también en economía (la bolsa) y en meteorología (pronóstico del tiempo). 
Aunque esto dependerá de la naturaleza de los datos que estemos analizando, 
tanto a nivel individual como poblacional. Todo esto no ocasiona una debilidad 
en nuestro modelo, ya que al tener las predicciones de los parámetros 
longitudinales un carácter dinámico (Rizopoulos, 2011), cada vez que 
actualicemos la información clínica de nuestro paciente, este riesgo se 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
58 
 
calculará de forma inmediata. Esto lo hemos visto en el ejemplo propuesto en 
resultados, en donde al introducir nuevos valores de los parámetros 
longitudinales, éstos se actualizan y determinan la nueva distribución de puntos 
del paciente. En otras palabras, el método propuesto podría utilizarse para 
calcular el riesgo del paciente cada vez que éste acuda a la consulta de su 
profesional sanitario, mientras que las escalas de riesgo tradicionales pueden 
utilizarse con mayor intervalo de tiempo, pues el pronóstico es para 10 años. 
En definitiva, podríamos utilizar de forma conjunta ambos tipos de modelos 
para valorar el riesgo tanto a corto como a largo plazo, ya que aunque se han 
visto discrepancias entre predicciones cardiovasculares a corto y largo plazo 
(Quispe et al., 2015), la utilización periódica de las predicciones a corto plazo, 
teniendo en cuenta la variabilidad de los factores de riesgo, puede 
complementar a los modelos cardiovasculares a largo plazo. En otras palabras, 
nuestra intención es que en la práctica clínica se utilice el modelo a corto plazo 
de forma periódica en aquellos pacientes que acuden frecuentemente a la 
consulta médica y el de largo plazo para aquéllos que no. 
 
Implicaciones para la práctica clínica y la investigación 
Para la primera mejora propuesta, se plantea en las escalas de riesgo 
cardiovascular ya construidas, el cálculo de la probabilidadde evento en 
periodos de tiempo inferiores, ya que estos datos estarán disponibles en la 
base de datos construida para la escala predictiva a 10 años. De la misma 
forma, podríamos aplicar esta técnica en nuevas escalas de riesgo 
cardiovascular. 
Seguidamente, para la segunda mejora propuesta (combinaciones), es obvio 
que las escalas cardiovasculares construidas deberían de aplicar esta nueva 
técnica para su utilización. En otras palabras, no es algo inmediato y podría 
cambiar los valores del modelo. En consecuencia, se plantea la utilización de 
esta técnica para la construcción de futuras escalas de riesgo cardiovascular. 
Finalmente, en el método sugerido más complejo, hemos de tener en cuenta 
que la obtención de simulaciones de los parámetros longitudinales no es una 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
59 
 
tarea sencilla y conlleva un coste computacional de aproximadamente un 
minuto si implementamos un total de 100 en un ordenador de usuario. Por otra 
parte, los valores históricos de los parámetros longitudinales están registrados 
en la historia clínica, generalmente electrónica (Palazón-Bru et al., 2014). 
Partiendo de estas ideas, toda la información necesaria para aplicar nuestros 
modelos se encuentra de forma informatizada, por lo que los algoritmos 
implementados pueden adaptarse al lenguaje de la base de datos donde se 
encuentren registrados los valores de los factores de riesgo y de esta forma 
todos los cálculos serían inmediatos para el profesional sanitario. En otras 
palabras, que a través de pulsar un botón, en un tiempo reducido aparezcan 
conjuntamente por pantalla el histograma ofrecido en la Figura 12, el sistema 
de puntos teórico y el conjunto de valores de los factores de riesgo que 
determinan la mediana de las puntuaciones. Por otra parte, a la hora de 
intervenir, se indicará el tiempo de la intervención y los posibles valores que 
estima el profesional sanitario sobre su nuevo paciente. Al introducir esta nueva 
información se reflejarán los dos histogramas conjuntamente (Figuras 12 y 13), 
lo cual permitirá visualmente al clínico conocer el beneficio de su intervención. 
Dado que el algoritmo se ha desarrollado sobre un conjunto de datos 
simulados, animamos a otros autores que tengan bases de datos 
cardiovasculares de la forma planteada, la implementación de un modelo de las 
características detalladas en esta tesis doctoral. De forma que si sobre datos 
reales se obtiene una mayor precisión en las predicciones, podremos aplicar 
esta metodología para obtener el mejor pronóstico y tomar las decisiones a 
corto plazo óptimas de cara al beneficio del paciente. No obstante, hemos de 
tener en cuenta que el método propuesto se basa en la combinación de 
modelos matemáticos utilizados en la literatura científica, es decir, nuestra 
técnica a nivel teórico es completamente correcta, pues hemos sido muy 
rigurosos en cada uno de los pasos a seguir. A nivel práctico podemos 
determinar el valor de �̃� y la complejidad de los modelos para poder aplicar el 
método propuesto. Finalmente, destacamos que el algoritmo desarrollado en 
este trabajo, puede aplicarse a otras enfermedades o en otras áreas del 
conocimiento, como la economía. 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
60 
 
1.8. Referencias. 
 
American Diabetes Association. 2014. Standards of medical care in diabetes--
2014. Diabetes Care 37 Suppl 1:S14-80. 
 
Andersen PK, Gill RD. 1982. Cox's Regression Model for Counting Processes: 
A Large Sample Study. Annals of Statistics 10: 1100-1120. 
 
Artigao-Ródenas LM, Carbayo-Herencia JA, Palazón-Bru A, Divisón-Garrote 
JA, Sanchis-Domènech C, Vigo-Aguiar I, Gil-Guillén VF; on behalf of GEVA. 
2015. Construction and validation of a 14-year cardiovascular risk score for use 
in the general population: the PURAS-GEVA chart. Medicine (Baltimore) 94: 
e1980. 
 
Brown ER, Ibrahim JG, DeGruttola V. 2005. A flexible B-spline model for 
multiple longitudinal biomarkers and survival. Biometrics 61: 64-73. 
 
Conroy RM, Pyörälä K, Fitzgerald AP, Sans S, Menotti A, De Backer G, De 
Bacquer D, Ducimetière P, Jousilahti P, Keil U, Njølstad I, Oganov RG, 
Thomsen T, Tunstall-Pedoe H, Tverdal A, Wedel H, Whincup P, Wilhelmsen L, 
Graham IM; SCORE project group. 2003. Estimation of ten-year risk of fatal 
cardiovascular disease in Europe: the SCORE project. European Heart Journal 
24: 987-1003. 
 
Cooney MT, Dudina AL, Graham IM. 2009. Value and limitations of existing 
scores for the assessment of cardiovascular risk: a review for clinicians. Journal 
of the American College of Cardiology 54: 1209-1227. 
 
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
61 
 
Faucett CL, Thomas DC. 1996. Simultaneously modelling censored survival 
data and repeatedly measured covariates: a Gibbs sampling approach. 
Statistics in Medicine 15: 1663-1685. 
 
Food and Agriculture Organization of the United Nations and World Health 
Organization. 1973. FAO/WHO. Energy and protein requirements: Report of a 
joint FAO/WHO ad hoc expert committee. FAO Nutrition Meetings Report 
Series No. 52. WHO Technical Report Series No. 522. Rome and Geneva: 
FAO/WHO. 
 
Henderson R, Diggle P, Dobson A. 2000. Joint modelling of longitudinal 
measurements and event time data. Biostatistics 1: 465-480. 
 
Hosmer DW, Lemeshow S. 2000. Applied Logistic Regression. New York: 
Wiley. 
 
Hosmer DW, Lemeshow S, May S. 2008. Applied Survival Analysis: Regression 
Modeling of Time-to-Event Data. New York: Wiley. 
 
James PA, Oparil S, Carter BL, Cushman WC, Dennison-Himmelfarb C, 
Handler J, Lackland DT, LeFevre ML, MacKenzie TD, Ogedegbe O, Smith SC 
Jr, Svetkey LP, Taler SJ, Townsend RR, Wright JT Jr, Narva AS, Ortiz E. 2014. 
2014 evidence-based guideline for the management of high blood pressure in 
adults: report from the panel members appointed to the Eighth Joint National 
Committee (JNC 8). JAMA 311: 507-520. Erratum in: JAMA 311: 1809. 
 
Molinero LM. 2003. Modelos de riesgo cardiovascular. Estudio de Framingham. 
Proyecto SCORE. Available at http://www.seh-lelha.org/pdf/modelries.pdf 
(accessed July 2015). 
 
http://www.seh-lelha.org/pdf/modelries.pdf
Nuevos modelos predictivos de enfermedad cardiovascular. 
 
62 
 
National Cholesterol Education Program (NCEP) Expert Panel on Detection, 
Evaluation, and Treatment of High Blood Cholesterol in Adults (Adult Treatment 
Panel III). 2002. Third Report of the National Cholesterol Education Program 
(NCEP) Expert Panel on Detection, Evaluation, and Treatment of High Blood 
Cholesterol in Adults (Adult Treatment Panel III) final report. Circulation 106: 
3143-3421. 
 
National Heart, Lung, and Blood Institute (Boston University). 2015. The 
Framingham Heart Study. Available at http://www.framinghamheartstudy.org/ 
(accessed July 2015). 
 
Lloyd-Jones DM. 2010. Cardiovascular risk prediction: basic concepts, current 
status, and future directions. Circulation 121: 1768-1777. 
 
López-Bru D, Palazón-Bru A, Folgado-de la Rosa DM, Gil-Guillén VF. 2015. 
Scoring System for Mortality in Patients Diagnosed with and Treated Surgically 
for Differentiated Thyroid Carcinoma with a 20-Year Follow-Up. PLoS One 10: 
e0128620. 
 
Palazón-Bru A, Carbayo-Herencia JA, Vigo MI, Gil-Guillén VF. 2016. A method 
to construct a points system to predict cardiovascular disease considering 
repeated measures of risk factors. PeerJ 4: e1673. 
 
Palazón-Bru A, Gil-Guillén VF, Orozco-Beltrán D, Pallarés-Carratalá V, Valls-
Roca F, Sanchís-Domenech C, Martín-Moreno JM, Redón J, Navarro-Pérez J, 
Fernández-Giménez A, Pérez-Navarro AM, Trillo JL, Usó R, Ruiz E. 2014. Is 
the physician's behavior in dyslipidemia diagnosis in accordance with 
guidelines? Cross-sectional ESCARVAL study. PLoS One 9:e91567. 
 
http://www.framinghamheartstudy.org/
Nuevos modelos predictivos de enfermedad cardiovascular.