tesis_palazon_bru

•

Valle De Huejucar

roger revilla

20/6/2024

¡Este material tiene más páginas!

Vista previa del material en texto

NUEVOS MODELOS PREDICTIVOS DE
ENFERMEDAD CARDIOVASCULAR

Antonio Palazón Bru

www.ua.es
www.eltallerdigital.com

Nuevos modelos predictivos de enfermedad cardiovascular.

UNIVERSIDAD DE ALICANTE

Departamento de Matemática Aplicada
Escuela Politécnica Superior

NUEVOS MODELOS PREDICTIVOS DE ENFERMEDAD
CARDIOVASCULAR

Antonio Palazón Bru

Programa de Doctorado en Métodos Matemáticos y Modelización en
Ciencias e Ingeniería

Tesis presentada para aspirar al grado de
DOCTOR/DOCTORA POR LA UNIVERSIDAD DE ALICANTE

DIRIGIDA POR LOS PROFESORES:
Dra. Dña. Isabel Vigo Aguiar Dr. D. Vicente Francisco Gil Guillén
Catedrático de Escuela Universitaria Profesor Titular de Universidad

Nuevos modelos predictivos de enfermedad cardiovascular.

A mis padres y a mi abuelo por su apoyo y cariño incondicional
en este proyecto.

Nuevos modelos predictivos de enfermedad cardiovascular.

A mis directores de tesis por su colaboración en la realización de esta
tesis doctoral.

Al profesor doctor D. Ramón Ángel Durazo por sus enseñanzas en la
predicción de enfermedades cardiovasculares.

Al profesor doctor D. Julio Antonio Carbayo Herencia, por su valiosa
ayuda en todas las publicaciones pertenecientes a esta tesis doctoral.

A D. Ian Jonstone, por su ayuda a lo largo de estos años de trabajo, ya
que sus comentarios y consejos han contribuido de forma sustancial en
mi carrera profesional, además de su apoyo lingüístico en los artículos
científicos integrados en esta tesis doctoral.

Al grupo GEVA por permitir hacerme partícipe del proyecto para construir
la escala de riesgo cardiovascular.

A Dña. Maria Repice por su contribución en la traducción de los artículos
científicos presentados en esta tesis doctoral.

Nuevos modelos predictivos de enfermedad cardiovascular.

“Ninguna investigación humana puede ser denominada ciencia si no pasa
a través de pruebas matemáticasi
Leonardo Da Vinci

i This image (or other media file) is in the public domain because its copyright has expired.
This applies to Australia, the European Union and those countries with a copyright term of life of the
author plus 70 years.
Nuevos modelos predictivos de enfermedad cardiovascular.
8
Nuevos modelos predictivos de enfermedad cardiovascular.
9
ÍNDICE
1. SÍNTESIS DE LAS PUBLICACIONES PRESENTADAS........................... 11
1.1. Antecedentes y estado actual del tema. ............................................ 13
1.2. Justificación. ...................................................................................... 16
1.3. Objetivos. ........................................................................................... 16
1.4. Artículos presentados. ....................................................................... 17
1.5. Métodos. ............................................................................................ 18
1.5.1. Modelos básicos empleados en las mejoras propuestas. ............. 18
1.5.2. Predicciones a corto, medio y largo plazo. ................................... 23
1.5.3. Determinación de la mejor combinación de variables para predecir
un evento cardiovascular. ......................................................................... 26
1.5.4. Construcción, validación y utilización de un sistema de puntos con
medidas repetidas de los factores de riesgo cardiovascular. .................... 29
1.6. Resultados. ........................................................................................ 33
1.6.1. Predicciones a corto, medio y largo plazo. ................................... 33
1.6.2. Determinación de la mejor combinación de variables para predecir
un evento cardiovascular. ......................................................................... 38
1.6.3. Construcción, validación y utilización de un sistema de puntos con
medidas repetidas de los factores de riesgo cardiovascular. .................... 38
1.7. Discusión. .......................................................................................... 56
1.8. Referencias. ....................................................................................... 60
2. TRABAJOS PUBLICADOS. ...................................................................... 67
3. CONCLUSIONES. ...................................................................................107
Nuevos modelos predictivos de enfermedad cardiovascular.

Nuevos modelos predictivos de enfermedad cardiovascular.

1. SÍNTESIS DE LAS PUBLICACIONES
PRESENTADAS.

Nuevos modelos predictivos de enfermedad cardiovascular.

1.1. Antecedentes y estado actual del tema.

Puesto que las enfermedades cardiovasculares en la actualidad constituyen
una de las principales causas de mortalidad en el mundo (WHO, 2014), es
lógico que sea de gran interés el desarrollo de modelos de predicción con el
objetivo de conocer sobre qué factores de riesgo podemos intervenir para
disminuir la probabilidad de que un paciente desarrolle una enfermedad
cardiovascular (Molinero, 2003).
El modelo más sencillo para realizar predicciones de un suceso dicotómico,
como es la enfermedad cardiovascular, es el modelo de regresión logística
binaria (Hosmer & Lemeshow, 2000), que produce una ecuación en la que
conocidos los valores de los diferentes factores de riesgo, se puede evaluar la
probabilidad de aparición de la enfermedad. Sin embargo, este tipo de modelos
no tiene en cuenta el tiempo de exposición. Esto es precisamente lo que se
hace en los modelos de supervivencia, los cuales analizan el tiempo de
ocurrencia de un evento determinado, siendo el método más conocido el
modelo de regresión de Cox (Hosmer & Lemeshow, 2008). Sin embargo, no es
la única alternativa posible, existiendo otros posibles métodos de
supervivencia, denominados paramétricos, debido a que suponen un tipo
concreto de distribución, como la de Weibull, que fue utilizada por el proyecto
SCORE (Conroy et al., 2003). Por otra parte, el estudio Framingham (National
Heart, Lung, and Blood Institute, 2015) ha utilizado tanto modelos de regresión
logística como modelos de supervivencia (paramétricos y no paramétricos).
Como referencia se utiliza en Europa la tabla de riesgo SCORE y en Estados
Unidos la del estudio Framingham. Estas tablas de riesgo están basadas en un
tiempo de seguimiento de 10 años, por lo que no permiten obtener predicciones
precisas a corto o medio plazo (Cooney, Dudina & Graham, 2009). Ésta es una
cuestión clínicamente relevante, ya que si conocemos que un paciente tiene
una alta probabilidad de desarrollar una enfermedad cardiovascular a corto
plazo (por ejemplo 2 años), se debería someter a una terapia farmacológica y
no farmacológica más intensa, ya que de no hacerlo es posible que el paciente
experimente una enfermedad cardiovascular.
Nuevos modelos predictivos de enfermedad cardiovascular.

Junto con los modelos predictivos de Framigham y SCORE, se han
desarrolladootros modelos que también se utilizan en la práctica clínica en
menor medida, como por ejemplo el Reynolds risk score and the WHO/ISH
score (Cooney, Dudina & Graham, 2009). Todos estos modelos tienen un
objetivo común: la realización de predicciones de enfermedad cardiovascular
en un periodo de 10 años, pero en la modelización del problema utilizan
diferentes modelos matemáticos (Cox y Weibull) y consideran diferentes
outcomes (morbimortalidad de enfermedades coronarias, mortalidad de
enfermedades coronarias, morbimortalidad cardiovascular o mortalidad
cardiovascular). Esto permite tomar decisiones a largo plazo para los
pacientes. Finalmente, destacamos que las guías de práctica clínica
recomiendan la utilización de estos modelos predictivos para la estratificación
del riesgo cardiovascular de los pacientes. Por ejemplo, la guía clínica europea
sobre la prevención de las enfermedades cardiovasculares, indica que un
sistema de estimación del riesgo, como SCORE, puede ayudar a la toma de
decisiones y de esa forma evitar tanto el exceso como el defecto del
tratamiento (Perk et al., 2012). En otras palabras, los clínicos siguen las guías
clínicas para mejorar su toma de decisiones con el objetivo de prevenir una
enfermedad cardiovascular, y son estas guías las que indican la utilización de
estos modelos predictivos, lo que produce que tengan gran relevancia en la
práctica clínica habitual.
En lo referente a la elección de las variables incluidas en los modelos
predictivos, generalmente los estudios cardiovasculares han recogido multitud
de variables que podrían influir en el pronóstico de cada paciente. Sin embargo,
en la práctica no todas ellas pueden ser incluidas en el modelo, ya que
aumentaría su complejidad y podría no existir la convergencia en la estimación
de sus parámetros (Hosmer & Lemeshow, 2008). Por ese motivo, la mayoría de
estudios han realizado modelos por pasos basados en algún test estadístico,
como puede ser el likelihood ratio test o el score test. Sin embargo, en estos
pasos es posible que obviemos alguna combinación de variables que produzca
un mejor pronóstico de la enfermedad cardiovascular, ya que podría ocurrir que
una variable por sí sola no fuera estadísticamente significativa, pero cuando se
Nuevos modelos predictivos de enfermedad cardiovascular.

combina con otro grupo de variables la predicción de la enfermedad
cardiovascular mejorase (López-Bru et al., 2015; Ramírez-Prado et al., 2015).
Dada la complejidad de estos modelos matemáticos, se ha aplicado un
algoritmo que permite al clínico comprenderlo de forma sencilla, aunque se
pierda precisión en la estimación de la probabilidad de enfermedad
cardiovascular (Sullivan, Massaro & D'Agostino, 2004). Para ello se han
transformado dichos modelos matemáticos en tablas de riesgo de colores que
pueden ser empleadas en la práctica clínica de forma sistemática. No obstante,
dichas tablas están basadas en modelos que manejan variables clínicas en la
situación basal del paciente (Conroy et al., 2003; Cooney, Dudina & Graham,
2009; National Heart, Lung, and Blood Institute, 2015), por lo que no tienen en
cuenta la variabilidad de las mismas a lo largo del tiempo, ya que los
parámetros biológicos están siendo considerados constantes a lo largo del
tiempo de seguimiento, cuando tienen gran variabilidad y el facultativo puede
intervenir mediante tratamiento farmacológico y disminuirlos o aumentarlos de
forma acelerada (NCEP, 2002; American Diabetes Association , 2014; James
et al., 2014; Stone et al., 2014).
Existen modelos predictivos de supervivencia de otro tipo de enfermedades,
que sí tienen en cuenta la variabilidad temporal de un único marcador biológico,
además de variables basales. Éstos son conocidos como Joint Models for
Longitudinal and Time-to-Event Data y están estructurados en dos partes: (i) Se
aplica un modelo lineal mixto para determinar la trayectoria del parámetro
longitudinal y (ii) a partir de un modelo de supervivencia se relacionan las
variables basales y el parámetro longitudinal con la aparición de un evento.
Este tipo de modelos pueden aplicarse para realizar predicciones más precisas
del desarrollo de una enfermedad (Rizopoulos, 2012). Sin embargo, dada su
complejidad, no se emplean en la práctica clínica habitual. Además, la
modelización conjunta cuando la parte de supervivencia está formada por una
función lineal con múltiples parámetros longitudinales (modelización habitual en
el análisis de supervivencia clásico aplicado a las ciencias de la salud), sólo se
ha abordado de forma teórica y en la actualidad sigue siendo un completo
desafío computacional, lo que no ha permitido que se desarrollen algoritmos
para realizar predicciones como en el caso univariado (Rizopoulos, 2011).
Nuevos modelos predictivos de enfermedad cardiovascular.

1.2. Justificación.

Es necesario dotar a los modelos predictivos de enfermedad cardiovascular ya
existentes de mejoras que puedan ser de gran utilidad para los profesionales
sanitarios, de forma que se mejore el pronóstico del paciente y no se pierda la
sencillez de los sistemas de puntos, tan empleados en la práctica clínica
habitual. Estas mejoras deberán aplicarse tanto a los conjuntos de datos que
sólo contengan información en la situación basal, como a aquéllos que
contengan medidas repetidas de los factores de riesgo cardiovascular a lo largo
del tiempo.

1.3. Objetivos.

El objetivo general es mejorar los modelos predictivos de enfermedad
cardiovascular que se utilizan en la actualidad en la práctica clínica habitual.
Para ello se plantean los siguientes objetivos específicos:

1. Detallar una metodología que permita construir y validar un modelo
predictivo de enfermedad cardiovascular con sólo información basal,
para obtener predicciones a corto, medio y largo plazo, para reducir la
incidencia de enfermedad cardiovascular en la población, ya que hemos
de tener en cuenta que los sistemas de puntos actuales no permiten
obtener probabilidades a corto o medio plazo.

2. Detallar cómo seleccionar las variables explicativas de un modelo
predictivo de enfermedad cardiovascular, teniendo en cuenta todas las
posibles combinaciones de variables que pueda soportar el modelo que
se construye.

3. Detallar una metodología para construir modelos predictivos de
enfermedad cardiovascular que puedan aplicarse de forma sistemática
Nuevos modelos predictivos de enfermedad cardiovascular.

en la práctica clínica habitual (sin perder los sistemas de puntos, tan
utilizados en la actualidad) y que determine con la mayor precisión
(teniendo en cuenta la variabilidad temporal de todos los factores de
riesgo cardiovascular) el riesgo de desarrollo de la misma.

1.4. Artículos presentados.

Los objetivos planteados han sido desarrollados dando lugar a tres
publicaciones científicas en revistas de alto de impacto del JCR (Science Ed.):

1. Artigao-Ródenas LM, Carbayo-Herencia JA, Palazón-Bru A, Divisón-
Garrote JA, Sanchis-Domènech C, Vigo-Aguiar I, Gil-Guillén VF; GEVA
(Group of Vascular Diseases from Albacete). 2015. Construction and
validation of a 14-year cardiovascular risk score for use in the general
population: the PURAS-GEVA chart. Medicine (Baltimore) 94: e1980.

Medicine es una revista científica que aborda todas las especialidades y
subespecialidades médicas con un factor de impacto de 5.723 (JCR
2014), situada en la posición número 15 de un total de 153 en la
categoría de MEDICINE, GENERAL & INTERNAL.

2. Ramírez-Prado D, Palazón-Bru A, Folgado-de la Rosa DM, Carbonell-
Torregrosa MÁ, Martínez-Díaz AM, Martínez-St John DR, Gil-Guillén VF.
2015. A four-year cardiovascular risk score for type 2 diabetic inpatients.
PeerJ 3: e984.

3. Palazón-Bru A, Carbayo-Herencia JA, Vigo-Aguiar I, Gil-Guillén VF.
2016. Amethod to construct a points system to predict cardiovascular
disease considering repeated measures of risk factors. PeerJ 4: e1673.
Nuevos modelos predictivos de enfermedad cardiovascular.

PeerJ es una revista científica con un factor de impacto de 2.112,
situada en la posición decimotercera en MULTIDISCIPLINARY
SCIENCES, la cual engloba a un total de 57 revistas científicas.

1.5. Métodos.

En esta sección detallaremos las mejoras propuestas para la creación de
nuevos modelos predictivos de enfermedad cardiovascular, pero antes de ello
se realizará una síntesis de los modelos básicos empleados en dichas mejoras
(modelo de supervivencia de Cox con variables tiempo-dependientes, cómo
elaborar un sistema de puntos con la metodología del Framingham Heart
Study, Joint Models for Longitudinal and Time-to-Event Data, y predicciones
dinámicas utilizando Joint Models).

1.5.1. Modelos básicos empleados en las mejoras propuestas.

Modelo de supervivencia de Cox con variables tiempo dependientes
Sea 𝑇 una variable aleatoria no negativa denotando el tiempo de supervivencia,
que es el mínimo valor entre el verdadero tiempo hasta el evento 𝑇∗ y el tiempo
de censura 𝐶 (censura no informativa por la derecha). En otras palabras,
𝑇 = min(𝑇∗,𝐶). Además, definimos 𝛿 como el indicador del evento, que toma el
valor 1 si 𝑇∗ ≤ 𝐶 y 0 en otro caso. Por otro lado, sea 𝑾 el vector de covariables
basales e 𝒀(𝑡) el vector de covariables tiempo-dependientes que tiene valores
definidos siempre para 𝑡 ≥ 0. Con estos datos, el modelo de Cox con
covariables tiempo-dependientes toma la siguiente forma (función de riesgo):

ℎ�𝑡|𝒘,𝒚(𝑡)� = ℎ0(𝑡) exp{𝜸𝑇𝒘 + 𝜶𝑇𝒚(𝑡)},

donde ℎ0(𝑡) es la función de riesgo en la situación basal, 𝜸 y 𝜶 son los vectores
de los coeficientes de la regresión para las covariables basales y tiempo
dependientes respectivamente (Andersen & Hill, 1982).
Nuevos modelos predictivos de enfermedad cardiovascular.

La estimación de los parámetros del modelo está basada en la función de
verosimilitud parcial (Andersen & Hill, 1982). Por otro lado, tenemos que
corroborar si la forma funcional de cada una de las covariables en el modelo es
lineal. Esto deberá hacerse mediante métodos gráficos (gráfico cartesiano
enfrentando a los residuos de Martingala frente a la covariable de interés).
Finalmente, debemos valorar si el modelo ajusta nuestros datos de forma
correcta, a través del análisis de los residuos de Cox-Snell (test gráfico).
El modelo clásico de Cox (sin variables tiempo-dependientes), elimina 𝜶 e 𝒚(𝑡)
de la expresión anterior. Además, el modelo tiene que verificar la siguiente
condición (hipótesis de riesgos proporcionales):

log�
ℎ(𝑡|𝒘)
ℎ0(𝑡)
� =𝜸𝑇𝒘.

Elaboración de un sistema de puntos desde un modelo de supervivencia de
Cox mediante la metodología del Framingham Heart Study
Vamos a resumir los pasos principales para adaptar un modelo de regresión de
Cox con 𝑝 covariables a sistema de puntos, mediante la metodología elaborada
por los investigadores del Framingham Heart Study (Sullivan, Massaro &
D'Agostino, 2004):

1) Estimar los parámetros del modelo: 𝜸�.

2) Organizar los factores de riesgo en categorías y determinar valores de
referencia:

a. Factor de riesgo continuo (ejemplo: la edad): realizar
agrupamientos contiguos del factor y determinar valores de
referencia para cada agrupamiento. Ejemplo para la edad: 18-30
[24], 30-39 [34.5], 40-49 [44.5], 50-59 [54.5], 60-69 [64.5] y ≥70
años [74.5]. En corchetes se indican cada uno de los valores de
referencia. Los investigadores del Framingham Heart Study
Nuevos modelos predictivos de enfermedad cardiovascular.

recomiendan el punto medio de cada intervalo como un valor
adecuado para la referencia, y para la primera y última categoría
la media entre el valor extremo y el percentil 1 (primera categoría)
o el percentil 99 (última categoría).

b. Factores de riesgo binarios (ejemplo el sexo: 0 mujer y 1 hombre):
los valores de referencia son 0 y 1.

𝑊𝑖𝑗 denotará el valor de referencia para la categoría 𝑗 y el factor de
riesgo 𝑖, donde 𝑖 = 1, . . . ,𝑝 y 𝑗 = 1, . . . , 𝑐𝑖 (número total de categorías para
el factor de riesgo 𝑖).

3) Determinar la categoría base para cada factor de riesgo: la categoría
base será aquélla que otorgue 0 puntos en el sistema y será denotada
por 𝑊𝑖𝑅𝐸𝐹, 𝑖 = 1, … ,𝑝.

4) Determinar cuántas unidades de regresión se separa cada categoría de
la categoría base: calcular 𝜸�𝑖 · �𝑊𝑖𝑗 −𝑊𝑖𝑅𝐸𝐹�, 𝑖 = 1, . . . ,𝑝 y 𝑗 = 1, . . . , 𝑐𝑖.

5) Fijar la constante 𝐵: el número de unidades de regresión equivalentes a
1 punto en el sistema. En el Framingham Heart Study se utiliza el
incremento de 5 (ó 10) años de edad.

6) Determinar el número de puntos para cada categoría de todos los
factores de riesgo: el número entero más cercano a 𝜸�𝑖 · �𝑊𝑖𝑗 −𝑊𝑖𝑅𝐸𝐹�/
𝐵.

7) Determinar el riesgo asociado con la puntuación total (la suma de todas
las puntuaciones asociada a cada uno de los factores de riesgo):
1 − �̂�0(𝑡)exp�∑ (𝜸�𝑖·𝑊𝑖𝑅𝐸𝐹)𝑝
𝑖=1 +𝐵·𝑃𝑢𝑛𝑡𝑜𝑠−∑ 𝜸�𝑖·𝒘�𝚤�
𝑝
𝑖=1 �, donde �̂�0(𝑡) se calcula a
través del estimador de Kaplan-Meier.

Nuevos modelos predictivos de enfermedad cardiovascular.

Joint Models for Longitudinal and Time-to-Event Data
Utilizando la notación anterior, nosotros tenemos el vector de variables
aleatorias {𝑇,𝑾,𝑌(𝑇)}, donde 𝑌(𝑇) es una única variable tiempo-dependiente
(parámetro longitudinal), que tiene sus valores definidos de forma intermitente
para 𝑡. En otras palabras, para un sujeto 𝑖 (𝑖 = 1, . . . ,𝑛), 𝑦(𝑡) está sólo definida
para 𝑡𝑖𝑗 (𝑗 = 1, … ,𝑛𝑖), 𝑦𝑖�𝑡𝑖𝑗�, donde 0 ≤ 𝑡𝑖1 ≤ 𝑡𝑖2 ≤ ⋯ ≤ 𝑡𝑖𝑛𝑖 (𝑡𝑖𝑛𝑖 es el instante
de tiempo máximo donde se ha recogido el parámetro longitudinal para el
sujeto 𝑖). Ahora, vamos a denotar a 𝑚(𝑡) como el valor real y no observado del
parámetro longitudinal en el instante de tiempo 𝑡 (𝑚𝑖(𝑡) para el sujeto 𝑖). Para
valorar el efecto de 𝑚(𝑡) en el riesgo de evento, la opción estándar es ajustar
un modelo de regresión de Cox con una única variable tiempo-dependiente:

ℎ(𝑡|ℳ(𝑡),𝒘) = ℎ0(𝑡∗) exp{𝜸𝑇𝒘 + 𝛼𝑚(𝑡)},

donde ℳ(𝑡) para un sujeto 𝑖 se define como ℳ𝑖(𝑡) = {𝑚𝑖(𝑢); 0 ≤ 𝑢 < 𝑡}, que
denota la historia del verdadero y no observado valor del parámetro longitudinal
hasta el instante de tiempo 𝑡. El resto de parámetros de la expresión sigue la
estructura del modelo de regresión de Cox con variables tiempo-dependientes,
el cual se ha detallado anteriormente. Respecto a la función de riesgo basal,
ésta puede dejarse no especificada o puede ser aproximada mediante splines o
funciones definidas a trozos (Rizopoulos, 2012).
En la expresión anterior, hemos utilizado 𝑚(𝑡) como el verdadero y no
observado valor del parámetro longitudinal, sin embargo en nuestra muestra
hemos recogido 𝑦(𝑡), por lo tanto estimaremos 𝑚(𝑡) utilizando 𝑦(𝑡) a través de
un modelo lineal de efectos mixtos, con el objetivo de describir las evoluciones
del parámetro longitudinal para cada uno de los sujetos:

⎩
⎪
⎨
⎪
⎧ 𝑦𝑖(𝑡) = 𝑚𝑖(𝑡) + 𝜀𝑖(𝑡)
𝑚𝑖(𝑡) = 𝒙𝒊𝑇(𝑡)𝜷 + 𝒛𝒊𝑇(𝑡)𝒃𝒊
𝒃𝒊 ∼ 𝑁(𝟎,𝑫)
𝜀𝑖(𝑡) ∼ 𝑁(0,𝜎2)
, �

Nuevos modelos predictivos de enfermedad cardiovascular.

donde 𝜷 y 𝒃𝒊 denotan los vectores de coeficientes de la regresión para los
efectos fijos y para los efectos aleatorios respectivamente, 𝒙𝒊(𝑡) y 𝒛𝒊(𝑡) denotan
los vectores fila de las matrices del diseño para los efectos fijos y para los
efectos aleatorios respectivamente, y 𝜀𝑖(𝑡) es el error que tiene una varianza
𝜎2. Finalmente, 𝒃𝒊 sigue una distribución normal con media 𝟎 y matriz de
varianzas-covarianzas 𝑫, e independente de 𝜀𝑖(𝑡) (Rizopoulos, 2012).La estimación de los parámetros del modelo está basada en la maximización
de la función de verosimilitud del modelo conjunto (Rizopoulos, 2012).
Respecto a los supuestos del modelo, nosotros tenemos que verificarlos para
ambos submodelos (longitudinal y supervivencia), utilizando los gráficos de
residuos. Para la parte longitudinal, nosotros representaremos los residuos
específicos de cada sujeto frente a los valores ajustados por el modelo, el
gráfico Q-Q de los residuos específicos de cada sujeto, y los residuos
marginales frente a los valores ajustados. Por otro lado, para la parte de
supervivencia, nosotros representaremos en un gráfico cartesiano los valores
ajustados de los parámetros longitudinales contra los residuos de Martingala, y
finalmente determinaremos gráficamente si los residuos de Cox-Snell siguen
una distribución (censurada) exponencial con parámetro la unidad (Rizopoulos,
2012). Respecto la última componente del modelo conjunto sobre la que hemos
indicado un supuesto (efectos aleatorios), otros autores han mostrado que los
modelos lineales de efectos mixtos son robustos a la falta de especificación de
esta distribución (Verbeke & Lesaffre, 1997).

Predicciones de los parámetros longitudinales utilizando Joint Models for
Longitudinal and Time-to-Event Data
Sea una muestra aleatoria �𝑡𝑖, 𝛿𝑖,𝒘𝑖 ,𝑦𝑖�𝑡𝑖𝑗�, 0 ≤ 𝑡𝑖𝑗 ≤ 𝑡𝑖, 𝑗 = 1, … ,𝑛𝑖�, 𝑖 = 1, … ,𝑛
del vector de variables aleatorias {𝑇, Δ,𝑾,𝑌}, utilizando la notación anterior.
Supongamos también que hemos ajustado un joint model como el que el que
se ha detallado anteriormente. Ahora, estamos interesados en predecir el valor
esperado del parámetro longitudinal en un instante de tiempo 𝑢 > 𝑡 para un
Nuevos modelos predictivos de enfermedad cardiovascular.

nuevo sujeto 𝑖, que tiene una historia hasta el tiempo 𝑡 del valor observado del
parámetro longitudinal 𝒴𝑖(𝑡) = {𝑦𝑖(𝑠); 0 ≤ 𝑠 < 𝑡}:

𝜔𝑖(𝑢|𝑡) = 𝐸𝑌{𝑦𝑖(𝑢)|𝑡𝑖∗ > 𝑡,𝒴𝑖(𝑡),𝒘𝒊;𝜽},

donde 𝜽 denota el vector de parámetros del joint model (Rizopoulos, 2011).
Rizopoulos desarrolló una aproximación de Monte Carlo para realizar esta
tarea, basada en formulación Bayesiana. Él obtuvo el siguiente algoritmo de
simulación (Rizopoulos, 2011):

Paso 1: Simular 𝜽(𝑙)~𝒩�𝜽�, 𝑣𝑎𝑟� �𝜽���.

Paso 2: Simular 𝒃𝒊
(𝑙)~�𝒃𝒊|𝑡𝑖∗ > 𝑡,𝒴𝑖(𝑡),𝒘𝒊;𝜽(𝑙)�.

Paso 3: Calcular 𝜔𝑖
(𝑙)(𝑢|𝑡) = 𝒙𝒊𝑇(𝑢)𝜷(𝑙) + 𝒛𝒊𝑇(𝑢)𝒃𝒊
(𝑙)

Este algoritmo deberá ser repetido 𝐿 veces. La estimación del parámetro
longitudinal será la media (o la mediana) de los valores calculados
(𝜔𝑖
(𝑙)(𝑢|𝑡), 𝑙 = 1, … , 𝐿) y el intervalo de confianza estará formado por los
percentiles (95%: percentiles 2.5 y 97.5%) (Rizopoulos, 2011).
Nosotros destacamos que estas predicciones tienen naturaleza dinámica, ya
que conforme se registra información del paciente, las predicciones se
actualizan con dicha información.

1.5.2. Predicciones a corto, medio y largo plazo.

Una vez hemos adaptado los coeficientes de un modelo de supervivencia a un
sistema de puntos construido mediante la metodología del estudio de
Framingham (Sullivan, Massaro & D'Agostino, 2004), dispondremos de los
siguientes elementos:
Nuevos modelos predictivos de enfermedad cardiovascular.

1) Estimación de los 𝑝 coeficientes asociados a nuestros factores de riesgo
(𝒘) del modelo de regresión: 𝜸�.

2) Valor de ∑ 𝜸�𝑖 · 𝒘�𝚤�
𝑝
𝑖=1 .

3) Todas las variables explicativas categorizadas. Por ejemplo, en una
variable cuantitativa, como puede ser la edad en años, supongamos que
disponemos de un rango para esta variable de 30-79 años, de forma que
podemos utilizar las categorías de edad 30-39, 40-49, 50-59, 60-69, 70-
79 años. Por otra parte, si un factor está modelado por un conjunto de
variables binarias, como puede ser el ser fumador, la categorización
será: ausente (el sujeto no es fumador) y presente (el sujeto sí que es
fumador).

4) Cada categoría dispone de una puntuación asociada. Por ejemplo, en
las categorías de edad anteriores, se podría dar el siguiente esquema de
puntuaciones:

a. 30-39 años → 0 puntos.
b. 40-49 años → 2 puntos.
c. 50-59 años → 4 puntos.
d. 60-69 años → 6 puntos.
e. 70-79 años → 8 puntos.

Mientras que para la variable del tabaquismo, las puntuaciones podrían
tener la siguiente forma:

a. No fumador → 0 puntos.
b. Fumador → 3 puntos.

Sumando la puntuación asociada a cada categoría, obtenemos la
puntuación total de cada sujeto.

Nuevos modelos predictivos de enfermedad cardiovascular.

5) La estimación de la probabilidad de supervivencia, obtenida a través del
estimador de Kaplan-Meier, para todos los instantes de tiempo recogidos
durante el estudio.

6) La constante 𝐵.

7) Valores de referencia para cada uno de los factores de riesgo: 𝑊𝑖𝑅𝐸𝐹.

A continuación, empleando toda esta información, podemos calcular la
probabilidad de evento para un sujeto con una puntuación P en un instante de
tiempo t, empleando la siguiente expresión:

1 − �̂�0(𝑡)exp�∑ (𝜸�𝑖·𝑊𝑖𝑅𝐸𝐹)𝑝
𝑖=1 +𝐵·𝑃−∑ 𝜸�𝑖·𝒘�𝚤�
𝑝
𝑖=1 �

Tanto los investigadores del Framingham Heart Study, como los del proyecto
SCORE, han utilizado siempre un valor de 10 años para t, lo cual no permite
obtener predicciones a corto o medio plazo, tal como se ha comentado
anteriormente en el punto de Antecedentes y estado actual del tema. Sin
embargo, la expresión anterior permite sustituir en cualquier valor de t
contenido en el rango de seguimiento del estudio. Esto nos permite obtener
predicciones a corto y medio plazo, así como a largo plazo (10 años). Por
ejemplo, podríamos sustituir en 𝑡 = 2, 4, 6, 8, 10 años y obtendríamos la
probabilidad cada dos años de evento cardiovascular, dependiendo
exclusivamente de la puntuación de cada nuevo sujeto y del tiempo de
predicción, ya que el resto de parámetros serían constantes en el cálculo.
Ahora, una vez construido nuestro sistema de puntos con predicciones en
varios puntos de corte en el tiempo, se nos presenta una dificultad, que es
cómo validar el sistema de puntos para determinar si existen diferencias entre
los eventos cardiovasculares observados y aquéllos pronosticados por nuestro
sistema.
La clave del cálculo de los eventos observados reside en que debemos de
tener en cuenta que un sujeto que ha padecido un evento cardiovascular en el
Nuevos modelos predictivos de enfermedad cardiovascular.

seguimiento, lo habrá padecido a partir de un instante fijo 𝑡∗, por lo que si
estamos calculando los eventos observados antes de dicho instante de tiempo,
el sujeto deberá ser considerado como libre de evento cardiovascular, mientras
que si el punto de corte del tiempo es considerado superior a 𝑡∗,
consideraremos que el participante sí que ha experimentado un evento.
Tras cálculo de eventos observados y esperados en cada instante de tiempo
prefijado (corto, medio o largo plazo), sólo debemos de determinar si existen
diferencias mediante la prueba de la χ2 de Pearson, cuyo valor será diferente
según el punto de corte del tiempo escogido (en el ejemplo anterior: 2, 4, 6, 8 y
10 años).

1.5.3. Determinación de la mejor combinación de variables para predecir
un evento cardiovascular.

Supongamos que tenemos un total de 𝑚 variables explicativas para tratar de
predecir un evento cardiovascular mediante un modelo de supervivencia, por
ejemplo un modelo de regresión de Cox. Por otro lado, consideremos que
podemos introducir un máximo de 𝑟 variables en el modelo, ya que debemos de
tener mucho cuidado en la convergencia del mismo y en la razón entre el
número de eventos y el número de variables explicativas introducidas en dicho
modelo.
La mayoría de trabajos han propuesto utilizar un método por pasos basado en
un test estadístico, como puede serel likelihood ratio test o el score test. Este
modelo por pasos suele ser hacia adelante (partir del modelo nulo e ir
introduciendo variables según el test estadístico elegido) o hacia atrás [partir
del modelo saturado (con todas las variables explicativas) e ir extrayendo
variables según el test estadístico elegido]. También se han considerado
métodos por pasos sucesivos, los cuales combinan los dos métodos anteriores
(hacia adelante y hacia atrás). Sin embargo, a la hora de realizar una
predicción, nos interesa aquel conjunto de variables que puede explicar mejor
nuestra variable respuesta, es decir, la aparición de la enfermedad
cardiovascular en el tiempo.
Nuevos modelos predictivos de enfermedad cardiovascular.

En los modelos de supervivencia se ha propuesto un estadístico, conocido
como estadístico 𝐶 (Pencina & D'Agostino, 2004), el cual mide la capacidad
discriminante del modelo para la variable respuesta. Este estadístico se
encuentra entre 0 y 1. La interpretación de su valor es la siguiente: cuanto más
cercano a 1 esté, mayor discriminación tendrá el modelo. En otras palabras,
tiene gran interés encontrar la combinación de variables que arroje un mayor
estadístico 𝐶, ya que será aquélla que discrimine mejor entre los sujetos que
padecerán una enfermedad cardiovascular y aquéllos que no, es decir, las
predicciones serán mucho más precisas.
Los métodos anteriores se basan en otro tipo de test estadísticos, por lo que no
tienen en cuenta esta cuestión. Por ese motivo, vamos a detallar una
metodología capaz de escoger la mejor combinación de variables para predecir
la aparición de una enfermedad cardiovascular (aquélla con un estadístico 𝐶
máximo).
Como hemos indicado anteriormente, podemos seleccionar un máximo de 𝑟
variables de un total de 𝑚. Planteamos el siguiente algoritmo:

𝑖 = 𝑟:

a. Calcular todas las posibles combinaciones de 𝑚 variables
tomadas de 𝑟 en 𝑟 sin repetición, es decir, �𝑚𝑖 � = �𝑚𝑟 �.

b. Determinar el estadístico 𝐶 para cada una de estas
combinaciones de variables.

𝑖 = 𝑟 − 1:

a. Repetir el proceso, pero ahora tomando las combinaciones de
𝑟 − 1 en 𝑟 − 1 sin repetición: �𝑚𝑖 � = � 𝑚
𝑟−1�.

b. Calcular de nuevo el estadístico 𝐶 en cada combinación.

Nuevos modelos predictivos de enfermedad cardiovascular.

…

𝑖 = 1:

a. Finalmente, calculamos todas las combinaciones de 𝑚 variables
tomadas de 1 en 1 sin repetición, es decir, �𝑚𝑖 � = �𝑚1� = 𝑚. En
otras palabras, probamos 𝑚 modelos, los cuales contienen una
única variable, la cual es diferente en todos ellos.

b. Calcular el estadístico 𝐶 en los 𝑚 modelos.

Una vez hemos realizado todo este proceso, seleccionaremos aquella
combinación que tenga un estadístico 𝐶 máximo, ya que será el modelo con
mayor capacidad discriminante y aquél que tendrá predicciones de enfermedad
cardiovascular más precisas.
El número total de combinaciones probadas en este nuevo algoritmo es:

�
𝑚
𝑟
� + �
𝑚
𝑟 − 1
� + �
𝑚
𝑟 − 2
� + ⋯+ �
𝑚
2
� + �
𝑚
1
�.

Por ejemplo, si 𝑚 = 20 y 𝑟 = 8, el algoritmo corroborará un total de 263,949
combinaciones y se quedará con aquélla que tenga un estadístico 𝐶 más
elevado (máximo de los valores).

Nuevos modelos predictivos de enfermedad cardiovascular.

1.5.4. Construcción, validación y utilización de un sistema de puntos con
medidas repetidas de los factores de riesgo cardiovascular.

Construcción
Queremos determinar la probabilidad de padecer una enfermedad
cardiovascular desde la situación basal (𝑡 = 0) hasta un instante de tiempo fijo
�̃�, teniendo una serie de factores de riesgo medidos durante el seguimiento y
en la situación basal. Para lograr este objetivo realizaremos los siguientes
pasos:

1) Ajustar un modelo de regresión de Cox con variables tiempo
dependientes en la muestra recogida. Al no poder estimar un modelo
conjunto con múltiples parámetros longitudinales (Rizopoulos, 2012),
emplearemos el modelo de Cox extendido clásico (sin estructura
compartida), el cual necesita conocer los valores de todos los
parámetros longitudinales en todos los instantes de tiempo. Como esto
no es conocido porque los parámetros se recogen de forma intermitente,
tomaremos el último valor en el tiempo como referencia.

2) Emplear la metodología del estudio Framingham para adaptar los
coeficientes del modelo obtenido a un sistema de puntos y determinar
las probabilidades de enfermedad cardiovascular de cada puntuación
hasta el instante �̃� (Sullivan, Massaro & D'Agostino, 2004). A través de
estas probabilidades construir grupos de riesgo que sean sencillos de
entender para el clínico (por ejemplo, en múltiplos de 5%).

3) Ajustar un joint model for longitudinal and time-to-event data para cada
parámetro longitudinal recogido en el seguimiento. Además, éstos
incluirán todas las variables basales. Estos modelos son construidos con
el objetivo de realizar predicciones de los parámetros longitudinales
sobre nuevos pacientes (validación o utilización tras validación).

Nuevos modelos predictivos de enfermedad cardiovascular.

Validación estadística a través de simulación
Una vez construido el sistema de puntos, queremos ver si sobre otro conjunto
diferente de sujetos (muestra de validación), el modelo determina de forma
precisa la aparición de la enfermedad cardiovascular. De esta muestra de
validación conoceremos en la situación basal la historia de los marcadores
longitudinales hasta el instante 𝑡 = 0 [registro de los factores de riesgo
cardiovascular en la historia clínica (𝑡 < 0)] y el valor de las variables basales.
Con esta información determinaremos la probabilidad que tiene cada sujeto de
experimentar un evento y la compararemos con lo que realmente ha pasado,
es decir, determinar si es válido el modelo. Para determinar esta validez
seguiremos los siguientes pasos:

1) Determinar 𝐿 simulaciones de los parámetros longitudinales en el
instante de tiempo �̃� mediante los modelos elaborados en el paso 3) de
la construcción, a través de su historia (𝑡 < 0) y de las variables basales
(𝑡 = 0). Mediante estos valores simulados, construiremos una
distribución de la puntuación para cada sujeto de la muestra, es decir,
cada sujeto tendrá 𝐿 valores de la variable puntuación (basta con
evaluar el sistema de puntos utilizando los valores simulados y las
variables basales). Por otra parte, también para cada simulación 𝑙-ésima
cada paciente tendrá un valor de puntuación. En otras palabras, cada
simulación tendrá una distribución de la variable de puntuaciones.

2) Para cada simulación 𝑙-ésima ajustar un modelo de Cox clásico (sin
variables tiempo-dependientes), utilizando como única variable
explicativa la puntuación obtenida. De cada uno de estos 𝐿 modelos,
determinar el valor del estadístico 𝐶 (estadístico de Harrell) (Pencina &
D'Agostino, 2004). Esto nos dará una distribución de valores para este
estadístico, de los cuales calcularemos la media (o la mediana), así
como los percentiles 2.5 y 97.5% (Rizopoulos, 2011). De esta forma
construiremos un intervalo de confianza para este estadístico, el cual
Nuevos modelos predictivos de enfermedad cardiovascular.

nos indicará la capacidad discriminante del sistema de puntos para
determinar qué pacientes desarrollaran una enfermedad cardiovascular.

3) Para cada paciente de la muestra de validación, calcular la mediana de
su distribución de puntuaciones. Notar que no empleamos la media,
debido a que podría tener decimales y esto no tiene sentido a la hora de
aplicar el sistema de puntos. Utilizando estas medianas, clasificar a cada
paciente en un grupo de riesgo y comprobar si existen diferencias entre
la tasa de acontecimientos predichos por el sistema de puntos en cada
grupo con la observada.El test empleado para este proceso será el de
la χ2 de Pearson.

En la literatura se ha descrito que el estadístico 𝐶 tiene varias limitaciones
(Lloyd-Jones, 2010). Primeramente, no compara si los riesgos observados y
estimados son similares en los sujetos. Debido a ello hemos añadido el análisis
de las diferencias entre los eventos observados y esperados, lo cual minimiza
el problema propuesto. Finalmente, en segundo lugar, es muy sensible a
valores de hazard ratios grandes (≥9). Sin embargo, debemos de tener en
cuenta que al tratarse todas las variables de forma cuantitativa (no
categorizando), los valores de los hazard ratio no superan este umbral. En
definitiva, mediante el análisis conjunto del índice de concordancia de Harrell y
las diferencias de eventos observados con los eventos esperados, disponemos
de una forma satisfactoria para validar estadísticamente por simulación el
modelo propuesto.

Utilización potencial
Una vez validado estadísticamente a través de simulación el sistema de
puntos, el clínico está en condiciones de aplicar dicho sistema para determinar
en un nuevo paciente su riesgo cardiovascular y posibles intervenciones para
su disminución. Hemos de tener en cuenta que el profesional sanitario tendrá
información histórica de los parámetros longitudinales (𝑡 < 0) e información en
Nuevos modelos predictivos de enfermedad cardiovascular.

la situación basal del nuevo paciente (𝑡 = 0). Los pasos que debe de seguir el
clínico son los siguientes:

1) Determinar el valor de cada uno de los parámetros longitudinales en el
instante �̃�. Para ello aplicaremos los modelos obtenidos en el paso 3) de
la construcción sobre el histórico del nuevo paciente y sobre la
información basal, con el objetivo de determinar 𝐿 simulaciones de cada
parámetro longitudinal, de forma análoga al proceso de validación. En
cada simulación 𝑙-ésima determinar la puntuación correspondiente al
perfil de factores de riesgo cardiovascular obtenido (valores simulados e
información basal). Esto nos construirá una distribución de la puntuación
para el nuevo paciente.

2) Determinar la mediana y los percentiles 2.5 y 97.5% del vector de
puntuaciones construido en el paso anterior. La mediana será la
estimación de la puntuación del nuevo paciente y los percentiles
definirán su intervalo de confianza (Rizopoulos, 2011). Por otro lado,
como cada puntuación tiene un riesgo asociado, el profesional sanitario
conocerá la probabilidad de enfermedad cardiovascular en un tiempo �̃�,
junto con su intervalo de confianza. Finalmente, le indicaremos al clínico
los valores de los parámetros biológicos en �̃� de la mediana del sistema
de puntos, ya que de esta forma podrá ver cuáles de ellos tienen una
puntuación por encima del nivel normal, es decir, conocerá los posibles
puntos de intervención para disminuir el riesgo cardiovascular.

3) Ahora que el clínico conoce el riesgo cardiovascular y qué parámetros
otorgan una puntuación por encima del nivel normal, tiene que diseñar la
mejor intervención de cara al paciente. Esto presenta un problema, ya
que necesitamos conocer el valor de cada parámetro biológico en el
instante �̃�, es decir, el clínico conoce una aproximación basada en
simulaciones, que ha sido construida a través de la historia de su
paciente, pero no sabe cómo afectarán sus intervenciones al riesgo
cardiovascular.
Nuevos modelos predictivos de enfermedad cardiovascular.

Del paso anterior el profesional sanitario conoce los parámetros sobre los que
ha de intervenir y la historia de estos parámetros y su situación basal. En base
a estas medidas el médico establecerá un objetivo realista para la próxima
visita del paciente en un instante �̃̃� (0 < �̃̃� < �̃�). Ahora insertará los valores
objetivo en �̃̃� en la historia del parámetro biológico y determinará su valor en el
instante �̃�, es decir, determinará 𝐿 simulaciones de cada uno de los factores de
riesgo cardiovascular a través de los modelos anteriores (paso 3 de la
construcción), añadiendo un nuevo valor a la historia (�̃̃�).
A través de estos cálculos obtendrá el beneficio de su intervención (estimación
[media o mediana] del parámetro biológico en �̃�) y podrá visualizar en el
sistema de puntos cómo disminuiría el riesgo del paciente.

1.6. Resultados.

Vamos a detallar los resultados que derivan de la aplicación de las mejoras
propuestas a los modelos cardiovasculares ya existentes, clasificando dichos
resultados según objetivos específicos alcanzados:

1.6.1. Predicciones a corto, medio y largo plazo.
En las Figuras 1 y 2 podemos observar cómo varían las probabilidades de
enfermedad cardiovascular, conforme cambiamos el tiempo de predicción.
Mientras que en la Figura 1 cambia cada año hasta un máximo de 4 (Ramírez-
Prado et al., 2015), en la Figura 2 se calcula la probabilidad de evento cada 2
años hasta un máximo de 14 (Artigao-Ródenas et al., 2015).

Nuevos modelos predictivos de enfermedad cardiovascular.

Figura 1: Escala de riesgo cardiovascular para pacientes diabéticos tipo 2
hospitalizados (Ramírez-Prado et al., 2015).

Nuevos modelos predictivos de enfermedad cardiovascular.

Figura 2: Modelo predictivo para determinar qué paciente sufrirá una
enfermedad cardiovascular en un periodo máximo de 14 años.

LVH, hipertrofia ventricular izquierda; PA, actividad física; SBP, tensión arterial sistólica.
Definición de la actividad física (Food and Agriculture Organization of the United Nations &
World Health Organization, 1973): 1) Actividad ligera: actividad de quien trabaja sentado en un
despacho o detrás de un mostrador con instrumentos automatizados; 2) Actividad moderada:
ligera actividad física continua, como en un trabajo ligero en la industria o en la agricultura fuera
de estación; 3) Actividad intensa: trabajo pesado y, a veces, enérgico (producción agrícola,
trabajo en minas o fundiciones). Si una persona no estaba trabajando se consideró que
experimentaba una actividad ligera.

Nuevos modelos predictivos de enfermedad cardiovascular.

Por otra parte, a la hora de validar el sistema de puntos con periodo máximo de
predicción de 14 años (Figura 3), vemos cómo aumenta la tasa de eventos
conforme aumenta el tiempo (cada 2 años).

Nuevos modelos predictivos de enfermedad cardiovascular.

Figura 3: Diferencias entre los diferentes grupos de riesgo construidos en
la muestra de validación (Artigao-Ródenas et al., 2015).

Nuevos modelos predictivos de enfermedad cardiovascular.

1.6.2. Determinación de la mejor combinación de variables para predecir
un evento cardiovascular.
En el artículo incluido en esta tesis doctoral sobre la construcción de una
escala de riesgo cardiovascular en pacientes diabéticos tipo 2 ingresados a
través de un servicios de urgencias (Ramírez-Prado et al., 2015), se aplicó el
algoritmo propuesto. Se disponía de un total de 15 posibles variables
explicativas, de las cuales sólo podíamos seleccionar un máximo de 7, por lo
que se comprobó un total de 16,383 combinaciones y la mejor combinación
otorgó un estadístico 𝐶 al modelo predictivo de 0.734.

1.6.3. Construcción, validación y utilización de un sistema de puntos con
medidas repetidas de los factores de riesgo cardiovascular.
Dado que no se disponía de datos reales para aplicar el nuevo método
propuesto, se trabajo sobre datos simulados con el único objetivo de explicar al
lector cómo utilizar el método propuesto. Notar, que se han llevado a cabo dos
simulaciones dando lugar a dos conjuntos de datos simulados, uno se ha
utilizado para construir el modelo y otro para su validación. Para que ambos
conjuntos tengan plausibilidad biológica, hemos empleado estimacionesobtenidas en el estudio cardiovascular Puras-GEVA (Artigao-Ródenas et al.,
2015).
Nuestros conjuntos incluyen los siguientes parámetros biológicos: edad (años),
tensión arterial sistólica (SBP) (mmHg), hemoglobina glicada (HbA1c) (%),
índice aterogénico, sexo (hombre o mujer) y tabaquismo (sí o no), de los cuales
la SBP, HbA1c y el índice aterogénico estarán presentes en la situación basal
(𝑡 = 0) y en el seguimiento para la muestra de construcción (𝑡 > 0) ó recogidos
en la historia clínica para la muestra de validación estadística a través de
simulación (𝑡 < 0). La elección de incluir estas variables se ha basado en las
escalas de riesgo cardiovascular actuales (Conroy et al., 2003; National Heart,
Lung, and Blood Institute, 2015), salvo la HbA1c, que se ha utilizado en lugar
del diagnóstico de diabetes mellitus, con el objetivo de incluir otro parámetro
tiempo-dependiente en el modelo final, además de que de esta forma
Nuevos modelos predictivos de enfermedad cardiovascular.

podríamos valorar el control de la diabetes mellitus (HbA1c <6.5%) a la hora de
prevenir una enfermedad cardiovascular.
Respecto a la variable principal (tiempo hasta la enfermedad cardiovascular),
vamos a suponer que nuestra cohorte se utiliza para predecir la aparición de
una enfermedad cardiovascular con un seguimiento de 2 años. Notar que las
escalas tradicionales de riesgo cardiovascular utilizan un tiempo de 10 años
(Conroy et al., 2003; National Heart, Lung, and Blood Institute, 2015). Nosotros
hemos tomado este valor inferior a dichas escalas, porque vamos a realizar
predicciones de los parámetros longitudinales desde la situación inicial (𝑡 = 0)
hasta el tiempo de predicción y si tomáramos un valor de predicción de 10
años, las predicciones de los parámetros longitudinales tendrían una gran
variabilidad y no permitirían realizar predicciones precisas de qué paciente
desarrollará una enfermedad cardiovascular, lo que en consecuencia
equivaldría a la falta de utilidad del método propuesto. Sin embargo, el hecho
de que las predicciones de los parámetros longitudinales tengan carácter
dinámico, permite determinar el riesgo a 2 años cada vez que el paciente entra
en la consulta del profesional sanitario con una mayor precisión. No obstante,
hemos de tener en cuenta que el método propuesto se ha desarrollado para un
tiempo teórico �̃� y puede ser aplicado para cualquier valor, aunque los
parámetros longitudinales tendrían por norma general mayor variabilidad en el
tiempo, pero claramente esto dependerá de la naturaleza de los datos, tanto
del individuo como de la población (Rizopoulos, 2012).
El trabajo en el que se ha basado nuestro conjunto de datos simulado (Artigao-
Ródenas et al., 2015), desarrolló y validó un modelo predictivo de enfermedad
cardiovascular (angina de cualquier tipo, infarto de miocardio, accidente
cerebrovascular, enfermedad arterial periférica de los miembros inferiores, o
muerte cardiovascular), para determinar el cálculo del riesgo a corto, medio y
largo plazo ( el riesgo fue calculado para cada puntuación cada dos años hasta
un máximo de catorce) en población general. En la Tabla 4 de este sistema de
puntos se observa la importancia de esta cuestión. Por ejemplo, un paciente
con 9 puntos presenta una probabilidad de enfermedad cardiovascular a los 2
años de 0.67%, mientras que a los 10 años ésta asciende al 5.16% (Artigao-
Ródenas et al., 2015). Si calculamos de forma periódica el riesgo
Nuevos modelos predictivos de enfermedad cardiovascular.

cardiovascular de nuestro paciente a los dos años y éste mantiene su
puntuación, no tomaremos ninguna medida terapéutica (riesgo <1%), mientras
que si sólo calculamos el riesgo una única vez cada 10 años, tomaremos
medidas terapéuticas agresivas en el momento en el que el paciente ha
entrado en nuestra consulta médica, ya que el riesgo se corresponde al punto
de corte definido como alto por el proyecto SCORE (5%→ uno de cada veinte
pacientes) (Conroy et al., 2003). En otras palabras, una predicción a corto
plazo realizada de forma regular, podría significar un cambio en la toma de
decisiones terapéuticas para la prevención de enfermedades cardiovasculares,
siempre y cuando tengamos la posibilidad de calcular el riesgo de forma
periódica. Por otra parte, dado que la tabla de riesgo del estudio Puras-GEVA
incluye predicciones a 4, 6, 8, 10, 12 y 14 años, se ha seleccionado el punto de
corte más bajo, debido a que si realizábamos predicciones con mayor tiempo,
éstas podrían aumentar su dispersión (Rizopoulos, 2012). Por estos motivos se
ha seleccionado este punto de corte para la simulación (2 años).
En lo referente a las medidas longitudinales en el seguimiento (muestra de
construcción), se ha supuesto que el paciente acude una vez cada 3 meses a
la consulta del médico para poder medir SBP, HbA1c e índice aterogénico.
Esto se realiza hasta el final del seguimiento de cada uno de los pacientes. Por
otro lado, en la muestra de validación estadística a través de simulación,
supondremos que tenemos cierta probabilidad de tener registradas en la
historia clínica medidas de todos los parámetros longitudinales cada 3 meses
durante 5 años de forma retrospectiva (𝑡 < 0). La probabilidad es diferente para
cada una de las visitas y dependerá de cada paciente. En otras palabras,
tendremos medidas intermitentes de todos estos parámetros desde 𝑡 = −5
años hasta 𝑡 = 0.
En el material suplementario del tercer artículo presentado en esta tesis
doctoral (Palazón-Bru et al., 2015) se han detallado todas las fórmulas
matemáticas empleadas para construir nuestros conjuntos de datos, siempre
basándonos en el estudio Puras-GEVA (Artigao-Ródenas et al., 2015).
Podría pensarse que al manejar un menor periodo de tiempo de 2 años no
exista variabilidad en los factores de riesgo cardiovascular. Sin embargo, en el
Nuevos modelos predictivos de enfermedad cardiovascular.

material suplementario observamos que los modelos utilizados presentan
variabilidad temporal de los factores de riesgo (Palazón-Bru et al., 2015), ya
que de no presentarse, éstos contendrían la constante con un error aleatorio
muy pequeño. En otras palabras, tiene sentido utilizar este periodo de
predicción.
Se decidió simular un conjunto de datos, por no disponer en la actualidad de un
conjunto de datos reales. Esta forma de explicar un nuevo método, ha sido
desarrollada por otros autores que han trabajado con modelos conjuntos de
supervivencia y datos longitudinales, ya que el único objetivo del conjunto de
datos simulado, es lograr explicar al lector cómo aplicar el nuevo método
(Faucett & Thomas, 1996; Henderson, Diggle & Dobson, 2000; Wang & Taylor,
2001; Brown, Ibrahim & DeGruttola, 2005; Zeng & Cai, 2005; Vonesh, Greene
& Schluchter, 2006; Rizopoulos & Ghosh, 2011).
Construcción del sistema de puntos
1) Estimamos el modelo multivariante de Cox con variables tiempo-
dependientes, definidas como el último valor registrado. Sus
coeficientes quedan reflejados en la Tabla 1.

Tabla 1: Parámetros (βs) del modelo de Cox multivariante.
Variable β p-valor
Edad (basal) (por 1 año) 0.0846 <0.001
SBP (por 1 mmHg) 0.00874 <0.001
HbA1c (por 1%) 0.188 <0.001
Índice aterogénico (por 1 unidad) 0.191 <0.001
Sexo hombre 0.479 0.001
Fumador (basal) 0.721 <0.001
Abreviaturas: SBP, systolic blood pressure; HbA1c, glycated haemoglobin.
Goodness-of-fit (likelihood ratio test): χ2=912.3, p<0.001.

Nuevos modelos predictivos de enfermedad cardiovascular.

En lo referente al análisis de los residuos de Martingala (Figura 4), observamos
que todas las variables tienen forma lineal en el modelo, ya que la línea roja
muestra una linealidad perfecta (la línea roja indica el ajuste lineal entre las dos
variables presentes en el gráfico cartesiano). Esto era esperado, pueslos datos
han sido simulados de esa forma. No obstante debemos de corroborarlo antes
de continuar con el método propuesto.

Nuevos modelos predictivos de enfermedad cardiovascular.

Figura 4: Forma funcional de las covariables en el modelo.

Nuevos modelos predictivos de enfermedad cardiovascular.

A continuación debemos de corroborar que el modelo ajusta bien los datos,
mediante el análisis de los residuos de Cox-Snell (Figura 5). Como podemos
observar, la línea roja (distribución exponencial de parámetro 1) se mantiene
dentro de los intervalos de confianza, por lo que nuestro modelo cumple todas
sus hipótesis básicas y estamos en condiciones de comenzar el paso 2) de la
construcción.

Figura 5: Análisis de los residues de Cox-Snell.

2) Adaptamos los coeficientes obtenidos en el modelo multivariante
a un sistema de puntos según la metodología del Framingham
Heart Study. Dado que es una metodología ampliamente
utilizada, simplemente daremos el resultado en forma de figura
(Figura 6). No obstante, todos los cálculos se anexan en una hoja
de cálculo Excel en el material suplementario donde se presenta
la técnica (Palazón-Bru et al., 2015). Se ha decidido la utilización
de una figura en vez de una tabla, para facilitar la lectura al
usuario, ya que las celdas están más separadas y no otorgan
confusión al clínico. Esta idea ha sido utilizado tanto por el
proyecto SCORE como por el estudio Framingham. Notar que los
grupos de riesgo se han construido como en el proyecto SCORE.

Nuevos modelos predictivos de enfermedad cardiovascular.

Figura 6: Sistema de puntos para predecir enfermedad cardiovascular en
2 años.

Abreviaturas: SBP, tensión arterial sistólica; HbA1c, hemoglobina glicada; TC, colesterol total;
HDL-c, colesterol HDL.

Nuevos modelos predictivos de enfermedad cardiovascular.

3) Hemos ajustado los modelos conjuntos para cada uno de los
parámetros longitudinales y sus coeficientes estimados quedan
reflejados en la Tabla 2. No se ha especificado una función de
riesgo basal.

Tabla 2: Parámetros de los modelos conjuntos construidos.
Variable
SBP
(mmHg)
p-
valor
HbA1c
(%)
p-
valor
Índice
aterogénico
p-
valor
Proceso del evento
Sexo hombre 0.428 <0.001 0.475 <0.001 0.446 <0.001
Edad (por 1 año) 0.0837 <0.001 0.0840 <0.001 0.0833 <0.001
Fumador 0.731 <0.001 0.757 <0.001 0.775 <0.001
Parámetro (por 1 unidad) 0.0085 <0.001 0.216 <0.001 0.195 <0.001
Proceso longitudinal: efectos fijos
1 133.557 <0.001 6.158 <0.001 4.602 <0.001
T 0.0046 <0.001 0.0001 <0.001 0.0001 <0.001
Proceso longitudinal: efectos mixtos
1 21.683 N/A 1.346 N/A 1.324 N/A
T 0.0358 N/A * * 0.0013 N/A
Residuos 8.933 N/A 0.357 N/A 0.302 N/A
Abreviaturas: SBP, tensión arterial sistólica; HbA1c, hemoglobina glicada; N/A, no aplica. *:
término eliminado por problemas de convergencia. La estrategia fue eliminar de términos más
complejos a términos más sencillos.
Goodness-of-fit: 1) SBP: χ2=371,574.1, p<0.001; 2) HbA1c: χ2=210,881.1, p<0.001; 3) Índice
aterogénico: χ2=121,118.0, p<0.001.

Nuevos modelos predictivos de enfermedad cardiovascular.

Respecto a las hipótesis básicas de los modelos, primeramente podemos
observar en la Figura 7, que no existe una tendencia entre los valores
ajustados y los residuos específicos de cada individuo, ya que la línea roja
(ajuste lineal entre las dos variables del eje cartesiano) se mantiene muy
cercana a 𝑦 = 0.

Figura 7: Gráficos de residuos específicos de cada sujeto frente a los
valores ajustados por los modelo.

Arriba: tensión arterial sistólica. Abajo a la izquierda: hemoglobina glicada. Abajo a la derecha:
índice aterogénico.

Nuevos modelos predictivos de enfermedad cardiovascular.

En lo referente a la normalidad de los residuos específicos, dado el volumen de
datos que disponemos, podemos asumir normalidad asintótica. No obstante, en
la Figura 8 se encuentran disponibles los gráficos Q-Q que comparan la
distribución de los datos con una distribución normal. A raíz de estos gráficos
también podemos concluir que nuestros residuos siguen una distribución
normal.

Figura 8: Gráficos Q-Q de los residuos específicos de cada sujeto.

Arriba: tensión arterial sistólica. Abajo a la izquierda: hemoglobina glicada. Abajo a la derecha:
índice aterogénico.

Nuevos modelos predictivos de enfermedad cardiovascular.

En el análisis de los residuos marginales frente a los valores ajustados (Figura
9), vemos que la línea roja (ajuste lineal entre las variables presentadas en el
gráfico cartesiano) no establece un patrón fuera de 𝑦 = 0. En otras palabras, se
han verificado todos los supuestos del submodelo longitudinal, por lo que ahora
vamos a comprobar las hipótesis básicas del submodelo de supervivencia.

Figura 9: Gráficos de los residuos marginales frente a los valores
ajustados.

Arriba: hemoglobina glicada. Abajo a la izquierda: tensión arterial sistólica. Abajo a la derecha:
índice aterogénico.

Nuevos modelos predictivos de enfermedad cardiovascular.

En la Figura 10 quedan reflejados ambos tipos de gráficos para corroborar las
hipótesis básicas del submodelo de supervivencia. En la primera columna
(valores ajustados de los parámetros longitudinales contra los residuos de
Martingala), no se observa ninguna tendencia, ya que la línea roja (ajuste lineal
entre ambas variables del gráfico) se asemeja a la recta 𝑦 = 0. Por otra parte,
podemos asumir que los residuos de Cox-Snell siguen una distribución
exponencial de parámetro la unidad (la línea roja se sitúa en los intervalos de
confianza de la supervivencia).

Nuevos modelos predictivos de enfermedad cardiovascular.

Figura 10: Gráficos para corroborar las hipótesis básicas del submodelo
de supervivencia.
Residuos de Martingala Residuos de Cox-Snell

Arriba: tensión arterial sistólica. Centro: hemoglobina glicada. Abajo: índice aterogénico.

Nuevos modelos predictivos de enfermedad cardiovascular.

Validación estadística por simulación
La concordancia fue muy satisfactoria: 0.844 (IC 95%: 0.842-0.846). La
comparación entre eventos observados y esperados no mostró diferencias
estadísticamente significativas (Figura 11).

Figura 11: Comparación entre proporción (%) de eventos observados y
esperados en los diferentes grupos de riesgo.

0.00
5.00
10.00
15.00
20.00
25.00
Low Medium High Very high
Observed 0.46 3.17 10.78 24.63
Expected 0.39 2.25 7.39 22.83
p=0.555
Nuevos modelos predictivos de enfermedad cardiovascular.

Utilización potencial
Llega a nuestra consulta un nuevo paciente de las siguientes características:
varón, 83 años, no fumador y tratamiento farmacológico (un antihipertensivo y
un antidiabético oral) y no farmacológico (dieta y ejercicio). Por otra parte, se
dispone del histórico de sus factores de riesgo cardiovascular (Tabla 3).

Tabla 3: Parámetros recogidos en la historia clínica electrónica
necesarios para aplicar nuestro sistema de puntos.
Tiempo (días) SBP (mmHg) HbA1c (%) Índice aterogénico
-360 152 5.1 3.56
-330 135 5.3 3.23
-270 164 4.7 3.45
-180 153 4.4 4.12
-90 170 5.0 4.15
0 145 4.9 5.17
Abreviaturas: SBP, tensión arterial sistólica; HbA1c, hemoglobina glicada. El tiempo tiene valor
negativo porque se refiere a los valores recogidos antes de la situación basal (𝑡 = 0).

Tras aplicar el modelo construido, se obtiene un histograma de la puntuación
de riesgo cardiovascular obtenida por el paciente (Figura 12). En ella
observamos un riesgo cardiovascularelevado, ya que la mayoría de
simulaciones se concentra en 16 puntos. La estimación de la puntuación fue de
16 (95% CI: 15-17). La mediana de la puntuación se correspondió con una SBP
de 160 mmHg, una HbA1c de 4.9% y un índice aterogénico de 6.76. Teniendo
en cuenta que existen factores del modelo sobre los cuales no podemos
intervenir (sexo y edad), que dan al paciente un mínimo de 13 puntos, debemos
de pensar estrategias que logren que el paciente no puntúe en el resto de
categorías de la escala (Figura 6).

Nuevos modelos predictivos de enfermedad cardiovascular.

Figura 12: Riesgo cardiovascular de un nuevo paciente teórico (situación
pre-intervención).

Ahora, el facultativo estima que si el paciente cumple con una serie de
intervenciones [farmacológicas (añadir dos fármacos antihipertensivos → -20
mmHg; prescribir una estatina → -40% índice atrogénico) y no farmacológicas
(reducir la sal en las comidas → -5 mmHg)], sus parámetros longitudinales en
un periodo de 3 meses serán: SBP 120 mmHg (145 – 2·10 – 5 = 120 mmHg),
índice aterogénico 3.10 (5.17 – 40% = 3.10), y HbA1c 4.9% (mismo valor, pues
no se ha realizado ninguna intervención). A continuación aplicamos de nuevo el
modelo con este nuevo dato y obtenemos el riesgo cardiovascular a dos años
(Figura 13). La estimación de la puntuación es de 15 (IC 95%: 14-15) y los
valores que otorgan la puntuación mediana son: SBP 124 mmHg, índice
aterogénico 4.85, y HbA1c 5.0%. De forma que el riesgo ha disminuido, ya que
ahora generalmente el paciente tiene 14 puntos (Figura 6).

Nuevos modelos predictivos de enfermedad cardiovascular.

Figura 13: Riesgo cardiovascular de un nuevo paciente teórico (situación
post-intervención).

Nuevos modelos predictivos de enfermedad cardiovascular.

1.7. Discusión.

Sumario
Esta tesis doctoral aporta posibles mejoras en la construcción de modelos
predictivos de enfermedad cardiovascular ya existentes. Estas mejoras residen
fundamentalmente en: 1) Obtener predicciones a corto y medio plazo; 2)
Seleccionar la mejor combinación de variables para discriminar con mayor
precisión, qué paciente desarrollará una enfermedad cardiovascular; 3) Detallar
una metodología para construir modelos predictivos de enfermedad
cardiovascular, teniendo en cuenta la variabilidad de los factores de riesgo
cardiovascular y sin perder la simplicidad de los sistemas de puntos, que son
ampliamente utilizados en la práctica clínica habitual a nivel mundial (Conroy et
al., 2003; National Heart, Lung, and Blood Institute, 2015).

Comparación con la literatura existente
Si analizamos la primera mejoría propuesta, estamos dando a los clínicos la
posibilidad de calcular el riesgo cardiovascular en periodos inferiores a 10
años, lo que puede permitir mejorar la toma de decisiones, ya que si un
paciente presenta alto riesgo cardiovascular en un periodo de tiempo muy
corto, deberemos realizar una estrategia terapéutica mucho más agresiva. Los
modelos de Framingham y SCORE no tienen esta característica (Conroy et al.,
2003; Cooney, Dudina & Graham, 2009; National Heart, Lung, and Blood
Institute, 2015). No obstante, dado que tendrán realizado el cálculo de la
supervivencia en todos los instantes de tiempo, es algo que podría
implementarse y tratar de aplicarlo en futuras escalas de riesgo cardiovascular.
En segundo lugar, el hecho de calcular todas las posibles combinaciones de
variables explicativas, nos está ayudando a elegir el mejor modelo matemático
para la obtención de la predicción más precisa en la enfermedad
cardiovascular. Eso permite aumentar el valor de nuestro estadístico 𝐶 hasta el
máximo posible. Esta estrategia en la elección de las variables no ha sido
utilizada por los investigadores del estudio Framingham o los del proyecto
Nuevos modelos predictivos de enfermedad cardiovascular.

SCORE (Conroy et al., 2003; Cooney, Dudina & Graham, 2009; National Heart,
Lung, and Blood Institute, 2015). Puede ser que si aplicamos esta estrategia
sobre los datos del proyecto SCORE o del estudio Framingham, obtengamos
una diferencia pequeña con el estadístico 𝐶 anterior. No obstante, una
ganancia de un 5%, puede equivaler a lograr identificar una mayor proporción
de pacientes que sufrirán una enfermedad cardiovascular, lo que desembocaría
en una menor morbimortalidad cardiovascular.
Finalmente, en lo referente a la tercera mejora propuesta, las escalas de riesgo
cardiovascular existentes no valoran la variabilidad temporal de los parámetros
de control de los factores de riesgo, aunque como aspecto muy positivo, sí que
tienen en cuenta la sencillez para su aplicación inmediata por parte de los
profesionales sanitarios, que son los que realmente aplicarán estos modelos
matemáticos (Conroy et al., 2003; Cooney, Dudina & Graham, 2009; National
Heart, Lung, and Blood Institute, 2015). Por otra parte, los joint models
actualmente utilizados, sí que tienen en cuenta la variabilidad en el tiempo de
un único parámetro longitudinal (Rizopoulos, 2011), pero su interpretación no
es tan sencilla como la de un sistema de puntos y no permite emplear varios
parámetros longitudinales, cuestión clave por la etiología multifactorial de la
enfermedad cardiovascular. Nosotros hemos tratado de fundir todas estas
técnicas en un único algoritmo, manteniendo las virtudes de cada una de ellas
(modelo de riesgos relativos, sistemas de puntos, predicciones dinámicas...).
Si tratamos de comparar el método propuesto con las actuales escalas de
riesgo cardiovascular, se nos presenta un problema, ya que nuestro modelo es
más adecuado para hacer predicciones en un tiempo más corto, ya que
conforme nos separamos de la situación basal (𝑡 = 0) a la hora de predecir,
esto ocasiona un aumento de la variabilidad de las predicciones de los
parámetros longitudinales (Rizopoulos, 2012). Este comportamiento se observa
también en economía (la bolsa) y en meteorología (pronóstico del tiempo).
Aunque esto dependerá de la naturaleza de los datos que estemos analizando,
tanto a nivel individual como poblacional. Todo esto no ocasiona una debilidad
en nuestro modelo, ya que al tener las predicciones de los parámetros
longitudinales un carácter dinámico (Rizopoulos, 2011), cada vez que
actualicemos la información clínica de nuestro paciente, este riesgo se
Nuevos modelos predictivos de enfermedad cardiovascular.

calculará de forma inmediata. Esto lo hemos visto en el ejemplo propuesto en
resultados, en donde al introducir nuevos valores de los parámetros
longitudinales, éstos se actualizan y determinan la nueva distribución de puntos
del paciente. En otras palabras, el método propuesto podría utilizarse para
calcular el riesgo del paciente cada vez que éste acuda a la consulta de su
profesional sanitario, mientras que las escalas de riesgo tradicionales pueden
utilizarse con mayor intervalo de tiempo, pues el pronóstico es para 10 años.
En definitiva, podríamos utilizar de forma conjunta ambos tipos de modelos
para valorar el riesgo tanto a corto como a largo plazo, ya que aunque se han
visto discrepancias entre predicciones cardiovasculares a corto y largo plazo
(Quispe et al., 2015), la utilización periódica de las predicciones a corto plazo,
teniendo en cuenta la variabilidad de los factores de riesgo, puede
complementar a los modelos cardiovasculares a largo plazo. En otras palabras,
nuestra intención es que en la práctica clínica se utilice el modelo a corto plazo
de forma periódica en aquellos pacientes que acuden frecuentemente a la
consulta médica y el de largo plazo para aquéllos que no.

Implicaciones para la práctica clínica y la investigación
Para la primera mejora propuesta, se plantea en las escalas de riesgo
cardiovascular ya construidas, el cálculo de la probabilidadde evento en
periodos de tiempo inferiores, ya que estos datos estarán disponibles en la
base de datos construida para la escala predictiva a 10 años. De la misma
forma, podríamos aplicar esta técnica en nuevas escalas de riesgo
cardiovascular.
Seguidamente, para la segunda mejora propuesta (combinaciones), es obvio
que las escalas cardiovasculares construidas deberían de aplicar esta nueva
técnica para su utilización. En otras palabras, no es algo inmediato y podría
cambiar los valores del modelo. En consecuencia, se plantea la utilización de
esta técnica para la construcción de futuras escalas de riesgo cardiovascular.
Finalmente, en el método sugerido más complejo, hemos de tener en cuenta
que la obtención de simulaciones de los parámetros longitudinales no es una
Nuevos modelos predictivos de enfermedad cardiovascular.

tarea sencilla y conlleva un coste computacional de aproximadamente un
minuto si implementamos un total de 100 en un ordenador de usuario. Por otra
parte, los valores históricos de los parámetros longitudinales están registrados
en la historia clínica, generalmente electrónica (Palazón-Bru et al., 2014).
Partiendo de estas ideas, toda la información necesaria para aplicar nuestros
modelos se encuentra de forma informatizada, por lo que los algoritmos
implementados pueden adaptarse al lenguaje de la base de datos donde se
encuentren registrados los valores de los factores de riesgo y de esta forma
todos los cálculos serían inmediatos para el profesional sanitario. En otras
palabras, que a través de pulsar un botón, en un tiempo reducido aparezcan
conjuntamente por pantalla el histograma ofrecido en la Figura 12, el sistema
de puntos teórico y el conjunto de valores de los factores de riesgo que
determinan la mediana de las puntuaciones. Por otra parte, a la hora de
intervenir, se indicará el tiempo de la intervención y los posibles valores que
estima el profesional sanitario sobre su nuevo paciente. Al introducir esta nueva
información se reflejarán los dos histogramas conjuntamente (Figuras 12 y 13),
lo cual permitirá visualmente al clínico conocer el beneficio de su intervención.
Dado que el algoritmo se ha desarrollado sobre un conjunto de datos
simulados, animamos a otros autores que tengan bases de datos
cardiovasculares de la forma planteada, la implementación de un modelo de las
características detalladas en esta tesis doctoral. De forma que si sobre datos
reales se obtiene una mayor precisión en las predicciones, podremos aplicar
esta metodología para obtener el mejor pronóstico y tomar las decisiones a
corto plazo óptimas de cara al beneficio del paciente. No obstante, hemos de
tener en cuenta que el método propuesto se basa en la combinación de
modelos matemáticos utilizados en la literatura científica, es decir, nuestra
técnica a nivel teórico es completamente correcta, pues hemos sido muy
rigurosos en cada uno de los pasos a seguir. A nivel práctico podemos
determinar el valor de �̃� y la complejidad de los modelos para poder aplicar el
método propuesto. Finalmente, destacamos que el algoritmo desarrollado en
este trabajo, puede aplicarse a otras enfermedades o en otras áreas del
conocimiento, como la economía.

Nuevos modelos predictivos de enfermedad cardiovascular.

1.8. Referencias.

American Diabetes Association. 2014. Standards of medical care in diabetes--
2014. Diabetes Care 37 Suppl 1:S14-80.

Andersen PK, Gill RD. 1982. Cox's Regression Model for Counting Processes:
A Large Sample Study. Annals of Statistics 10: 1100-1120.

Artigao-Ródenas LM, Carbayo-Herencia JA, Palazón-Bru A, Divisón-Garrote
JA, Sanchis-Domènech C, Vigo-Aguiar I, Gil-Guillén VF; on behalf of GEVA.
2015. Construction and validation of a 14-year cardiovascular risk score for use
in the general population: the PURAS-GEVA chart. Medicine (Baltimore) 94:
e1980.

Brown ER, Ibrahim JG, DeGruttola V. 2005. A flexible B-spline model for
multiple longitudinal biomarkers and survival. Biometrics 61: 64-73.

Conroy RM, Pyörälä K, Fitzgerald AP, Sans S, Menotti A, De Backer G, De
Bacquer D, Ducimetière P, Jousilahti P, Keil U, Njølstad I, Oganov RG,
Thomsen T, Tunstall-Pedoe H, Tverdal A, Wedel H, Whincup P, Wilhelmsen L,
Graham IM; SCORE project group. 2003. Estimation of ten-year risk of fatal
cardiovascular disease in Europe: the SCORE project. European Heart Journal
24: 987-1003.

Cooney MT, Dudina AL, Graham IM. 2009. Value and limitations of existing
scores for the assessment of cardiovascular risk: a review for clinicians. Journal
of the American College of Cardiology 54: 1209-1227.

Nuevos modelos predictivos de enfermedad cardiovascular.

Faucett CL, Thomas DC. 1996. Simultaneously modelling censored survival
data and repeatedly measured covariates: a Gibbs sampling approach.
Statistics in Medicine 15: 1663-1685.

Food and Agriculture Organization of the United Nations and World Health
Organization. 1973. FAO/WHO. Energy and protein requirements: Report of a
joint FAO/WHO ad hoc expert committee. FAO Nutrition Meetings Report
Series No. 52. WHO Technical Report Series No. 522. Rome and Geneva:
FAO/WHO.

Henderson R, Diggle P, Dobson A. 2000. Joint modelling of longitudinal
measurements and event time data. Biostatistics 1: 465-480.

Hosmer DW, Lemeshow S. 2000. Applied Logistic Regression. New York:
Wiley.

Hosmer DW, Lemeshow S, May S. 2008. Applied Survival Analysis: Regression
Modeling of Time-to-Event Data. New York: Wiley.

James PA, Oparil S, Carter BL, Cushman WC, Dennison-Himmelfarb C,
Handler J, Lackland DT, LeFevre ML, MacKenzie TD, Ogedegbe O, Smith SC
Jr, Svetkey LP, Taler SJ, Townsend RR, Wright JT Jr, Narva AS, Ortiz E. 2014.
2014 evidence-based guideline for the management of high blood pressure in
adults: report from the panel members appointed to the Eighth Joint National
Committee (JNC 8). JAMA 311: 507-520. Erratum in: JAMA 311: 1809.

Molinero LM. 2003. Modelos de riesgo cardiovascular. Estudio de Framingham.
Proyecto SCORE. Available at http://www.seh-lelha.org/pdf/modelries.pdf
(accessed July 2015).

http://www.seh-lelha.org/pdf/modelries.pdf
Nuevos modelos predictivos de enfermedad cardiovascular.

National Cholesterol Education Program (NCEP) Expert Panel on Detection,
Evaluation, and Treatment of High Blood Cholesterol in Adults (Adult Treatment
Panel III). 2002. Third Report of the National Cholesterol Education Program
(NCEP) Expert Panel on Detection, Evaluation, and Treatment of High Blood
Cholesterol in Adults (Adult Treatment Panel III) final report. Circulation 106:
3143-3421.

National Heart, Lung, and Blood Institute (Boston University). 2015. The
Framingham Heart Study. Available at http://www.framinghamheartstudy.org/
(accessed July 2015).

Lloyd-Jones DM. 2010. Cardiovascular risk prediction: basic concepts, current
status, and future directions. Circulation 121: 1768-1777.

López-Bru D, Palazón-Bru A, Folgado-de la Rosa DM, Gil-Guillén VF. 2015.
Scoring System for Mortality in Patients Diagnosed with and Treated Surgically
for Differentiated Thyroid Carcinoma with a 20-Year Follow-Up. PLoS One 10:
e0128620.

Palazón-Bru A, Carbayo-Herencia JA, Vigo MI, Gil-Guillén VF. 2016. A method
to construct a points system to predict cardiovascular disease considering
repeated measures of risk factors. PeerJ 4: e1673.

Palazón-Bru A, Gil-Guillén VF, Orozco-Beltrán D, Pallarés-Carratalá V, Valls-
Roca F, Sanchís-Domenech C, Martín-Moreno JM, Redón J, Navarro-Pérez J,
Fernández-Giménez A, Pérez-Navarro AM, Trillo JL, Usó R, Ruiz E. 2014. Is
the physician's behavior in dyslipidemia diagnosis in accordance with
guidelines? Cross-sectional ESCARVAL study. PLoS One 9:e91567.

http://www.framinghamheartstudy.org/
Nuevos modelos predictivos de enfermedad cardiovascular.

Contenido elegido para ti

75 pag.

Desarrollo-de-un-modelo-de-prediccion-de-la-incidencia-de-hipertension-arterial-sistemica-en-adultos-mexicanos

96 pag.

Desarrollo-y-validacion-de-un-instrumento-de-prediccion-de-incidencia-de-diabetes-mellitus-tipo-2-en-mujeres-mexicanas-en-edad-reproductiva

76 pag.

Validação de Métodos de Estratificação de Risco em Cirurgia Cardíaca

62 pag.

Comparacion-de-dos-escalas-de-riesgo-de-mortalidad-en-la-unidad-de-terapia-intensiva-del-Hospital-Infantil-de-Mexico--PIM2-y-PELOD

35 pag.

tesis_palazon_bru

Valle De Huejucar

Más contenidos de este tema

Contenido elegido para ti

Desarrollo-de-un-modelo-de-prediccion-de-la-incidencia-de-hipertension-arterial-sistemica-en-adultos-mexicanos

Desarrollo-y-validacion-de-un-instrumento-de-prediccion-de-incidencia-de-diabetes-mellitus-tipo-2-en-mujeres-mexicanas-en-edad-reproductiva

Validação de Métodos de Estratificação de Risco em Cirurgia Cardíaca

Comparacion-de-dos-escalas-de-riesgo-de-mortalidad-en-la-unidad-de-terapia-intensiva-del-Hospital-Infantil-de-Mexico--PIM2-y-PELOD

Discriminacion-y-calibracion-de-cuatro-escalas-de-calificacion-de-disfuncion-organica-multiple-en-terapia-intensiva