Vista previa del material en texto
NUEVOS MODELOS PREDICTIVOS DE ENFERMEDAD CARDIOVASCULAR Antonio Palazón Bru www.ua.es www.eltallerdigital.com Nuevos modelos predictivos de enfermedad cardiovascular. 1 UNIVERSIDAD DE ALICANTE Departamento de Matemática Aplicada Escuela Politécnica Superior NUEVOS MODELOS PREDICTIVOS DE ENFERMEDAD CARDIOVASCULAR Antonio Palazón Bru Programa de Doctorado en Métodos Matemáticos y Modelización en Ciencias e Ingeniería Tesis presentada para aspirar al grado de DOCTOR/DOCTORA POR LA UNIVERSIDAD DE ALICANTE DIRIGIDA POR LOS PROFESORES: Dra. Dña. Isabel Vigo Aguiar Dr. D. Vicente Francisco Gil Guillén Catedrático de Escuela Universitaria Profesor Titular de Universidad Nuevos modelos predictivos de enfermedad cardiovascular. 2 Nuevos modelos predictivos de enfermedad cardiovascular. 3 A mis padres y a mi abuelo por su apoyo y cariño incondicional en este proyecto. Nuevos modelos predictivos de enfermedad cardiovascular. 4 Nuevos modelos predictivos de enfermedad cardiovascular. 5 A mis directores de tesis por su colaboración en la realización de esta tesis doctoral. Al profesor doctor D. Ramón Ángel Durazo por sus enseñanzas en la predicción de enfermedades cardiovasculares. Al profesor doctor D. Julio Antonio Carbayo Herencia, por su valiosa ayuda en todas las publicaciones pertenecientes a esta tesis doctoral. A D. Ian Jonstone, por su ayuda a lo largo de estos años de trabajo, ya que sus comentarios y consejos han contribuido de forma sustancial en mi carrera profesional, además de su apoyo lingüístico en los artículos científicos integrados en esta tesis doctoral. Al grupo GEVA por permitir hacerme partícipe del proyecto para construir la escala de riesgo cardiovascular. A Dña. Maria Repice por su contribución en la traducción de los artículos científicos presentados en esta tesis doctoral. Nuevos modelos predictivos de enfermedad cardiovascular. 6 Nuevos modelos predictivos de enfermedad cardiovascular. 7 “Ninguna investigación humana puede ser denominada ciencia si no pasa a través de pruebas matemáticasi Leonardo Da Vinci i This image (or other media file) is in the public domain because its copyright has expired. This applies to Australia, the European Union and those countries with a copyright term of life of the author plus 70 years. Nuevos modelos predictivos de enfermedad cardiovascular. 8 Nuevos modelos predictivos de enfermedad cardiovascular. 9 ÍNDICE 1. SÍNTESIS DE LAS PUBLICACIONES PRESENTADAS........................... 11 1.1. Antecedentes y estado actual del tema. ............................................ 13 1.2. Justificación. ...................................................................................... 16 1.3. Objetivos. ........................................................................................... 16 1.4. Artículos presentados. ....................................................................... 17 1.5. Métodos. ............................................................................................ 18 1.5.1. Modelos básicos empleados en las mejoras propuestas. ............. 18 1.5.2. Predicciones a corto, medio y largo plazo. ................................... 23 1.5.3. Determinación de la mejor combinación de variables para predecir un evento cardiovascular. ......................................................................... 26 1.5.4. Construcción, validación y utilización de un sistema de puntos con medidas repetidas de los factores de riesgo cardiovascular. .................... 29 1.6. Resultados. ........................................................................................ 33 1.6.1. Predicciones a corto, medio y largo plazo. ................................... 33 1.6.2. Determinación de la mejor combinación de variables para predecir un evento cardiovascular. ......................................................................... 38 1.6.3. Construcción, validación y utilización de un sistema de puntos con medidas repetidas de los factores de riesgo cardiovascular. .................... 38 1.7. Discusión. .......................................................................................... 56 1.8. Referencias. ....................................................................................... 60 2. TRABAJOS PUBLICADOS. ...................................................................... 67 3. CONCLUSIONES. ...................................................................................107 Nuevos modelos predictivos de enfermedad cardiovascular. 10 Nuevos modelos predictivos de enfermedad cardiovascular. 11 1. SÍNTESIS DE LAS PUBLICACIONES PRESENTADAS. Nuevos modelos predictivos de enfermedad cardiovascular. 12 Nuevos modelos predictivos de enfermedad cardiovascular. 13 1.1. Antecedentes y estado actual del tema. Puesto que las enfermedades cardiovasculares en la actualidad constituyen una de las principales causas de mortalidad en el mundo (WHO, 2014), es lógico que sea de gran interés el desarrollo de modelos de predicción con el objetivo de conocer sobre qué factores de riesgo podemos intervenir para disminuir la probabilidad de que un paciente desarrolle una enfermedad cardiovascular (Molinero, 2003). El modelo más sencillo para realizar predicciones de un suceso dicotómico, como es la enfermedad cardiovascular, es el modelo de regresión logística binaria (Hosmer & Lemeshow, 2000), que produce una ecuación en la que conocidos los valores de los diferentes factores de riesgo, se puede evaluar la probabilidad de aparición de la enfermedad. Sin embargo, este tipo de modelos no tiene en cuenta el tiempo de exposición. Esto es precisamente lo que se hace en los modelos de supervivencia, los cuales analizan el tiempo de ocurrencia de un evento determinado, siendo el método más conocido el modelo de regresión de Cox (Hosmer & Lemeshow, 2008). Sin embargo, no es la única alternativa posible, existiendo otros posibles métodos de supervivencia, denominados paramétricos, debido a que suponen un tipo concreto de distribución, como la de Weibull, que fue utilizada por el proyecto SCORE (Conroy et al., 2003). Por otra parte, el estudio Framingham (National Heart, Lung, and Blood Institute, 2015) ha utilizado tanto modelos de regresión logística como modelos de supervivencia (paramétricos y no paramétricos). Como referencia se utiliza en Europa la tabla de riesgo SCORE y en Estados Unidos la del estudio Framingham. Estas tablas de riesgo están basadas en un tiempo de seguimiento de 10 años, por lo que no permiten obtener predicciones precisas a corto o medio plazo (Cooney, Dudina & Graham, 2009). Ésta es una cuestión clínicamente relevante, ya que si conocemos que un paciente tiene una alta probabilidad de desarrollar una enfermedad cardiovascular a corto plazo (por ejemplo 2 años), se debería someter a una terapia farmacológica y no farmacológica más intensa, ya que de no hacerlo es posible que el paciente experimente una enfermedad cardiovascular. Nuevos modelos predictivos de enfermedad cardiovascular. 14 Junto con los modelos predictivos de Framigham y SCORE, se han desarrolladootros modelos que también se utilizan en la práctica clínica en menor medida, como por ejemplo el Reynolds risk score and the WHO/ISH score (Cooney, Dudina & Graham, 2009). Todos estos modelos tienen un objetivo común: la realización de predicciones de enfermedad cardiovascular en un periodo de 10 años, pero en la modelización del problema utilizan diferentes modelos matemáticos (Cox y Weibull) y consideran diferentes outcomes (morbimortalidad de enfermedades coronarias, mortalidad de enfermedades coronarias, morbimortalidad cardiovascular o mortalidad cardiovascular). Esto permite tomar decisiones a largo plazo para los pacientes. Finalmente, destacamos que las guías de práctica clínica recomiendan la utilización de estos modelos predictivos para la estratificación del riesgo cardiovascular de los pacientes. Por ejemplo, la guía clínica europea sobre la prevención de las enfermedades cardiovasculares, indica que un sistema de estimación del riesgo, como SCORE, puede ayudar a la toma de decisiones y de esa forma evitar tanto el exceso como el defecto del tratamiento (Perk et al., 2012). En otras palabras, los clínicos siguen las guías clínicas para mejorar su toma de decisiones con el objetivo de prevenir una enfermedad cardiovascular, y son estas guías las que indican la utilización de estos modelos predictivos, lo que produce que tengan gran relevancia en la práctica clínica habitual. En lo referente a la elección de las variables incluidas en los modelos predictivos, generalmente los estudios cardiovasculares han recogido multitud de variables que podrían influir en el pronóstico de cada paciente. Sin embargo, en la práctica no todas ellas pueden ser incluidas en el modelo, ya que aumentaría su complejidad y podría no existir la convergencia en la estimación de sus parámetros (Hosmer & Lemeshow, 2008). Por ese motivo, la mayoría de estudios han realizado modelos por pasos basados en algún test estadístico, como puede ser el likelihood ratio test o el score test. Sin embargo, en estos pasos es posible que obviemos alguna combinación de variables que produzca un mejor pronóstico de la enfermedad cardiovascular, ya que podría ocurrir que una variable por sí sola no fuera estadísticamente significativa, pero cuando se Nuevos modelos predictivos de enfermedad cardiovascular. 15 combina con otro grupo de variables la predicción de la enfermedad cardiovascular mejorase (López-Bru et al., 2015; Ramírez-Prado et al., 2015). Dada la complejidad de estos modelos matemáticos, se ha aplicado un algoritmo que permite al clínico comprenderlo de forma sencilla, aunque se pierda precisión en la estimación de la probabilidad de enfermedad cardiovascular (Sullivan, Massaro & D'Agostino, 2004). Para ello se han transformado dichos modelos matemáticos en tablas de riesgo de colores que pueden ser empleadas en la práctica clínica de forma sistemática. No obstante, dichas tablas están basadas en modelos que manejan variables clínicas en la situación basal del paciente (Conroy et al., 2003; Cooney, Dudina & Graham, 2009; National Heart, Lung, and Blood Institute, 2015), por lo que no tienen en cuenta la variabilidad de las mismas a lo largo del tiempo, ya que los parámetros biológicos están siendo considerados constantes a lo largo del tiempo de seguimiento, cuando tienen gran variabilidad y el facultativo puede intervenir mediante tratamiento farmacológico y disminuirlos o aumentarlos de forma acelerada (NCEP, 2002; American Diabetes Association , 2014; James et al., 2014; Stone et al., 2014). Existen modelos predictivos de supervivencia de otro tipo de enfermedades, que sí tienen en cuenta la variabilidad temporal de un único marcador biológico, además de variables basales. Éstos son conocidos como Joint Models for Longitudinal and Time-to-Event Data y están estructurados en dos partes: (i) Se aplica un modelo lineal mixto para determinar la trayectoria del parámetro longitudinal y (ii) a partir de un modelo de supervivencia se relacionan las variables basales y el parámetro longitudinal con la aparición de un evento. Este tipo de modelos pueden aplicarse para realizar predicciones más precisas del desarrollo de una enfermedad (Rizopoulos, 2012). Sin embargo, dada su complejidad, no se emplean en la práctica clínica habitual. Además, la modelización conjunta cuando la parte de supervivencia está formada por una función lineal con múltiples parámetros longitudinales (modelización habitual en el análisis de supervivencia clásico aplicado a las ciencias de la salud), sólo se ha abordado de forma teórica y en la actualidad sigue siendo un completo desafío computacional, lo que no ha permitido que se desarrollen algoritmos para realizar predicciones como en el caso univariado (Rizopoulos, 2011). Nuevos modelos predictivos de enfermedad cardiovascular. 16 1.2. Justificación. Es necesario dotar a los modelos predictivos de enfermedad cardiovascular ya existentes de mejoras que puedan ser de gran utilidad para los profesionales sanitarios, de forma que se mejore el pronóstico del paciente y no se pierda la sencillez de los sistemas de puntos, tan empleados en la práctica clínica habitual. Estas mejoras deberán aplicarse tanto a los conjuntos de datos que sólo contengan información en la situación basal, como a aquéllos que contengan medidas repetidas de los factores de riesgo cardiovascular a lo largo del tiempo. 1.3. Objetivos. El objetivo general es mejorar los modelos predictivos de enfermedad cardiovascular que se utilizan en la actualidad en la práctica clínica habitual. Para ello se plantean los siguientes objetivos específicos: 1. Detallar una metodología que permita construir y validar un modelo predictivo de enfermedad cardiovascular con sólo información basal, para obtener predicciones a corto, medio y largo plazo, para reducir la incidencia de enfermedad cardiovascular en la población, ya que hemos de tener en cuenta que los sistemas de puntos actuales no permiten obtener probabilidades a corto o medio plazo. 2. Detallar cómo seleccionar las variables explicativas de un modelo predictivo de enfermedad cardiovascular, teniendo en cuenta todas las posibles combinaciones de variables que pueda soportar el modelo que se construye. 3. Detallar una metodología para construir modelos predictivos de enfermedad cardiovascular que puedan aplicarse de forma sistemática Nuevos modelos predictivos de enfermedad cardiovascular. 17 en la práctica clínica habitual (sin perder los sistemas de puntos, tan utilizados en la actualidad) y que determine con la mayor precisión (teniendo en cuenta la variabilidad temporal de todos los factores de riesgo cardiovascular) el riesgo de desarrollo de la misma. 1.4. Artículos presentados. Los objetivos planteados han sido desarrollados dando lugar a tres publicaciones científicas en revistas de alto de impacto del JCR (Science Ed.): 1. Artigao-Ródenas LM, Carbayo-Herencia JA, Palazón-Bru A, Divisón- Garrote JA, Sanchis-Domènech C, Vigo-Aguiar I, Gil-Guillén VF; GEVA (Group of Vascular Diseases from Albacete). 2015. Construction and validation of a 14-year cardiovascular risk score for use in the general population: the PURAS-GEVA chart. Medicine (Baltimore) 94: e1980. Medicine es una revista científica que aborda todas las especialidades y subespecialidades médicas con un factor de impacto de 5.723 (JCR 2014), situada en la posición número 15 de un total de 153 en la categoría de MEDICINE, GENERAL & INTERNAL. 2. Ramírez-Prado D, Palazón-Bru A, Folgado-de la Rosa DM, Carbonell- Torregrosa MÁ, Martínez-Díaz AM, Martínez-St John DR, Gil-Guillén VF. 2015. A four-year cardiovascular risk score for type 2 diabetic inpatients. PeerJ 3: e984. 3. Palazón-Bru A, Carbayo-Herencia JA, Vigo-Aguiar I, Gil-Guillén VF. 2016. Amethod to construct a points system to predict cardiovascular disease considering repeated measures of risk factors. PeerJ 4: e1673. Nuevos modelos predictivos de enfermedad cardiovascular. 18 PeerJ es una revista científica con un factor de impacto de 2.112, situada en la posición decimotercera en MULTIDISCIPLINARY SCIENCES, la cual engloba a un total de 57 revistas científicas. 1.5. Métodos. En esta sección detallaremos las mejoras propuestas para la creación de nuevos modelos predictivos de enfermedad cardiovascular, pero antes de ello se realizará una síntesis de los modelos básicos empleados en dichas mejoras (modelo de supervivencia de Cox con variables tiempo-dependientes, cómo elaborar un sistema de puntos con la metodología del Framingham Heart Study, Joint Models for Longitudinal and Time-to-Event Data, y predicciones dinámicas utilizando Joint Models). 1.5.1. Modelos básicos empleados en las mejoras propuestas. Modelo de supervivencia de Cox con variables tiempo dependientes Sea 𝑇 una variable aleatoria no negativa denotando el tiempo de supervivencia, que es el mínimo valor entre el verdadero tiempo hasta el evento 𝑇∗ y el tiempo de censura 𝐶 (censura no informativa por la derecha). En otras palabras, 𝑇 = min(𝑇∗,𝐶). Además, definimos 𝛿 como el indicador del evento, que toma el valor 1 si 𝑇∗ ≤ 𝐶 y 0 en otro caso. Por otro lado, sea 𝑾 el vector de covariables basales e 𝒀(𝑡) el vector de covariables tiempo-dependientes que tiene valores definidos siempre para 𝑡 ≥ 0. Con estos datos, el modelo de Cox con covariables tiempo-dependientes toma la siguiente forma (función de riesgo): ℎ�𝑡|𝒘,𝒚(𝑡)� = ℎ0(𝑡) exp{𝜸𝑇𝒘 + 𝜶𝑇𝒚(𝑡)}, donde ℎ0(𝑡) es la función de riesgo en la situación basal, 𝜸 y 𝜶 son los vectores de los coeficientes de la regresión para las covariables basales y tiempo dependientes respectivamente (Andersen & Hill, 1982). Nuevos modelos predictivos de enfermedad cardiovascular. 19 La estimación de los parámetros del modelo está basada en la función de verosimilitud parcial (Andersen & Hill, 1982). Por otro lado, tenemos que corroborar si la forma funcional de cada una de las covariables en el modelo es lineal. Esto deberá hacerse mediante métodos gráficos (gráfico cartesiano enfrentando a los residuos de Martingala frente a la covariable de interés). Finalmente, debemos valorar si el modelo ajusta nuestros datos de forma correcta, a través del análisis de los residuos de Cox-Snell (test gráfico). El modelo clásico de Cox (sin variables tiempo-dependientes), elimina 𝜶 e 𝒚(𝑡) de la expresión anterior. Además, el modelo tiene que verificar la siguiente condición (hipótesis de riesgos proporcionales): log� ℎ(𝑡|𝒘) ℎ0(𝑡) � =𝜸𝑇𝒘. Elaboración de un sistema de puntos desde un modelo de supervivencia de Cox mediante la metodología del Framingham Heart Study Vamos a resumir los pasos principales para adaptar un modelo de regresión de Cox con 𝑝 covariables a sistema de puntos, mediante la metodología elaborada por los investigadores del Framingham Heart Study (Sullivan, Massaro & D'Agostino, 2004): 1) Estimar los parámetros del modelo: 𝜸�. 2) Organizar los factores de riesgo en categorías y determinar valores de referencia: a. Factor de riesgo continuo (ejemplo: la edad): realizar agrupamientos contiguos del factor y determinar valores de referencia para cada agrupamiento. Ejemplo para la edad: 18-30 [24], 30-39 [34.5], 40-49 [44.5], 50-59 [54.5], 60-69 [64.5] y ≥70 años [74.5]. En corchetes se indican cada uno de los valores de referencia. Los investigadores del Framingham Heart Study Nuevos modelos predictivos de enfermedad cardiovascular. 20 recomiendan el punto medio de cada intervalo como un valor adecuado para la referencia, y para la primera y última categoría la media entre el valor extremo y el percentil 1 (primera categoría) o el percentil 99 (última categoría). b. Factores de riesgo binarios (ejemplo el sexo: 0 mujer y 1 hombre): los valores de referencia son 0 y 1. 𝑊𝑖𝑗 denotará el valor de referencia para la categoría 𝑗 y el factor de riesgo 𝑖, donde 𝑖 = 1, . . . ,𝑝 y 𝑗 = 1, . . . , 𝑐𝑖 (número total de categorías para el factor de riesgo 𝑖). 3) Determinar la categoría base para cada factor de riesgo: la categoría base será aquélla que otorgue 0 puntos en el sistema y será denotada por 𝑊𝑖𝑅𝐸𝐹, 𝑖 = 1, … ,𝑝. 4) Determinar cuántas unidades de regresión se separa cada categoría de la categoría base: calcular 𝜸�𝑖 · �𝑊𝑖𝑗 −𝑊𝑖𝑅𝐸𝐹�, 𝑖 = 1, . . . ,𝑝 y 𝑗 = 1, . . . , 𝑐𝑖. 5) Fijar la constante 𝐵: el número de unidades de regresión equivalentes a 1 punto en el sistema. En el Framingham Heart Study se utiliza el incremento de 5 (ó 10) años de edad. 6) Determinar el número de puntos para cada categoría de todos los factores de riesgo: el número entero más cercano a 𝜸�𝑖 · �𝑊𝑖𝑗 −𝑊𝑖𝑅𝐸𝐹�/ 𝐵. 7) Determinar el riesgo asociado con la puntuación total (la suma de todas las puntuaciones asociada a cada uno de los factores de riesgo): 1 − �̂�0(𝑡)exp�∑ (𝜸�𝑖·𝑊𝑖𝑅𝐸𝐹)𝑝 𝑖=1 +𝐵·𝑃𝑢𝑛𝑡𝑜𝑠−∑ 𝜸�𝑖·𝒘�𝚤� 𝑝 𝑖=1 �, donde �̂�0(𝑡) se calcula a través del estimador de Kaplan-Meier. Nuevos modelos predictivos de enfermedad cardiovascular. 21 Joint Models for Longitudinal and Time-to-Event Data Utilizando la notación anterior, nosotros tenemos el vector de variables aleatorias {𝑇,𝑾,𝑌(𝑇)}, donde 𝑌(𝑇) es una única variable tiempo-dependiente (parámetro longitudinal), que tiene sus valores definidos de forma intermitente para 𝑡. En otras palabras, para un sujeto 𝑖 (𝑖 = 1, . . . ,𝑛), 𝑦(𝑡) está sólo definida para 𝑡𝑖𝑗 (𝑗 = 1, … ,𝑛𝑖), 𝑦𝑖�𝑡𝑖𝑗�, donde 0 ≤ 𝑡𝑖1 ≤ 𝑡𝑖2 ≤ ⋯ ≤ 𝑡𝑖𝑛𝑖 (𝑡𝑖𝑛𝑖 es el instante de tiempo máximo donde se ha recogido el parámetro longitudinal para el sujeto 𝑖). Ahora, vamos a denotar a 𝑚(𝑡) como el valor real y no observado del parámetro longitudinal en el instante de tiempo 𝑡 (𝑚𝑖(𝑡) para el sujeto 𝑖). Para valorar el efecto de 𝑚(𝑡) en el riesgo de evento, la opción estándar es ajustar un modelo de regresión de Cox con una única variable tiempo-dependiente: ℎ(𝑡|ℳ(𝑡),𝒘) = ℎ0(𝑡∗) exp{𝜸𝑇𝒘 + 𝛼𝑚(𝑡)}, donde ℳ(𝑡) para un sujeto 𝑖 se define como ℳ𝑖(𝑡) = {𝑚𝑖(𝑢); 0 ≤ 𝑢 < 𝑡}, que denota la historia del verdadero y no observado valor del parámetro longitudinal hasta el instante de tiempo 𝑡. El resto de parámetros de la expresión sigue la estructura del modelo de regresión de Cox con variables tiempo-dependientes, el cual se ha detallado anteriormente. Respecto a la función de riesgo basal, ésta puede dejarse no especificada o puede ser aproximada mediante splines o funciones definidas a trozos (Rizopoulos, 2012). En la expresión anterior, hemos utilizado 𝑚(𝑡) como el verdadero y no observado valor del parámetro longitudinal, sin embargo en nuestra muestra hemos recogido 𝑦(𝑡), por lo tanto estimaremos 𝑚(𝑡) utilizando 𝑦(𝑡) a través de un modelo lineal de efectos mixtos, con el objetivo de describir las evoluciones del parámetro longitudinal para cada uno de los sujetos: ⎩ ⎪ ⎨ ⎪ ⎧ 𝑦𝑖(𝑡) = 𝑚𝑖(𝑡) + 𝜀𝑖(𝑡) 𝑚𝑖(𝑡) = 𝒙𝒊𝑇(𝑡)𝜷 + 𝒛𝒊𝑇(𝑡)𝒃𝒊 𝒃𝒊 ∼ 𝑁(𝟎,𝑫) 𝜀𝑖(𝑡) ∼ 𝑁(0,𝜎2) , � Nuevos modelos predictivos de enfermedad cardiovascular. 22 donde 𝜷 y 𝒃𝒊 denotan los vectores de coeficientes de la regresión para los efectos fijos y para los efectos aleatorios respectivamente, 𝒙𝒊(𝑡) y 𝒛𝒊(𝑡) denotan los vectores fila de las matrices del diseño para los efectos fijos y para los efectos aleatorios respectivamente, y 𝜀𝑖(𝑡) es el error que tiene una varianza 𝜎2. Finalmente, 𝒃𝒊 sigue una distribución normal con media 𝟎 y matriz de varianzas-covarianzas 𝑫, e independente de 𝜀𝑖(𝑡) (Rizopoulos, 2012).La estimación de los parámetros del modelo está basada en la maximización de la función de verosimilitud del modelo conjunto (Rizopoulos, 2012). Respecto a los supuestos del modelo, nosotros tenemos que verificarlos para ambos submodelos (longitudinal y supervivencia), utilizando los gráficos de residuos. Para la parte longitudinal, nosotros representaremos los residuos específicos de cada sujeto frente a los valores ajustados por el modelo, el gráfico Q-Q de los residuos específicos de cada sujeto, y los residuos marginales frente a los valores ajustados. Por otro lado, para la parte de supervivencia, nosotros representaremos en un gráfico cartesiano los valores ajustados de los parámetros longitudinales contra los residuos de Martingala, y finalmente determinaremos gráficamente si los residuos de Cox-Snell siguen una distribución (censurada) exponencial con parámetro la unidad (Rizopoulos, 2012). Respecto la última componente del modelo conjunto sobre la que hemos indicado un supuesto (efectos aleatorios), otros autores han mostrado que los modelos lineales de efectos mixtos son robustos a la falta de especificación de esta distribución (Verbeke & Lesaffre, 1997). Predicciones de los parámetros longitudinales utilizando Joint Models for Longitudinal and Time-to-Event Data Sea una muestra aleatoria �𝑡𝑖, 𝛿𝑖,𝒘𝑖 ,𝑦𝑖�𝑡𝑖𝑗�, 0 ≤ 𝑡𝑖𝑗 ≤ 𝑡𝑖, 𝑗 = 1, … ,𝑛𝑖�, 𝑖 = 1, … ,𝑛 del vector de variables aleatorias {𝑇, Δ,𝑾,𝑌}, utilizando la notación anterior. Supongamos también que hemos ajustado un joint model como el que el que se ha detallado anteriormente. Ahora, estamos interesados en predecir el valor esperado del parámetro longitudinal en un instante de tiempo 𝑢 > 𝑡 para un Nuevos modelos predictivos de enfermedad cardiovascular. 23 nuevo sujeto 𝑖, que tiene una historia hasta el tiempo 𝑡 del valor observado del parámetro longitudinal 𝒴𝑖(𝑡) = {𝑦𝑖(𝑠); 0 ≤ 𝑠 < 𝑡}: 𝜔𝑖(𝑢|𝑡) = 𝐸𝑌{𝑦𝑖(𝑢)|𝑡𝑖∗ > 𝑡,𝒴𝑖(𝑡),𝒘𝒊;𝜽}, donde 𝜽 denota el vector de parámetros del joint model (Rizopoulos, 2011). Rizopoulos desarrolló una aproximación de Monte Carlo para realizar esta tarea, basada en formulación Bayesiana. Él obtuvo el siguiente algoritmo de simulación (Rizopoulos, 2011): Paso 1: Simular 𝜽(𝑙)~𝒩�𝜽�, 𝑣𝑎𝑟� �𝜽���. Paso 2: Simular 𝒃𝒊 (𝑙)~�𝒃𝒊|𝑡𝑖∗ > 𝑡,𝒴𝑖(𝑡),𝒘𝒊;𝜽(𝑙)�. Paso 3: Calcular 𝜔𝑖 (𝑙)(𝑢|𝑡) = 𝒙𝒊𝑇(𝑢)𝜷(𝑙) + 𝒛𝒊𝑇(𝑢)𝒃𝒊 (𝑙) Este algoritmo deberá ser repetido 𝐿 veces. La estimación del parámetro longitudinal será la media (o la mediana) de los valores calculados (𝜔𝑖 (𝑙)(𝑢|𝑡), 𝑙 = 1, … , 𝐿) y el intervalo de confianza estará formado por los percentiles (95%: percentiles 2.5 y 97.5%) (Rizopoulos, 2011). Nosotros destacamos que estas predicciones tienen naturaleza dinámica, ya que conforme se registra información del paciente, las predicciones se actualizan con dicha información. 1.5.2. Predicciones a corto, medio y largo plazo. Una vez hemos adaptado los coeficientes de un modelo de supervivencia a un sistema de puntos construido mediante la metodología del estudio de Framingham (Sullivan, Massaro & D'Agostino, 2004), dispondremos de los siguientes elementos: Nuevos modelos predictivos de enfermedad cardiovascular. 24 1) Estimación de los 𝑝 coeficientes asociados a nuestros factores de riesgo (𝒘) del modelo de regresión: 𝜸�. 2) Valor de ∑ 𝜸�𝑖 · 𝒘�𝚤� 𝑝 𝑖=1 . 3) Todas las variables explicativas categorizadas. Por ejemplo, en una variable cuantitativa, como puede ser la edad en años, supongamos que disponemos de un rango para esta variable de 30-79 años, de forma que podemos utilizar las categorías de edad 30-39, 40-49, 50-59, 60-69, 70- 79 años. Por otra parte, si un factor está modelado por un conjunto de variables binarias, como puede ser el ser fumador, la categorización será: ausente (el sujeto no es fumador) y presente (el sujeto sí que es fumador). 4) Cada categoría dispone de una puntuación asociada. Por ejemplo, en las categorías de edad anteriores, se podría dar el siguiente esquema de puntuaciones: a. 30-39 años → 0 puntos. b. 40-49 años → 2 puntos. c. 50-59 años → 4 puntos. d. 60-69 años → 6 puntos. e. 70-79 años → 8 puntos. Mientras que para la variable del tabaquismo, las puntuaciones podrían tener la siguiente forma: a. No fumador → 0 puntos. b. Fumador → 3 puntos. Sumando la puntuación asociada a cada categoría, obtenemos la puntuación total de cada sujeto. Nuevos modelos predictivos de enfermedad cardiovascular. 25 5) La estimación de la probabilidad de supervivencia, obtenida a través del estimador de Kaplan-Meier, para todos los instantes de tiempo recogidos durante el estudio. 6) La constante 𝐵. 7) Valores de referencia para cada uno de los factores de riesgo: 𝑊𝑖𝑅𝐸𝐹. A continuación, empleando toda esta información, podemos calcular la probabilidad de evento para un sujeto con una puntuación P en un instante de tiempo t, empleando la siguiente expresión: 1 − �̂�0(𝑡)exp�∑ (𝜸�𝑖·𝑊𝑖𝑅𝐸𝐹)𝑝 𝑖=1 +𝐵·𝑃−∑ 𝜸�𝑖·𝒘�𝚤� 𝑝 𝑖=1 � Tanto los investigadores del Framingham Heart Study, como los del proyecto SCORE, han utilizado siempre un valor de 10 años para t, lo cual no permite obtener predicciones a corto o medio plazo, tal como se ha comentado anteriormente en el punto de Antecedentes y estado actual del tema. Sin embargo, la expresión anterior permite sustituir en cualquier valor de t contenido en el rango de seguimiento del estudio. Esto nos permite obtener predicciones a corto y medio plazo, así como a largo plazo (10 años). Por ejemplo, podríamos sustituir en 𝑡 = 2, 4, 6, 8, 10 años y obtendríamos la probabilidad cada dos años de evento cardiovascular, dependiendo exclusivamente de la puntuación de cada nuevo sujeto y del tiempo de predicción, ya que el resto de parámetros serían constantes en el cálculo. Ahora, una vez construido nuestro sistema de puntos con predicciones en varios puntos de corte en el tiempo, se nos presenta una dificultad, que es cómo validar el sistema de puntos para determinar si existen diferencias entre los eventos cardiovasculares observados y aquéllos pronosticados por nuestro sistema. La clave del cálculo de los eventos observados reside en que debemos de tener en cuenta que un sujeto que ha padecido un evento cardiovascular en el Nuevos modelos predictivos de enfermedad cardiovascular. 26 seguimiento, lo habrá padecido a partir de un instante fijo 𝑡∗, por lo que si estamos calculando los eventos observados antes de dicho instante de tiempo, el sujeto deberá ser considerado como libre de evento cardiovascular, mientras que si el punto de corte del tiempo es considerado superior a 𝑡∗, consideraremos que el participante sí que ha experimentado un evento. Tras cálculo de eventos observados y esperados en cada instante de tiempo prefijado (corto, medio o largo plazo), sólo debemos de determinar si existen diferencias mediante la prueba de la χ2 de Pearson, cuyo valor será diferente según el punto de corte del tiempo escogido (en el ejemplo anterior: 2, 4, 6, 8 y 10 años). 1.5.3. Determinación de la mejor combinación de variables para predecir un evento cardiovascular. Supongamos que tenemos un total de 𝑚 variables explicativas para tratar de predecir un evento cardiovascular mediante un modelo de supervivencia, por ejemplo un modelo de regresión de Cox. Por otro lado, consideremos que podemos introducir un máximo de 𝑟 variables en el modelo, ya que debemos de tener mucho cuidado en la convergencia del mismo y en la razón entre el número de eventos y el número de variables explicativas introducidas en dicho modelo. La mayoría de trabajos han propuesto utilizar un método por pasos basado en un test estadístico, como puede serel likelihood ratio test o el score test. Este modelo por pasos suele ser hacia adelante (partir del modelo nulo e ir introduciendo variables según el test estadístico elegido) o hacia atrás [partir del modelo saturado (con todas las variables explicativas) e ir extrayendo variables según el test estadístico elegido]. También se han considerado métodos por pasos sucesivos, los cuales combinan los dos métodos anteriores (hacia adelante y hacia atrás). Sin embargo, a la hora de realizar una predicción, nos interesa aquel conjunto de variables que puede explicar mejor nuestra variable respuesta, es decir, la aparición de la enfermedad cardiovascular en el tiempo. Nuevos modelos predictivos de enfermedad cardiovascular. 27 En los modelos de supervivencia se ha propuesto un estadístico, conocido como estadístico 𝐶 (Pencina & D'Agostino, 2004), el cual mide la capacidad discriminante del modelo para la variable respuesta. Este estadístico se encuentra entre 0 y 1. La interpretación de su valor es la siguiente: cuanto más cercano a 1 esté, mayor discriminación tendrá el modelo. En otras palabras, tiene gran interés encontrar la combinación de variables que arroje un mayor estadístico 𝐶, ya que será aquélla que discrimine mejor entre los sujetos que padecerán una enfermedad cardiovascular y aquéllos que no, es decir, las predicciones serán mucho más precisas. Los métodos anteriores se basan en otro tipo de test estadísticos, por lo que no tienen en cuenta esta cuestión. Por ese motivo, vamos a detallar una metodología capaz de escoger la mejor combinación de variables para predecir la aparición de una enfermedad cardiovascular (aquélla con un estadístico 𝐶 máximo). Como hemos indicado anteriormente, podemos seleccionar un máximo de 𝑟 variables de un total de 𝑚. Planteamos el siguiente algoritmo: 𝑖 = 𝑟: a. Calcular todas las posibles combinaciones de 𝑚 variables tomadas de 𝑟 en 𝑟 sin repetición, es decir, �𝑚𝑖 � = �𝑚𝑟 �. b. Determinar el estadístico 𝐶 para cada una de estas combinaciones de variables. 𝑖 = 𝑟 − 1: a. Repetir el proceso, pero ahora tomando las combinaciones de 𝑟 − 1 en 𝑟 − 1 sin repetición: �𝑚𝑖 � = � 𝑚 𝑟−1�. b. Calcular de nuevo el estadístico 𝐶 en cada combinación. Nuevos modelos predictivos de enfermedad cardiovascular. 28 … 𝑖 = 1: a. Finalmente, calculamos todas las combinaciones de 𝑚 variables tomadas de 1 en 1 sin repetición, es decir, �𝑚𝑖 � = �𝑚1� = 𝑚. En otras palabras, probamos 𝑚 modelos, los cuales contienen una única variable, la cual es diferente en todos ellos. b. Calcular el estadístico 𝐶 en los 𝑚 modelos. Una vez hemos realizado todo este proceso, seleccionaremos aquella combinación que tenga un estadístico 𝐶 máximo, ya que será el modelo con mayor capacidad discriminante y aquél que tendrá predicciones de enfermedad cardiovascular más precisas. El número total de combinaciones probadas en este nuevo algoritmo es: � 𝑚 𝑟 � + � 𝑚 𝑟 − 1 � + � 𝑚 𝑟 − 2 � + ⋯+ � 𝑚 2 � + � 𝑚 1 �. Por ejemplo, si 𝑚 = 20 y 𝑟 = 8, el algoritmo corroborará un total de 263,949 combinaciones y se quedará con aquélla que tenga un estadístico 𝐶 más elevado (máximo de los valores). Nuevos modelos predictivos de enfermedad cardiovascular. 29 1.5.4. Construcción, validación y utilización de un sistema de puntos con medidas repetidas de los factores de riesgo cardiovascular. Construcción Queremos determinar la probabilidad de padecer una enfermedad cardiovascular desde la situación basal (𝑡 = 0) hasta un instante de tiempo fijo �̃�, teniendo una serie de factores de riesgo medidos durante el seguimiento y en la situación basal. Para lograr este objetivo realizaremos los siguientes pasos: 1) Ajustar un modelo de regresión de Cox con variables tiempo dependientes en la muestra recogida. Al no poder estimar un modelo conjunto con múltiples parámetros longitudinales (Rizopoulos, 2012), emplearemos el modelo de Cox extendido clásico (sin estructura compartida), el cual necesita conocer los valores de todos los parámetros longitudinales en todos los instantes de tiempo. Como esto no es conocido porque los parámetros se recogen de forma intermitente, tomaremos el último valor en el tiempo como referencia. 2) Emplear la metodología del estudio Framingham para adaptar los coeficientes del modelo obtenido a un sistema de puntos y determinar las probabilidades de enfermedad cardiovascular de cada puntuación hasta el instante �̃� (Sullivan, Massaro & D'Agostino, 2004). A través de estas probabilidades construir grupos de riesgo que sean sencillos de entender para el clínico (por ejemplo, en múltiplos de 5%). 3) Ajustar un joint model for longitudinal and time-to-event data para cada parámetro longitudinal recogido en el seguimiento. Además, éstos incluirán todas las variables basales. Estos modelos son construidos con el objetivo de realizar predicciones de los parámetros longitudinales sobre nuevos pacientes (validación o utilización tras validación). Nuevos modelos predictivos de enfermedad cardiovascular. 30 Validación estadística a través de simulación Una vez construido el sistema de puntos, queremos ver si sobre otro conjunto diferente de sujetos (muestra de validación), el modelo determina de forma precisa la aparición de la enfermedad cardiovascular. De esta muestra de validación conoceremos en la situación basal la historia de los marcadores longitudinales hasta el instante 𝑡 = 0 [registro de los factores de riesgo cardiovascular en la historia clínica (𝑡 < 0)] y el valor de las variables basales. Con esta información determinaremos la probabilidad que tiene cada sujeto de experimentar un evento y la compararemos con lo que realmente ha pasado, es decir, determinar si es válido el modelo. Para determinar esta validez seguiremos los siguientes pasos: 1) Determinar 𝐿 simulaciones de los parámetros longitudinales en el instante de tiempo �̃� mediante los modelos elaborados en el paso 3) de la construcción, a través de su historia (𝑡 < 0) y de las variables basales (𝑡 = 0). Mediante estos valores simulados, construiremos una distribución de la puntuación para cada sujeto de la muestra, es decir, cada sujeto tendrá 𝐿 valores de la variable puntuación (basta con evaluar el sistema de puntos utilizando los valores simulados y las variables basales). Por otra parte, también para cada simulación 𝑙-ésima cada paciente tendrá un valor de puntuación. En otras palabras, cada simulación tendrá una distribución de la variable de puntuaciones. 2) Para cada simulación 𝑙-ésima ajustar un modelo de Cox clásico (sin variables tiempo-dependientes), utilizando como única variable explicativa la puntuación obtenida. De cada uno de estos 𝐿 modelos, determinar el valor del estadístico 𝐶 (estadístico de Harrell) (Pencina & D'Agostino, 2004). Esto nos dará una distribución de valores para este estadístico, de los cuales calcularemos la media (o la mediana), así como los percentiles 2.5 y 97.5% (Rizopoulos, 2011). De esta forma construiremos un intervalo de confianza para este estadístico, el cual Nuevos modelos predictivos de enfermedad cardiovascular. 31 nos indicará la capacidad discriminante del sistema de puntos para determinar qué pacientes desarrollaran una enfermedad cardiovascular. 3) Para cada paciente de la muestra de validación, calcular la mediana de su distribución de puntuaciones. Notar que no empleamos la media, debido a que podría tener decimales y esto no tiene sentido a la hora de aplicar el sistema de puntos. Utilizando estas medianas, clasificar a cada paciente en un grupo de riesgo y comprobar si existen diferencias entre la tasa de acontecimientos predichos por el sistema de puntos en cada grupo con la observada.El test empleado para este proceso será el de la χ2 de Pearson. En la literatura se ha descrito que el estadístico 𝐶 tiene varias limitaciones (Lloyd-Jones, 2010). Primeramente, no compara si los riesgos observados y estimados son similares en los sujetos. Debido a ello hemos añadido el análisis de las diferencias entre los eventos observados y esperados, lo cual minimiza el problema propuesto. Finalmente, en segundo lugar, es muy sensible a valores de hazard ratios grandes (≥9). Sin embargo, debemos de tener en cuenta que al tratarse todas las variables de forma cuantitativa (no categorizando), los valores de los hazard ratio no superan este umbral. En definitiva, mediante el análisis conjunto del índice de concordancia de Harrell y las diferencias de eventos observados con los eventos esperados, disponemos de una forma satisfactoria para validar estadísticamente por simulación el modelo propuesto. Utilización potencial Una vez validado estadísticamente a través de simulación el sistema de puntos, el clínico está en condiciones de aplicar dicho sistema para determinar en un nuevo paciente su riesgo cardiovascular y posibles intervenciones para su disminución. Hemos de tener en cuenta que el profesional sanitario tendrá información histórica de los parámetros longitudinales (𝑡 < 0) e información en Nuevos modelos predictivos de enfermedad cardiovascular. 32 la situación basal del nuevo paciente (𝑡 = 0). Los pasos que debe de seguir el clínico son los siguientes: 1) Determinar el valor de cada uno de los parámetros longitudinales en el instante �̃�. Para ello aplicaremos los modelos obtenidos en el paso 3) de la construcción sobre el histórico del nuevo paciente y sobre la información basal, con el objetivo de determinar 𝐿 simulaciones de cada parámetro longitudinal, de forma análoga al proceso de validación. En cada simulación 𝑙-ésima determinar la puntuación correspondiente al perfil de factores de riesgo cardiovascular obtenido (valores simulados e información basal). Esto nos construirá una distribución de la puntuación para el nuevo paciente. 2) Determinar la mediana y los percentiles 2.5 y 97.5% del vector de puntuaciones construido en el paso anterior. La mediana será la estimación de la puntuación del nuevo paciente y los percentiles definirán su intervalo de confianza (Rizopoulos, 2011). Por otro lado, como cada puntuación tiene un riesgo asociado, el profesional sanitario conocerá la probabilidad de enfermedad cardiovascular en un tiempo �̃�, junto con su intervalo de confianza. Finalmente, le indicaremos al clínico los valores de los parámetros biológicos en �̃� de la mediana del sistema de puntos, ya que de esta forma podrá ver cuáles de ellos tienen una puntuación por encima del nivel normal, es decir, conocerá los posibles puntos de intervención para disminuir el riesgo cardiovascular. 3) Ahora que el clínico conoce el riesgo cardiovascular y qué parámetros otorgan una puntuación por encima del nivel normal, tiene que diseñar la mejor intervención de cara al paciente. Esto presenta un problema, ya que necesitamos conocer el valor de cada parámetro biológico en el instante �̃�, es decir, el clínico conoce una aproximación basada en simulaciones, que ha sido construida a través de la historia de su paciente, pero no sabe cómo afectarán sus intervenciones al riesgo cardiovascular. Nuevos modelos predictivos de enfermedad cardiovascular. 33 Del paso anterior el profesional sanitario conoce los parámetros sobre los que ha de intervenir y la historia de estos parámetros y su situación basal. En base a estas medidas el médico establecerá un objetivo realista para la próxima visita del paciente en un instante �̃̃� (0 < �̃̃� < �̃�). Ahora insertará los valores objetivo en �̃̃� en la historia del parámetro biológico y determinará su valor en el instante �̃�, es decir, determinará 𝐿 simulaciones de cada uno de los factores de riesgo cardiovascular a través de los modelos anteriores (paso 3 de la construcción), añadiendo un nuevo valor a la historia (�̃̃�). A través de estos cálculos obtendrá el beneficio de su intervención (estimación [media o mediana] del parámetro biológico en �̃�) y podrá visualizar en el sistema de puntos cómo disminuiría el riesgo del paciente. 1.6. Resultados. Vamos a detallar los resultados que derivan de la aplicación de las mejoras propuestas a los modelos cardiovasculares ya existentes, clasificando dichos resultados según objetivos específicos alcanzados: 1.6.1. Predicciones a corto, medio y largo plazo. En las Figuras 1 y 2 podemos observar cómo varían las probabilidades de enfermedad cardiovascular, conforme cambiamos el tiempo de predicción. Mientras que en la Figura 1 cambia cada año hasta un máximo de 4 (Ramírez- Prado et al., 2015), en la Figura 2 se calcula la probabilidad de evento cada 2 años hasta un máximo de 14 (Artigao-Ródenas et al., 2015). Nuevos modelos predictivos de enfermedad cardiovascular. 34 Figura 1: Escala de riesgo cardiovascular para pacientes diabéticos tipo 2 hospitalizados (Ramírez-Prado et al., 2015). Nuevos modelos predictivos de enfermedad cardiovascular. 35 Figura 2: Modelo predictivo para determinar qué paciente sufrirá una enfermedad cardiovascular en un periodo máximo de 14 años. LVH, hipertrofia ventricular izquierda; PA, actividad física; SBP, tensión arterial sistólica. Definición de la actividad física (Food and Agriculture Organization of the United Nations & World Health Organization, 1973): 1) Actividad ligera: actividad de quien trabaja sentado en un despacho o detrás de un mostrador con instrumentos automatizados; 2) Actividad moderada: ligera actividad física continua, como en un trabajo ligero en la industria o en la agricultura fuera de estación; 3) Actividad intensa: trabajo pesado y, a veces, enérgico (producción agrícola, trabajo en minas o fundiciones). Si una persona no estaba trabajando se consideró que experimentaba una actividad ligera. Nuevos modelos predictivos de enfermedad cardiovascular. 36 Por otra parte, a la hora de validar el sistema de puntos con periodo máximo de predicción de 14 años (Figura 3), vemos cómo aumenta la tasa de eventos conforme aumenta el tiempo (cada 2 años). Nuevos modelos predictivos de enfermedad cardiovascular. 37 Figura 3: Diferencias entre los diferentes grupos de riesgo construidos en la muestra de validación (Artigao-Ródenas et al., 2015). Nuevos modelos predictivos de enfermedad cardiovascular. 38 1.6.2. Determinación de la mejor combinación de variables para predecir un evento cardiovascular. En el artículo incluido en esta tesis doctoral sobre la construcción de una escala de riesgo cardiovascular en pacientes diabéticos tipo 2 ingresados a través de un servicios de urgencias (Ramírez-Prado et al., 2015), se aplicó el algoritmo propuesto. Se disponía de un total de 15 posibles variables explicativas, de las cuales sólo podíamos seleccionar un máximo de 7, por lo que se comprobó un total de 16,383 combinaciones y la mejor combinación otorgó un estadístico 𝐶 al modelo predictivo de 0.734. 1.6.3. Construcción, validación y utilización de un sistema de puntos con medidas repetidas de los factores de riesgo cardiovascular. Dado que no se disponía de datos reales para aplicar el nuevo método propuesto, se trabajo sobre datos simulados con el único objetivo de explicar al lector cómo utilizar el método propuesto. Notar, que se han llevado a cabo dos simulaciones dando lugar a dos conjuntos de datos simulados, uno se ha utilizado para construir el modelo y otro para su validación. Para que ambos conjuntos tengan plausibilidad biológica, hemos empleado estimacionesobtenidas en el estudio cardiovascular Puras-GEVA (Artigao-Ródenas et al., 2015). Nuestros conjuntos incluyen los siguientes parámetros biológicos: edad (años), tensión arterial sistólica (SBP) (mmHg), hemoglobina glicada (HbA1c) (%), índice aterogénico, sexo (hombre o mujer) y tabaquismo (sí o no), de los cuales la SBP, HbA1c y el índice aterogénico estarán presentes en la situación basal (𝑡 = 0) y en el seguimiento para la muestra de construcción (𝑡 > 0) ó recogidos en la historia clínica para la muestra de validación estadística a través de simulación (𝑡 < 0). La elección de incluir estas variables se ha basado en las escalas de riesgo cardiovascular actuales (Conroy et al., 2003; National Heart, Lung, and Blood Institute, 2015), salvo la HbA1c, que se ha utilizado en lugar del diagnóstico de diabetes mellitus, con el objetivo de incluir otro parámetro tiempo-dependiente en el modelo final, además de que de esta forma Nuevos modelos predictivos de enfermedad cardiovascular. 39 podríamos valorar el control de la diabetes mellitus (HbA1c <6.5%) a la hora de prevenir una enfermedad cardiovascular. Respecto a la variable principal (tiempo hasta la enfermedad cardiovascular), vamos a suponer que nuestra cohorte se utiliza para predecir la aparición de una enfermedad cardiovascular con un seguimiento de 2 años. Notar que las escalas tradicionales de riesgo cardiovascular utilizan un tiempo de 10 años (Conroy et al., 2003; National Heart, Lung, and Blood Institute, 2015). Nosotros hemos tomado este valor inferior a dichas escalas, porque vamos a realizar predicciones de los parámetros longitudinales desde la situación inicial (𝑡 = 0) hasta el tiempo de predicción y si tomáramos un valor de predicción de 10 años, las predicciones de los parámetros longitudinales tendrían una gran variabilidad y no permitirían realizar predicciones precisas de qué paciente desarrollará una enfermedad cardiovascular, lo que en consecuencia equivaldría a la falta de utilidad del método propuesto. Sin embargo, el hecho de que las predicciones de los parámetros longitudinales tengan carácter dinámico, permite determinar el riesgo a 2 años cada vez que el paciente entra en la consulta del profesional sanitario con una mayor precisión. No obstante, hemos de tener en cuenta que el método propuesto se ha desarrollado para un tiempo teórico �̃� y puede ser aplicado para cualquier valor, aunque los parámetros longitudinales tendrían por norma general mayor variabilidad en el tiempo, pero claramente esto dependerá de la naturaleza de los datos, tanto del individuo como de la población (Rizopoulos, 2012). El trabajo en el que se ha basado nuestro conjunto de datos simulado (Artigao- Ródenas et al., 2015), desarrolló y validó un modelo predictivo de enfermedad cardiovascular (angina de cualquier tipo, infarto de miocardio, accidente cerebrovascular, enfermedad arterial periférica de los miembros inferiores, o muerte cardiovascular), para determinar el cálculo del riesgo a corto, medio y largo plazo ( el riesgo fue calculado para cada puntuación cada dos años hasta un máximo de catorce) en población general. En la Tabla 4 de este sistema de puntos se observa la importancia de esta cuestión. Por ejemplo, un paciente con 9 puntos presenta una probabilidad de enfermedad cardiovascular a los 2 años de 0.67%, mientras que a los 10 años ésta asciende al 5.16% (Artigao- Ródenas et al., 2015). Si calculamos de forma periódica el riesgo Nuevos modelos predictivos de enfermedad cardiovascular. 40 cardiovascular de nuestro paciente a los dos años y éste mantiene su puntuación, no tomaremos ninguna medida terapéutica (riesgo <1%), mientras que si sólo calculamos el riesgo una única vez cada 10 años, tomaremos medidas terapéuticas agresivas en el momento en el que el paciente ha entrado en nuestra consulta médica, ya que el riesgo se corresponde al punto de corte definido como alto por el proyecto SCORE (5%→ uno de cada veinte pacientes) (Conroy et al., 2003). En otras palabras, una predicción a corto plazo realizada de forma regular, podría significar un cambio en la toma de decisiones terapéuticas para la prevención de enfermedades cardiovasculares, siempre y cuando tengamos la posibilidad de calcular el riesgo de forma periódica. Por otra parte, dado que la tabla de riesgo del estudio Puras-GEVA incluye predicciones a 4, 6, 8, 10, 12 y 14 años, se ha seleccionado el punto de corte más bajo, debido a que si realizábamos predicciones con mayor tiempo, éstas podrían aumentar su dispersión (Rizopoulos, 2012). Por estos motivos se ha seleccionado este punto de corte para la simulación (2 años). En lo referente a las medidas longitudinales en el seguimiento (muestra de construcción), se ha supuesto que el paciente acude una vez cada 3 meses a la consulta del médico para poder medir SBP, HbA1c e índice aterogénico. Esto se realiza hasta el final del seguimiento de cada uno de los pacientes. Por otro lado, en la muestra de validación estadística a través de simulación, supondremos que tenemos cierta probabilidad de tener registradas en la historia clínica medidas de todos los parámetros longitudinales cada 3 meses durante 5 años de forma retrospectiva (𝑡 < 0). La probabilidad es diferente para cada una de las visitas y dependerá de cada paciente. En otras palabras, tendremos medidas intermitentes de todos estos parámetros desde 𝑡 = −5 años hasta 𝑡 = 0. En el material suplementario del tercer artículo presentado en esta tesis doctoral (Palazón-Bru et al., 2015) se han detallado todas las fórmulas matemáticas empleadas para construir nuestros conjuntos de datos, siempre basándonos en el estudio Puras-GEVA (Artigao-Ródenas et al., 2015). Podría pensarse que al manejar un menor periodo de tiempo de 2 años no exista variabilidad en los factores de riesgo cardiovascular. Sin embargo, en el Nuevos modelos predictivos de enfermedad cardiovascular. 41 material suplementario observamos que los modelos utilizados presentan variabilidad temporal de los factores de riesgo (Palazón-Bru et al., 2015), ya que de no presentarse, éstos contendrían la constante con un error aleatorio muy pequeño. En otras palabras, tiene sentido utilizar este periodo de predicción. Se decidió simular un conjunto de datos, por no disponer en la actualidad de un conjunto de datos reales. Esta forma de explicar un nuevo método, ha sido desarrollada por otros autores que han trabajado con modelos conjuntos de supervivencia y datos longitudinales, ya que el único objetivo del conjunto de datos simulado, es lograr explicar al lector cómo aplicar el nuevo método (Faucett & Thomas, 1996; Henderson, Diggle & Dobson, 2000; Wang & Taylor, 2001; Brown, Ibrahim & DeGruttola, 2005; Zeng & Cai, 2005; Vonesh, Greene & Schluchter, 2006; Rizopoulos & Ghosh, 2011). Construcción del sistema de puntos 1) Estimamos el modelo multivariante de Cox con variables tiempo- dependientes, definidas como el último valor registrado. Sus coeficientes quedan reflejados en la Tabla 1. Tabla 1: Parámetros (βs) del modelo de Cox multivariante. Variable β p-valor Edad (basal) (por 1 año) 0.0846 <0.001 SBP (por 1 mmHg) 0.00874 <0.001 HbA1c (por 1%) 0.188 <0.001 Índice aterogénico (por 1 unidad) 0.191 <0.001 Sexo hombre 0.479 0.001 Fumador (basal) 0.721 <0.001 Abreviaturas: SBP, systolic blood pressure; HbA1c, glycated haemoglobin. Goodness-of-fit (likelihood ratio test): χ2=912.3, p<0.001. Nuevos modelos predictivos de enfermedad cardiovascular. 42 En lo referente al análisis de los residuos de Martingala (Figura 4), observamos que todas las variables tienen forma lineal en el modelo, ya que la línea roja muestra una linealidad perfecta (la línea roja indica el ajuste lineal entre las dos variables presentes en el gráfico cartesiano). Esto era esperado, pueslos datos han sido simulados de esa forma. No obstante debemos de corroborarlo antes de continuar con el método propuesto. Nuevos modelos predictivos de enfermedad cardiovascular. 43 Figura 4: Forma funcional de las covariables en el modelo. Nuevos modelos predictivos de enfermedad cardiovascular. 44 A continuación debemos de corroborar que el modelo ajusta bien los datos, mediante el análisis de los residuos de Cox-Snell (Figura 5). Como podemos observar, la línea roja (distribución exponencial de parámetro 1) se mantiene dentro de los intervalos de confianza, por lo que nuestro modelo cumple todas sus hipótesis básicas y estamos en condiciones de comenzar el paso 2) de la construcción. Figura 5: Análisis de los residues de Cox-Snell. 2) Adaptamos los coeficientes obtenidos en el modelo multivariante a un sistema de puntos según la metodología del Framingham Heart Study. Dado que es una metodología ampliamente utilizada, simplemente daremos el resultado en forma de figura (Figura 6). No obstante, todos los cálculos se anexan en una hoja de cálculo Excel en el material suplementario donde se presenta la técnica (Palazón-Bru et al., 2015). Se ha decidido la utilización de una figura en vez de una tabla, para facilitar la lectura al usuario, ya que las celdas están más separadas y no otorgan confusión al clínico. Esta idea ha sido utilizado tanto por el proyecto SCORE como por el estudio Framingham. Notar que los grupos de riesgo se han construido como en el proyecto SCORE. Nuevos modelos predictivos de enfermedad cardiovascular. 45 Figura 6: Sistema de puntos para predecir enfermedad cardiovascular en 2 años. Abreviaturas: SBP, tensión arterial sistólica; HbA1c, hemoglobina glicada; TC, colesterol total; HDL-c, colesterol HDL. Nuevos modelos predictivos de enfermedad cardiovascular. 46 3) Hemos ajustado los modelos conjuntos para cada uno de los parámetros longitudinales y sus coeficientes estimados quedan reflejados en la Tabla 2. No se ha especificado una función de riesgo basal. Tabla 2: Parámetros de los modelos conjuntos construidos. Variable SBP (mmHg) p- valor HbA1c (%) p- valor Índice aterogénico p- valor Proceso del evento Sexo hombre 0.428 <0.001 0.475 <0.001 0.446 <0.001 Edad (por 1 año) 0.0837 <0.001 0.0840 <0.001 0.0833 <0.001 Fumador 0.731 <0.001 0.757 <0.001 0.775 <0.001 Parámetro (por 1 unidad) 0.0085 <0.001 0.216 <0.001 0.195 <0.001 Proceso longitudinal: efectos fijos 1 133.557 <0.001 6.158 <0.001 4.602 <0.001 T 0.0046 <0.001 0.0001 <0.001 0.0001 <0.001 Proceso longitudinal: efectos mixtos 1 21.683 N/A 1.346 N/A 1.324 N/A T 0.0358 N/A * * 0.0013 N/A Residuos 8.933 N/A 0.357 N/A 0.302 N/A Abreviaturas: SBP, tensión arterial sistólica; HbA1c, hemoglobina glicada; N/A, no aplica. *: término eliminado por problemas de convergencia. La estrategia fue eliminar de términos más complejos a términos más sencillos. Goodness-of-fit: 1) SBP: χ2=371,574.1, p<0.001; 2) HbA1c: χ2=210,881.1, p<0.001; 3) Índice aterogénico: χ2=121,118.0, p<0.001. Nuevos modelos predictivos de enfermedad cardiovascular. 47 Respecto a las hipótesis básicas de los modelos, primeramente podemos observar en la Figura 7, que no existe una tendencia entre los valores ajustados y los residuos específicos de cada individuo, ya que la línea roja (ajuste lineal entre las dos variables del eje cartesiano) se mantiene muy cercana a 𝑦 = 0. Figura 7: Gráficos de residuos específicos de cada sujeto frente a los valores ajustados por los modelo. Arriba: tensión arterial sistólica. Abajo a la izquierda: hemoglobina glicada. Abajo a la derecha: índice aterogénico. Nuevos modelos predictivos de enfermedad cardiovascular. 48 En lo referente a la normalidad de los residuos específicos, dado el volumen de datos que disponemos, podemos asumir normalidad asintótica. No obstante, en la Figura 8 se encuentran disponibles los gráficos Q-Q que comparan la distribución de los datos con una distribución normal. A raíz de estos gráficos también podemos concluir que nuestros residuos siguen una distribución normal. Figura 8: Gráficos Q-Q de los residuos específicos de cada sujeto. Arriba: tensión arterial sistólica. Abajo a la izquierda: hemoglobina glicada. Abajo a la derecha: índice aterogénico. Nuevos modelos predictivos de enfermedad cardiovascular. 49 En el análisis de los residuos marginales frente a los valores ajustados (Figura 9), vemos que la línea roja (ajuste lineal entre las variables presentadas en el gráfico cartesiano) no establece un patrón fuera de 𝑦 = 0. En otras palabras, se han verificado todos los supuestos del submodelo longitudinal, por lo que ahora vamos a comprobar las hipótesis básicas del submodelo de supervivencia. Figura 9: Gráficos de los residuos marginales frente a los valores ajustados. Arriba: hemoglobina glicada. Abajo a la izquierda: tensión arterial sistólica. Abajo a la derecha: índice aterogénico. Nuevos modelos predictivos de enfermedad cardiovascular. 50 En la Figura 10 quedan reflejados ambos tipos de gráficos para corroborar las hipótesis básicas del submodelo de supervivencia. En la primera columna (valores ajustados de los parámetros longitudinales contra los residuos de Martingala), no se observa ninguna tendencia, ya que la línea roja (ajuste lineal entre ambas variables del gráfico) se asemeja a la recta 𝑦 = 0. Por otra parte, podemos asumir que los residuos de Cox-Snell siguen una distribución exponencial de parámetro la unidad (la línea roja se sitúa en los intervalos de confianza de la supervivencia). Nuevos modelos predictivos de enfermedad cardiovascular. 51 Figura 10: Gráficos para corroborar las hipótesis básicas del submodelo de supervivencia. Residuos de Martingala Residuos de Cox-Snell Arriba: tensión arterial sistólica. Centro: hemoglobina glicada. Abajo: índice aterogénico. Nuevos modelos predictivos de enfermedad cardiovascular. 52 Validación estadística por simulación La concordancia fue muy satisfactoria: 0.844 (IC 95%: 0.842-0.846). La comparación entre eventos observados y esperados no mostró diferencias estadísticamente significativas (Figura 11). Figura 11: Comparación entre proporción (%) de eventos observados y esperados en los diferentes grupos de riesgo. 0.00 5.00 10.00 15.00 20.00 25.00 Low Medium High Very high Observed 0.46 3.17 10.78 24.63 Expected 0.39 2.25 7.39 22.83 p=0.555 Nuevos modelos predictivos de enfermedad cardiovascular. 53 Utilización potencial Llega a nuestra consulta un nuevo paciente de las siguientes características: varón, 83 años, no fumador y tratamiento farmacológico (un antihipertensivo y un antidiabético oral) y no farmacológico (dieta y ejercicio). Por otra parte, se dispone del histórico de sus factores de riesgo cardiovascular (Tabla 3). Tabla 3: Parámetros recogidos en la historia clínica electrónica necesarios para aplicar nuestro sistema de puntos. Tiempo (días) SBP (mmHg) HbA1c (%) Índice aterogénico -360 152 5.1 3.56 -330 135 5.3 3.23 -270 164 4.7 3.45 -180 153 4.4 4.12 -90 170 5.0 4.15 0 145 4.9 5.17 Abreviaturas: SBP, tensión arterial sistólica; HbA1c, hemoglobina glicada. El tiempo tiene valor negativo porque se refiere a los valores recogidos antes de la situación basal (𝑡 = 0). Tras aplicar el modelo construido, se obtiene un histograma de la puntuación de riesgo cardiovascular obtenida por el paciente (Figura 12). En ella observamos un riesgo cardiovascularelevado, ya que la mayoría de simulaciones se concentra en 16 puntos. La estimación de la puntuación fue de 16 (95% CI: 15-17). La mediana de la puntuación se correspondió con una SBP de 160 mmHg, una HbA1c de 4.9% y un índice aterogénico de 6.76. Teniendo en cuenta que existen factores del modelo sobre los cuales no podemos intervenir (sexo y edad), que dan al paciente un mínimo de 13 puntos, debemos de pensar estrategias que logren que el paciente no puntúe en el resto de categorías de la escala (Figura 6). Nuevos modelos predictivos de enfermedad cardiovascular. 54 Figura 12: Riesgo cardiovascular de un nuevo paciente teórico (situación pre-intervención). Ahora, el facultativo estima que si el paciente cumple con una serie de intervenciones [farmacológicas (añadir dos fármacos antihipertensivos → -20 mmHg; prescribir una estatina → -40% índice atrogénico) y no farmacológicas (reducir la sal en las comidas → -5 mmHg)], sus parámetros longitudinales en un periodo de 3 meses serán: SBP 120 mmHg (145 – 2·10 – 5 = 120 mmHg), índice aterogénico 3.10 (5.17 – 40% = 3.10), y HbA1c 4.9% (mismo valor, pues no se ha realizado ninguna intervención). A continuación aplicamos de nuevo el modelo con este nuevo dato y obtenemos el riesgo cardiovascular a dos años (Figura 13). La estimación de la puntuación es de 15 (IC 95%: 14-15) y los valores que otorgan la puntuación mediana son: SBP 124 mmHg, índice aterogénico 4.85, y HbA1c 5.0%. De forma que el riesgo ha disminuido, ya que ahora generalmente el paciente tiene 14 puntos (Figura 6). Nuevos modelos predictivos de enfermedad cardiovascular. 55 Figura 13: Riesgo cardiovascular de un nuevo paciente teórico (situación post-intervención). Nuevos modelos predictivos de enfermedad cardiovascular. 56 1.7. Discusión. Sumario Esta tesis doctoral aporta posibles mejoras en la construcción de modelos predictivos de enfermedad cardiovascular ya existentes. Estas mejoras residen fundamentalmente en: 1) Obtener predicciones a corto y medio plazo; 2) Seleccionar la mejor combinación de variables para discriminar con mayor precisión, qué paciente desarrollará una enfermedad cardiovascular; 3) Detallar una metodología para construir modelos predictivos de enfermedad cardiovascular, teniendo en cuenta la variabilidad de los factores de riesgo cardiovascular y sin perder la simplicidad de los sistemas de puntos, que son ampliamente utilizados en la práctica clínica habitual a nivel mundial (Conroy et al., 2003; National Heart, Lung, and Blood Institute, 2015). Comparación con la literatura existente Si analizamos la primera mejoría propuesta, estamos dando a los clínicos la posibilidad de calcular el riesgo cardiovascular en periodos inferiores a 10 años, lo que puede permitir mejorar la toma de decisiones, ya que si un paciente presenta alto riesgo cardiovascular en un periodo de tiempo muy corto, deberemos realizar una estrategia terapéutica mucho más agresiva. Los modelos de Framingham y SCORE no tienen esta característica (Conroy et al., 2003; Cooney, Dudina & Graham, 2009; National Heart, Lung, and Blood Institute, 2015). No obstante, dado que tendrán realizado el cálculo de la supervivencia en todos los instantes de tiempo, es algo que podría implementarse y tratar de aplicarlo en futuras escalas de riesgo cardiovascular. En segundo lugar, el hecho de calcular todas las posibles combinaciones de variables explicativas, nos está ayudando a elegir el mejor modelo matemático para la obtención de la predicción más precisa en la enfermedad cardiovascular. Eso permite aumentar el valor de nuestro estadístico 𝐶 hasta el máximo posible. Esta estrategia en la elección de las variables no ha sido utilizada por los investigadores del estudio Framingham o los del proyecto Nuevos modelos predictivos de enfermedad cardiovascular. 57 SCORE (Conroy et al., 2003; Cooney, Dudina & Graham, 2009; National Heart, Lung, and Blood Institute, 2015). Puede ser que si aplicamos esta estrategia sobre los datos del proyecto SCORE o del estudio Framingham, obtengamos una diferencia pequeña con el estadístico 𝐶 anterior. No obstante, una ganancia de un 5%, puede equivaler a lograr identificar una mayor proporción de pacientes que sufrirán una enfermedad cardiovascular, lo que desembocaría en una menor morbimortalidad cardiovascular. Finalmente, en lo referente a la tercera mejora propuesta, las escalas de riesgo cardiovascular existentes no valoran la variabilidad temporal de los parámetros de control de los factores de riesgo, aunque como aspecto muy positivo, sí que tienen en cuenta la sencillez para su aplicación inmediata por parte de los profesionales sanitarios, que son los que realmente aplicarán estos modelos matemáticos (Conroy et al., 2003; Cooney, Dudina & Graham, 2009; National Heart, Lung, and Blood Institute, 2015). Por otra parte, los joint models actualmente utilizados, sí que tienen en cuenta la variabilidad en el tiempo de un único parámetro longitudinal (Rizopoulos, 2011), pero su interpretación no es tan sencilla como la de un sistema de puntos y no permite emplear varios parámetros longitudinales, cuestión clave por la etiología multifactorial de la enfermedad cardiovascular. Nosotros hemos tratado de fundir todas estas técnicas en un único algoritmo, manteniendo las virtudes de cada una de ellas (modelo de riesgos relativos, sistemas de puntos, predicciones dinámicas...). Si tratamos de comparar el método propuesto con las actuales escalas de riesgo cardiovascular, se nos presenta un problema, ya que nuestro modelo es más adecuado para hacer predicciones en un tiempo más corto, ya que conforme nos separamos de la situación basal (𝑡 = 0) a la hora de predecir, esto ocasiona un aumento de la variabilidad de las predicciones de los parámetros longitudinales (Rizopoulos, 2012). Este comportamiento se observa también en economía (la bolsa) y en meteorología (pronóstico del tiempo). Aunque esto dependerá de la naturaleza de los datos que estemos analizando, tanto a nivel individual como poblacional. Todo esto no ocasiona una debilidad en nuestro modelo, ya que al tener las predicciones de los parámetros longitudinales un carácter dinámico (Rizopoulos, 2011), cada vez que actualicemos la información clínica de nuestro paciente, este riesgo se Nuevos modelos predictivos de enfermedad cardiovascular. 58 calculará de forma inmediata. Esto lo hemos visto en el ejemplo propuesto en resultados, en donde al introducir nuevos valores de los parámetros longitudinales, éstos se actualizan y determinan la nueva distribución de puntos del paciente. En otras palabras, el método propuesto podría utilizarse para calcular el riesgo del paciente cada vez que éste acuda a la consulta de su profesional sanitario, mientras que las escalas de riesgo tradicionales pueden utilizarse con mayor intervalo de tiempo, pues el pronóstico es para 10 años. En definitiva, podríamos utilizar de forma conjunta ambos tipos de modelos para valorar el riesgo tanto a corto como a largo plazo, ya que aunque se han visto discrepancias entre predicciones cardiovasculares a corto y largo plazo (Quispe et al., 2015), la utilización periódica de las predicciones a corto plazo, teniendo en cuenta la variabilidad de los factores de riesgo, puede complementar a los modelos cardiovasculares a largo plazo. En otras palabras, nuestra intención es que en la práctica clínica se utilice el modelo a corto plazo de forma periódica en aquellos pacientes que acuden frecuentemente a la consulta médica y el de largo plazo para aquéllos que no. Implicaciones para la práctica clínica y la investigación Para la primera mejora propuesta, se plantea en las escalas de riesgo cardiovascular ya construidas, el cálculo de la probabilidadde evento en periodos de tiempo inferiores, ya que estos datos estarán disponibles en la base de datos construida para la escala predictiva a 10 años. De la misma forma, podríamos aplicar esta técnica en nuevas escalas de riesgo cardiovascular. Seguidamente, para la segunda mejora propuesta (combinaciones), es obvio que las escalas cardiovasculares construidas deberían de aplicar esta nueva técnica para su utilización. En otras palabras, no es algo inmediato y podría cambiar los valores del modelo. En consecuencia, se plantea la utilización de esta técnica para la construcción de futuras escalas de riesgo cardiovascular. Finalmente, en el método sugerido más complejo, hemos de tener en cuenta que la obtención de simulaciones de los parámetros longitudinales no es una Nuevos modelos predictivos de enfermedad cardiovascular. 59 tarea sencilla y conlleva un coste computacional de aproximadamente un minuto si implementamos un total de 100 en un ordenador de usuario. Por otra parte, los valores históricos de los parámetros longitudinales están registrados en la historia clínica, generalmente electrónica (Palazón-Bru et al., 2014). Partiendo de estas ideas, toda la información necesaria para aplicar nuestros modelos se encuentra de forma informatizada, por lo que los algoritmos implementados pueden adaptarse al lenguaje de la base de datos donde se encuentren registrados los valores de los factores de riesgo y de esta forma todos los cálculos serían inmediatos para el profesional sanitario. En otras palabras, que a través de pulsar un botón, en un tiempo reducido aparezcan conjuntamente por pantalla el histograma ofrecido en la Figura 12, el sistema de puntos teórico y el conjunto de valores de los factores de riesgo que determinan la mediana de las puntuaciones. Por otra parte, a la hora de intervenir, se indicará el tiempo de la intervención y los posibles valores que estima el profesional sanitario sobre su nuevo paciente. Al introducir esta nueva información se reflejarán los dos histogramas conjuntamente (Figuras 12 y 13), lo cual permitirá visualmente al clínico conocer el beneficio de su intervención. Dado que el algoritmo se ha desarrollado sobre un conjunto de datos simulados, animamos a otros autores que tengan bases de datos cardiovasculares de la forma planteada, la implementación de un modelo de las características detalladas en esta tesis doctoral. De forma que si sobre datos reales se obtiene una mayor precisión en las predicciones, podremos aplicar esta metodología para obtener el mejor pronóstico y tomar las decisiones a corto plazo óptimas de cara al beneficio del paciente. No obstante, hemos de tener en cuenta que el método propuesto se basa en la combinación de modelos matemáticos utilizados en la literatura científica, es decir, nuestra técnica a nivel teórico es completamente correcta, pues hemos sido muy rigurosos en cada uno de los pasos a seguir. A nivel práctico podemos determinar el valor de �̃� y la complejidad de los modelos para poder aplicar el método propuesto. Finalmente, destacamos que el algoritmo desarrollado en este trabajo, puede aplicarse a otras enfermedades o en otras áreas del conocimiento, como la economía. Nuevos modelos predictivos de enfermedad cardiovascular. 60 1.8. Referencias. American Diabetes Association. 2014. Standards of medical care in diabetes-- 2014. Diabetes Care 37 Suppl 1:S14-80. Andersen PK, Gill RD. 1982. Cox's Regression Model for Counting Processes: A Large Sample Study. Annals of Statistics 10: 1100-1120. Artigao-Ródenas LM, Carbayo-Herencia JA, Palazón-Bru A, Divisón-Garrote JA, Sanchis-Domènech C, Vigo-Aguiar I, Gil-Guillén VF; on behalf of GEVA. 2015. Construction and validation of a 14-year cardiovascular risk score for use in the general population: the PURAS-GEVA chart. Medicine (Baltimore) 94: e1980. Brown ER, Ibrahim JG, DeGruttola V. 2005. A flexible B-spline model for multiple longitudinal biomarkers and survival. Biometrics 61: 64-73. Conroy RM, Pyörälä K, Fitzgerald AP, Sans S, Menotti A, De Backer G, De Bacquer D, Ducimetière P, Jousilahti P, Keil U, Njølstad I, Oganov RG, Thomsen T, Tunstall-Pedoe H, Tverdal A, Wedel H, Whincup P, Wilhelmsen L, Graham IM; SCORE project group. 2003. Estimation of ten-year risk of fatal cardiovascular disease in Europe: the SCORE project. European Heart Journal 24: 987-1003. Cooney MT, Dudina AL, Graham IM. 2009. Value and limitations of existing scores for the assessment of cardiovascular risk: a review for clinicians. Journal of the American College of Cardiology 54: 1209-1227. Nuevos modelos predictivos de enfermedad cardiovascular. 61 Faucett CL, Thomas DC. 1996. Simultaneously modelling censored survival data and repeatedly measured covariates: a Gibbs sampling approach. Statistics in Medicine 15: 1663-1685. Food and Agriculture Organization of the United Nations and World Health Organization. 1973. FAO/WHO. Energy and protein requirements: Report of a joint FAO/WHO ad hoc expert committee. FAO Nutrition Meetings Report Series No. 52. WHO Technical Report Series No. 522. Rome and Geneva: FAO/WHO. Henderson R, Diggle P, Dobson A. 2000. Joint modelling of longitudinal measurements and event time data. Biostatistics 1: 465-480. Hosmer DW, Lemeshow S. 2000. Applied Logistic Regression. New York: Wiley. Hosmer DW, Lemeshow S, May S. 2008. Applied Survival Analysis: Regression Modeling of Time-to-Event Data. New York: Wiley. James PA, Oparil S, Carter BL, Cushman WC, Dennison-Himmelfarb C, Handler J, Lackland DT, LeFevre ML, MacKenzie TD, Ogedegbe O, Smith SC Jr, Svetkey LP, Taler SJ, Townsend RR, Wright JT Jr, Narva AS, Ortiz E. 2014. 2014 evidence-based guideline for the management of high blood pressure in adults: report from the panel members appointed to the Eighth Joint National Committee (JNC 8). JAMA 311: 507-520. Erratum in: JAMA 311: 1809. Molinero LM. 2003. Modelos de riesgo cardiovascular. Estudio de Framingham. Proyecto SCORE. Available at http://www.seh-lelha.org/pdf/modelries.pdf (accessed July 2015). http://www.seh-lelha.org/pdf/modelries.pdf Nuevos modelos predictivos de enfermedad cardiovascular. 62 National Cholesterol Education Program (NCEP) Expert Panel on Detection, Evaluation, and Treatment of High Blood Cholesterol in Adults (Adult Treatment Panel III). 2002. Third Report of the National Cholesterol Education Program (NCEP) Expert Panel on Detection, Evaluation, and Treatment of High Blood Cholesterol in Adults (Adult Treatment Panel III) final report. Circulation 106: 3143-3421. National Heart, Lung, and Blood Institute (Boston University). 2015. The Framingham Heart Study. Available at http://www.framinghamheartstudy.org/ (accessed July 2015). Lloyd-Jones DM. 2010. Cardiovascular risk prediction: basic concepts, current status, and future directions. Circulation 121: 1768-1777. López-Bru D, Palazón-Bru A, Folgado-de la Rosa DM, Gil-Guillén VF. 2015. Scoring System for Mortality in Patients Diagnosed with and Treated Surgically for Differentiated Thyroid Carcinoma with a 20-Year Follow-Up. PLoS One 10: e0128620. Palazón-Bru A, Carbayo-Herencia JA, Vigo MI, Gil-Guillén VF. 2016. A method to construct a points system to predict cardiovascular disease considering repeated measures of risk factors. PeerJ 4: e1673. Palazón-Bru A, Gil-Guillén VF, Orozco-Beltrán D, Pallarés-Carratalá V, Valls- Roca F, Sanchís-Domenech C, Martín-Moreno JM, Redón J, Navarro-Pérez J, Fernández-Giménez A, Pérez-Navarro AM, Trillo JL, Usó R, Ruiz E. 2014. Is the physician's behavior in dyslipidemia diagnosis in accordance with guidelines? Cross-sectional ESCARVAL study. PLoS One 9:e91567. http://www.framinghamheartstudy.org/ Nuevos modelos predictivos de enfermedad cardiovascular.