VALORACIÓN DE LAS EVIDENCIAS CLINICAS

Medicina

•
Abaco - Chiclayo

javier alberto saavedra quintana
5/10/2023
¡Este material tiene más páginas!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Medicina

245.921 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
C A P Í T U L O 2 | Valoración de las evidencias clínicas 45
La excelencia en toda atención clínica requiere integrar la experiencia clínica, las prefe-
rencias del paciente y las mejores evidencias clínicas disponibles.1
Estudia cuidadosamente las claras descripciones de cómo la anamnesis y la exploración 
física se pueden considerar pruebas diagnósticas; cómo valorar la precisión de las prue-
bas de laboratorio, las imágenes radiográficas y los procedimientos de diagnóstico; y cómo 
valorar los estudios de investigación clínica y las guías de prevención de las enfermedades. 
El dominio de estas destrezas analíticas mejorará tu práctica clínica y asegurará que tus 
valoraciones y recomendaciones se basen en las mejores evidencias clínicas (fig. 2-1).
Valoración de las 
evidencias clínicas
La serie de Bates ofrece estos recursos adicionales para reforzar el aprendizaje 
y facilitar la comprensión de este capítulo:
■ Bates. Guía de bolsillo de exploración física e historia clínica, 8.a edición
■ Bates. Guía visual para la exploración física (todos los volúmenes)
■ Recursos en línea disponibles en thePoint para estudiantes y profesores: http://thepoint.lww.com/
espanol-Bickley_12e
Experiencia
clínica
Preferencias
del paciente
Evidencias
de investigación
F I G U R A 2 - 1 . Diagrama de Venn sobre la práctica clínica basada en evidencias 
(adaptada con autorización de Haynes RB, Sackett DL, Gray JM, et al. Transferring evidence from research into practice: 1. The role 
of clinical care research evidence in clinical decisions. ACP J Club. 1996;125:A14–A16).
https://booksmedicos.org
https://booksmedicos.org
ANAMNESIS Y EXPLORACIÓN FÍSICA COMO PRUEBAS DE DIAGNÓSTICO
46 B A T E S . G U Í A D E E X P L O R A C I Ó N F Í S I C A E H I S T O R I A C L Í N I C A
Desarrollarás tu experiencia clínica conforme aprendas al respecto y practiques tu disci-
plina clínica, lo que te permitirá hacer diagnósticos e identificar potenciales intervencio-
nes más eficazmente. En el capítulo 3 se abordan las estrategias para involucrar a 
los pacientes en las decisiones de atención sanitarias al reconocer que éstos llevan sus 
preferencias, preocupaciones y expectativas individualizadas al encuentro clínico. Los 
elementos de la anamnesis y la exploración física se pueden considerar pruebas de 
diagnóstico, cuya precisión se valorará de acuerdo con los criterios que se presentan 
más adelante en este capítulo. En los capítulos dedicados a la exploración por regiones, 
encontrarás recomendaciones basadas en evidencias para las intervenciones de promo-
ción de la salud, especialmente la detección y la prevención. Estas recomendaciones 
también se basan en evidencias de las publicaciones clínicas, que se pueden valorar de 
acuerdo con los criterios que se presentan en este capítulo.
Umbral de
la prueba0%
Probabilidad del diagnóstico
Probabilidad menor
al umbral de la prueba;
no se justifica hacerla
Umbral del
tratamiento 100%
Probabilidad entre el umbral
de la prueba y el tratamiento;
se requieren pruebas adicionales
Probabilidad por arriba
del umbral del tratamiento,
concluyeron las pruebas,
se inicia el tratamiento
F I G U R A 2 - 2 . Valoración de las probabilidades (adaptado con autorización de Guyatt G, Rennie D, 
Meade M, et al. Users’ Guides to the Medical Literature. 2nd ed. New York, NY: McGraw-Hill Company; 2008; capítulo 14, figura 14-2).
Anamnesis y exploración física como 
pruebas de diagnóstico
El proceso de razonamiento diagnóstico se inicia con la anamnesis. Conforme 
obtengas información de tu paciente, empezarás a desarrollar un diagnóstico diferen-
cial, que es una lista de las posibles causas de los problemas del paciente cuya longitud 
reflejará tu incertidumbre en cuanto a la posible explicación de un problema determi-
nado. Tu lista empezará con la explicación más probable, pero también incluirá otros 
diagnósticos, en particular aquellos con consecuencias graves si no se detectan y tratan. 
Se asignarán probabilidades a los diversos diagnósticos según la factibilidad de que 
constituyan explicaciones del problema de tu paciente. Por ahora estas probabilidades 
se basarán en lo que hayas aprendido de los libros de texto y las conferencias. Con el 
transcurso del tiempo, estos cálculos de probabilidades también reflejarán tu experien-
cia clínica.
Cuando inicies el abordaje de problemas clínicos, tu meta será determinar si necesitas 
ordenar pruebas adicionales (fig. 2-2).2
https://booksmedicos.org
https://booksmedicos.org
VALORACIÓN DE LAS PRUEBAS DE DIAGNÓSTICO
 C A P Í T U L O 2 |
 
Valoración de las evidencias clínicas 47
Si la probabilidad de una enfermedad es muy alta con base en la anamnesis y la explo-
ración (es decir, rebasa el umbral terapéutico), entonces se puede avanzar e iniciar el 
tratamiento. Por el contrario, si la probabilidad de detectar una enfermedad es muy 
baja (es decir, por debajo del umbral de prueba), entonces no necesitas hacer otras 
pruebas. El intervalo entre los umbrales de prueba y tratamiento representa la incer-
tidumbre clínica, y se necesitarán pruebas adicionales para valorar las probabilidades 
y guiar el tratamiento clínico. La expectativa es que los resultados permitan cruzar el 
umbral de prueba-tratamiento. Debes comprender que estos umbrales de prueba- 
tratamiento no son inamovibles y varían con base en los posibles efectos adver-
sos del tratamiento y la gravedad del trastorno. Por ejemplo, se requerirá un umbral 
de tratamiento mucho más alto (confianza de que el paciente tiene una elevada pro-
babilidad de sufrir la enfermedad) para iniciar la quimioterapia del cáncer, en com-
paración con la prescripción de un antibiótico para una infección urinaria. A su vez, 
se requerirá un umbral de prueba mucho menor (confianza de que el paciente 
tiene pocas probabilidades de presentar la enfermedad) al tratar de descartar la enfer-
medad isquémica cardíaca en comparación con la sinusitis bacteriana. Sin embargo, 
el saber si un resultado de prueba podrá lograr este efecto puede constituir un desafío 
y requiere que  comprendas cómo se debe valorar el desempeño de una prueba 
de diagnóstico.
Valoración de las pruebas de diagnóstico
Podrás recurrir a las publicaciones clínicas para determinar cómo se pueden usar los 
resultados de las pruebas de diagnóstico, que incluyen elementos de la anamnesis y la 
exploración física, así como análisis de laboratorio, radiografías y procedimientos, para 
evaluar las probabilidades. Se explorarán dos conceptos en la valoración de las pruebas 
de diagnóstico: la validez de los hallazgos y la reproducibilidad de los resultados.
Validez
El paso inicial para valorar una prueba de diagnóstico consiste en determinar si provee 
resultados válidos. ¿Permite la prueba identificar con precisión que un paciente presenta una 
enfermedad? Ello implica compararla con un estándar ideal o de referencia, el mejor pará-
metro que indica que un paciente presenta la enfermedad, que pudiese ser una biopsia 
para valorar una masa pulmonar, un examen psiquiátrico estructurado para la depresión 
o una colonoscopia ante un resultado positivo de una prueba de sangre oculta en heces.
La tabla de 2 × 2 constituye el formato básico para valorar las características de desem-
peño de una prueba de diagnóstico, es decir, qué tanto los resultados de la prueba 
determinan las probabilidades de padecer una enfermedad.
Hay dos columnas: la de los pacientes que presentan la enfermedad y la de aquellos 
que no. Las categorías se basan en una prueba estándar ideal. Las dos filas corresponden 
a los resultados positivos y negativos de la prueba. Las cuatro celdas (a, b, c, d) 
corresponden a los resultados positivos reales, falsos positivos, falsos negativos y 
negativos reales, respectivamente.3
https://booksmedicos.org
https://booksmedicos.org
VALORACIÓN DE LAS PRUEBAS DE DIAGNÓSTICO
48 B A T E S . G U Í A D E E X P L O R A C I Ó N F Í S I C A E H I S T O R I A C L Í N I C A
Sensibilidad y especificidad.Los primeros análisis estadísticos que se deben 
calcular son la sensibilidad y la especificidad.
Sensibilidad y especificidad
● Sensibilidad es la probabilidad de que una persona con enfermedad tenga un resul-
tado positivo de la prueba. Esto se representa como a/(a + c) en la columna de presen-
cia de enfermedad de la tabla de 2 × 2. La sensibilidad también se conoce como la 
“tasa de positivos reales”.
● Especificidad es la probabilidad de que una persona no enferma presente una prueba 
negativa, representada por d/(b + d) en la columna de ausencia de enfermedad de la 
tabla de 2 × 2. La especificidad también se conoce como la “tasa de negativos reales”.
● Ejemplos. Un ejemplo de estos análisis estadísticos sería la probabilidad de que la 
esplenomegalia (véase capítulo 11, p. 479) se relacione con la matidez a la percusión 
bajo el borde costal izquierdo (sensibilidad). Por el contrario, la probabilidad de que un 
paciente sin esplenomegalia presente matidez a la percusión corresponde a la tasa de 
falsos positivos (1 – especificidad) para esta maniobra de exploración física.
Estructuración de la tabla de 2 × 2
Estándar ideal:
presencia de enfermedad
Estándar ideal:
ausencia de enfermedad
Prueba con resul-
tado positivo
a
Positivo real
b
Falso positivo
Prueba con resul-
tado negativo
c
Falso negativo
d
Negativo real
El conocer la sensibilidad y especificidad de una prueba no necesariamente ayuda a 
tomar decisiones clínicas, porque se trata de análisis estadísticos basados en el conoci-
miento de si el paciente presenta la enfermedad. Sin embargo, hay dos excepciones. Un 
resultado negativo de una prueba con alta sensibilidad (p. ej., una tasa muy baja de falsos 
negativos) suele descartar la enfermedad. Lo anterior se representa por las siglas 
SnNOUT: una prueba Sensible con un resultado Negativo descarta (del inglés, OUT) 
la enfermedad. Por el contrario, un resultado positivo en una prueba con alta espe-
cificidad (p. ej., una muy baja tasa de falsos positivos) suele indicar la presencia de 
enfermedad, lo que se representa por las siglas SpPIN: una prueba eSpecífica con un 
resultado Positivo indica (del inglés, IN) la presencia de enfermedad.4
Valor predictivo positivo y negativo. El escenario clínico habitual que enfrentan 
los médicos clínicos implica determinar si un paciente en realidad presenta la enfermedad 
con base en el resultado positivo o negativo de una prueba. Los análisis estadísticos de 
prueba importantes en este caso son los valores predictivos positivos y negativos.3
https://booksmedicos.org
https://booksmedicos.org
VALORACIÓN DE LAS PRUEBAS DE DIAGNÓSTICO
 C A P Í T U L O 2 |
 
Valoración de las evidencias clínicas 49
Prevalencia de la enfermedad. Aunque los análisis estadísticos del valor pre-
dictivo parecen ser intuitivamente útiles, variarán sustancialmente de acuerdo con la 
prevalencia de la enfermedad (proporción de pacientes en la columna de presencia de 
enfermedad). La prevalencia se basa en las características de la población de pacientes 
y el contexto clínico. Por ejemplo, la prevalencia de muchas enfermedades, por lo 
general, será mayor en los pacientes de edad avanzada y en aquellos atendidos en 
clínicas de especialidades de hospitales de referencia.
En el siguiente recuadro se muestra una tabla de 2 × 2 donde tanto la sensibilidad como 
la especificidad de la prueba diagnóstica son del 90% y la prevalencia (porcentaje de sujetos 
que presentan la enfermedad) del 10%. El valor predictivo positivo calculado a partir de 
la fila de resultado positivo de la tabla sería de 90/180 = 50%, lo que significa que la mitad 
de las personas con un resultado positivo de la prueba presentan la enfermedad.
Valor predictivo positivo y negativo
● El valor predictivo positivo (VPP) es la probabilidad de que una persona con un resul-
tado positivo de una prueba presente la enfermedad; se representa como a/(a + b) de 
la fila de tal resultado en la tabla de 2 × 2.
Se encuentra un ejemplo de esta estadística en la detección del cáncer de próstata 
(véase capítulo 15, p. 612), donde un hombre con un valor de antígeno prostático 
específico (APE) mayor de 4.0 ng/mL tiene una probabilidad de sólo el 30% de 
padecerlo, con base en el resultado de una biopsia.5
● El valor predictivo negativo (VPN) es la probabilidad de que una persona con un 
resultado negativo de la prueba no presente la enfermedad; se representa como 
d/(c + d) en la fila de tal resultado en la tabla de 2 × 2. 
Entre los hombres con una cifra de APE de 3.0 ng/mL o menor, en el 85% se observa 
ausencia de cáncer en la biopsia.6
Valores predictivos: prevalencia del 10% con 
sensibilidad y especificidad = 90%
Presencia de 
enfermedad
Ausencia de 
enfermedad
Total
Resultado 
positivo
a
90
b
90 180
Resultado 
negativo
c
10
d
810 820
Total 100 900 1 000
Sin embargo, si sensibilidad y especificidad se mantienen iguales pero la prevalencia 
resulta de sólo 1%, las celdas tendrán un aspecto muy diferente.
Sensibilidad = a/(a + c) = 90/100 o 90%; especificidad = d/(b + d) = 810/900 = 90%
Valor predictivo positivo = a/(a + b) = 90/180 = 50%
https://booksmedicos.org
https://booksmedicos.org
VALORACIÓN DE LAS PRUEBAS DE DIAGNÓSTICO
50 B A T E S . G U Í A D E E X P L O R A C I Ó N F Í S I C A E H I S T O R I A C L Í N I C A
Ahora, el valor predictivo positivo calculado a partir de la columna de resultado positivo 
de la prueba en la tabla sería de 9/108 = 8.3%. La consecuencia es que gran parte de las 
pruebas positivas son falsas, lo que significa que la mayoría de los sujetos que se someten 
a pruebas estándar ideales (que suelen ser invasivas, costosas y potencialmente lesivas) 
no presentarán la enfermedad, lo que tiene implicaciones para su seguridad y la asignación 
de recursos, debido a que los clínicos desean limitar el número de los no enfermos que 
se someten a pruebas estándar ideales. Sin embargo, como se muestra en el ejemplo, los 
valores predictivos no necesariamente proveen suficiente orientación para usar las prue-
bas en poblaciones con diferente prevalencia de la enfermedad.
Cocientes de verosimilitudes. Por suerte, hay otras formas para valorar el desem-
peño de una prueba de diagnóstico con la que se puede contar para la variante preva-
lencia de enfermedad observada en diferentes poblaciones de pacientes. Una forma 
consiste en usar el cociente de verosimilitudes (likelihood ratio), definido como la proba-
bilidad de obtener un resultado determinado de una prueba en un paciente enfermo, 
dividida entre la correspondiente en uno no enfermo.3,7 El cociente de verosimilitudes 
indica el grado en que el resultado de un estudio cambia la probabilidad preprueba de 
presentar la enfermedad (prevalencia), respecto de la probabilidad posprueba.
En el caso más simple, se asume que el resultado de la prueba es positivo o negativo. Por 
lo tanto, el cociente de verosimilitudes de un resultado positivo de la prueba corresponde a la 
división de la probabilidad de un resultado positivo en una persona enferma entre 
la de obtenerlo en una que no lo está. A partir de la tabla de 2 × 2 se observa que esto es 
lo mismo que el resultado de dividir la frecuencia de positivos reales (sensibilidad) entre la 
tasa de positivos falsos (1 – especificidad). Un valor más alto (mucho mayor que 1) 
indica que es mucho más probable que el resultado positivo de una prueba provenga 
de una persona enferma que de una que no lo está, lo que aumenta nuestra con-
fianza de que quien lo presente padezca la enfermedad.
El cociente de verosimilitudes de un resultado negativo de una prueba es la probabilidad de 
obtenerlo en una persona enferma, dividida entre la correspondiente en una persona que 
no lo está.7 A partir de la tabla de 2 × 2 se observa que esto es lo mismo que la tasa de 
falsos negativos (1 – sensibilidad) dividida entre la tasa de negativos reales (especifici-
dad). Un valor más bajo (mucho menor que 1) indica que es mucho más probable 
que se obtenga un resultadonegativo de la prueba en una persona no enferma que 
en una que sí lo está, lo que aumenta nuestra confianza de que quien lo presente no 
sufra la enfermedad.
Valores predictivos: prevalencia del 1% con sensibilidad 
y especificidad = 90%
Presencia de 
enfermedad
Ausencia de 
enfermedad
Total
Resultado 
positivo de la 
prueba
a
9
b
99 108
Resultado 
negativo de 
la prueba
c
1
d
891 892
Total 10 990 1 000
Sensibilidad = a/(a + c) = 9/10 o 90%; especificidad = d/(b + d) = 891/990 = 90%
Valor predictivo positivo = a/(a + b) = 9/108 = 8.3%
https://booksmedicos.org
https://booksmedicos.org
VALORACIÓN DE LAS PRUEBAS DE DIAGNÓSTICO
 C A P Í T U L O 2 |
 
Valoración de las evidencias clínicas 51
En el siguiente recuadro se muestra cómo interpretar los cocientes de verosimilitudes con 
base en el grado en el que el resultado de una prueba cambia la probabilidad posterior 
de enfermedad respecto de la previa.8
Interpretación de los cocientes de verosimilitudes
Cocientes de 
verosimilitudesa
Efecto sobre la probabilidad preprueba 
a posprueba
CV > 10 o < 0.1 Generan grandes cambios
CV de 5-10 o 0.1-0.2 Generan cambios moderados
CV de 2-5 y 0.5-0.2 Generan cambios pequeños (a veces importantes)
CV de 1-2 y 0.5-1 La modifican en un grado pequeño (rara vez importante)
aLos cocientes de verosimilitudes (CV) > 1 se relacionan con resultados positivos y mayor proba-
bilidad de enfermedad. 
Los cocientes de verosimilitudes < 1 se relacionan con resultados negativos y una menor probabi-
lidad de enfermedad. Una prueba con un cociente de verosimilitudes de 1 no aporta información 
adicional acerca de la probabilidad de enfermedad.
A continuación se muestra cómo se pueden usar los cocientes de verosimilitudes para 
evaluar la probabilidad de enfermedad con el ejemplo de la detección del cáncer de mama.
¿Qué tan probable es que una mujer con anomalías en 
la mamografía presente cáncer de mama?
Una mujer de 57 años de edad con riesgo promedio de cáncer de mama muestra anomalías 
en la mamografía y desea saber la probabilidad de que lo presente. En las publicaciones se 
señala que el riesgo basal (prevalencia) es del 1%, la sensibilidad de la mamografía del 90% 
y la especificidad del 91%.
Teorema de Bayes. Una forma de utilizar los cocientes de verosimilitudes para 
evaluar la probabilidad correspondiente de enfermedad es con el teorema de Bayes,4 
que requiere convertir la prevalencia calculada (probabilidad preprueba) en momios 
(odds), con el uso de la ecuación:
Momios preprueba = probabilidad preprueba/(1 – probabilidad preprueba)
Los momios preprueba se multiplican por el cociente de verosimilitudes para calcu-
lar los momios posprueba utilizando la siguiente ecuación:
Momios posprueba = momios preprueba × cociente de verosimilitudes
Los momios posprueba se convierten después en una probabilidad utilizando 
la ecuación:
Probabilidades posprueba = momios posprueba / (1 + momios posprueba)
Por ejemplo, una prevalencia del 1% representa la probabilidad preprueba; esto signi-
fica que los momios preprueba son de 0.01/0.99 o 0.01. El cociente de verosimilitudes 
de un resultado positivo de la prueba es la sensibilidad (1 – especificidad), que corres-
ponde a 90%/9% = 10. Los momios preprueba se multiplican por este cociente de 
https://booksmedicos.org
https://booksmedicos.org
VALORACIÓN DE LAS PRUEBAS DE DIAGNÓSTICO
52 B A T E S . G U Í A D E E X P L O R A C I Ó N F Í S I C A E H I S T O R I A C L Í N I C A
verosimilitudes (0.01 × 10) para obtener los momios posprueba de 0.10. Los momios 
posprueba se convierten [0.1/(1 + 0.1)] en una probabilidad posprueba de alrededor 
del 9%.
Nomograma de Fagan. Si te sientes más cómodo pensando en términos de la 
probabilidad de presentar una enfermedad, entonces con el nomograma de Fagan 
te puede ser más fácil usar los cocientes de verosimilitudes (fig. 2-3).9 Con este nomo-
grama se leen las probabilidades preprueba en la línea de la izquierda y después se traza 
una línea recta desde la probabilidad preprueba cruzando el cociente de verosimilitudes 
correspondiente en la línea media, y a continuación se lee la probabilidad posprueba en 
la línea de la derecha.
También se puede utilizar el nomograma de Fagan para responder la pregunta de la 
mamografía (véase fig. 2-3). La probabilidad preprueba (prevalencia) es igual al 1% y 
2000
1000
500
200
100
50
20
10
5
2
1
0.002
0.005
0.01
0.02
0.05
0.1
0.2
0.5
0.001
0.0005
0.1
Probabilidad
preprueba (%)
Cociente de
probabilidades
0.2
0.5
1
2
5
10
20
30
40
50
60
70
80
90
95
98
99 0.1
0.2
0.5
1
2
5
10
20
30
40
50
60
70
80
90
95
98
99
Probabilidad
posprueba (%)
F I G U R A 2 - 3 . Nomograma de Fagan (adaptado con autorización de Fagan TJ. Letter: nomogram for 
Bayes theorem. N Engl J Med. 1975;293:257).
https://booksmedicos.org
https://booksmedicos.org
VALORACIÓN DE LAS PRUEBAS DE DIAGNÓSTICO
 C A P Í T U L O 2 |
 
Valoración de las evidencias clínicas 53
la correspondiente de un resultado positivo de la prueba [sensibilidad/(1 – especifici-
dad)] es igual a 10. La línea azul corresponde al caso de un resultado positivo de la prueba 
con una probabilidad posprueba de casi el 9%. Si el resultado de la mamografía fuese 
negativo (línea roja), entonces el cociente de verosimilitudes de un resultado negativo 
de la prueba [(1 – sensibilidad)/especificidad] sería de 10%/91% = 0.11, y la probabili-
dad posprueba de un cáncer de mama resultaría del 0.1%.
Frecuencias naturales. El uso de declaraciones de frecuencia puede ser una 
alternativa más intuitiva de los cocientes de verosimilitudes para determinar el modo 
en que el resultado de una prueba cambiaría la probabilidad de padecer la enferme-
dad.9,10 Las frecuencias naturales representan las periodicidades unidas de dos sucesos, 
como el número de pacientes con la enfermedad y el de aquellos con un resultado posi-
tivo de la prueba. Se empieza tomando un gran número de personas (p. ej., 100 o 1 000, 
dependiendo de la prevalencia) y se divide entre el de frecuencias naturales (p. ej., cuán-
tas de las personas presentan la enfermedad, cuántas con la enfermedad darán resultado 
positivo en la prueba, cuántas sin la enfermedad darán resultado positivo).
Frecuencias naturales para responder la pregunta 
de la mamografía
Se pueden usar las frecuencias naturales para responder la pregunta de la mamografía 
mediante la creación de la tabla de 2 × 2 con base en una población de 1 000 mujeres. Una pre-
valencia del 1% indica que 10 mujeres presentarán cáncer de mama. La sensibilidad del 90% 
indica que nueve de aquellas con carcinoma mamario presentarán una mamografía anómala. 
La especificidad del 91% indica que 89 de las 990 personas sin cáncer mamario tendrán, no 
obstante, una mamografía anormal. La probabilidad de que una mujer con una mamografía 
anómala presente cáncer de mama es de 9/(9 + 89) = aproximadamente 9%.
Resultado de la 
mamografía
Cáncer 
de mama
Ausencia de 
cáncer de mama Total
Positivo 9 89 98
Negativo 1 901 902
10 990 1 000
Datos obtenidos de Gigerenzer G. What are natural frequencies? BMJ. 2011;343:d6386.
Reproducibilidad
Coeficiente kappa (κ). Otra característica de las pruebas de diagnóstico es su 
reproducibilidad.3 Un aspecto importante de la valoración de los elementos de diag-
nóstico de la anamnesis y la exploración física es la determinación de la reproducibili-
dad de los hallazgos para el diagnóstico de un trastorno clínico. Cuando, por ejemplo, 
dos médicos clínicos exploran a un paciente, tal vez no siempre concuerden res-
pecto de la presencia de un hallazgo determinado, lo que hace surgir la pregunta de 
si es útil para el diagnóstico de un trastorno clínico. Por azar, si muchos pacientes 
están siendo examinados, habrá un cierto grado de concordancia entre los dos médicos. 
La comprensión de si hay concordancia más allá del azar, no obstante, es importante 
para determinar si el dato es suficientemente útil para respaldar una toma de decisiónhttps://booksmedicos.org
https://booksmedicos.org
VALORACIÓN DE LAS PRUEBAS DE DIAGNÓSTICO
54 B A T E S . G U Í A D E E X P L O R A C I Ó N F Í S I C A E H I S T O R I A C L Í N I C A
clínica. El coeficiente κ corresponde al grado de concordancia que se presenta 
más allá del azar (fig. 2-4).12 En el siguiente recuadro se muestra cómo interpretar 
los valores del coeficiente κ.
Comprender la determinación de la concordancia entre diferentes 
observadores. Los médicos clínicos concuerdan en el 75% de los casos en que un 
paciente presenta un hallazgo físico anómalo. La concordancia esperada con base en el 
azar es del 50%, lo que significa que aquella más allá del azar es del 50% y la concordan-
cia real correspondiente del observador es del 25%. El valor de κ es entonces de 25%/50% 
= 0.5, lo que indica una concordancia moderada.
Precisión. En el contexto de la reproducibilidad, por precisión se hace referencia 
al poder aplicar la misma prueba a la misma persona dos veces y obtener los mismos 
resultados.4 La precisión se usa a menudo cuando se hace referencia a las pruebas de 
laboratorio. Por ejemplo, cuando se determina la concentración de troponina por sospe-
cha de isquemia cardíaca, los clínicos podrían utilizar un límite particular para decidir si 
ingresar al paciente a una unidad de cuidados coronarios. Si los resultados de la prueba 
Concordancia esperada por azar Posible concordancia superior a la presente por azar
75%
25%
50%
Concordancia observada:
Concordancia observada superior a la correspondiente por azar:
κ = 25/50 = 0.5 (concordancia moderada)
F I G U R A 2 - 4 . Coeficiente κ (adaptado con autorización de McGinn T, Wyer PC, Newman TB, et al. Tips for learners of 
evidence-based medicine: 3. Measures of observer variability [kappa statistic]. CMAJ. 2004;171:1369–1379).
Interpretación de los valores de κ
Valor de κ Potencia de la concordancia
< 0.20 Mala
0.21-0.40 Leve
0.4-0.60 Moderada
0.61-0.80 Buena
0.81-1.00 Excelente
https://booksmedicos.org
https://booksmedicos.org
PROMOCIÓN DE LA SALUD
 C A P Í T U L O 2 |
 
Valoración de las evidencias clínicas 55
Promoción de la salud
En este libro encontrarás secciones de promoción de la salud, donde se hacen recomenda-
ciones para la prevención primaria (intervenciones diseñadas para prevenir enfermedades) 
así como para la prevención secundaria (pruebas de detección diseñadas para encontrar 
enfermedades o procesos patológicos en una etapa temprana, asintomática). El motivo 
para promover la prevención secundaria es que el tratamiento de la enfermedad en una 
etapa temprana suele ser más eficaz que en una posterior. Estas recomendaciones 
de promoción de la salud se basan en las guías emitidas por organizaciones de profesio-
nales. Se destacan las guías que se basan en evidencias, como las emitidas por el U.S. 
Preventive Services Task Force (USPSTF),13 que consideran la calidad de la evidencia y 
la solidez de la recomendación para proveer o evitar una intervención.14 Las recomen-
daciones más sólidas de promoción de la salud se basan en los resultados de 
los estudios aleatorizados controlados (o la síntesis de varios de estos estudios) 
del tratamiento o la prevención.
El diseño de un estudio aleatorizado controlado disminuye los sesgos, lo que aumenta la 
validez de los resultados. Los estudios observacionales tienen más probabilidades de 
presentar sesgos en los resultados y se pueden ofrecer opiniones de expertos en ausencia 
de evidencias. Cuando busques información basada en evidencias, deberás seleccionar 
el nivel más alto de las pruebas disponibles (p. ej., revisiones sistemáticas de estudios 
aleatorizados controlados de alta calidad) (fig. 2-5).15
son imprecisos, pueden llevar a hospitalizar a un individuo sin cardiopatía isquémica o 
enviar a casa a uno con un problema isquémico. Una prueba estadística utilizada para 
determinar la precisión es el coeficiente de variación, definido como la desviación estándar 
dividida entre la media. Las cifras menores indican una mayor precisión.
Revisiones
sistemáticas
Estudios aleatorizados controlados
Estudios pareados
Estudios de casos y controles
Series de casos, informes de casos
Editoriales, opiniones de expertos
F I G U R A 2 - 5 . Pirámide de evidencias (adaptado con autorización de Sackett DL, Straus SE, Richardson 
WS et al. Evidence-Based Medicine: How to Practice and Teach EBM. 2nd ed. Edinburgh: Churchill Livingstone; 2000).
https://booksmedicos.org
https://booksmedicos.org
VALORACIÓN CRÍTICA
56 B A T E S . G U Í A D E E X P L O R A C I Ó N F Í S I C A E H I S T O R I A C L Í N I C A
Durante tu entrenamiento en atención sanitaria es indispensable que aprendas el proceso 
de valoración crítica de las publicaciones clínicas, para poder interpretar los nuevos estu-
dios y guías conforme aparezcan durante tu carrera profesional.
Un proceso ampliamente aceptado para el abordaje crítico de las publicaciones clíni-
cas es el desarrollado por The Evidence Based Working Group (Grupo de trabajo basado 
en evidencias),16 constituido por expertos en epidemiología, el estudio de la enferme-
dad en las poblaciones, donde se creó un abordaje riguroso y estandarizado para la 
valoración de los estudios, que se ha aplicado a una amplia variedad de temas clínicos 
incluyendo estudios de terapéutica y prevención, pruebas de diagnóstico, metaanálisis, 
análisis de eficacia en cuanto a coste y guías de práctica profesional. El abordaje incluye 
tres preguntas básicas:
1. ¿Son válidos los resultados (son creíbles)?
2. ¿Cuáles son los resultados (su magnitud y precisión)?
3. ¿Cómo se pueden aplicar los resultados a la atención de los pacientes?
Comprender los sesgos
Al evaluar los resultados de un estudio, es importante tener plena comprensión de los 
sesgos, es decir, los errores sistemáticos cometidos al realizar un estudio que atentan 
contra la validez de los resultados. Los estudios con un bajo riesgo de presentar sesgos 
ofrecen las evidencias más válidas para la toma de decisiones clínicas y las intervenciones 
para promover la salud. Los principales tipos de sesgos en las investigaciones clínicas son 
los de selección, desempeño, detección y deserción.17
Valoración crítica
Tipos de sesgos que afectan las evidencias
Sesgo de selección
● Ocurre cuando los grupos de comparación presentan diferencias sistemáticas en sus 
características basales que pueden afectar el resultado del estudio.
● Crea problemas en la interpretación de las diferencias observadas en los resultados 
porque puede provenir de diferencias basales o de las intervenciones entre los grupos.
● La asignación aleatorizada de los sujetos que serán intervenidos constituye el mejor 
abordaje para disminuir al mínimo este sesgo.
Sesgo de desempeño
● Ocurre cuando hay diferencias sistemáticas en la atención que recibieron los grupos 
de comparación (diferentes a los de intervención).
● Crea problemas en la interpretación de las diferencias entre los resultados.
● El enmascaramiento de los sujetos y proveedores de la intervención es el mejor 
abordaje para reducirlo al mínimo.
(continúa )
https://booksmedicos.org
https://booksmedicos.org
VALORACIÓN CRÍTICA
 C A P Í T U L O 2 |
 
Valoración de las evidencias clínicas 57
Sesgo de detección
● Ocurre cuando hay diferencias sistemáticas en los esfuerzos por diagnosticar 
o precisar un resultado.
● El enmascaramiento de los evaluadores de resultados (asegurando que no tengan 
conocimiento de la intervención de que fue objeto el sujeto) constituye el mejor 
abordaje para disminuirlo al mínimo.
Sesgo de deserción
● Ocurre cuando hay diferencias sistemáticas en los grupos de comparación en cuanto 
al número de sujetos que no concluyen el estudio.
● No tomar en cuenta estas diferencias puede llevar a un cálculo incorrecto de la eficacia 
de una intervención.
● El uso de un análisis de intento de tratamiento, donde se considera a todos los sujetos 
que se asignaron a un grupo de comparación independientementede que fuesen objeto 
o concluyesen la intervención o no, puede disminuir al mínimo este sesgo.
Resultados
Valoración del desempeño de una intervención de tratamiento o preven-
ción. Otros aspectos que se deben considerar en la valoración de la calidad de las 
publicaciones incluyen los resultados y su generalizabilidad. Ya se han analizado los resul-
tados de los estudios sobre las pruebas de diagnóstico. Las guías para la prevención de la 
salud suelen basarse en estudios clínicos de tratamiento o prevención, cuyos resultados 
también se calculan a partir de una tabla de 2 × 2, donde las columnas corresponden a 
si el sujeto presentó el resultado y las filas a si fue objeto de (o estuvo expuesto a) 
la intervención. Los análisis estadísticos utilizados para describir el desempeño de una 
intervención de tratamiento o prevención incluyen riesgo relativo, diferencias de 
riesgo relativo (pueden corresponder a disminución o aumento, refl ejo de beneficio 
o  daño), diferencias de riesgo absoluto (pueden corresponder a disminución o 
aumento, refl ejo de beneficio o daño), número necesario de pacientes para el trata-
miento, y el correspondiente para el daño.18
Tabla de 2 × 2 para valorar los estudios 
de tratamiento o prevención
Se presentó el suceso No se presentó el 
suceso
Total
Grupo experimental a b a + b
Grupo control c d c + d
El cálculo de estos análisis estadísticos a partir de la tabla de 2 × 2 se inicia con la determi-
nación de la probabilidad de que se presenten ciertos resultados.
■ La probabilidad de que un sujeto sometido a la intervención presente el resultado se 
representa como a/(a + b) a partir de la fila 1 (grupo experimental), que también 
se conoce como tasa de sucesos experimentales (EER, de experimental event rate).
Tipos de sesgos que afectan las evidencias (continuación )
https://booksmedicos.org
https://booksmedicos.org
VALORACIÓN CRÍTICA
58 B A T E S . G U Í A D E E X P L O R A C I Ó N F Í S I C A E H I S T O R I A C L Í N I C A
■ La probabilidad de que un sujeto control o testigo presente el resultado es c/(c + d) 
a partir de la fila 2 (grupo control) o tasa de sucesos en controles (CER, de control 
event rate).
■ El riesgo relativo, la probabilidad de un resultado en el grupo de intervención, en 
comparación con la del correspondiente en el grupo control, se expresa como 
EER/CER.
■ Se define a la diferencia de riesgo relativo como |CER – EER|/CER × 100%, o 100% – 
riesgo relativo, que describe el porcentaje que disminuye/aumenta el riesgo basal por 
el tratamiento.
■ La diferencia de riesgo absoluto, o la diferencia en las tasas de resultados entre los 
grupos de comparación, se expresa como |CER – EER|.
■ El recíproco de la diferencia de riesgo absoluto (expresada como fracción) es el nú-
mero de sujetos que necesita tratarse durante un período específico para prevenir un 
resultado. Si la intervención en realidad aumenta el riesgo de un mal resultado, este 
análisis estadístico se convierte en el número necesario para que ocurra daño.
Medición de la eficacia del tratamiento. Un ejemplo de estos cálculos 
se basa en los resultados hipotéticos de un estudio de comparación de los efectos de un 
nuevo fármaco, CardioProtect (CP), frente a uno de uso amplio, CareStandard (CS), que 
se muestra a continuación. En este estudio aleatorizado controlado de 1 año se compa-
raron pacientes que sobrevivieron a un infarto de miocardio reciente, para ver si el nuevo 
fármaco disminuiría el resultado de un episodio cardiovascular, definido como infarto 
de miocardio mortal o no, o un ictus. Los fármacos estaban recubiertos, de manera que 
ni pacientes ni proveedores pudieran diferenciarlos. Los sujetos que recibieron el CP 
constituyen el grupo experimental, y el EER = 10 sucesos en 100 sujetos = 0.10. El 
grupo control, por su parte, recibió CS y el CER fue de 30 sucesos en 100 sujetos = 0.30. 
El riesgo relativo de presentar un episodio cardiovascular en el grupo de CP, en compa-
ración con el de CS, es de 0.10/0.30 = 0.33, o 33%. La disminución del riesgo relativo 
es 1 – 0.33 = 0.67, o 67%, lo que significa que el riesgo de un episodio cardiovascular 
en el grupo de CP es 67% menor que en el de CS. El CP llevó a un descenso en el 
número de sucesos cardiovasculares, por lo que se usa la disminución del riesgo abso-
luto que se comunica como decimal: 0.3 – 0.1 = 0.2. El recíproco de este valor (1/0.2) 
da un número de sujetos que se necesita tratar de 5, lo que significa que por cada cinco 
pacientes que reciben CP en lugar de CS habrá un episodio menos. El número necesario 
de pacientes para el tratamiento siempre se basa en un período específico, por lo que 
se debe expresar que se necesita tratar a cinco pacientes durante 1 año con CP, en com-
paración con CS, para prevenir un episodio cardiovascular.
Ejemplo de tablas de 2 × 2 para valorar los estudios de 
tratamiento o prevención
Episodio cardiovascular Ningún episodio Total
CardioProtect 10 90 100
CareStandard 30 70 100
https://booksmedicos.org
https://booksmedicos.org
VALORACIÓN CRÍTICA
 C A P Í T U L O 2 |
 
Valoración de las evidencias clínicas 59
Resultados generalizables
El último punto a considerar cuando se valora la calidad de las publicaciones es si los 
resultados son generalizables (p. ej., si se pueden aplicar a sus pacientes). A fin de 
determinarlo, primero se necesita ver los datos demográficos de los sujetos del estudio 
(p. ej., edad, sexo, grupo poblacional, estado socioeconómico, condiciones clínicas). 
A continuación, se debe determinar si los datos demográficos son suficientemente simi-
lares a los de tu paciente, para que los resultados sean aplicables. También necesitas 
evaluar si la intervención es factible en tu contexto. ¿Cuentas con la experiencia, tecnología 
y capacidad clínica para ofrecer la intervención? De suma importancia, necesitas conside-
rar el rango de los beneficios y daños potenciales vinculados con la intervención y decidir 
si es aceptable para tu paciente.
Recomendaciones de guías
Hay muchos abordajes para calificar la solidez de las recomendaciones y se discutirán 
varios de los sistemas de graduación.
Abordaje de el United States Preventive Services Task Force 
(USPSTF). En el USPSTF se asignan calificaciones del 1 al 5 a sus recomendaciones 
(tabla 2-1). También se establece un grado de certidumbre respecto del beneficio 
neto (tabla 2-2).
Grado, valoración, desarrollo y evaluación de las recomendaciones 
(GRADE). En el proceso GRADE (G rading of Recommendations, Assessment, Develop-
ment, and Evaluation) se valora la calidad de la evidencia y los grados de solidez de 
las recomendaciones incluidas en las guías clínicas.19 Desarrollado por un grupo inter-
nacional de redactores de guías y expertos en evidencias, los principales objetivos 
de GRADE son (1) separar claramente la calidad de la evidencia y la solidez de las reco-
mendaciones y (2) proveer interpretaciones pragmáticas claras de las recomendaciones 
sólidas con respecto a las débiles.
Las evidencias de alta calidad, de que el beneficio de una intervención rebasa al daño, 
justifican una recomendación sólida y sugieren que es poco probable que la investigación 
adicional cambie la confianza en el efecto calculado. Mientras tanto, la incertidumbre 
acerca de la relación riesgo-beneficio (p. ej., por evidencias de baja calidad o por riesgos 
y beneficios de fuerza similar) conducen a una recomendación débil.
En el American College of Chest Physicians (AACP) también se perfeccionó un sistema de 
graduación usado por muchas organizaciones,20 en el que se clasifica la calidad de la evi-
dencia como alta (de grado A), moderada (de grado B) o baja (de grado C), con base 
en el diseño del estudio, la sistematicidad de los resultados y lo directo de la evidencia. En 
el sistema se clasifica a la solidez de la recomendación como sólida (de grado 1) o débil 
(de grado 2) con base en el equilibrio calculado entre beneficios, riesgos, cargas, costes y 
el nivel de confianza en loscálculos. En la tabla 2-3 se proveen más detalles sobre los cri-
terios y las definiciones.
En las secciones de promoción de la salud se indicará el grado de evidencia en el que se 
basan diversas recomendaciones.
https://booksmedicos.org
https://booksmedicos.org
60 B A T E S . G U Í A D E E X P L O R A C I Ó N F Í S I C A E H I S T O R I A C L Í N I C A
MÁS ADELANTE
Más adelante
En este capítulo se presenta el concepto de la práctica clínica basada en evidencias y se 
muestra cómo llevar las evidencias clínicas al cuidado de los pacientes. Las maniobras de 
exploración física y los elementos de la historia clínica se pueden considerar como pruebas 
de diagnóstico y se ha mostrado cómo valorar su desempeño. En el resto de la obra se 
proveerá información adicional sobre el desempeño diagnóstico. También se abordarán las 
evidencias que dan fundamento a las guías clínicas y la forma en que una buena guía deberá 
determinarlas e indicar la solidez de las recomendaciones para implementar una inter-
vención. Se proveerá tal información cuando se describan las guías en las secciones de 
Promoción y asesoramiento sobre salud de cada uno de los capítulos de exploración regional.
https://booksmedicos.org
https://booksmedicos.org
	Botón1:
VALORACIÓN DE LAS EVIDENCIAS CLINICAS

Medicina

Abaco - Chiclayo

Medicina

Continuar navegando

Otros materiales