Del pretest a la decisión clínica: el valor de la reclasificación del riesgo

Santiago Decotto ^ID· Ana Miceli ^ID· Rodolfo Pizarro ^ID

Servicio de Cardiología, Hospital Italiano de Buenos Aires.
Ciudad Autónoma de Buenos Aires. Argentina.

Acta Gastroenterol Latinoam 2026;56(2):127-130

Recibido: 22/06/2026 / Aceptado: 26/06/2026 / Publicado online: 30/06/2026 / https://doi.org/10.52787/agl.v56i2.664

Introducción

En medicina nos encontramos constantemente en búsqueda de nuevas herramientas diagnósticas y pronósticas. Es así que continuamente se incorporan variables clínicas, biomarcadores séricos, técnicas de imagen y nuevos modelos predictivos con el objetivo de mejorar la estimación del riesgo y guiar la toma de decisiones en nuestros pacientes. Sin embargo, la mera asociación estadística entre una variable y un desenlace clínico no garantiza su utilidad en la práctica asistencial.

Frente a la aparición de un nuevo marcador, su utilidad no radica únicamente en la capacidad de predecir eventos, sino en si aporta información capaz de modificar la estimación del riesgo de un paciente de manera clínicamente significativa.¹ En otras palabras, ¿permite tomar mejores decisiones?

Toda evaluación clínica comienza con la estimación de la probabilidad pretest, a partir de antecedentes, factores de riesgo, hallazgos clínicos relevantes y estudios complementarios. Sobre esta base, los pacientes suelen clasificarse en categorías de riesgo bajo, intermedio o alto, que orientan conductas diagnósticas y terapéuticas específicas.² La incorporación de una nueva variable adquiere verdadero valor cuando logra desplazar a un individuo desde una categoría de riesgo hacia otra más apropiada, modificando potencialmente la conducta terapéutica.

Este concepto, conocido como reclasificación del riesgo, ha cobrado creciente relevancia en la evaluación de nuevos biomarcadores y modelos predictivos.³ En los últimos años, numerosos estudios han demostrado que mejoras aparentemente modestas en las medidas tradicionales de discriminación no siempre se traducen en cambios clínicamente relevantes. Como consecuencia, han surgido herramientas metodológicas destinadas a evaluar no solo la capacidad predictiva de un modelo, sino también su impacto sobre la clasificación de los pacientes y, en última instancia, sobre la toma de decisiones.

El objetivo de esta revisión es describir los fundamentos de la reclasificación del riesgo, analizar sus principales métricas y discutir su relevancia para la evaluación crítica de nuevas herramientas diagnósticas y pronósticas.

¿Cómo evaluamos un modelo predictivo?

Tradicionalmente, el rendimiento de un modelo predictivo se ha evaluado mediante su capacidad de discriminación, es decir, su habilidad para diferenciar correctamente a los pacientes que presentarán un evento de aquellos que no lo harán.

La herramienta más utilizada para este propósito es la curva ROC (Receiver Operating Characteristic), que representa la relación entre sensibilidad y especificidad para distintos puntos de corte de una determinada prueba diagnóstica. El área bajo la curva (AUC) resume esta capacidad discriminativa en un único valor, donde 0,5 representa una discriminación equivalente al azar y 1,0 una discriminación perfecta. En términos generales, cuanto mayor es el AUC, mejor es la capacidad del modelo para distinguir entre pacientes con y sin eventos.^4,5

La curva ROC permite visualizar cómo varía el rendimiento diagnóstico al modificar el punto de corte de una prueba. Cada punto de la curva representa un valor umbral con un equilibrio diferente entre sensibilidad y especificidad. Uno de los métodos más utilizados para seleccionar un punto de corte es el índice de Youden, que identifica el valor que maximiza simultáneamente ambas medidas (sensibilidad y especificidad). Sin embargo, el punto de corte estadísticamente óptimo no siempre coincide con el más adecuado desde una perspectiva clínica. En la práctica, la elección del umbral dependerá del contexto clínico y de las consecuencias que puedan tener los errores diagnósticos. Así, en algunas situaciones se prioriza la sensibilidad para minimizar falsos negativos, como ocurre en las pruebas utilizadas como estrategia de tamizaje de enfermedades potencialmente graves, mientras que en otras es preferible maximizar la especificidad para evitar falsos positivos e intervenciones innecesarias, particularmente cuando el objetivo es confirmar un diagnóstico antes de indicar un tratamiento específico.

Por este motivo, la comparación de áreas bajo la curva se ha convertido en una práctica habitual para evaluar nuevos biomarcadores o modelos pronósticos. Sin embargo, aunque la discriminación es una propiedad importante, no necesariamente refleja el impacto clínico de una nueva variable. En muchos casos, la incorporación de un biomarcador puede generar mejoras mínimas en el AUC y, aun así, modificar de manera significativa la clasificación del riesgo de determinados pacientes, o viceversa. Esta limitación impulsó el desarrollo de nuevas herramientas destinadas a evaluar el valor incremental de una prueba más allá de la discriminación tradicional.

Concepto de reclasificación

Como se mencionó, aunque las medidas de discriminación son útiles para evaluar la capacidad predictiva de un modelo, no siempre reflejan su impacto sobre la toma de decisiones. En la práctica clínica, las decisiones rara vez se basan en probabilidades exactas; por el contrario, los pacientes suelen agruparse en categorías de riesgo que orientan conductas diagnósticas y terapéuticas específicas.

Desde esta perspectiva, una mejora en la capacidad discriminativa de un modelo no necesariamente implica un beneficio clínico. Un biomarcador puede aumentar marginalmente el AUC sin modificar la clasificación de ningún paciente. Por el contrario, una variación aparentemente modesta en los parámetros tradicionales puede traducirse en una reclasificación significativa de individuos ubicados cerca de los puntos de corte clínicamente relevantes.

El concepto de reclasificación surge precisamente para responder a esta necesidad. Su objetivo es evaluar si la incorporación de una nueva variable permite asignar a los pacientes a categorías de riesgo más apropiadas, acercando la predicción estadística a la toma de decisiones clínicas.⁶

¿Cómo evaluamos la reclasificación?

En 2008 Pencina y col. introdujeron una nueva medida denominada índice de reclasificación neta (NRI).⁷ Este fue desarrollado para evaluar si un nuevo marcador proporciona una mejora clínicamente relevante en la predicción de eventos. Su fundamento es sencillo: un nuevo marcador útil desde el punto de vista clínico debería incrementar el riesgo estimado de los pacientes que efectivamente presentarán el evento y reducirlo en aquellos que permanecerán libres de él, favoreciendo así una reclasificación más adecuada del riesgo individual. El objetivo es aumentar tanto la proporción de individuos con evento con reclasificación ascendente (reestratificación a categoría de mayor riesgo al aplicar el modelo nuevo), como la proporción de individuos sin evento con reclasificación descendente (reestratificación a categoría de menor riesgo al aplicar el modelo nuevo).

Para su cálculo, la población se divide en individuos que presentaron el evento de interés y aquellos que permanecieron libres de él durante el seguimiento. En los sujetos con eventos se considera favorable una reclasificación hacia categorías de mayor riesgo, mientras que en aquellos sin eventos se considera favorable una reclasificación hacia categorías de menor riesgo.

El NRI cuantifica el balance neto entre estas reclasificaciones correctas e incorrectas. De esta manera, valores positivos indican que el nuevo modelo mejora la clasificación del riesgo respecto del modelo original, mientras que valores cercanos a cero sugieren una escasa contribución adicional. Cuanto mayor sea el NRI, mayor será la capacidad del nuevo marcador para reclasificar adecuadamente a los individuos. La figura central resume de manera esquemática los principios que sustentan el cálculo del NRI y los distintos escenarios de reclasificación observados tras la incorporación de una nueva variable a un modelo predictivo.

Aplicabilidad y generalización de los modelos predictivos

Un aspecto fundamental a considerar es que si bien la sensibilidad, la especificidad y el AUC son propiedades intrínsecas de una prueba o modelo, su utilidad clínica varía significativamente según la probabilidad pretest de la población en la que se apliquen. Así, una misma prueba puede presentar un elevado valor predictivo positivo en poblaciones de alto riesgo y un rendimiento mucho menor cuando se utiliza en poblaciones de bajo riesgo. De manera inversa, el valor predictivo negativo suele incrementarse a medida que disminuye la prevalencia del evento.

Esta dependencia de la probabilidad pretest tiene implicancias relevantes para la validación de modelos predictivos. En poblaciones con una prevalencia extremadamente baja o elevada de un evento los valores predictivos pueden resultar artificialmente favorables. Por este motivo, la validación de un marcador suele ser particularmente informativa en poblaciones de riesgo intermedio, donde existe una mayor incertidumbre diagnóstica y en las que una herramienta predictiva tiene mayores posibilidades de reclasificar pacientes de manera clínicamente significativa.⁸

Conclusiones

La evaluación de nuevas herramientas diagnósticas y pronósticas no debería limitarse exclusivamente a las medidas tradicionales de discriminación. Si bien la curva ROC y el AUC continúan siendo herramientas fundamentales para valorar el rendimiento de un modelo, su capacidad para reflejar el impacto clínico de una nueva variable es limitada. La reclasificación del riesgo aporta una perspectiva complementaria al evaluar si la información adicional modifica de manera apropiada la estimación de riesgo individual y, potencialmente, la conducta médica.

Este concepto adquiere especial relevancia en poblaciones de riesgo intermedio, donde la incertidumbre diagnóstica es mayor y donde una nueva herramienta tiene mayores posibilidades de modificar la estimación de riesgo y cambiar una conducta clínica. En este contexto, la capacidad de reclasificar correctamente a los pacientes puede resultar más valiosa que pequeñas mejoras en las medidas tradicionales de discriminación.

Finalmente, el objetivo no es solamente predecir mejor, sino clasificar mejor a los pacientes para tomar decisiones más adecuadas.

Figura central. Se resumen de manera esquemática los principios que sustentan el cálculo del índice de reclasificación neta (NRI) y los distintos escenarios de reclasificación observados tras la incorporación de una nueva variable a un modelo predictivo

Propiedad intelectual. Los autores declaran que los datos y la figura presentes en el manuscrito son originales y se realizaron en sus instituciones pertenecientes.

Financiamiento. Los autores declaran que no hubo fuentes de financiación externas.

Conflictos de interés. Los autores declaran no tener conflictos de interés en relación con este artículo.

Aviso de derechos de autor

© 2026 Acta Gastroenterológica Latinoamericana. Este es un artículo de acceso abierto publicado bajo los términos de la Licencia Creative Commons Attribution (CC BY-NC-SA 4.0), la cual permite el uso, la distribución y la reproducción de forma no comercial, siempre que se cite al autor y la fuente original.

Cite este artículo como: Decotto S, Miceli A y Pizarro R. Del pretest a la decisión clínica: el valor de la reclasificación del riesgo. Acta Gastroenterol Latinoam. 2026;56(2):127-130. https://doi.org/10.52787/agl.v56i2.664

Referencias

Cook NR. Use and misuse of the receiver operating characteristic curve in risk prediction. Circulation 2007;115(7):928-35.
Pauker SG, Kassirer JP. The threshold approach to clinical decision making. N Engl J Med 1980;302(20):1109-17.
Hlatky MA, Greenland P, Arnett DK, et al. Criteria for evaluation of novel markers of cardiovascular risk: a scientific statement from the American Heart Association. Circulation 2009;119(17):2408-16.
Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic (ROC) curve. Radiology 1982;143(1):29-36.
Zweig MH, Campbell G. Receiver-operating characteristic (ROC) plots: a fundamental evaluation tool in clinical medicine. Clin Chem 1993;39(4):561-77.
Kerr KF, Wang Z, Janes H, McClelland RL, Psaty BM, Pepe MS. Net reclassification indices for evaluating risk prediction instruments: a critical review. Epidemiology 2014;25(1):114-21.
Pencina MJ, D’Agostino RB Sr, D’Agostino RB Jr, Vasan RS. Evaluating the added predictive ability of a new marker: from area under the ROC curve to reclassification and beyond. Stat Med 2008;27(2):157-72; discussion 207-12.
Greenland P, Alpert JS, Beller GA, et al. 2010 ACCF/AHA guideline for assessment of cardiovascular risk in asymptomatic adults: a report of the American College of Cardiology Foundation/American Heart Association Task Force on Practice Guidelines. J Am Coll Cardiol 2010;56(25):e50-103.

Correspondencia: Santiago Decotto
Correo electrónico: santiago.decotto@hospitalitaliano.org.ar

Acta Gastroenterol Latinoam 2026;56(2):127-130