Daniel Cisternas ID
Gastroenterología, Clínica Alemana de Santiago de Chile.
Santiago, Chile.
Acta Gastroenterol Latinoam 2022;52(2):128-134
Recibido: 16/05/2022 / Aceptado:
17/06/2022 / Publicado online el 27/06/2022 / https://doi.org/10.52787/agl.v52i2.215
La enfermedad por reflujo gastroesofágico (ERGE) es muy frecuente en la población, con tasas de prevalencia reportadas de entre 10 y 30%, tanto en Latinoamérica1 como en el resto del mundo.2 Esto, sumado a que el diagnóstico suele requerir estudios costosos y que el manejo implica tratamientos médicos prolongados o cirugía, hacen que la ERGE resulte una enorme carga económica para los países.3 Por otro lado, impacta significativamente en la calidad de vida, habiéndose reportado peor calidad de vida que en casos de enfermedades como la angina de pecho o la insuficiencia cardíaca.4 En este contexto, un abordaje diagnóstico y terapéutico costo-efectivo es imprescindible, en especial en los países subdesarrollados.
Los avances tecnológicos de los últimos años han dado lugar a nuevos métodos diagnósticos y nuevas variables para el diagnóstico de la ERGE. Con esto, ha sido necesaria la realización de diversos consensos y la actualización de guías de manejo,5-7 incluido el recientemente desarrollado Consenso Latinoamericano 2022. Entre ellos, se destaca el Consenso de Lyon, que fue publicado en 2018 y es el fruto de años de trabajo de un grupo de connotados expertos mundiales.8 Ha sido tremendamente influyente pues ha redefinido los criterios diagnósticos de la ERGE. Estas definiciones han sido adoptadas, por ejemplo, por el Consenso Latinoamericano y este documento se basa en ellas.
Los criterios diagnósticos corresponden a un conjunto de síntomas, signos o resultados de test de laboratorio o imágenes que permiten separar grupos de individuos entre normales y enfermos, o separar entre subgrupos de pacientes.9 Existen manifestaciones infrecuentes de enfermedades, cuya sola presencia es considerada patológica (el hallazgo de una neoplasia en una biopsia, por ejemplo), en un esquema de SÍ/NO. Por otro lado, existen enfermedades que corresponden a exacerbaciones/disminuciones de un fenómeno fisiológico que ocurre en individuos sanos (por ejemplo, de acuerdo con cierto nivel de hemoglobina en sangre se discrimina entre individuos sanos e individuos con anemia). En estos casos, es necesario establecer un valor de corte en un continuo. Un criterio (habitualmente el primero en ser utilizado) es estadístico: a partir de una muestra de individuos asintomáticos, presuntamente sanos con relación a la enfermedad en cuestión, se determina un percentil (habitualmente percentil 95 o 5) a partir del cual se establece el criterio de enfermedad. Este es un criterio muy limitado, pues es certero para reconocer a los enfermos solo en casos de enfermedades que se presentan exactamente en el 5% de la población. Por ejemplo, el sobrepeso y la obesidad tienen una prevalencia global por sobre el 30%, pues la definición del IMC de corte se deriva del análisis de riesgo de complicaciones crónicas y no en percentil 95.10, 11 En el caso de enfermedades raras, el uso de percentil 95 sobrediagnostica. Otro criterio para determinar el corte es establecer el mejor punto en una curva ROC para la asociación entre la variable y la presencia de los síntomas/manifestaciones más relevantes de la enfermedad o entre la variable y la capacidad de predecir una respuesta adecuada a un tratamiento específico. Este criterio selecciona mucho mejor, pues se independiza de la prevalencia de la enfermedad y es más útil al momento de tomar decisiones terapéuticas en un paciente en particular. En este caso, debe tenerse en cuenta que el punto óptimo en la curva ROC corresponde al mejor equilibrio entre sensibilidad y especificidad, las que casi nunca son del 100%. Por lo tanto, en el mejor punto, aún es posible que exista un error en la clasificación. Además, tanto a derecha como a izquierda del punto es posible diagnosticar/descartar la enfermedad (Figura 1).
Figura 1. Curva ROC para una situación diagnóstica imaginaria. El
punto A corresponde al mejor valor de corte, pero ni su sensibilidad ni su especificidad son perfectas,
por lo que es posible cometer un error diagnóstico al utilizarlo. Por otro lado, con valores de corte en
relación con el punto B y C, tampoco es posible descartar ni afirmar siempre con certeza la presencia o
ausencia de la enfermedad.
En el caso del uso de un valor de corte único en un continuo, debe considerarse también la variabilidad de los resultados del test. A más variable es un test, el uso de un corte único se hace menos recomendable, pues la posibilidad de reclasificar al individuo como sano/enfermo al repetir el test es máxima alrededor del valor de corte (Figura 2).
Figura 2. Ejemplo de que el uso de un valor de corte único genera
una máxima posibilidad de reclasificación de un individuo al repetir el test. En este caso, la máxima
posibilidad de reclasificación de una pH-metría ocurre si se usa el valor de corte para TEA de 4,9%.
Esta posibilidad es del 50%. Adaptado de Weiner y col.34
Finalmente, se presenta el problema del uso de múltiples pruebas o variables para diagnosticar una misma enfermedad. Por ejemplo, a partir de un estudio de pH-impedanciometría (PIM), es posible extraer más de cuarenta variables. La mayoría de ellas está definida por percentil 95, de modo que existe un 5% de posibilidades de que un individuo cualquiera tenga alterada alguna de ellas. Con esto, la enorme mayoría de los individuos, incluidos los sanos, tendrá alterada alguna de las cuarenta variables. Por lo tanto, en el escenario de múltiples test/variables, es necesario escoger cuál de ellas está asociada de manera independiente a la enfermedad; esto es, las variables que determinan enfermedad aun cuando el resto de las variables son negativas. Esta determinación requiere estudios de regresión logística para determinar predictores independientes de un estándar de oro, por ejemplo, el resultado de una imagen, una biopsia o la predicción de respuesta a un tratamiento específico (Figura 3).
Figura 3. A. Ejemplo de múltiples variables
asociadas aisladamente a un resultado en particular (análisis univariado). B. Al
realizar una regresión logística (análisis multivariado), se determina que solo una de las variables
está asociada de manera independiente al resultado.
En primer lugar, el reflujo gastroesofágico es un fenómeno fisiológico: los individuos sanos presentan hasta 50-70 eventos de reflujo y tienen hasta un 4% de tiempo de exposición ácida (TEA) en su esófago durante 24 horas.12, 13 A pesar de un gran número de eventos de reflujo ocurridos, suele considerarse patológica la presencia de solo dos eventos de pirosis o regurgitación a la semana.14, 15 Esto implica que un porcentaje muy bajo de los eventos de reflujo son percibidos en situaciones normales. Además, implica que la existencia de síntomas frecuentes puede deberse no solo a un aumento de eventos de reflujo, sino también a un aumento del porcentaje de eventos percibidos. Este último punto puede deberse a ciertas características del material refluido, como su acidez y extensión proximal,16, 17 pero también al grado de sensibilidad de los receptores esofágicos. El flujo de información aferente desde el esófago hasta la corteza cerebral ocurre a través de diversas neuronas, cada una de ellas susceptible de ser modulada.18, 19 La determinación del grado de sensibilización en un individuo dado es difícil y, generalmente, no está disponible en la práctica clínica habitual. Dado esto, la separación entre patologías “orgánicas” y “funcionales” es arbitraria.
Además, la ERGE se ha asociado a un gran número de síntomas, tanto esofágicos como extraesofágicos.20 Esto genera múltiples escenarios de probabilidades pretest, dificultando la interpretación de los resultados de los estudios diagnósticos.
Finalmente, debe destacarse que existen múltiples métodos diagnósticos para la ERGE, pero ninguno con una sensibilidad y especificidad perfectas.21
Se ha definido la ERGE como la condición caracterizada por síntomas típicos debidos a reflujo gastroesofágico o a la presencia de daño mucoso; esto es, presencia de esofagitis erosiva (EE) significativa, estenosis péptica y/o esófago de Barrett.7, 20
En primer lugar, debe destacarse que la sola presencia de síntomas típicos no permite el diagnóstico de la ERGE si no se ha demostrado su asociación con regurgitación de contenido gástrico. La pirosis y la regurgitación presentan un pobre comportamiento diagnóstico, habiéndose reportado una sensibilidad del 30-76% y una especificidad del 62-96%.22 El uso de scores estandarizados de síntomas no parece mejorar el rendimiento diagnóstico de los síntomas aislados.23 Por esto, todas las guías de manejo actuales desaconsejan el uso diagnóstico de los síntomas en forma aislada.5, 7 Si bien se utiliza frecuentemente en la práctica clínica, el tratamiento empírico con inhibidores de bomba de protones (IBP) como test diagnóstico es también subóptimo, dado que se ha reportado una sensibilidad del 78% y una especificidad de solo el 54%.22 Por lo tanto, se requiere una demostración objetiva de una carga de reflujo aumentada en el contexto de síntomas para establecer la asociación causal. Para este objetivo, se considera la PIM o la evaluación de pH-metría (PM) inalámbrica como los patrones de oro.7, 24
Por otro lado, la presencia de EE relevante y/o esófago de Barrett se considera específica de la ERGE, dado que su sola presencia permite establecer el diagnóstico. Sin embargo, su rendimiento diagnóstico es subóptimo, pues tienen sensibilidades entre el 30% y 10%, respectivamente.25-27 Estos valores son aún peores en el contexto de endoscopías hechas de forma concomitante al uso de IBP.26 En relación con la interpretación de la EE, el Consenso de Lyon ha sugerido un cambio importante: usando la Clasificación de Los Ángeles,28 se ha propuesto que los grados más leves (A y B) no son lo suficientemente específicos para diagnosticar la ERGE.8 En primer lugar, porque se los ha descrito en un 5-7,5% de la población sana asintomática.29, 30 Por otra parte, los grados leves de EE presentan muy bajos valores de acuerdo interobservador.31, 32 Finalmente, se ha descrito que, sin tratamiento, solo un 1-6% de las esofagitis A/B progresará a esofagitis C/D, mientras que un 20-60% evolucionará a ausencia de EE.33 Debe notarse que toda esta evidencia proviene de estudios en los cuales se clasifica la EE como leve si es A o B. Es posible que el comportamiento diagnóstico de la EE B de LA sea aceptable, pero aún no existen datos que lo demuestren. En el intertanto, los expertos hacen sugerencias sobre su abordaje: el consenso de Lyon menciona como aceptable el uso de tratamiento médico en pacientes con esofagitis B-LA, pero no el uso de cirugía antirreflujo, en cuyo caso se requiere certificación de la ERGE mediante PM o PIM.8 Las guías de manejo del Colegio Americano de Gastroenterología 2022 sugieren que la esofagitis B-LA puede ser diagnóstica de la ERGE en el contexto de síntomas típicos que responden a tratamiento médico.7
A diferencia de los métodos diagnósticos ya mencionados, la PM y la PIM presentan altos niveles de sensibilidad y especificidad, siendo consideradas como el patrón de oro. Dentro de las múltiples variables extraíbles a partir de estas pruebas, el tiempo de exposición ácida (TEA) es la de mayor importancia. En primer lugar, porque es una variable sobre la cual existe evidencia acumulada durante más de treinta años, y se ha demostrado que es la de mayor reproducibilidad entre las variables de la PM.34 Además, se ha demostrado consistentemente que predice respuesta a tratamiento médico35-37 y quirúrgico.38-40 Más importante, en estudios de regresión logística, se ha demostrado que es un predictor de respuesta a tratamiento, independientemente del resultado de las otras múltiples variables utilizables para diagnosticar la ERGE.36, 39, 40 Con todo esto, el TEA es la variable recomendada para definir la ERGE.41
Con relación al TEA, el Consenso de Lyon ha sugerido un gran cambio en su interpretación: se desaconseja el uso de un valor de corte único (habitualmente un valor entre 4,2-4,6%) para separar sanos de enfermos. Se sugiere el uso de un espectro entre TEA de 4% y 6%, sobre el que se diagnostica y por debajo del que se descarta la ERGE. Dentro del espectro de esta área gris, se sugiere el uso de otras variables para hacer el diagnóstico de la ERGE más o menos probable.8 Esto debido a dos principales razones: en primer lugar, existe evidencia de estudios poblacionales de que el percentil 95 de TEA en sanos estaría más bien en el rango de 5,0-6,0%.42, 43 Pero, lo más relevante tiene que ver con la variabilidad intraindividual del TEA, habiendo demostrado ser subóptima en estudios en los que se repetía la medición en sanos.44 En el contexto de variables con una alta variabilidad, el uso de un corte único conlleva el máximo riesgo de reclasificar el individuo como normal o anormal si repite la medición. Por ejemplo, Wiener y cols. estudiaron a 53 individuos con 2 PM separadas por diez días. Los individuos que tenían un TEA entre 3,0% y 7,0% tenían la máxima probabilidad de ser reclasificados en el segundo estudio (entre 30% y 50%)34 (Figura 2). La existencia de esta “área gris” ha tenido un enorme impacto en la práctica clínica y en el desarrollo de guías clínicas, pues no permite el uso de la enorme mayoría de la evidencia previa basada en un corte único de TEA de alrededor del 4,0%, generando además un subgrupo específico de pacientes, de incerteza respecto de la ERGE, que requieren ser estudiados de manera dirigida en investigaciones futuras.
Existen numerosas variables posibles de derivar de estos estudios, incluyendo el número total de eventos de reflujo, el número de reflujos débilmente ácidos, el tiempo de exposición de material refluido, el número y porcentaje de reflujos con extensión proximal, etc. Todas estas variables covarían; esto es, todas ellas se elevan en un individuo con ERGE. Como se ha mencionado, la elección de las variables que permiten diagnosticar la ERGE independientemente del resultado del resto de las variables requiere la realización de regresiones logísticas. En estos estudios, se ha demostrado de manera reiterada que el TEA es un determinante independiente. El número total de eventos de reflujo no ha logrado demostrar ser un predictor independiente.36, 39, 40 Por lo tanto, se ha desaconsejado su uso aislado para diagnosticar la ERGE,41 reservando su uso como adyuvante en casos en que el TAE se encuentre en la zona gris.8 La impedancia basal mucosa nocturna (IBMN) es una variable recientemente descrita, que ha demostrado correlacionarse con respuesta a tratamiento médico45, 46 y quirúrgico,45 incluyendo estudios en pacientes con TEA intermedios, entre el 4 y 6%.45, 47 Sin embargo, existen dudas sobre su especificidad.45, 46 Finalmente, se ha demostrado que, si se incluye el TEA en el modelo, la IBMN no es un predictor independiente de respuesta a tratamiento.46, 48 Con todo esto, el Consenso de Lyon sugiere el uso de la IBMN solo como adyuvante en el contexto de TEA intermedios.8 Debe consignarse que ninguna de las otras variables derivadas de la PM o PIM, incluidos el score de De Meester, el tiempo de exposición del contenido refluido o la extensión proximal, son recomendadas para el diagnóstico de la ERGE.
Debe consignarse, también, que ninguno de los otros métodos diagnósticos para la ERGE, incluidos los estudios baritados, los hallazgos en la nasofibroscopía, el análisis de pepsina, etc., presenta un perfil de certeza suficiente para ser confiables en el diagnóstico de la ERGE.
La Tabla 1 resume la recomendación actual para diagnóstico de la ERGE, tras las recomendaciones del Consenso de Lyon.
Tabla 1. Recomendación actual sobre la interpretación de los
resultados de los test sugeridos para el diagnóstico de la ERGE. La esofagitis se clasifica según la
clasificación de Chicago.*En casos de resultados no concluyentes, el Consenso de Lyon recomienda el uso
del número total de eventos de reflujo y la impedancia basal mucosa nocturna como apoyo
diagnóstico.8
La recomendación actual para el diagnóstico de la ERGE sigue basándose en el uso de TEA y el hallazgo de EE relevante (Tabla 1). La evidencia respecto de la variabilidad del TEA y la menor especificidad de la EE leve ha hecho que se sugieran cambios en la forma de interpretación de estas variables, utilizando un rango de TEA del 4-6% y requiriendo la presencia de esofagitis C/D de Los Ángeles. Ninguno de los otros hallazgos endoscópicos ni de la PM/PIM son suficientes por sí solos para diagnosticar o descartar la ERGE, debiendo considerarse solo el número de eventos de reflujo y la IBMN como adyuvantes en el caso de TEA en el rango intermedio. No deberían utilizarse otros test para el diagnóstico de certeza de la ERGE. Finalmente, debe consignarse que el grado de certeza diagnóstica útil en la práctica clínica puede ser menor en el caso de tratamientos de bajo riesgo, como el uso de IBP.
Propiedad intelectual. El autor declara que los datos, las tablas y las figuras presentes en el manuscrito son veraces. Asimismo, se solicitó autorización y se le dio reconocimiento al autor original de la Figura 2.
Financiamiento. Los autores declaran que no hubo fuentes de financiación externas.
Conflicto de interés. Los autores declaran no tener conflictos de interés en relación con este artículo.
Aviso de derechos de autor
© 2022 Acta Gastroenterológica Latinoamericana. Este es un artículo de acceso abierto publicado bajo los términos de la Licencia Creative Commons Attribution (CC BY-NC-SA 4.0), la cual permite el uso, la distribución y la reproducción de forma no comercial, siempre que se cite al autor y la fuente original.
Cite este artículo como: Cisternas D. Diagnosticando la enfermedad por reflujo gastroesofágico en 2022: los cómo y los por qué. Acta Gastroenterol Latinoam. 2022;52(2):128-134. https://doi.org/10.52787/agl.v52i2.215
Correspondencia: Daniel Cisternas
Correo electrónico: dcisternasc@alemana.cl
Acta Gastroenterol Latinoam 2022;52(2):128-134