Jorge Baquerizo -Burgos ID· María Egas-Izquierdo ID· Doménica Cunto ID· Carlos Robles-Medranda ID
Departamento de Endoscopia, Instituto Ecuatoriano de Enfermedades Digestivas (IECED), Guayaquil, Ecuador.
Acta Gastroenterol Latinoam 2023;53(3):211-225
Recibido: 09/08/2023 / Aceptado: 14/09/2023 / Publicado online el 30/09/2023 / https://doi.org/10.52787/agl.v53i3.339
La inteligencia artificial es un campo de la ciencia y la ingeniería que se ocupa de la comprensión computacional de comportamientos inteligentes y la creación de artefactos que exhiben tales comportamientos, lo que permite a las computadoras funcionar y pensar de manera similar a la de los seres humanos. Esta tecnología ayuda a superar los múltiples retos que enfrentan los profesionales de la salud y aporta al diagnóstico, al manejo y al pronóstico de los pacientes. Actualmente se están desarrollando varios modelos para la endoscopia digestiva, incluyendo algunos que permiten la detección de estructuras anatómicas que pueden ayudar en el entrenamiento de los médicos, servir como guía durante los procedimientos endoscópicos o para la estratificación de lesiones premalignas y malignas. De esta forma disminuirían los falsos negativos y se proporcionarían más tratamientos oportunos. En la actualidad existen sistemas computarizados de detección de lesiones y de diagnóstico en los distintos segmentos de la vía digestiva, cada uno con funciones particulares que proporcionan asistencia durante los procedimientos. Todo esto se ha llevado a cabo con el fin de reducir los riesgos derivados de los factores humanos y ambientales, entre otros, los cuales pueden afectar el diagnóstico y el manejo de las enfermedades. Los modelos de inteligencia artificial en la endoscopia digestiva pueden, además de mejorar la impresión visual de los endoscopistas, disminuir la curva de aprendizaje a través de la aplicación de tecnologías precisas. De esta manera, se reduce la diferencia entre los endoscopistas expertos y menos expertos. En este artículo se discuten los avances tecnológicos de la inteligencia artificial en la endoscopia digestiva y los aspectos futuros relacionados.
Palabras claves. Inteligencia artificial, detección asistida por computadora, diagnóstico asistido por computadora, aprendizaje profundo, endoscopia.
Artificial intelligence is a field of science and engineering that focuses on the computational understanding of intelligent behaviors and the creation of artifacts that exhibit such behaviors, enabling computers to function and think similarly to humans. This technology assists in overcoming the various challenges that healthcare professionals face, contributing to the diagnosis, management, and prognosis of patients. Currently, several artificial intelligence models have been developed in the field of digestive endoscopy, including some that enable the detection of anatomical structures that can aid in the training of medical professionals, serve as guides during endoscopic procedures, or assist in stratifying pre-malignant and malignant lesions. This reduces false negatives, providing timely treatments. Computerized lesion detection and diagnostic system exist for different segments of the digestive tract, each with specific functions that provide assistance during procedures. All of this has been done with the aim of reducing risks stemming from human and environmental factors, among others, which can affect early diagnosis and management of diseases. Artificial intelligence models for digestive endoscopy can not only enhance the visual impression for endoscopists but also reduce the learning curve through the application of precise technologies, thus bridging the gap between experienced and less experienced endoscopists. This article discusses the technological advancements of artificial intelligence in digestive endoscopy and related future aspects.
Keywords. Artificial intelligence, Computer-assisted detection, computer-assisted diagnosis, deep learning, endoscopy.
Abreviaturas
IA: Inteligencia artificial.
ML: Machine learning
(aprendizaje de máquinas).
DL: Deep learning (aprendizaje
profundo).
CADe: Computer-assisted detection device (dispositivo de detección
asistida por computadora).
CADx: Computer-assisted diagnostic device
(dispositivo de diagnóstico asistido por computadora).
EUS: Endoscopic
ultrasound (ultrasonido endoscópico).
EGD:
Esofagogastroduodenoscopia.
AUC: Area under the curve (área bajo la
curva).
EB: Esófago de Barrett.
NBI: Narrow Band
Imaging (imágenes de banda estrecha).
ERGE: Enfermedad por reflujo
gastroesofágico.
SVM: Support Vector Machine (máquinas de
vector en soporte).
CNN: Convolutional Neural Network (red neuronal
convolucional).
CCR: Cáncer colorrectal.
RR:
Riesgo relativo.
PDR: Polyp Detection Rate (tasa de detección de
pólipos).
CPRE: Colangiopancreatografía endoscópica
retrógrada.
VPP: Valor predictivo positivo.
VPN:
Valor predictivo negativo.
mAP: Mean Average Precision (media de
precisión).
FPS: Frames per Second (fotogramas por
segundo).
NPMI: Neoplasia papilar mucinosa
intraductal.
GIST: Gastrointestinal Stromal Tumors (tumores del estroma
gastrointestinal).
Inteligencia artificial: conceptos básicos
La inteligencia artificial (IA) es una rama de las ciencias de la computación cuyo ejecución de comprensiones inteligentes a partir de un conjunto de modelos.1 Usando un conjunto de algoritmos, la IA es capaz de funcionar y pensar como un ser humano mediante un proceso de aprendizaje basado en el entrenamiento y tiene como ventaja el poder completarlo en menor tiempo que el ser humano.1 Adicionalmente, esta tecnología puede integrar el aprendizaje de máquinas (machine learning, ML) y una rama de éste, el aprendizaje profundo (deep learning, DL).2
El ML es un subgrupo de la IA que se caracteriza por la utilización de modelos matemáticos para el aprendizaje de datos que posteriormente permitirán el reconocimiento de patrones.3 A partir de los algoritmos se crean modelos predictivos que permiten el análisis de datos y la resolución de problemas complejos. Asimismo, el ML puede ser supervisado, no supervisado y de reforzamiento:2,4,5
• El aprendizaje supervisado está basado en el entrenamiento a partir de datos bien categorizados o etiquetados (supervisión externa). Los datos etiquetados son divididos para el entrenamiento y la validación interna. Este tipo de aprendizaje está basado en la regresión, la clasificación y la caracterización.2,3
• El aprendizaje no supervisado o automatizado es el modelo que aprende de datos no categorizados y que permite al algoritmo actuar sin ningún tipo de guía, basándose en el entendimiento de patrones y, por ende, requiriendo mayor cantidad de información.2,3
• El aprendizaje de reforzamiento no requiere datos ni supervisión para alimentarse sino que está basado en el aprendizaje del entorno a partir de recompensas.2,3
El DL es una categoría especial del ML, el cual está basado en la arquitectura de redes neuronales análogas a las del cerebro humano.3 Consiste en una capa inicial que recibe una entrada o input; a esta capa la sigue un conjunto de capas medias ocultas o hidden layers y, a continuación, la capa final de salida u output (Figura 1). Cada capa de esta red consiste en un grupo de neuronas o nodos que convierten (activación) un input en output a partir de funciones matemáticas.2 El output de una capa anterior sirve de input para la capa siguiente, y así sucesivamente, hasta llegar a la capa de salida y obtener un resultado o detección.2,3
Figura 1. Representación esquemática de la arquitectura de los modelos de redes
neuronales convolucionales
El desarrollo del modelo de detección basado en DL incluye tres fases principales. En la primera fase, se realiza la recolección de datos (imágenes o videos) y se etiquetan adecuadamente las estructuras que se utilizarán en el aprendizaje del modelo. Luego, en la segunda fase, se establece la arquitectura del modelo y se crean las redes neuronales (capa de entrada, capas medias y capa de salida). Finalmente, en la tercera fase, se utilizan las muestras obtenidas en las fases anteriores para realizar el entrenamiento del modelo y su subsecuente validación interna (Figura 2).1 De esta última fase se obtienen las métricas para la evaluación del rendimiento del modelo (Tabla 1).
Figura 2. Fases de desarrollo de modelos de aprendizaje profundo
Tabla 1. Métricas obtenidas para evaluación del rendimiento de los modelos de
aprendizaje profundo
Aplicaciones clínicas de la inteligencia artificial
Las aplicaciones clínicas de la IA han aumentado progresivamente en el área de la salud, incluida la gastroenterología. La IA ayuda a superar los múltiples retos que enfrentan los profesionales de la salud durante la adquisición, el análisis y la aplicación de conocimientos que aportan al diagnóstico, al manejo y al pronóstico de los pacientes.1 Además, la automatización en la identificación y el reconocimiento de imágenes ayudan a la reducción de errores derivados de factores humanos (fatiga, carga laboral, entre otros).
El avance tecnológico ha permitido la realización de sistemas inteligentes que facilitan la detección o la estratificación de lesiones observadas durante procedimientos endoscópicos o imagenológicos. Estos se denominan dispositivos de detección asistida por computadora (Computer-assisted detection device, CADe) o de diagnóstico asistido por computadora (Computer-assisted diagnostic device, CADx).6 De esta manera, la aplicación de estos dispositivos en la endoscopia digestiva puede facilitar y aumentar la detección de lesiones durante los procedimientos y categorizar lesiones en benignas y malignas en tiempo real.
Inteligencia artificial en la endoscopia digestiva
Actualmente se están desarrollando varios modelos para la endoscopia digestiva alta y baja, y para procedimientos endoscópicos avanzados (colangioscopia y ultrasonido endoscópico, EUS) (Tabla 2). Estos modelos incluyen CADe y CADx con algoritmos característicos que permiten distintas funcionalidades como detectar estructuras anatómicas y lesiones específicas, ayudar en el entrenamiento de los médicos, servir como guía durante los procedimientos endoscópicos, reducir el número de falsos negativos por medio de la caracterización y la estratificación de lesiones premalignas y malignas, entre otras.4
En los siguientes apartados se revisará información actualizada sobre los usos de la IA y su repercusión de acuerdo con el tipo de evaluación endoscópica.
Tabla 2. Aplicaciones de la inteligencia artificial en los distintos segmentos de la
vía digestiva
Endoscopia digestiva alta
También conocida como esofagogastroduodenoscopia (EGD), es un procedimiento de gran importancia en el diagnóstico de las lesiones del tracto gastrointestinal superior.7,8 Sin embargo, la tasa de diagnóstico varía según el desempeño de cada endoscopista.9 Los errores durante la realización de la EGD son una de las principales causas en el fallo del diagnóstico de lesiones premalignas y de enfermedades esofagogastroduodenales severas. Los sistemas de IA han sido desarrollados para sobrepasar las barreras técnicas antes descritas. Su aplicación en el tracto digestivo superior va desde la localización anatómica hasta la detección y la evaluación de lesiones malignas y premalignas.7-10
Takiyama et al. desarrollaron un modelo de IA capaz de clasificar las estructuras anatómicas del tracto digestivo superior, el cual ha mostrado un buen desempeño durante la identificación de la laringe (AUC 1,00), el esófago (AUC 1,00), el estómago (superior, medio e inferior) y el duodeno (AUC 0,99).7
Por otro lado, en el estudio multicéntrico realizado por Luo et al. se evalúo la precisión diagnóstica del modelo GRADIS para la detección de neoplasias del tubo digestivo superior (esófago y estómago). Este modelo alcanzó una precisión diagnóstica del 95,5% (IC 95%: 95,2 - 95,7) durante la validación interna. Al comparar su desempeño con el de los endoscopistas que tenían diferentes niveles de experiencia, la sensibilidad fue similar a la de los expertos (94,2% versus 94,5%) y mayor al compararla con los endoscopistas competentes (94,2% versus 85,8%) y los endoscopistas en entrenamiento (94,2% versus 72,2%).11 Adicionalmente, la precisión diagnóstica de los expertos (92,8%) al usar el modelo de IA fue similar al grupo de endoscopistas competentes (93,4%) y endoscopistas en entrenamiento (90,4%).11 Esto demuestra que la aplicación de IA disminuye la brecha entre expertos y no expertos.11
Esófago
La precisión en el diagnóstico temprano del esófago de Barrett (EB) y de la neoplasia esofágica continúa siendo un reto incluso para muchos endoscopistas experimentados. Una vez identificado el EB, es necesaria la identificación de las regiones con displasia o adenocarcinoma temprano.
Los modelos de IA han sido designados con el fin de ayudar a los endoscopistas a mejorar la precisión en el diagnóstico de las lesiones mencionadas,12 e incluyen sistemas para la clasificación de las neoplasias que aplican la magnificación en vivo con alta precisión (89,9%). Esto ha permitido el diagnóstico y la diferenciación tempranos de neoplasia en el EB.13,14
El CADx desarrollado y validado por De Groof et al. permitió la clasificación de imágenes neoplásicas y no neoplásicas en el EB comparándola con el desempeño de 53 endoscopistas. El modelo superó el desempeño de los endoscopistas y obtuvo mayor precisión (88% versus 73%), sensibilidad (93% versus 72%) y especificidad (83% versus 74%).15
Por otro lado, debido a la gran importancia en el reconocimiento y el tratamiento oportuno del carcinoma de esófago, los investigadores han desarrollado sistemas que permiten la detección de las lesiones, así como también la invasión de la enfermedad.12,16,17 El carcinoma esofágico suele ser detectado en estadios tardíos, y las lesiones pequeñas suelen ser detectadas por endoscopistas muy experimentados.12 La IA permite la detección de lesiones menores de 10 mm con una gran precisión (91,4%), incluso mayor que muchos endoscopistas denominados expertos (> 15 años; 88,8%), con moderada experiencia (5 - 15 años; 81,6%), y baja experiencia (< 5 años; 77,2 %).16
La determinación de la profundidad de la lesión permite la selección del tratamiento
(quirúrgico, endoscópico, farmacológico) y la determinación del pronóstico.17 Uno de los modelos
con gran exactitud diagnóstica en la predicción de la profundidad de la invasión del carcinoma escamoso del
esófago es el propuesto por Tokai et al.
Los investigadores utilizaron 1751 imágenes para el
entrenamiento y 291 para la validación; se obtuvo una sensibilidad del 84,1% y una exactitud diagnóstica del
80,9% en la estimación de la profundidad de la invasión del carcinoma. A su vez, al comparar el modelo con
trece endoscopistas éste obtuvo mayor exactitud diagnóstica y mayor AUC.17
Estómago
El cáncer de estómago suele presentar síntomas inespecíficos durante sus estadios tempranos; debido a esto los pacientes suelen ser diagnosticados en estadios avanzados. El pronóstico del cáncer de estómago depende de la valoración de la profundidad y de la detección temprana de las lesiones. Se ha reportado que la detección temprana del cáncer de estómago puede aumentar la supervivencia a los 5 años a un 90%.18
De acuerdo con Menon et al., la tasa de falsos negativos en el diagnóstico de cáncer de estómago temprano puede alcanzar el 25%.18 Los sistemas de automatización buscan disminuir este porcentaje con modelos que clasifiquen las imágenes del estómago en la EGD para monitorear puntos ciegos con gran precisión,19 modelos que detecten lesiones sugestivas de cáncer de estómago11 y lesiones precancerosas,20 y que además evalúen la profundidad de la invasión.21
La cromoendoscopia es uno de los métodos diagnósticos utilizados para la detección temprana de neoplasia gástrica. Sin embargo, durante una sesión endoscópica se pueden generar múltiples fotogramas de videos (frames) que convierten la revisión de ésta en una labor exhaustiva para los endoscopistas.
Para evitar pérdidas durante la evaluación, Ali et al. desarrollaron un CADx entrenado para clasificar fotogramas normales y patológicos a partir de la textura local y global. Este mostró una sensibilidad, especificidad, precisión y AUC del 91%, 82%, 87% y 0,91%, respectivamente.22 El modelo demostró ser una ayuda diagnóstica durante la detección temprana del cáncer gástrico ya que reduce el tiempo utilizado para la evaluación de la secuencia endoscópica.
El modelo estudiado por Wu et al.19 obtuvo alta precisión, especificidad y sensibilidad (92,5%, 94% y 91%, respectivamente) en la evaluación de no malignidad y superó a los endoscopistas expertos en esta tarea.19 Adicionalmente, durante procedimientos en tiempo real mostró un gran rendimiento en la detección del adenocarcinoma gástrico temprano con monitorización de puntos ciegos. Junto a este, otros modelos de IA han mostrado una gran precisión durante el diagnóstico de la neoplasia gastrointestinal comparable con la de endoscopistas expertos.11,17
Por otro lado, se han desarrollado modelos que además de identificar las lesiones neoplásicas también predicen su profundidad. Nagao et al. entrenaron a un modelo para predecir la invasión en profundidad del cáncer gástrico utilizando imágenes convencionales de luz blanca, imágenes de banda estrecha (Narrow Band Imaging, NBI), e imágenes con contraste índigo carmín.21 El modelo demostró alta precisión basada en los tres sistemas (imágenes de luz blanca 94,5%, NBI 94,3% e índigo carmín 95,5%).21
Zhu et al. (precisión total 89,16%) y Yoon et al. (sensibilidad 81,7%, especificidad 75,4%) han reportado que la precisión diagnóstica de su modelo para evaluar la profundidad de la invasión es comparable con la de otros métodos convencionales. Las ventajas de utilizar estos modelos radican en la evaluación más objetiva de las características macroscópicas de las lesiones, con la disminución del uso de otras técnicas invasivas como el EUS.21,23,24
Además de la identificación de neoplasia, otras aplicaciones incluyen la detección de la enfermedad por reflujo gastroesofágico (ERGE)25 y de gastritis asociada a Helicobacter pylori.26 Modelos desarrollados para la asistencia durante la clasificación de la ERGE con NBI han alcanzado una precisión diagnóstica total del 99,2% para lesiones grado A-B, 100% para lesiones grado C-D y 100% en el grupo control. Por lo tanto, se consideran de gran utilidad para la asistencia durante la detección de lesiones compatibles con ERGE, y aumentan la precisión diagnóstica en endoscopistas en entrenamiento.25
Por otro lado, la red neuronal diseñada para la predicción de Helicobacter pylori en imágenes endoscópicas diagnosticó correctamente el 80% de los casos negativos, el 84% de los casos erradicados y el 48% de los casos positivos. Los autores de este estudio resaltan la utilidad de este modelo en la identificación de pacientes que requieran alguna prueba de confirmación de Helicobacter pylori a partir de los resultados endoscópicos, y recomiendan su uso como asistencia diagnóstica.26
Intestino delgado
La cápsula endoscópica, procedimiento no invasivo, permite la detección y la clasificación de lesiones (sangrado, úlceras y pólipos), la valoración de la motilidad intestinal y la evaluación de la enfermedad celíaca, entre otras patologías que afectan especialmente al intestino delgado. Sin embargo, la evaluación de la gran cantidad de imágenes obtenidas (> 60 000 imágenes) y la dificultad para el manejo direccional de la cápsula (dependiente totalmente de la peristalsis del tubo digestivo) hacen que el estudio sea prolongado (de 45 minutos a 8 horas) y tedioso. Para sobrellevar las dificultades técnicas derivadas de este procedimiento se ha buscado su automatización a partir de la IA.28
Los modelos de IA para cápsula endoscópica han basado su desarrollo en DL. La clasificación y categorización de las imágenes se realiza a partir de máquinas de vector en soporte (SVM, por sus siglas en inglés). Por medio de estos modelos, los datos son separados por hiperplanos de dos o más dimensiones. Luego de utilizar los parámetros de Kernel, se consigue el hiperplano «óptimo» que crea «fronteras» para la categorización de los datos (Figura 3).27,28 Posterior a la categorización se forman los algoritmos de DL que crean así las redes neuronales artificiales.27,29
Figura 3. Máquinas de vector en soporte (SVM) para clasificación de datos
Actualmente, los modelos de IA para cápsula endoscópica incluyen el seguimiento de la cápsula, la detección de pólipos, sangrado, úlceras, y el estudio de patologías propias del intestino delgado como la enfermedad celíaca y la enfermedad de Crohn.26
En general, en el tracto gastrointestinal, los modelos incorporados en la cápsula endoscópica permiten su seguimiento y localización en los distintos segmentos (boca, estómago, intestino delgado y colon), previa anulación de frames con «ruido» (heces, burbujas, entre otros) con una sensibilidad y especificidad > 88%.30 La evaluación de las imágenes de acuerdo con su localización topográfica ahorra tiempo de estudio y aumenta la precisión diagnóstica.30
En el estudio multicéntrico publicado por Ding et al.30 se desarrolló una red neural convolucional (CNN) para la identificación de imágenes normales, inflamación, úlceras, pólipos, linfangiectasias, sangrado, enfermedad vascular, divertículos y parásitos, entre otros. Al comparar los resultados del modelo de los gastroenterólogos participantes, se obtuvo una sensibilidad del 98,9% (IC 95%: 99,7-99,9) versus 74,6% (IC 95%: 73,1-76) en la identificación de anormalidades por paciente y una sensibilidad del 99,9% (IC 95%: 99,6 - 99,9) versus 76,9% (IC 95%: 75,6 - 78,2) en el análisis por lesión. Asimismo, el tiempo de lectura por paciente fue menor en el grupo de la CNN versus los gastroenterólogos (5,9 ± 2,23 minutos versus 96,6 ± 22,53 minutos, p < 0,001). A partir de estos resultados los investigadores concluyeron que la aplicación de la IA en la cápsula endoscópica es una herramienta importante para ayudar a los gastroenterólogos a analizar las imágenes capturadas con este dispositivo de manera más eficiente y precisa.31
Los modelos para la detección de sangrado en tiempo real alcanzan una precisión diagnóstica de hasta el 99%.32-34 El modelo de Aoki et al. detectó sangrado gastrointestinal con una sensibilidad, especificidad y precisión del 96,6%, 99,9% y 99,9%, respectivamente.31 Otros modelos desarrollados ayudan a la estratificación y predicción del riesgo de hemorragias recurrentes con el fin de brindar un tratamiento oportuno y evitar endoscopias innecesarias.35,36
Para la detección de úlceras y erosiones, el modelo de Wang et al. alcanzó una precisión diagnóstica del 92,1%.37 Para la identificación de tumores la precisión diagnóstica parte del 86%, con una sensibilidad que oscila entre el 88% y el 97%, y una especificidad entre el 81% y el 96%.38
En un metaanálisis reciente sobre la CNN en cápsulas endoscópicas, se obtuvo una sensibilidad agrupada y una especificidad del 96% (IC 95%: 91-98) y 97% (IC 95%: 93-99) en la detección de úlceras y erosiones; 97% (IC 95%: 93-99) y 100% (IC 95%: 99-100) en la identificación de sangrado gastrointestinal; 97% (IC 95%: 82-99) y 98% (IC 95%: 92-99) en la detección de cáncer y pólipos.37
Adicionalmente, los modelos desarrollados para la identificación de enfermedad inflamatoria intestinal por medio de cápsula endoscópica alcanzan en la actualidad altos niveles de precisión (83,3% al 90,8%)39 y permiten también el reconocimiento de patrones ocultos de la enfermedad.4
En comparación con los endoscopios actuales con los que se obtienen imágenes de muy alta calidad, la calidad de las imágenes de la cápsula endoscópica es baja.27 Sin embargo, los modelos de IA para la cápsula endoscópica tienen la ventaja de contar con una base de datos robusta, alimentada con una gran cantidad de imágenes útiles para la creación de la CNN.
Intestino grueso
El cáncer colorrectal (CCR) se considera en la actualidad una de las principales causas de muerte relacionadas con el cáncer en hombres y mujeres.40 Para la identificación temprana de lesiones premalignas (pólipos y adenomas) la colonoscopia sigue siendo un estudio imprescindible. Sin embargo, de acuerdo con la literatura, se puede perder la identificación de aproximadamente el 25% de estas lesiones, incluso en manos expertas.41 Las lesiones premalignas no detectadas aumentan el riesgo de desarrollar CCR.
Para la detección y caracterización de los pólipos se han desarrollado sistemas automatizados. Los primeros sistemas desarrollados utilizaban una cantidad reducida de imágenes y tenían como consecuencia una precisión diagnóstica baja (72%).42 Posteriormente, se han entrenado nuevos modelos con mayor precisión (> 95%), que utilizan un mayor número de imágenes. Esto permite que en la actualidad se pueda evaluar mejor los pólipos y los adenomas diminutos (≤ 5 mm); y predecir el pronóstico del CCR, la supervivencia de los pacientes y la presencia de invasión a distancia.42,43
Un metaanálisis evaluó el rendimiento de los CADe en la detección de neoplasia colorrectal.44 Los autores obtuvieron mayor tasa de detección de adenomas (adenoma detection rate, ADR) en los grupos en los que se usaron los CADe en comparación con sus grupos control (36,6% versus 25,2%; RR: 1,44; IC 95%: 1,27-1,62; p < 0,01). Asimismo, la detección de adenomas por colonoscopia fue superior en los grupos en los que se usaron CADe en comparación con el grupo control (50,3% versus 34,6%; RR: 1,70; IC 95%: 1,53-1,89; p < 0.01). Los autores no evidenciaron una diferencia significativa en la eficiencia de la colonoscopia (tiempo de retirada) entre los grupos en que se usaron CADe y el grupo control.44
Robles-Medranda et al. estudiaron la eficiencia de la colonoscopia asistida por IA para la detección de pólipos y adenomas durante los estudios de screening de CCR (Figura 4).45 Los resultados obtenidos por los autores fueron comparados de acuerdo con el nivel de experiencia de los endoscopistas (expertos versus no expertos). Con la asistencia de la IA durante los procedimientos endoscópicos, se obtuvo un aumento de la ADR y tasa de detección de pólipos del 16,5% al 18,2% y del 50,4% al 60%, respectivamente. De acuerdo con el nivel de experiencia, el aumento de la ADR fue evidente en el grupo junior (10,8% a 16,2%), que se aproximó al nivel de los expertos.45
Figura 4. Detección de lesión polipoide en colon utilizando un dispositivo de
detección asistido por computadora (CADe) (AITROL, mdconsgroup, Guayaquil, Ecuador)
Además, se han diseñado CADx con capacidad de caracterizar de manera inmediata los pólipos utilizando tecnología de imágenes más allá de la endoscopia con luz blanca y NBI magnificada, y la endomicroscopia confocal. En este campo, un modelo desarrollado por Sánchez-Montes et al. para la predicción de la clasificación histológica de los pólipos, alcanzó una precisión diagnóstica, una sensibilidad y una especificidad del 91,1%, 92,3%, y 89,2%, respectivamente.46
Adicionalmente, características como la depresión de la lesión, la convergencia de los pliegues, y el patrón capilar irregular y heterogéneo se asocian con la invasión en profundidad de las lesiones premalignas. Los modelos actuales de los CADe para la identificación de las características antes descritas resultan atractivos antes de determinar el tipo de tratamiento a realizar (por ejemplo, la resección endoscópica de la mucosa).4
A pesar de que en la actualidad se encuentran disponibles algunos métodos diagnósticos, como colangioscopia, colangiopancreatografía endoscópica retrógrada (CPRE) o EUS para el estudio del sistema biliopancreático, existen dificultades en la diferenciación de lesiones y discrepancia entre los evaluadores.
Colangioscopia
Como la colangioscopia es una técnica endoscópica avanzada, relativamente nueva y sin guías de entrenamiento establecidas, la impresión visual entre los operadores es muy variable.47 Se han creado varias clasificaciones para detectar malignidad basándose en las características macroscópicas de las lesiones de la vía biliar durante el procedimiento,48-51 con la intención de disminuir esta variabilidad entre los observadores. Sin embargo, estas clasificaciones no han logrado ese objetivo.47
Recientemente, se han empezado a desarrollar modelos de IA con la finalidad de ayudar a los operadores a detectar lesiones malignas y a obtener biopsias. Los primeros modelos de IA en la colangioscopia fueron desarrollados para la detección de vasos sanguíneos tortuosos, pero tenían la desventaja de estar limitados a imágenes y no era posible su utilidad en casos en vivo.52,53 Otra limitación de dichos modelos es su falta de validación clínica. Sin embargo, obtuvieron métricas de validación interna bastante altas. En su primer estudio, Mascarenhas et al. desarrollaron un modelo con 6475 imágenes de colangioscopia obtenidas de 85 pacientes. Durante la validación con frames se obtuvo una sensibilidad, una especificidad, un valor predictivo positivo (VPP) y valor predictivo negativo (VPN) de 99,3%, 99,4%, 99,6% y 98,7%, respectivamente.53 Luego, desarrollaron un nuevo trabajo en el que duplicaron el número de imágenes obtenidas del mismo número de pacientes (de 6475 a 11855); esta vez evaluaron la precisión del modelo para distinguir entre lesiones benignas y malignas. Las métricas obtenidas fueron: precisión diagnóstica (94,9%), sensibilidad (94,7%), especificidad (92,1%), VPP (94,8%) y VPN (84,2%).52 Se resalta que a pesar de que el modelo obtuvo excelentes parámetros de validación interna, estos no deben ser extrapolados a su utilidad real en casos clínicos en vivo.
Posteriormente, se realizaron dos estudios con modelos de IA en tiempo real. El primer estudio, realizado por Marya et al., evalúa la aplicación clínica del modelo y lo compara con los resultados de las biopsias y la citología. En el estudio se observa que el modelo de CNN obtuvo mayores sensibilidad (93,3%), especificidad (88,2%) y precisión (90,6%) en comparación con las biopsias, que obtuvieron 35,7% de sensibilidad, 100% de especificidad y 60,9% de precisión; y con la citología, que obtuvo 40%, 100% y 62,5% de sensibilidad, de especificidad y de precisión, respectivamente.54 Una de las limitaciones del estudio fue que sólo un operador estuvo a cargo de realizar las anotaciones de alrededor de 2 millones de imágenes, lo que puede conllevar a errores por fatiga y a la aparición de un sesgo.
Robles-Medranda et al. desarrollaron su propio modelo de CNN capaz de detectar lesiones neoplásicas en videos pregrabados y en tiempo real (Figura 5). Posterior a las etapas de implementación de modelos de IA (recolección, anotación y diseño del modelo), se realizó la validación interna y luego una comparación clínica entre el modelo y los endoscopistas (expertos y no expertos).55 Este estudio multicéntrico se llevó a cabo en dos fases. La primera fase fue la de desarrollo y validación del modelo de IA, denominado AIworks-Cholangioscopy (mdconsgroup, Guayaquil, Ecuador). La primera versión de este modelo fue desarrollada a partir de 81080 imágenes de 23 pacientes, y obtuvo una media de precisión (mAP) de 0,298, un puntaje F1 de 0,280, la intersección sobre la unión fue de 32,3% y la pérdida total fue de 0,1034. A pesar de ser resultados aceptables, la detección de fotogramas por segundo (frames per second, FPS) fue baja y llegó a un promedio de 5. Esta baja detección de FPS impidió que el modelo se utilice para la detección de lesiones en tiempo real. Su validación interna obtuvo una sensibilidad, una especificidad, un VPP y un VPN de 98%, 95%, 98%, y 94%, respectivamente. Posteriormente, al aumentar el número de casos e imágenes disponibles para el entrenamiento (de 81080 a 198941), junto con una mejor calidad de imagen, las métricas de validación interna aumentaron drásticamente: mAP de 0,298 a 0,880, puntaje F1 de 0,280 a 0,738, IoU de 32,3% a 83,2%, pérdida total de 0,1034 a 0,0975. La sensibilidad, la especificidad, el VPP y el VPN para detectar lesiones neoplásicas en imágenes tuvieron resultados similares a los obtenidos por Mascarenhas et al.: 98,6%, 98%, 89,2%, y 99,2%, respectivamente.52,53,55 Sin embargo, al realizar la segunda fase para la validación clínica en 170 pacientes, se observó que estos valores de precisión diagnóstica disminuyeron y se aproximaron a los de los endoscopistas. Durante la comparación del modelo con la impresión visual de los endoscopistas (expertos y no expertos) que usaron dos clasificaciones de lesiones neoplásicas (clasificación CRM y de Mendoza),48,50 se evidenció que el modelo de IA fue superior tanto al de los expertos como al de los no expertos.55 Este estudio demuestra la importancia de realizar una validación clínica y de no extrapolar los resultados de una validación interna a la clínica como resultado final.
Figura 5. Detección de imágenes sugestivas de neoplasia en colangioscopia por medio
de la inteligencia artificial (AIWorks- Cholangioscopy, Mdconsgroup, Guayaquil, Ecuador)
Ultrasonido endoscópico
Para el manejo diagnóstico y terapéutico de patologías biliopancreáticas, el EUS se considera superior a la tomografía y a la resonancia magnética debido a su mayor precisión diagnóstica y a su capacidad de obtener imágenes de mejor calidad.56 Sin embargo, estos procedimientos tienen limitaciones como la baja sensibilidad para diferenciar la neoplasia papilar mucinosa intraductal (NPMI) benigna de la maligna, y la baja especificidad para diferenciar las lesiones malignas de la pancreatitis crónica.57 Otra limitación de este procedimiento es su dependencia de los operadores, por lo que los endoscopistas menos experimentados pueden no apreciar las diferencias entre pancreatitis crónica y malignidad pancreática.57 Por esta razón, la aplicación de IA en este tipo de procedimientos sería beneficiosa y podría influenciar la calidad del EUS realizado por endoscopistas expertos o en entrenamiento.58
Se han desarrollado varios estudios para evaluar y comparar la precisión diagnóstica del EUS asistido por IA contra el EUS tradicional en la detección del cáncer pancreático, y distinguir entre lesiones crónicas y tejido normal.55 Un estudio realizado por Norton et al., demostró que su modelo de IA tuvo mayor sensibilidad (100%) para la diferenciación entre malignidad e inflamación, sin embargo, la precisión diagnóstica fue similar entre el modelo (80%), el endoscopista ciego a los resultados del procedimiento (83%) y el procedimiento tradicional (85%).59 Los autores demostraron la posibilidad de aplicar modelos de IA para la interpretación de imágenes en el EUS y la capacidad de distinción entre malignidad y condiciones crónicas; de esta forma resolvieron una de las limitaciones mencionadas anteriormente.
Con el paso del tiempo, se desarrollaron nuevas técnicas de EUS que se incluyeron como parte del manejo de los pacientes. En paralelo, se diseñaron diferentes tipos de IA para diferenciar las lesiones pancreáticas benignas de las malignas. Sãftoiu et al. evaluaron la aplicación de un modelo de IA que permite diferenciar las lesiones benignas de las malignas usando la elastografía, una técnica que evalúa la rigidez y la elasticidad de los tejidos. Obtuvieron altas sensibilidad (91,4%), especificidad (87,9%) y precisión diagnóstica (89,7%).60 Estos resultados indican la posibilidad de aplicar modelos de IA en la elastografía en casos en los que la aspiración con aguja fina guiada por EUS tenga resultados negativos.
Posteriormente, los mismos autores compararon el uso de la elastografía con IA y la elastografía sin IA; observaron que la precisión diagnóstica del primer procedimiento (EUS + IA) fue mayor (AUC: 94%) que la elastografía tradicional (AUC: 85%). Esto sugiere que los modelos de elastografía basados en CNN pueden proporcionar soporte para la toma de decisiones al proveer una interpretación de imágenes rápida y precisa, cuando se los compara con la elastografía sin IA.61
Otra de las limitaciones del EUS que ha sido evaluada es la diferenciación de las NPMI benignas de las malignas. Las NPMI son las precursoras de los adenocarcinomas pancreáticos, y una vez que las lesiones progresan a lesiones invasivas, el pronóstico de los pacientes disminuye.62
Kuwahara et al. desarrollaron un modelo de DL e investigaron si el análisis preoperatorio de imágenes de NPMI por EUS que utiliza IA puede predecir malignidad. Los autores compararon la interpretación de las lesiones con los diagnósticos preoperatorios de los endoscopistas, las técnicas predictivas convencionales y otras técnicas de EUS.63 Como resultado, observaron que el modelo de IA obtuvo una AUC de 91% para predecir malignidad. En la comparación de la precisión diagnóstica entre el modelo y el endoscopista, se observó que el modelo fue superior (94% versus 56%, respectivamente).63
Otra aplicación de la IA en el EUS es el diagnóstico diferencial de lesiones subepiteliales. Hirai et al. evaluaron un modelo de DL que permitía su clasificación en imágenes de EUS. Recolectaron imágenes de lesiones subepiteliales de la vía digestiva alta, incluyendo tumores del estroma gastrointestinal (GIST), leiomiomas, schwannomas, tumores neuroendocrinos y páncreas ectópico. El modelo pudo clasificar las lesiones anteriormente mencionadas con una precisión del 86,1%, la cual fue mucho mayor que la de los endoscopistas participantes.64 La sensibilidad, la especificidad y la precisión diagnóstica para diferenciar los GIST de las demás lesiones fue del 98,8%, 67,6%, y 89,3%, respectivamente.64 Otros estudios, incluyendo metaanálisis que compararon la precisión de otro modelo de CNN para diferenciar los GIST de otras lesiones, tuvieron resultados similares.65
Debido a la tendencia de aumento de neoplasias biliopancreáticas a nivel mundial, es importante poder realizar una adecuada diferenciación entre las lesiones tumorales malignas y las benignas o tejidos normales. La aplicación de la IA en la endoscopia biliopancreática ha sido evaluada por mucho tiempo y mostró resultados prometedores. La IA y su aplicación en medicina se deben considerar beneficiosas porque ayudarán a sobrepasar las limitaciones de estos procedimientos complejos (colangioscopia y EUS).
Aplicaciones futuras de la IA en la endoscopia digestiva
La IA ha demostrado ser útil para detectar y clasificar lesiones durante los distintos tipos de procedimientos endoscópicos disponibles y estudiados. Sin embargo, la aplicación de modelos inteligentes puede ir más allá de la detección y el diagnóstico.
Carlos Robles-Medranda et al., desarrollaron un sistema de EUS basado en
modelos de CNN entrenados para detectar estructuras anatómicas normales en las distintas ventanas evaluadas
durante este procedimiento avanzado (mediastinal, gástrica y duodenal) (Figura 6), lo que permitió la
identificación de 20 estructuras anatómicas con alta sensibilidad y especificidad (Tabla
3).66
La precisión diagnóstica del modelo para detectar dichas estructuras fue mayor
al 95%. Esto indica que los modelos de IA no solo tienen utilidad para detectar patologías, sino también para
detectar estructuras normales, lo cual puede beneficiar el entrenamiento de los endoscopistas y reforzar el
conocimiento de aquellos con más experiencia. La aplicación de la IA en el entrenamiento de los endoscopistas
fue evaluada por Zhang et al., quienes demostraron que aquellos endoscopistas entrenados con IA
tuvieron una menor curva de aprendizaje y mejores resultados que aquellos entrenados
tradicionalmente.67
Figura 6. Modelo de inteligencia artificial de ultrasonido endoscópico detectando
estructuras anatómicas (AIWorks-EUS, mdconsgroup, Guayaquil, Ecuador)
Tabla 3. Estructuras anatómicas observadas por el sistema de detección asistido por
computadora AIWorks-EUS (Mdconsgroup, Guayaquil, Ecuador)
Adicionalmente, por medio de modelos inteligentes, es posible automatizar el proceso de obtención de imágenes para la generación de reportes y como medidor de calidad de las pruebas.68 Esto se puede llevar a cabo por medio de la unión de varias funciones y su aplicación simultánea, como la detección del órgano valorado junto con la detección de lesiones dentro de ese órgano. De esta manera, al final del procedimiento, se puede generar de manera automática el reporte del estudio realizado.68,69 Modelos como el AI-EARS y el ISRGS han demostrado buena precisión diagnóstica para identificar los órganos y las lesiones, generando un reporte automático utilizando IA tanto en vía digestiva alta68 como en baja.69
La aplicación de modelos de IA para entrenar a endoscopistas en procedimientos endoscópicos avanzados puede aumentar la eficacia de dichos endoscopistas y disminuir el número de procedimientos necesarios para alcanzar competencia.
A pesar de que la automatización de los modelos durante la endoscopia busca reducir los riesgos derivados de factores humanos y ambientales, entre otros, el éxito los modelos de IA dependerá de la calidad y la cantidad de información utilizada durante su entrenamiento y validación. Asimismo, cobra gran importancia la validación externa por medio de estudios multicéntricos e internacionales con endoscopistas expertos antes de la generalización y la universalización de los resultados del entrenamiento.
Los modelos de IA en la endoscopia digestiva tienen el potencial de mejorar la precepción visual de los endoscopistas, y acercar la precisión entre aquellos con menos experiencia y los considerados expertos. Además, pueden ser de gran ayuda en la detección de lesiones y en la evaluación de la invasión en los tejidos. Se vislumbra un futuro en el cual los enfoques de formación tradicionales serán superados y los centros médicos en todo el mundo podrán implementar mejoras en la capacitación de los profesionales, mediante la aplicación de tecnologías precisas que reduzcan la curva de aprendizaje en estos procedimientos. Esto beneficiará a los profesionales menos experimentados y reducirá la brecha entre los endoscopistas expertos y los de menor experiencia, mejorando la competencia de los endoscopistas.
Propiedad intelectual. Los autores declaran que los datos, las figuras y las tablas presentes en el manuscrito son originales y se realizaron en sus instituciones pertenecientes.
Financiamiento. Los autores declaran que no hubo fuentes de financiación externas.
Conflicto de interés. Carlos Robles-Medranda es un líder de opinión y consultor para Pentax Medical, Steris, Micro-tech, G-Tech Medical Supply, CREO Medical, EndoSound y Mdconsgroup. Los demás autores no declaran ningún conflicto de interés.
Aviso de derechos de autor

© 2023 Acta Gastroenterológica Latinoamericana. Este es un artículo de acceso abierto publicado bajo los términos de la Licencia Creative Commons Attribution (CC BY-NC-SA 4.0), la cual permite el uso, la distribución y la reproducción de forma no comercial, siempre que se cite al autor y la fuente original.
Cite este artículo como: Baquerizo-Burgos J, Egas-Izquierdo M, Cunto D y col. La era de la endoscopia inteligente: cómo la inteligencia artificial potencia la endoscopia digestiva. Acta Gastroenterol Latinoam. 2023;53(3):211-225. https://doi.org/10.52787/agl.v53i3.339
Referencias
Correspondencia:
Jorge Baquerizo-Burgos
Correo electrónico: jorgebaquerizoburgos@gmail.com
Acta Gastroenterol Latinoam 2023;53(3):211-225