Clear Sky Science · es

Método de detección de pólipos gastrointestinales basado en el RT-DETR mejorado

· Volver al índice

Por qué importa detectar los crecimientos diminutos

El cáncer colorrectal a menudo comienza como pequeños crecimientos llamados pólipos en el revestimiento del intestino. Los médicos utilizan colonoscopias y otros exámenes endoscópicos para localizar y extirpar estos pólipos antes de que se vuelvan peligrosos. Sin embargo, incluso los endoscopistas más experimentados pueden pasar por alto lesiones sutiles u de forma irregular, sobre todo en vídeo ruidoso o con movimiento rápido. Este estudio presenta un sistema de inteligencia artificial (IA) diseñado para actuar como un segundo par de ojos ultrarrápido, detectando más pólipos en tiempo real sin ralentizar el procedimiento.

El reto de ver lo imperceptible

Los pólipos presentan muchas formas y tamaños, desde pequeñas manchas planas hasta bultos más evidentes, y pueden esconderse entre pliegues, sombras, fluidos y reflejos dentro del intestino. Ya existen asistentes comerciales con IA, pero a veces tienen dificultades cuando las imágenes proceden de cámaras distintas o cuando los pólipos son muy pequeños o de bajo contraste. Muchos sistemas de investigación afrontan un intercambio: si son precisos, tienden a ser lentos; si son lo bastante rápidos para vídeo en tiempo real, pueden pasar por alto lesiones difíciles de ver. Los autores se centran en romper ese compromiso para que los médicos puedan contar tanto con velocidad como con una visión más aguda.

Figure 1
Figure 1.

Una forma más inteligente de leer el vídeo endoscópico

El equipo parte de un marco de detección moderno llamado RT-DETR-r18, que trata la búsqueda de pólipos un poco como traducir una imagen a una lista de objetos. Añaden tres mejoras clave orientadas a las particularidades de las imágenes endoscópicas. La primera mejora, un módulo que preserva detalles, está diseñado para conservar texturas finas de la superficie de pólipos planos o lejanos que los algoritmos estándar tienden a difuminar al reducir las imágenes para el análisis. La segunda mejora introduce un mecanismo de atención eficiente: en lugar de examinar cada par de píxeles en una computación pesada, usa una forma más ligera de concentrarse en las áreas más informativas, ayudando al sistema a ignorar distracciones como burbujas, heces o reflejos. La tercera mejora fusiona información de varias escalas, de modo que el sistema puede manejar tanto vistas en primer plano con alto detalle como pequeñas “puntuaciones visuales” que representan lesiones vistas desde más lejos.

Poniendo el sistema a prueba

Para evaluar su método, los investigadores lo entrenaron y probaron con 1.611 imágenes etiquetadas de dos fuentes diferentes: colonoscopia estándar y endoscopia con cápsula inalámbrica. Esta mezcla obliga a la IA a basarse en rasgos reales de las lesiones en lugar de en peculiaridades de un único dispositivo. Convirtieron máscaras de segmentación de expertos en cuadros delimitadores ajustados para dar al modelo ejemplos precisos de dónde están los pólipos. El rendimiento se juzgó con medidas habituales como precisión (evitar falsas alarmas), exhaustividad/recall (evitar omisiones) y precisión media, junto con el número de imágenes procesadas por segundo. En cinco ejecuciones independientes, el sistema mejorado elevó la precisión del 90,7% al 94,8% y el recall del 84,0% al 89,9%, al tiempo que aumentó la calidad global de detección. De forma crucial, siguió analizando vídeo a unos 188 fotogramas por segundo—muy por encima de los 30–60 fps típicos en endoscopia clínica—por lo que puede seguir el ritmo de procedimientos reales.

Figure 2
Figure 2.

Cómo se compara y dónde falla

En comparación con detectores de objetos populares de la familia YOLO y variantes más potentes de RT-DETR, el nuevo método consiguió el mejor equilibrio entre precisión, ajuste de los contornos de los pólipos y coste computacional. Produjo resultados de detección más limpios, con menos cuadros sobredimensionados y menos lesiones perdidas, especialmente en escenas complejas. Aun así, el sistema no es perfecto. A veces falla en zonas muy oscuras o donde las lesiones están parcialmente ocultas por pliegues. También puede confundir reflejos brillantes o burbujas con pólipos reales si imitan la apariencia redondeada y elevada de un crecimiento. Los autores sugieren que añadir información de fotogramas vecinos en el vídeo podría ayudar en el futuro a filtrar esos artefactos fugaces y a estabilizar aún más las alertas.

Qué significa esto para pacientes y médicos

Desde una perspectiva general, el estudio muestra que la IA ya puede escanear imágenes endoscópicas mucho más rápido que un humano a la vez que comete menos errores que los detectores en tiempo real actuales. Al preservar mejor los pequeños detalles, centrarse en regiones relevantes y manejar objetos a múltiples escalas visuales, el sistema propuesto encuentra más puntos potencialmente problemáticos sin entorpecer el examen. Aunque estos resultados provienen de conjuntos de imágenes cuidadosamente seleccionados y no de colonoscopias en vivo, apuntan a herramientas de IA que podrían reducir la probabilidad de que un pólipo importante pase inadvertido. El siguiente paso serán ensayos clínicos a gran escala para determinar si estas mejoras técnicas se traducen en menos cánceres no detectados y en un cribado más seguro, eficiente y con mayor confianza para los pacientes.

Cita: Du, J., He, Z., Zhang, S. et al. Gastrointestinal polyp detection method based on the improved RT-DETR. Sci Rep 16, 7020 (2026). https://doi.org/10.1038/s41598-026-38617-1

Palabras clave: colonoscopia, detección de pólipos, IA médica, imágenes endoscópicas, cribado en tiempo real