Clear Sky Science · es

InfoColon: un conjunto de datos de fotogramas informativos consecutivos en colonoscopia

· Volver al índice

Por qué importan vídeos de colonoscopia más claros

La colonoscopia es una de las principales herramientas que usan los médicos para detectar signos tempranos de cáncer colorrectal, pero los vídeos que genera suelen ser caóticos. Muchos fotogramas están borrosos, bloqueados por burbujas o instrumentos, o simplemente muestran una pared de tejido sin nada relevante. Esos momentos poco útiles ralentizan a los médicos y confunden a los programas informáticos que pretenden asistirlos. Este estudio presenta InfoColon, una nueva colección compartida de vídeos de colonoscopia diseñada para separar las vistas útiles de las inútiles y para ayudar a construir sistemas de IA médica más inteligentes y fiables.

Limpiar una transmisión de vídeo médico ruidosa

Durante una colonoscopia, la cámara avanza por un órgano retorcido, húmedo y en movimiento. A medida que el especialista introduce o retira el endoscopio, la imagen puede temblar, empañarse o llenarse de deslumbramiento por la luz. Los autores señalan que esos fotogramas poco informativos dificultan la localización de pólipos, aumentan la fatiga de los clínicos y alargan los procedimientos para los pacientes. Sostienen que poder seleccionar rápidamente los fotogramas informativos, donde se ve claramente el túnel interior del colon y sus estructuras, mejoraría el diagnóstico, permitiría comprobaciones automáticas de la calidad y respaldaría herramientas nuevas como mapas 3D del colon y ayudas de navegación. Sin embargo, hasta ahora no existía un gran conjunto de datos público para entrenar y comparar tales métodos.

Figure 1. Cómo se separan los fotogramas claros de colonoscopia del ruido para apoyar un mejor análisis y vistas 3D del colon.
Figure 1. Cómo se separan los fotogramas claros de colonoscopia del ruido para apoyar un mejor análisis y vistas 3D del colon.

Una nueva biblioteca compartida de vistas del colon

Los investigadores construyeron InfoColon combinando vídeos reales de colonoscopia de dos hospitales con varias colecciones de imágenes públicas bien conocidas. De los exámenes hospitalarios reunieron más de 119.000 fotogramas muestreados a una por segundo y luego añadieron decenas de miles de fotogramas de conjuntos de investigación existentes. Cada fotograma fue etiquetado por endoscopistas expertos como informativo o como perteneciente a uno de seis tipos no informativos: pared lisa, burbuja, borroso, mala iluminación, instrumento en medio u otros obstáculos como heces. Comprobaciones en una muestra de fotogramas mostraron un fuerte acuerdo entre expertos, lo que da confianza en que las etiquetas son fiables. Junto con los vídeos, el equipo proporciona informes resumidos que muestran cómo se distribuyen los fotogramas informativos a lo largo del tiempo en cada procedimiento.

Enseñar a los ordenadores a centrarse en lo importante

Etiquetar a mano un número tan grande de fotogramas sería costoso y lento, por lo que el equipo probó estrategias de aprendizaje que aprovechan al máximo un conjunto más pequeño de ejemplos etiquetados. Compararon el aprendizaje supervisado estándar con enfoques semi supervisados y de aprendizaje activo que piden a los expertos etiquetar solo las nuevas muestras más útiles. Su nuevo método, llamado Accuracy Driven Adaptive Threshold BALD, elige fotogramas para revisión experta basándose en cuánto está cambiando el rendimiento del modelo, en lugar de solo en cuán incierto está. Usando un modelo moderno de transformador de visión, demostraron que este enfoque puede alcanzar alta precisión al distinguir fotogramas informativos de no informativos en varias configuraciones de etiquetas, usando muchas menos imágenes etiquetadas por expertos que el entrenamiento tradicional.

De fotogramas de vídeo planos a mapas 3D

InfoColon hace más que listar qué fotogramas son claros. El conjunto de datos también incluye vídeos de calibración de cámara y parámetros que corrigen la distorsión de gran angular de la lente del colonoscopio. Con estos datos, los autores usaron únicamente fotogramas informativos para probar métodos de reconstrucción 3D que convierten imágenes 2D en una nube de puntos 3D de la superficie del colon. En clips de ejemplo, los modelos 3D resultantes capturaron formas importantes como pliegues, curvas y textura, y mostraron transiciones suaves entre fotogramas. Esto sugiere que un flujo bien filtrado de fotogramas puede sustentar herramientas futuras que guíen el endoscopio, estimen la cobertura o ayuden a detectar áreas pasadas por alto.

Figure 2. Cómo muchos fotogramas desordenados de colonoscopia se filtran hasta obtener vistas claras que alimentan una forma 3D simple del colon.
Figure 2. Cómo muchos fotogramas desordenados de colonoscopia se filtran hasta obtener vistas claras que alimentan una forma 3D simple del colon.

Qué significa esto para pacientes e investigadores

Para una persona no experta, InfoColon puede verse como una biblioteca cuidadosamente organizada que conserva las imágenes claras y etiqueta las inútiles, además de registrar cómo se comporta la cámara. Este recurso compartido debería facilitar que investigadores de todo el mundo construyan y comparen de forma justa programas informáticos que limpien, analicen o reconstruyan vídeos de colonoscopia. A largo plazo, ese progreso podría ayudar a los médicos con mejores comprobaciones de calidad y vistas más informativas del colon, sin cambiar el procedimiento en sí para los pacientes.

Cita: Choi, T., Moon, H.S., Jang, S. et al. InfoColon: A dataset for consecutive informative frames in Colonoscopy. Sci Data 13, 748 (2026). https://doi.org/10.1038/s41597-026-07060-2

Palabras clave: colonoscopia, imagen médica, análisis de vídeo, conjunto de datos, aprendizaje activo