Clear Sky Science · fr

InfoColon : un jeu de données pour images consécutives informatives en coloscopie

· Retour à l’index

Pourquoi des vidéos de coloscopie plus nettes comptent

La coloscopie est l'un des principaux outils dont se servent les médecins pour repérer les premiers signes du cancer colorectal, mais les vidéos qu'elle produit sont souvent désordonnées. De nombreux plans sont flous, obstrués par des bulles ou des instruments, ou montrent simplement une paroi tissulaire sans intérêt. Ces moments peu utiles ralentissent les médecins et perturbent les programmes informatiques destinés à les assister. Cette étude présente InfoColon, une nouvelle collection partagée de vidéos de coloscopie conçue pour séparer les vues utiles des vues inutiles et pour aider à construire des systèmes d'IA médicale plus intelligents et plus fiables.

Nettoyer un flux vidéo médical bruyant

Lors d'une coloscopie, la caméra parcourt un organe sinueux, humide et en mouvement. À mesure que le praticien avance et retire l'endoscope, l'image peut trembler, s'embuer ou être inondée d'éblouissement dû à la lumière. Les auteurs soulignent que de tels plans non informatifs rendent la détection de polypes plus difficile, augmentent la fatigue des cliniciens et allongent les procédures pour les patients. Ils défendent l'idée qu'être capable d'extraire rapidement les images informatives, où le tunnel intestinal et ses structures sont clairement visibles, améliorerait le diagnostic, permettrait des contrôles automatiques de qualité et soutiendrait de nouveaux outils tels que des cartes 3D du côlon et des aides à la navigation. Pourtant, jusqu'à présent, il n'existait pas de grand jeu de données public pour entraîner et comparer de telles méthodes.

Figure 1. Comment les images de coloscopie claires sont séparées du bruit pour permettre une meilleure analyse et des vues 3D du côlon.
Figure 1. Comment les images de coloscopie claires sont séparées du bruit pour permettre une meilleure analyse et des vues 3D du côlon.

Une nouvelle bibliothèque partagée de vues du côlon

Les chercheurs ont construit InfoColon en combinant des vidéos de coloscopie réelles provenant de deux hôpitaux avec plusieurs collections d'images publiques bien connues. À partir des examens hospitaliers, ils ont rassemblé plus de 119 000 images échantillonnées à une image par seconde, puis ajouté des dizaines de milliers d'images issues de jeux de données de recherche existants. Chaque image a été annotée par des endoscopistes experts comme étant informative ou appartenant à l'un des six types non informatifs : paroi nue, bulle, flou, mauvaise lumière, instrument gênant, ou autres obstacles tels que des selles. Des contrôles sur un échantillon d'images ont montré une forte concordance entre experts, ce qui donne confiance dans la fiabilité des annotations. En parallèle des vidéos, l'équipe fournit des rapports synthétiques montrant comment les images informatives sont réparties dans le temps pour chaque procédure.

Apprendre aux ordinateurs à se concentrer sur l'essentiel

Annoter manuellement un si grand nombre d'images serait coûteux et lent, aussi l'équipe a testé des stratégies d'apprentissage pouvant tirer le meilleur parti d'un plus petit jeu d'exemples annotés. Ils ont comparé l'apprentissage supervisé classique avec des approches semi-supervisées et d'apprentissage actif qui demandent aux experts d'annoter uniquement les nouveaux échantillons les plus utiles. Leur nouvelle méthode, appelée Accuracy Driven Adaptive Threshold BALD, sélectionne des images pour revue experte en fonction de l'évolution des performances du modèle, plutôt qu'en se basant uniquement sur son incertitude. En utilisant un modèle vision transformer moderne, ils ont montré que cette approche peut atteindre une grande précision pour distinguer les images informatives des non-informatives selon plusieurs configurations d'étiquettes, tout en nécessitant beaucoup moins d'images annotées par des experts que l'entraînement traditionnel.

Des images vidéo planes aux cartes 3D

InfoColon ne se contente pas d'indiquer quelles images sont nettes. Le jeu de données inclut également des vidéos d'étalonnage de la caméra et des paramètres corrigeant la distorsion grand-angle de l'objectif du coloscope. Avec ces éléments, les auteurs ont utilisé uniquement les images informatives pour tester des méthodes de reconstruction 3D qui transforment des images 2D en un nuage de points 3D de la surface du côlon. Dans des séquences d'exemple, les modèles 3D obtenus rendaient des formes importantes comme les plis, les coudes et la texture, et montraient des transitions fluides d'une image à l'autre. Cela suggère qu'un flux d'images bien filtré peut soutenir des outils futurs pour guider l'endoscope, estimer la couverture ou aider à repérer des zones manquées.

Figure 2. Comment de nombreuses images de coloscopie encombrées sont filtrées pour ne conserver que des vues nettes alimentant une forme colique 3D simple.
Figure 2. Comment de nombreuses images de coloscopie encombrées sont filtrées pour ne conserver que des vues nettes alimentant une forme colique 3D simple.

Ce que cela signifie pour les patients et les chercheurs

Pour un non-spécialiste, InfoColon peut être vu comme une bibliothèque soigneusement organisée qui conserve les images claires et étiquette les inutiles, tout en enregistrant le comportement de la caméra. Cette ressource partagée devrait faciliter pour les chercheurs du monde entier la construction et la comparaison équitable de programmes informatiques qui nettoient, analysent ou reconstruisent des vidéos de coloscopie. À long terme, de tels progrès pourraient assister les médecins par de meilleurs contrôles de qualité et des vues du côlon plus informatives, sans modifier la procédure elle-même pour les patients.

Citation: Choi, T., Moon, H.S., Jang, S. et al. InfoColon: A dataset for consecutive informative frames in Colonoscopy. Sci Data 13, 748 (2026). https://doi.org/10.1038/s41597-026-07060-2

Mots-clés: coloscopie, imagerie médicale, analyse vidéo, jeu de données, apprentissage actif