Clear Sky Science · fr

Classification multi‑classe des tumeurs cérébrales avec un backbone ResNet101 intégré à un module d’attention déformable multi‑échelle et des augmentations de données avancées

· Retour à l’index

Pourquoi le tri des scans cérébraux est important

Lorsque les médecins examinent des scans cérébraux pour détecter des tumeurs, ils doivent déterminer non seulement la présence d’une tumeur, mais aussi son type. Différents types de tumeurs nécessitent des traitements différents, pourtant ils peuvent apparaître très similaires en imagerie par résonance magnétique (IRM). Cette étude explore une nouvelle approche d’intelligence artificielle capable de trier de nombreuses sortes de tumeurs cérébrales à partir d’IRM avec une très grande précision, offrant potentiellement aux radiologues un soutien plus rapide et plus cohérent lors de décisions ayant un fort impact sur la vie des patients.

Figure 1. Comment l’IA transforme les scans IRM cérébraux en catégories nettes couvrant de nombreux types de tumeurs.
Figure 1. Comment l’IA transforme les scans IRM cérébraux en catégories nettes couvrant de nombreux types de tumeurs.

Apprendre aux ordinateurs à lire les scans cérébraux

Les chercheurs se concentrent sur la classification multi‑classe, c’est‑à‑dire la discrimination simultanée de nombreuses catégories de tumeurs plutôt que la simple détection tumeur/non tumeur. Ils utilisent un modèle d’apprentissage profond basé sur ResNet101, un réseau de reconnaissance d’images largement utilisé et préalablement entraîné sur de grandes collections d’images naturelles pour capter des motifs visuels généraux. L’équipe adapte ce réseau aux IRM cérébrales et l’évalue sur un jeu de données public comprenant 15 classes, allant du tissu cérébral normal à des tumeurs spécifiques telles que le glioblastome, le méningiome et le médulloblastome. Traiter autant de catégories rapproche la tâche de ce que les radiologues rencontrent en clinique.

Nettoyer et équilibrer des données réelles

Les collections d’images médicales comportent souvent des écueils cachés, comme des scans dupliqués pour un même patient ou de fortes disparités dans la fréquence des types de tumeurs. Pour éviter des résultats trompeurs, les auteurs explorent d’abord l’ensemble des données, calculent une empreinte numérique pour chaque image et suppriment les doublons exacts. Ils regroupent ensuite les images par identifiant de patient et répartissent les patients — et non les images — entre ensembles d’entraînement, de validation et de test, de sorte qu’un même individu n’apparaisse jamais dans plusieurs sous‑ensembles. Cette séparation par patient aide à garantir que la précision rapportée reflète la performance sur des personnes réellement inconnues et non des vues répétées d’un même cerveau. L’équipe applique aussi une batterie de transformations d’image et une technique appelée MixUp pour mieux représenter les tumeurs rares pendant l’entraînement et aider le modèle à gérer les variations d’orientation, de luminosité et de bruit.

Figure 2. Comment une attention multi‑échelle flexible permet à l’IA de se concentrer sur les régions clés des IRM cérébrales pour distinguer les types de tumeurs.
Figure 2. Comment une attention multi‑échelle flexible permet à l’IA de se concentrer sur les régions clés des IRM cérébrales pour distinguer les types de tumeurs.

Regarder de plus près grâce à une attention flexible

Une innovation clé de l’étude est un module que les auteurs nomment module d’attention déformable multi‑échelle. En termes simples, le modèle examine l’IRM à différents niveaux de détail, depuis les structures globales du cerveau jusqu’aux textures plus fines autour de la tumeur. Plutôt que d’explorer chaque position selon une grille rigide, l’attention déformable apprend à décaler légèrement ses points d’observation pour se concentrer sur les régions informatives. Le module applique ensuite deux formes d’attention complémentaires : l’une qui met en évidence les points importants de l’image et l’autre qui renforce les canaux de caractéristiques les plus utiles à l’intérieur du réseau. Cette combinaison permet au système de mieux capter les différences subtiles de forme et de texture qui distinguent les types de tumeurs.

Tester la performance et la robustesse

Après de nombreux cycles d’entraînement, le modèle atteint une précision de validation d’environ 97 % et une précision sur le test supérieur à 99 % sur l’ensemble des 15 classes. La plupart des types de tumeurs sont classés parfaitement sur l’ensemble de test tenu à l’écart, avec seulement quelques erreurs dans des catégories à la fois rares et visuellement proches. Les chercheurs comparent leurs résultats à une méthode antérieure utilisant aussi l’attention déformable et montrent que leur approche l’égale ou la dépasse sur presque toutes les mesures d’évaluation, malgré la complexité de la répartition des classes. Ils soumettent en outre le système à des tests de résistance en ajoutant du bruit et en réduisant la résolution des images, constatant que la précision reste élevée même lorsque la qualité des scans se dégrade, ce qui est important pour les conditions réelles en milieu hospitalier.

Voir ce que le modèle voit

Pour aider les cliniciens à faire confiance au système, les auteurs utilisent des outils de visualisation qui révèlent où le réseau se focalise lorsqu’il prend une décision. Des cartes de chaleur produites par Grad‑CAM mettent en évidence les zones de l’IRM qui ont le plus influencé la prédiction, et des analyses basées sur SHAP indiquent quelles caractéristiques apprises poussent le modèle vers tel ou tel diagnostic. Ces explications visuelles pointent systématiquement les régions tumorales et leurs contours plutôt que des arrière‑plans non pertinents, suggérant que le raisonnement du modèle concorde avec l’intuition radiologique. Si l’étude souligne qu’un testing externe supplémentaire est nécessaire, elle montre qu’un pipeline d’apprentissage profond soigneusement conçu peut non seulement classifier de nombreux types de tumeurs cérébrales avec une grande fiabilité, mais aussi fournir des indices interprétables sur la façon dont ces décisions sont prises.

Ce que cela pourrait signifier pour les patients

Dans la pratique clinique quotidienne, ce type de système ne remplacerait pas les radiologues mais agirait en tant que second lecteur, signalant rapidement les types de tumeurs probables et attirant l’attention sur des régions suspectes du scan. En prenant en charge une grande variété de tumeurs et en restant stable face à des images bruitées ou de moindre qualité, le cadre décrit dans cet article illustre comment l’IA pourrait soutenir des diagnostics plus cohérents et plus rapides. Avec une validation supplémentaire à travers différents hôpitaux et appareils d’imagerie, de tels outils pourraient devenir partie intégrante des flux de travail, aidant les spécialistes à se concentrer sur la planification des traitements pendant que les ordinateurs gèrent une grande partie du tri d’images répétitif.

Citation: Reddy, B.S., Jha, R.R., Dasore, A. et al. Multi-class classification of brain tumor using a ResNet101 backbone integrated with multi-scale deformable attention module and advanced data augmentations. Sci Rep 16, 15938 (2026). https://doi.org/10.1038/s41598-026-45675-y

Mots-clés: IRM tumeur cérébrale, apprentissage profond, IA en imagerie médicale, classification des tumeurs, réseaux d’attention