Clear Sky Science · fr

Transformeur de vision multi-plans pour la classification des hémorragies à partir de données IRM axiales et sagittales

· Retour à l’index

Pourquoi cette recherche compte pour les patients et les médecins

Lorsqu’une personne est susceptible de faire un AVC ou de présenter une hémorragie cérébrale, chaque minute compte. Les examens cérébraux peuvent révéler des hémorragies dangereuses, mais lire ces images rapidement et avec précision est difficile, en particulier pour l’imagerie par résonance magnétique (IRM), qui produit de nombreux types d’images selon différents plans de coupe. Cette étude présente une nouvelle méthode d’intelligence artificielle (IA) conçue pour lire des IRM multi-angles de façon plus proche du raisonnement d’un radiologue expérimenté, dans le but de repérer les hémorragies cérébrales de manière plus fiable en conditions hospitalières réelles.

Le défi de détecter les saignements cérébraux sur IRM

L’hémorragie intracrânienne — saignement à l’intérieur du crâne — est une urgence vitale nécessitant un diagnostic rapide. Pendant des décennies, la tomodensitométrie (CT) a été l’outil d’imagerie de référence pour les hémorragies suspectées car elle est rapide et relativement simple à interpréter. L’IRM peut égaler ou même dépasser la CT pour détecter des hémorragies et est meilleure pour estimer l’ancienneté du saignement et révéler d’autres problèmes, comme des zones du cerveau déficitaires en apport sanguin. Cependant, l’IRM prend plus de temps, reste moins disponible dans certains centres, et ses images sont plus complexes à interpréter. Cette complexité en fait une cible intéressante pour des outils d’IA capables d’aider les radiologues en filtrant un grand nombre d’examens, en signalant les cas suspects et en réduisant le risque qu’une hémorragie subtile mais critique soit manquée.

Pourquoi plusieurs vues et types d’acquisitions posent problème aux ordinateurs

En pratique clinique courante, l’IRM cérébrale est souvent acquise avec des coupes relativement épaisses pour raccourcir l’examen, produisant des images beaucoup plus nettes dans certaines directions que dans d’autres. Les radiologues examinent le cerveau selon plusieurs plans — axial (vue de dessus), sagittal (vue de profil) et parfois coronal (vue de face) — car certaines hémorragies sont plus faciles à voir depuis certains angles. Les examens existent aussi en plusieurs « contrastes » ou variantes, tels que FLAIR, diffusion et susceptibilité, chacun mettant en évidence des propriétés tissulaires différentes. La plupart des systèmes d’IA actuels, en revanche, s’attendent à ce que toutes les images soient alignées dans une orientation standard unique et à la même résolution. Pour satisfaire cette exigence, les hôpitaux doivent retransformer et redimensionner les données, ce qui peut flouter des détails fins et potentiellement masquer de petites hémorragies. Les jeux de données cliniques réels ajoutent une complication supplémentaire : tous les patients ne sont pas scannés avec le même ensemble de contrastes, si bien que les modèles doivent gérer des informations manquantes.

Un nouveau modèle multi-plans qui préserve davantage l’information

Pour répondre à ces problèmes, les auteurs ont conçu un « transformeur de vision multi-plans » (MP-ViT), un type d’IA initialement développé pour l’analyse d’images naturelles. Plutôt que de contraindre toutes les données IRM dans un même plan, le MP-ViT comporte deux branches de traitement dédiées : une pour les images axiales et une pour les images sagittales. Chaque branche scinde le volume cérébral en petits blocs, les convertit en tokens que le transformeur peut traiter, puis apprend des motifs pouvant indiquer la présence d’une hémorragie. Fait important, ces branches ne fonctionnent pas simplement en parallèle et de façon indépendante. Le modèle utilise un mécanisme de cross-attention pour permettre aux deux branches d’échanger des informations, imitant la manière dont un radiologue combine mentalement des vues de différents angles pour former une image globale plus claire du cerveau.

Figure 1
Figure 1.

Gérer les types d’acquisitions manquants grâce à un signal d’orientation

Dans les flux de travail hospitaliers réels, tous les patients n’ont pas le même ensemble de contrastes IRM ; certains peuvent manquer certaines séquences sensibles aux saignements. Pour rendre l’IA robuste à ces lacunes, les auteurs ont ajouté un « vecteur d’indication de modalité » — un code simple qui informe le modèle des types d’images présents et absents pour un patient donné. Ce vecteur est transformé en un ensemble de signaux internes qui interagissent avec les caractéristiques apprises du modèle via une étape supplémentaire de cross-attention. En pratique, le réseau est ainsi guidé pour ajuster ses attentes lorsque certains types d’informations sont indisponibles, plutôt que d’être confus ou excessivement confiant. Cette conception rend le MP-ViT mieux adapté aux données désordonnées et incomplètes qui surviennent en pratique clinique quotidienne.

Figure 2
Figure 2.

Performance de la nouvelle méthode

Les chercheurs ont entraîné et testé le MP-ViT sur un large jeu de données réel de plus de 12 000 examens IRM provenant de trois grands fabricants d’appareils, annotés par des radiologues expérimentés comme présentant ou non une hémorragie intracrânienne aiguë ou subaiguë. Sur un jeu de test indépendant, le MP-ViT a atteint une surface sous la courbe (AUC) de 0,854, mesure de la capacité du modèle à séparer les cas avec et sans hémorragie sur l’ensemble des seuils de décision possibles. Ce score était sensiblement supérieur à celui d’un transformeur de vision standard travaillant sur un seul plan, ainsi qu’à plusieurs architectures convolutives bien connues comme ResNet et DenseNet. Des tests statistiques ont confirmé que ces gains étaient peu susceptibles d’être dus au hasard. Une analyse interne a également montré que l’inclusion du vecteur d’indication de modalité améliorait la performance de plus d’un point de pourcentage, soulignant l’intérêt d’informer explicitement le modèle sur les types d’acquisitions disponibles.

Ce que cela pourrait signifier pour les soins futurs

Pour un non-spécialiste, l’essentiel est que cette étude montre une façon plus intelligente pour l’IA de lire les IRM : elle observe le cerveau sous plusieurs angles, conserve davantage de détails d’origine et s’adapte lorsque certains types d’images sont absents. Bien que le travail ait été évalué sur un seul jeu de données interne et se soit concentré uniquement sur la classification plutôt que sur la délimitation précise des hémorragies, il montre que des transformeurs soigneusement conçus peuvent mieux correspondre à la réalité désordonnée de l’imagerie clinique. Si ces méthodes sont validées plus largement et intégrées de manière responsable aux flux de travail hospitaliers, des approches comme le MP-ViT pourraient aider les radiologues à détecter plus fiablement les saignements cérébraux, tant en urgence pour les AVC que lors d’examens ambulatoires de routine, permettant potentiellement des traitements plus rapides et de meilleurs résultats pour les patients.

Citation: Das, B.K., Zhao, G., Mailhe, B. et al. Multi-plane vision transformer for hemorrhage classification using axial and sagittal MRI data. Sci Rep 16, 9333 (2026). https://doi.org/10.1038/s41598-026-44524-2

Mots-clés: hémorragie cérébrale, IRM, IA en imagerie médicale, transformeur de vision, diagnostic d’accident vasculaire cérébral