Clear Sky Science · fr

Un système d’IA interprétable réduit les diagnostics IRM faussement positifs en stratifiant les lésions mammaires à haut risque

· Retour à l’index

Des examens plus intelligents, moins de procédures inutiles

L’IRM mammaire est l’un des meilleurs outils pour détecter le cancer précocement, en particulier chez les femmes à haut risque, mais elle « voit » souvent trop de choses, signalant de nombreux points inoffensifs comme suspects. Ces résultats dans une zone grise entraînent anxiété, examens complémentaires et biopsies douloureuses qui s’avèrent finalement bénignes. Cette étude présente un nouveau système d’intelligence artificielle (IA) qui lit les examens IRM mammaires en complément des radiologues et aide à distinguer les lésions réellement dangereuses de celles que l’on peut surveiller en toute sécurité, dans le but de détecter le cancer sans envoyer autant de femmes à la table de biopsie.

Figure 1
Figure 1.

Le problème des résultats incertains à l’IRM mammaire

Lorsque les radiologues interprètent une IRM mammaire, ils étiquettent les zones suspectes à l’aide d’une échelle appelée BI-RADS. La catégorie 4 est la plus problématique : elle regroupe des lésions ayant une probabilité de cancer comprise entre 2 % et 95 %. Parce que cet intervalle est si large, la règle pratique actuelle est de biopsier presque toutes ces lésions. En conséquence, de nombreuses femmes subissent des procédures invasives pour des lésions qui s’avèrent bénignes. De plus, l’interprétation de l’IRM est subjective. Différents radiologues, notamment les moins expérimentés, peuvent diverger sur le même examen, surestimant parfois des lésions bénignes ou manquant des cancers subtils. Les auteurs se sont donné pour objectif de concevoir un outil qui réduise cette incertitude tout en s’intégrant dans la pratique hospitalière réelle.

Un partenaire IA entraîné sur des milliers d’examens

Les chercheurs ont développé le BI-RADS 4 Lesions Analysis System, ou BL4AS, un modèle d’IA conçu spécifiquement pour ces résultats IRM à la fois à haut risque et ambigus. Contrairement aux systèmes antérieurs qui se fiaient à un unique instantané, BL4AS examine plusieurs points temporels après injection d’un produit de contraste, suivant la manière dont chaque lésion s’illumine et s’estompe dans le temps. Ces variations offrent des indices importants sur la probabilité que le tissu soit bénin ou malin. L’équipe a d’abord pré-entraîné un large « modèle fondation » sur plus de 17 000 volumes IRM pour apprendre des caractéristiques d’imagerie générales, puis l’a affiné sur 2 803 lésions BI-RADS 4 provenant de 2 686 femmes traitées dans trois centres médicaux. Le système délimite la lésion et la classe comme à faible ou haut risque, en fournissant une probabilité qu’il s’agisse d’un cancer.

Surpasser les lecteurs humains en milieu clinique

Pour évaluer la performance de BL4AS en dehors du laboratoire, les auteurs l’ont testé sur des données indépendantes d’autres hôpitaux et sur un groupe prospectif de patients nouvellement recrutés. Dans ces contextes, l’IA a montré une forte précision et, surtout, une spécificité nettement supérieure à celle des radiologues — c’est‑à‑dire qu’elle reconnaissait mieux les lésions bénignes et évitait davantage les faux positifs. Dans une étude prospective de lecteurs, huit radiologues ont d’abord interprété les cas seuls, puis les ont réexaminés avec l’aide de BL4AS. Avec le soutien de l’IA, leur précision diagnostique a augmenté, leur taux de faux positifs a diminué de plus d’un quart, et la concordance entre lecteurs s’est nettement améliorée. Les radiologues juniors en ont le plus bénéficié : leurs performances, avec l’aide du système, ont presque égalé celles de leurs collègues seniors.

Figure 2
Figure 2.

Rendre les décisions de l’IA transparentes et exploitables

Parce que les cliniciens sont légitimement prudents vis‑à‑vis des IA « boîte noire », l’équipe a intégré des explications visuelles. BL4AS produit des cartes de chaleur qui mettent en évidence les parties de la lésion ayant influencé sa décision, se focalisant souvent sur des formes irrégulières, des bords nets et des motifs d’amélioration inhabituels que les radiologues associent déjà au cancer. Le système va aussi au‑delà d’une simple prédiction oui/non en classant les lésions dans les sous-groupes BI-RADS 4A, 4B ou 4C, reflétant un risque croissant. Dans les jeux de test externes, ces sous‑catégories définies par l’IA correspondaient étroitement aux taux réels de cancer et faisaient mieux que les radiologues pour identifier à la fois les lésions à faible risque pouvant éviter la biopsie en toute sécurité et les lésions à haut risque nécessitant une prise en charge rapide.

Ce que cela pourrait signifier pour les patientes

Globalement, l’étude suggère qu’un assistant IA interprétable comme BL4AS peut aider les radiologues à lire les IRM mammaires de manière plus cohérente, réduire les biopsies inutiles tout en maintenant une marge de sécurité très élevée contre les cancers manqués. En exploitant la richesse des données IRM résolues dans le temps et en présentant son raisonnement de façon compréhensible pour l’humain, le système propose une voie concrète vers une prise en charge plus personnalisée du cancer du sein : les femmes présentant des lésions véritablement préoccupantes peuvent accéder rapidement au traitement, tandis que celles avec des résultats à faible risque peuvent éviter des procédures invasives et être simplement suivies de près au fil du temps.

Citation: Liang, Y., Wei, Z., Dai, Y. et al. An interpretable AI system reduces false-positive MRI diagnoses by stratifying high-risk breast lesions. Nat Commun 17, 2263 (2026). https://doi.org/10.1038/s41467-026-69212-7

Mots-clés: IRM mammaire, intelligence artificielle, diagnostic du cancer, imagerie médicale, stratification du risque