Clear Sky Science · fr

Mécanisme d’attention mixte et apprentissage multitâche pour la reconnaissance du plan standard abdominal fœtal et la détection des structures anatomiques clés

· Retour à l’index

Aider les médecins à voir avant la naissance

L’échographie prénatale est l’une des premières fenêtres dont disposent les parents et les médecins pour évaluer la santé d’un bébé. Mais interpréter ces images granuleuses en noir et blanc est une compétence qui demande des années de pratique, et de petits détails peuvent faire la différence entre détecter un problème tôt et le manquer. Cette étude présente un système informatique conçu pour aider : un outil d’intelligence artificielle capable de reconnaître rapidement les vues standards de l’abdomen du fœtus et de mettre en évidence les organes clés que les médecins recherchent lors des examens de routine pendant la grossesse.

Figure 1
Figure 1.

Pourquoi les vues standards sont importantes

Lorsque une future mère passe une échographie au milieu de la grossesse, le clinicien ne se contente pas de « regarder » au hasard. Il recherche délibérément un ensemble de vues standards du fœtus. Pour l’abdomen, cela inclut des coupes transversales utilisées pour mesurer la taille abdominale, des vues centrées sur la vessie, le cordon ombilical et plusieurs angles sur les reins et la colonne vertébrale. Ensemble, ces plans permettent aux médecins d’estimer la croissance, de vérifier l’absence d’anomalies structurelles et d’évaluer les risques liés à l’accouchement. Obtenir chaque vue standard exige des gestes manuels précis et une bonne connaissance de l’anatomie, et des tranches d’aspect similaire peuvent facilement être confondues — surtout pour le personnel moins expérimenté ou lorsque les images sont bruitées.

Transformer les images échographiques en données

Pour entraîner un ordinateur à aider dans cette tâche, les chercheurs ont d’abord constitué une grande collection d’images issues de la pratique clinique. Sur quatre ans, ils ont rassemblé plus de 6 700 images d’échographie abdominale provenant de plus de 3 100 femmes enceintes dans plusieurs hôpitaux, avec de nombreux appareils différents. Des radiologues expérimentés ont soigneusement tracé 14 structures anatomiques clés sur chaque image — comme l’estomac, la vessie, les reins, les gros vaisseaux, la colonne, les côtes et le cordon ombilical — et ont étiqueté laquelle des sept vues abdominales standards chaque image représentait. Ce processus de labellisation intensif a créé une « carte » riche reliant les motifs de pixels à des structures d’intérêt clinique.

Une IA à double objectif avec attention ciblée

En s’appuyant sur ce jeu de données, l’équipe a développé un modèle d’apprentissage profond qu’elle appelle FAUSP‑NET. Contrairement aux systèmes qui n’exécutent qu’une seule tâche, FAUSP‑NET est un réseau multitâche : en une seule passe, il encadre les organes clés et décide à quel plan standard appartient l’image. Sous le capot, le modèle utilise une architecture moderne de détection d’objets, enrichie de plusieurs composants d’« attention » qui l’aident à se concentrer sur les régions et les échelles les plus informatives. Certains blocs d’attention mettent en évidence de subtiles différences entre des structures proches en apparence (par exemple, rein gauche versus rein droit, ou cordon ombilical versus vaisseaux adjacents), tandis que d’autres s’adaptent à des organes de tailles très différentes. Une fonction de perte spécialement conçue aide le système à apprendre à partir de structures rares ou difficiles à voir, améliorant la précision de leur délimitation.

Figure 2
Figure 2.

Performances du système

Une fois entraîné, FAUSP‑NET a été testé sur des images mises de côté et comparé à 24 modèles de vision par ordinateur existants, incluant des détecteurs d’objets et des classifieurs d’images populaires. Il s’est avéré plus précis que tous dans la détection des organes et la reconnaissance des vues standards. Pour la détection d’organes, il reproduisait correctement les marquages des cliniciens dans la grande majorité des cas et traitait la plupart des structures avec une fiabilité quasi parfaite ; seules les caractéristiques les plus ténues et les plus petites, comme certains vaisseaux et le diaphragme, restaient challengées. Pour la reconnaissance des vues, le système classait correctement les images comme l’un des sept plans abdominaux plus de 97 % du temps. Sur du matériel standard, il traitait chaque image en environ 24 millisecondes — assez rapide pour un usage en temps réel pendant un examen.

Comparer l’IA aux experts humains

Pour évaluer la valeur pratique de l’outil, les chercheurs l’ont testé sur un ensemble d’images entièrement distinct provenant d’un autre hôpital et ont comparé ses performances à celles de médecins en échographie juniors, intermédiaires et seniors. La précision de FAUSP‑NET pour détecter les structures et identifier les vues standards s’est approchée ou a égalé celle des médecins seniors expérimentés, et a nettement dépassé celle des praticiens moins expérimentés. Fait essentiel, le système a effectué son analyse en moins d’un centième du temps nécessaire à un médecin senior pour examiner les mêmes cas. Des techniques de visualisation ont montré que le modèle a tendance à se focaliser sur les mêmes régions que celles sur lesquelles s’appuient les experts humains, ce qui renforce son interprétabilité et son acceptation potentielle en pratique clinique.

Ce que cela signifie pour les familles enceintes

Concrètement, ce travail montre qu’un système d’IA entraîné avec soin peut servir de seconde paire d’yeux lors des échographies prénatales de l’abdomen. FAUSP‑NET peut rapidement indiquer si la bonne vue abdominale a été acquise et si les organes cruciaux sont bien visibles, aidant les échographistes moins expérimentés à éviter des erreurs et libérant les spécialistes pour se concentrer sur les cas complexes. Bien que des tests supplémentaires sur davantage d’hôpitaux et d’appareils soient encore nécessaires, cette technologie ouvre la voie à des échographies de routine plus cohérentes, plus rapides et moins dépendantes de la personne qui tient la sonde, améliorant potentiellement la prise en charge des mères et des nouveau‑nés.

Citation: Li, Y., Huang, Y., Liu, Z. et al. Mixed attention mechanism multi-task learning for fetal abdominal standard plane recognition and key anatomical structure detection. Sci Rep 16, 12324 (2026). https://doi.org/10.1038/s41598-026-40590-8

Mots-clés: échographie prénatale, abdomen fœtal, apprentissage profond, détection de plans standards, analyse d’images médicales