Clear Sky Science · fr
Une approche en deux étapes de prétraitement et de classification pour une détection précise du COVID-19 sur radiographies
Pourquoi une lecture plus intelligente des radiographies importe
Pendant la pandémie de COVID-19, les médecins se sont principalement appuyés sur les tests de laboratoire pour confirmer les infections. Mais les équipements de laboratoire peuvent manquer et les résultats peuvent prendre du temps, en particulier dans les régions à ressources limitées. Les radiographies thoraciques, en revanche, sont rapides et largement disponibles, pourtant même des radiologues experts peuvent avoir du mal à repérer les modifications pulmonaires souvent subtiles causées par le COVID-19. Cet article explore une façon d'apprendre aux ordinateurs à lire les radiographies de manière plus fiable en nettoyant d'abord les images, puis en appliquant des techniques d'intelligence artificielle modernes, dans le but d'aider les cliniciens à prendre des décisions plus rapides et plus précises.
Faire ressortir les détails importants dans des images bruitées
Une radiographie thoracique contient un enchevêtrement d'informations : os, tissus mous, ombres et artefacts de la machine se superposent. Les systèmes d'apprentissage profond classiques tentent d'apprendre directement à partir de ces images brutes, ce qui oblige le réseau à déterminer lui-même quelles parties de chaque image sont importantes. Cela devient difficile lorsque les images varient en luminosité, contraste et qualité. Les auteurs s'attaquent à ce problème en ajoutant une étape de prétraitement dédiée avant que les radiographies n'atteignent le réseau neuronal. Ils utilisent une technique de vision par ordinateur appelée Maximally Stable Extremal Regions (MSER), qui scanne l'image à plusieurs niveaux de luminosité et sélectionne les régions qui restent stables lorsque le seuil change. Ces zones stables correspondent souvent à des structures signifiantes — comme des régions de tissu pulmonaire anormal — tout en ignorant le désordre plus aléatoire.

Laisser une meute virtuelle de loups régler les paramètres
MSER est puissant mais délicat : ses performances dépendent fortement de plusieurs paramètres numériques qui contrôlent la taille maximale d'une région, la variation de luminosité admissible et la netteté de ses contours. Tester manuellement toutes les combinaisons pour des milliers de radiographies serait fastidieux et lent. Pour résoudre cela, les chercheurs ont recours à une méthode d'optimisation inspirée de la nature appelée Grey Wolf Optimizer. Dans cet algorithme, une meute virtuelle de « loups » explore différentes combinaisons de paramètres, évoluant progressivement vers celles qui produisent les régions les plus nettes et informatives dans les images. La qualité de chaque configuration est évaluée à l'aide d'une mesure qui récompense les régions à la fois uniformes en leur sein et clairement séparées de leur environnement. Après quelques dizaines d'itérations par image, la meute converge vers un ensemble de paramètres qui fait ressortir clairement les zones pulmonaires suspectes.
Enseigner aux réseaux neuronaux avec des images plus propres
Une fois les radiographies affinées de cette façon, elles sont transmises à un réseau de neurones convolutifs profond — la même classe de modèles largement utilisée pour la reconnaissance faciale et les véhicules autonomes. Les auteurs ont testé leur pipeline en deux étapes avec trois familles de réseaux différentes : un réseau personnalisé très simple, DenseNet (une architecture plus robuste et complexe) et MobileNet (un modèle plus léger conçu pour les appareils mobiles). Pour chacun, ils ont comparé les performances sur deux jeux de données publics de radiographies thoraciques, d'abord en utilisant les images brutes puis en utilisant les images prétraitées par la combinaison MSER–Grey Wolf. Dans tous les cas, les images prétraitées ont conduit à une meilleure précision, moins de faux positifs et un entraînement plus rapide. Dans un cas, la précision est passée d'environ 90 % à près de 99 %, tandis que le temps d'entraînement a été réduit d'environ deux tiers.

Quelle robustesse de cette approche dans le monde réel ?
Pour vérifier si la méthode ne faisait que mémoriser les particularités d'un seul jeu de données, les auteurs ont mené un test plus exigeant : ils ont entraîné leurs modèles sur une collection de radiographies puis les ont évalués sur une autre collection jamais vue auparavant. Les performances ont naturellement diminué, mais les systèmes utilisant le nouveau prétraitement ont mieux résisté que ceux entraînés uniquement sur des images brutes. L'étude comprenait également une analyse d'ablation, qui a montré que l'utilisation de MSER sans réglage automatique n'apportait pas beaucoup d'amélioration, ainsi qu'une comparaison avec une méthode de rehaussement de contraste plus conventionnelle. Dans ces cas, les gains disparaissaient en grande partie. Cela suggère que l'ingrédient clé n'est pas simplement « améliorer » les images, mais guider l'algorithme pour isoler, de manière principielle et basée sur les données, des régions stables pertinentes pour la maladie.
Ce que cela signifie pour les patients et les médecins
Ce travail ne remplace pas les tests PCR ni les radiologues experts, et les auteurs notent des limites : les données proviennent d'un ensemble restreint d'hôpitaux et la méthode n'a pas été testée sur toutes les architectures réseau modernes ni sur d'autres maladies pulmonaires. Néanmoins, leurs résultats montrent qu'un prétraitement conçu avec soin peut rendre les systèmes d'IA existants beaucoup plus précis et efficaces. En aidant les réseaux neuronaux à se concentrer sur les parties les plus informatives de chaque radiographie thoracique, l'approche en deux étapes offre une voie pratique vers des outils d'aide au diagnostic automatisés et fiables pour le COVID-19 et, potentiellement, d'autres affections respiratoires — en particulier dans des contextes où des décisions rapides et des ressources de calcul limitées sont la norme.
Citation: González, A., Gutiérrez, V.G., Cuevas, E. et al. A two-stage preprocessing and classification approach for accurate COVID-19 detection in X-ray images. Sci Rep 16, 13514 (2026). https://doi.org/10.1038/s41598-026-41861-0
Mots-clés: Diagnostic COVID-19 par radiographie, prétraitement d'images médicales, apprentissage profond en radiologie, détection assistée par ordinateur, IA pour l'imagerie thoracique