Clear Sky Science · fr

Classification précise des lésions cutanées sur images dermoscopiques déséquilibrées et à forte variance via le cadre SCTFD

2026-03-05 · Retour à l’index

Pourquoi des examens de la peau plus intelligents sont importants

Le cancer de la peau est l’un des cancers les plus fréquents, mais aussi l’un des plus guérissables s’il est détecté tôt. Les dermatologues s’appuient de plus en plus sur des photographies rapprochées de grains de beauté et de taches, prises avec un grossissement manuel appelé dermatoscope, pour décider lesquels sont dangereux. Pourtant, l’interprétation de ces images reste difficile, même pour les experts, et les systèmes informatiques susceptibles de les aider échouent souvent parce que certains types de cancer sont rares et que les lésions peuvent varier énormément d’un patient à l’autre. Cette étude présente un nouveau cadre d’intelligence artificielle (IA), nommé SCTFD, conçu pour rendre la classification automatisée des lésions cutanées plus précise et plus fiable précisément dans ces situations difficiles.

Le défi des taches cutanées rares et difficiles

Les collections d’images cutanées en conditions réelles sont loin d’être équilibrées. Les grains de beauté fréquents et généralement bénins apparaissent des milliers de fois dans les jeux d’entraînement, tandis que des cancers graves comme le mélanome ou des tumeurs rares n’apparaissent que quelques centaines de fois, voire moins. Parallèlement, des lésions appartenant à une même maladie peuvent différer fortement en taille, couleur et forme. Les systèmes d’IA standards ont tendance à surajuster les motifs fréquents et à négliger les motifs rares, ce qui est dangereux en médecine : il vaut mieux manquer un grain de beauté bénin qu’un mélanome. Les stratégies classiques, comme copier simplement des images rares, les mélanger ou utiliser des modèles génératifs complexes, présentent des limites en termes de réalisme, de stabilité ou de coût computationnel. SCTFD a été conçu spécifiquement pour gérer ce déséquilibre et cette variabilité tout en restant suffisamment efficace pour une utilisation pratique.

Créer de meilleurs exemples d’entraînement

Le premier bloc de construction de SCTFD est un générateur de données appelé CN-SMOTE. Plutôt que d’interpoler les valeurs de pixels ou d’entraîner un réseau antagoniste génératif fragile, CN-SMOTE utilise une paire encodeur–décodeur : un réseau compresse une image dermoscopique en un code interne compact, et un autre la reconstruit en image. Une fois cet espace compact appris, la méthode recherche des voisins proches parmi les lésions de classes rares et interpole entre leurs codes, puis décode ces codes mixtes en nouvelles images. Une pénalité d’entraînement spécifique maintient les codes internes des lésions d’un même type proches les uns des autres, de sorte que les images synthétiques restent réalistes et fidèles à la maladie sous-jacente. Le résultat est une collection plus grande et plus équilibrée d’images dermoscopiques dans laquelle les types de lésions rares mais importants sont mieux représentés.

Voir à la fois les détails et l’ensemble

Le deuxième composant, MARD-Net, vise à transformer chaque image en un ensemble riche de caractéristiques révélatrices. Les couches convolutionnelles jouent le rôle de lentilles ajustables qui captent des motifs fins tels que les bordures et les textures. Par-dessus cela, un module d’attention apprend au réseau à se concentrer sur la petite région où se trouve réellement la lésion, en atténuant la peau saine environnante qui pourrait distraire le modèle. Enfin, une étape basée sur un Transformer examine l’image dans son ensemble pour capturer les relations entre des parties distantes de la lésion, par exemple la disposition des couleurs et des structures. Pour éviter la lourde charge computationnelle habituellement associée aux Transformers, les auteurs introduisent une stratégie de fenêtre glissante qui permet au modèle d’obtenir une vue large de la lésion tout en ne réalisant des calculs d’attention ciblés que dans des régions sélectionnées, le rendant ainsi plus rapide et moins gourmand en mémoire.

Orienter le modèle pour traiter chaque classe équitablement

Le troisième pilier de SCTFD est un nouvel objectif d’entraînement nommé FDLoss, qui indique à l’IA comment se corriger pendant l’apprentissage. Plutôt que de compter chaque image à parts égales, FDLoss met l’accent sur les cas difficiles et rares afin que le modèle ne puisse pas se contenter d’obtenir de bons résultats sur les exemples abondants et faciles. Il combine des idées de deux critères populaires : l’un récompensant un bon équilibre entre sensibilité et précision, et l’autre réduisant le poids des exemples triviaux que le réseau classe déjà correctement. En outre, FDLoss ajoute un terme qui encourage les images d’une même maladie à former des groupes serrés dans l’espace interne du modèle, tout en éloignant les maladies différentes. Cette combinaison lutte directement à la fois contre le déséquilibre des classes et contre la grande variation au sein de chaque classe qui embrouille généralement les classificateurs.

Quelle est la performance de la nouvelle approche

Les auteurs ont testé SCTFD sur deux bancs d’essai internationaux largement utilisés en imagerie cutanée, ISIC 2018 et ISIC 2019, qui contiennent des dizaines de milliers d’images dermoscopiques cliniques réelles réparties respectivement sur sept et huit types de lésions, et sont fortement biaisés en faveur des grains de beauté communs. Comparé à plusieurs méthodes à l’état de l’art, SCTFD a obtenu une précision supérieure et un équilibre nettement meilleur entre la détection des vrais positifs et l’évitement des fausses alertes. Il a porté la précision globale à environ 93 % sur ISIC 2018 et 91 % sur ISIC 2019, et a élevé le score F1 — une mesure qui équilibre omissions et erreurs d’étiquetage — au-delà de tous les systèmes concurrents. Les visualisations ont montré que ses modules d’attention se concentrent précisément sur les régions de la lésion et que les caractéristiques des différentes maladies deviennent plus nettement séparées après l’entraînement.

Ce que cela signifie pour les patients et les médecins

Pour les patients, la promesse de SCTFD est un second avis plus fiable lorsqu’une tache suspecte apparaît sur la peau. En synthétisant des exemples réalistes de cancers rares, en se concentrant sur les parties les plus informatives de chaque image et en entraînant avec une fonction de perte qui impose une séparation claire entre les types de maladies, le cadre réduit le risque que les systèmes automatisés négligent des lésions dangereuses simplement parce qu’elles sont rares ou atypiques. Sans remplacer le jugement d’un dermatologue, cette approche pourrait faciliter un diagnostic précoce et précis dans les cabinets et les plateformes de télémédecine, permettant potentiellement de détecter des cancers cutanés mortels plus tôt et de façon plus systématique.

Citation: Li, X., Ouyang, J., Chen, Y. et al. Accurate skin lesion classification on imbalanced dermoscopic images with high variance via the SCTFD framework. Sci Rep 16, 12302 (2026). https://doi.org/10.1038/s41598-026-37846-8

Mots-clés: détection du cancer de la peau, IA en dermoscopie, classification d'images médicales, jeux de données déséquilibrés, apprentissage profond en dermatologie