Clear Sky Science · fr
DEENet : un modèle double-encodeur CNN–Transformer amélioré par renforcement des bords pour la détection des défauts de surface de l’acier
Pourquoi de minuscules défauts dans l’acier ont de l’importance
Des automobiles et des ponts aux appareils ménagers, la vie moderne repose discrètement sur l’acier. Pourtant, la fiabilité de tous ces produits peut être compromise par des défauts si petits qu’ils sont difficiles à repérer, même au microscope. Cette étude présente DEENet, un nouveau système de vision par ordinateur capable de détecter automatiquement des défauts de surface subtils sur des bandes d’acier avec plus de précision et d’efficacité que les outils existants, aidant les usines à repérer les problèmes tôt, améliorer la sécurité et réduire les déchets.

Le défi de voir les petits défauts
Les surfaces d’acier subissent de nombreux types de défauts pendant la production : plaques écailleuses, piqûres, fissures capillaires, inclusions de corps étrangers et rayures. L’inspection traditionnelle repose sur des opérateurs humains ou des filtres d’image simples, qui sont lents, incohérents et facilement perturbés par des arrière-plans industriels bruyants. Les algorithmes modernes de détection « en un seul passage », comme la famille YOLO, peuvent analyser une image d’un coup, mais ils ratent encore les défauts très petits ou à faible contraste et ont souvent tendance à flouter les contours des zones endommagées. Lorsque les frontières entre acier sain et défectueux sont floues, les détecteurs estiment mal la taille et la position, ce qui entraîne des défauts manqués ou des fausses alertes.
Mêler deux façons de voir
DEENet s’attaque à ce problème en combinant deux approches complémentaires d’analyse d’image. Une branche est un réseau de neurones convolutif (CNN) classique, performant pour saisir les textures locales fines, comme de petites piqûres ou des rayures fines. L’autre branche est un réseau basé sur Transformer, qui découpe l’image en patchs et excelle à capturer le contexte global — comment les motifs se rapportent à l’ensemble de la bande d’acier. Dans DEENet, ces deux branches agissent comme des « yeux » jumeaux : l’un focalisé sur le détail, l’autre sur la vue d’ensemble. Un module de fusion à double canal personnalisé mêle ensuite leurs sorties, de sorte que chaque région de l’image soit décrite à la fois par sa texture locale et par son rôle dans la scène globale. Cet échange d’information rend le système plus sensible aux défauts minuscules et très rapprochés que les anciens modèles ont tendance à négliger.
Aiguiser le contour des dommages
Même avec des caractéristiques riches, les détecteurs peuvent encore peiner à tracer des contours nets autour des défauts, surtout lorsque ceux-ci se fondent progressivement dans l’arrière-plan. Pour y remédier, les auteurs conçoivent un module d’amélioration des bords, nommé C2f_EEM, qui se concentre spécifiquement sur les changements d’intensité aux frontières entre zones endommagées et indemnes. Il fait passer les caractéristiques à travers plusieurs filtres de tailles différentes pour capter des structures allant des fissures fines aux taches plus larges, puis utilise une sorte de comparaison avant-après pour mettre en évidence les transitions nettes. Ce processus met en relief le contenu « haute fréquence » où se trouvent les arêtes, faisant ainsi ressortir plus clairement fissures et piqûres, et ce avec des calculs légers adaptés à une utilisation en temps réel sur des lignes de production.

Mettre le système à l’épreuve
Les chercheurs évaluent DEENet sur une référence largement utilisée pour les défauts de bandes d’acier qui comprend six types de défauts courants, chacun avec des centaines d’images d’exemple. Comparé aux détecteurs standard basés sur YOLO et aux modèles plus récents de type Transformer, DEENet atteint une meilleure moyenne de précision moyenne (mAP) — une mesure synthétique de la fréquence à laquelle les détections sont à la fois correctes et bien placées — atteignant 81,4 %. Les gains sont particulièrement importants pour la catégorie la plus difficile, le craquèlement (crazing), qui ressemble à une fine toile de fissures et présente généralement un très faible contraste. DEENet non seulement détecte davantage de ces défauts difficiles, mais encadre aussi plus précisément leurs limites, tout en conservant une charge de calcul suffisamment basse pour un déploiement pratique. Des tests supplémentaires sur un autre jeu de données industriel et sur des images avec bruit ajouté et variations d’éclairage montrent que le modèle reste précis même lorsque les conditions se détériorent.
Ce que cela signifie pour les produits du quotidien
En termes simples, l’étude montre que fournir à un système de vision machine deux « vues » complémentaires de la même surface d’acier — et lui apprendre à renforcer les bords — peut rendre la détection des défauts à la fois plus intelligente et plus fiable. La capacité améliorée de DEENet à repérer des défauts petits et discrets et à en tracer précisément les contours pourrait aider les sidérurgistes à détecter les problèmes plus tôt, réduire les rebuts et fournir des matériaux plus homogènes pour tout, des gratte-ciel aux smartphones. Si les auteurs notent que des travaux supplémentaires seront nécessaires pour réduire la taille du modèle pour des appareils basse consommation et le tester dans des usines plus variées, leurs résultats représentent une avancée vers un contrôle qualité plus sûr, plus efficace et plus automatisé dans l’industrie lourde.
Citation: Pan, W., Zhong, R., Huang, J. et al. DEENet: an edge-enhanced CNN–Transformer dual-encoder model for steel surface defect detection. Sci Rep 16, 6692 (2026). https://doi.org/10.1038/s41598-026-36390-9
Mots-clés: défauts de l’acier, vision par ordinateur, apprentissage profond, inspection de la qualité, automatisation industrielle