Clear Sky Science · it

DEENet: un modello a doppio encoder CNN–Transformer con miglioramento dei contorni per il rilevamento dei difetti superficiali dell’acciaio

· Torna all'indice

Perché piccoli difetti nell’acciaio contano

Dalle automobili e dai ponti agli elettrodomestici, la vita moderna si affida silenziosamente all’acciaio. Eppure l’affidabilità di tutti questi prodotti può essere compromessa da difetti così piccoli da risultare difficili da individuare anche al microscopio. Questo studio presenta DEENet, un nuovo sistema di visione artificiale in grado di individuare automaticamente difetti superficiali sottili su nastri d’acciaio con maggiore accuratezza ed efficienza rispetto agli strumenti esistenti, aiutando le fabbriche a intercettare i problemi precocemente, migliorare la sicurezza e ridurre gli scarti.

Figure 1
Figure 1.

La sfida di vedere i difetti piccoli

Le superfici d’acciaio acquisiscono diversi tipi di difetti durante la produzione: chiazze squamose, avvallamenti, crepe sottili, inclusioni di materiali estranei e graffi. L’ispezione tradizionale si basa su operatori umani o su filtri immagini semplici, che sono lenti, incoerenti e facilmente confusi dai rumori presenti negli ambienti di produzione. Gli algoritmi moderni di rilevamento “one-shot”, come la famiglia YOLO, possono analizzare un’immagine in un’unica passata, ma continuano a perdere difetti molto piccoli o a basso contrasto e spesso sfumano i contorni delle aree danneggiate. Quando i confini tra acciaio sano e difettoso sono sfocati, i rilevatori valutano male dimensioni e posizione, causando difetti non individuati o falsi allarmi.

Combinare due modi di vedere

DEENet affronta questo problema combinando due modalità complementari di analisi dell’immagine. Un ramo è una classica rete convoluzionale (CNN), efficace nell’acquisire texture locali fini, come piccoli avvallamenti o graffi sottili. L’altro ramo è una rete basata su Transformer, che suddivide l’immagine in patch ed è eccellente nel catturare il contesto più ampio—come i rapporti tra pattern su tutto il nastro d’acciaio. In DEENet questi due rami funzionano come “occhi” gemelli: uno focalizzato sul dettaglio, l’altro sulla visione d’insieme. Un modulo personalizzato di Dual Channel Fusion miscela poi i loro output, così che ogni regione dell’immagine sia descritta sia dalla sua texture locale sia dal suo ruolo nella scena complessiva. Questo scambio incrociato rende il sistema più sensibile a difetti piccoli e affollati che i modelli più datati tendono a trascurare.

Affilare il contorno del danno

Anche con caratteristiche ricche, i rilevatori possono ancora incontrare difficoltà nel tracciare confini netti intorno ai difetti, specialmente quando questi sfumano gradualmente nello sfondo. Per risolvere il problema, gli autori progettano un modulo di miglioramento dei contorni, chiamato C2f_EEM, che si concentra specificamente sulle variazioni di intensità ai bordi tra aree danneggiate e non danneggiate. Fa passare le feature attraverso diversi filtri di dimensioni variabili per catturare strutture che vanno dalle crepe sottili alle macchie più ampie, quindi utilizza una sorta di confronto ante/post per enfatizzare le transizioni nette. Questo processo mette in risalto il contenuto “ad alta frequenza” dove risiedono i bordi, facendo emergere crepe e avvallamenti in modo più chiaro, e lo fa con calcoli leggeri adatti all’uso in tempo reale sulle linee di produzione.

Figure 2
Figure 2.

Mettere il sistema alla prova

I ricercatori valutano DEENet su un benchmark largamente utilizzato di difetti su nastri d’acciaio che include sei tipologie comuni di imperfezioni, ciascuna con centinaia di immagini campione. Rispetto ai rilevatori standard basati su YOLO e ai più recenti modelli in stile Transformer, DEENet raggiunge una mean Average Precision più elevata—una misura riassuntiva di quanto spesso le rilevazioni siano sia corrette sia ben posizionate—arrivando all’81,4%. I miglioramenti sono particolarmente marcati per la categoria più difficile, il crazing, che appare come una fitta rete di crepe e tipicamente presenta contrasto molto basso. DEENet non solo individua più di questi difetti ostici, ma disegna anche bounding box più aderenti attorno a essi, mantenendo nel contempo un carico computazionale abbastanza basso per un dispiegamento pratico. Test aggiuntivi su un altro dataset industriale e su immagini con rumore e variazioni di illuminazione aggiunte dimostrano che il modello resta accurato anche quando le condizioni peggiorano.

Cosa significa per i prodotti di uso quotidiano

In termini semplici, lo studio mostra che fornire a un sistema di visione artificiale due “visioni” complementari della stessa superficie d’acciaio—e insegnargli ad accentuare i bordi—può rendere il rilevamento dei difetti più intelligente e affidabile. La migliorata capacità di DEENet di individuare difetti piccoli e deboli e di delinearli con precisione potrebbe aiutare gli acciai produttori a intercettare problemi in una fase più precoce, ridurre gli scarti e fornire materiali più coerenti per tutto, dai grattacieli agli smartphone. Pur notando che sono necessari ulteriori lavori per ridurre il modello per dispositivi a basso consumo e per testarlo in fabbriche più varie, gli autori considerano i risultati un passo verso un controllo qualità nell’industria pesante più sicuro, efficiente e automatizzato.

Citazione: Pan, W., Zhong, R., Huang, J. et al. DEENet: an edge-enhanced CNN–Transformer dual-encoder model for steel surface defect detection. Sci Rep 16, 6692 (2026). https://doi.org/10.1038/s41598-026-36390-9

Parole chiave: difetti dell’acciaio, visione artificiale, apprendimento profondo, ispezione della qualità, automazione industriale