Clear Sky Science · pl

DEENet: model z podwójnym enkoderem CNN–Transformer z wzmocnieniem krawędzi do wykrywania defektów powierzchni stali

· Powrót do spisu

Dlaczego drobne usterki w stali mają znaczenie

Od samochodów i mostów po sprzęt gospodarstwa domowego — współczesne życie w dużej mierze opiera się na stali. Niezawodność tych produktów może jednak zostać podważona przez wady tak małe, że trudno je dostrzec nawet pod mikroskopem. W tym badaniu przedstawiono DEENet, nowy system widzenia komputerowego, który potrafi automatycznie wykrywać subtelne defekty powierzchniowe na taśmach stalowych dokładniej i wydajniej niż istniejące narzędzia, pomagając zakładom wychwytywać problemy wcześniej, poprawiać bezpieczeństwo i zmniejszać straty.

Figure 1
Figure 1.

Trudność dostrzegania małych wad

Powierzchnie stali podczas produkcji mogą nabierać różnych rodzajów wad: łuszczących się plam, dziurek, włoskowatych pęknięć, inkluzji obcych materiałów i zarysowań. Tradycyjna kontrola opiera się na pracy ludzi lub prostych filtrach obrazów, które są wolne, niespójne i łatwo mylone przez zakłócające tło fabryczne. Nowoczesne algorytmy „one-shot”, takie jak rodzina YOLO, potrafią przeskanować obraz w jednym przejściu, ale wciąż przeoczają bardzo małe lub słabo kontrastowe defekty i często zacierają krawędzie uszkodzonych obszarów. Gdy granice między zdrową a uszkodzoną stalą są nieostre, detektory błędnie oceniają rozmiar i położenie, co prowadzi do przeoczeń lub fałszywych alarmów.

Połączenie dwóch sposobów widzenia

DEENet rozwiązuje ten problem, łącząc dwa komplementarne sposoby analizy obrazu. Jeden tor to klasyczna sieć konwolucyjna (CNN), dobra w wychwytywaniu drobnych lokalnych faktur, takich jak maleńkie dziurki czy cienkie rysy. Drugi tor to sieć oparta na Transformerze, która dzieli obraz na łatki i świetnie radzi sobie z uchwyceniem szerszego kontekstu — jak wzory odnoszą się do siebie na całej taśmie stali. W DEENet te dwa tory działają jak bliźniacze „oczy”: jedno skupione na detalach, drugie na całości obrazu. Niestandardowy moduł Dual Channel Fusion łączy ich wyjścia, dzięki czemu każdy obszar obrazu jest opisany zarówno przez lokalną teksturę, jak i przez jego rolę w ogólnej scenie. Ta wymiana informacji zwiększa wrażliwość systemu na drobne, zatłoczone defekty, które starsze modele mają tendencję przeoczać.

Wyostrzenie konturu uszkodzeń

Nawet przy bogatych cechach detektory mogą mieć trudności z rysowaniem wyraźnych granic wokół defektów, szczególnie gdy stopniowo przechodzą one w tło. Aby temu zaradzić, autorzy zaprojektowali moduł wzmocnienia krawędzi, nazwany C2f_EEM, który koncentruje się specjalnie na zmianach natężenia wzdłuż granic między obszarami uszkodzonymi i nieuszkodzonymi. Przepuszcza cechy przez kilka filtrów o różnych rozmiarach, aby uchwycić struktury od cienkich pęknięć po szersze plamy, a następnie wykorzystuje rodzaj porównania przed‑i‑po, by uwypuklić ostre przejścia. Proces ten podkreśla zawartość o wysokiej częstotliwości, gdzie znajdują się krawędzie, sprawiając, że rysy i dziurki stają się wyraźniejsze, a przy tym stosuje niewielkie obliczenia odpowiednie do pracy w czasie rzeczywistym na liniach produkcyjnych.

Figure 2
Figure 2.

Testy systemu

Badacze ocenili DEENet na powszechnie używanym benchmarku defektów taśm stalowych, który obejmuje sześć typowych rodzajów wad, z setkami przykładowych obrazów dla każdego. W porównaniu ze standardowymi detektorami opartymi na YOLO i nowszymi modelami w stylu Transformera, DEENet osiągnął wyższą średnią precyzję (mAP) — miarę podsumowującą, jak często wykrycia są zarówno poprawne, jak i dobrze umiejscowione — osiągając 81,4%. Zyski są szczególnie wyraźne dla najtrudniejszej kategorii, crazing, przypominającej drobną sieć pęknięć i zwykle cechującej się bardzo niskim kontrastem. DEENet nie tylko znajduje więcej tych trudnych defektów, lecz także rysuje dla nich ciaśniejsze ramki, przy jednoczesnym utrzymaniu obliczeń na poziomie odpowiednim do praktycznego wdrożenia. Dodatkowe testy na innym zbiorze przemysłowym oraz na obrazach z nałożonym szumem i zmianami oświetlenia pokazują, że model pozostaje dokładny nawet przy pogorszonych warunkach.

Co to oznacza dla produktów codziennego użytku

W prostych słowach badanie pokazuje, że wyposażenie systemu widzenia maszynowego w dwa komplementarne „widoki” tej samej powierzchni stali — i nauczanie go wyostrzania krawędzi — może uczynić wykrywanie defektów zarówno mądrzejszym, jak i bardziej niezawodnym. Lepsza zdolność DEENet do wykrywania małych, słabo widocznych wad i precyzyjnego ich obrysowania może pomóc producentom stali wychwytywać problemy wcześniej, zmniejszać odpady i dostarczać bardziej jednolite materiały do wszystkiego, od wieżowców po smartfony. Autorzy zauważają, że potrzebne są dalsze prace nad zmniejszeniem modelu dla urządzeń o niskim poborze mocy oraz testami w bardziej zróżnicowanych zakładach, jednak ich wyniki stanowią krok w kierunku bezpieczniejszej, wydajniejszej i bardziej zautomatyzowanej kontroli jakości w przemyśle ciężkim.

Cytowanie: Pan, W., Zhong, R., Huang, J. et al. DEENet: an edge-enhanced CNN–Transformer dual-encoder model for steel surface defect detection. Sci Rep 16, 6692 (2026). https://doi.org/10.1038/s41598-026-36390-9

Słowa kluczowe: wady stali, widzenie komputerowe, uczenie głębokie, inspekcja jakości, automatyzacja przemysłowa