Clear Sky Science · pl

Wieloskalowa sieć splotowa z postępującą dylatacją do wykrywania w czasie rzeczywistym wyróżniających się obiektów wad powierzchni taśm stalowych

· Powrót do spisu

Dlaczego drobne uszkodzenia stali mają znaczenie

Od nadwozi samochodowych po mosty — długie wstęgi stali zjeżdżają codziennie z linii produkcyjnych. Nawet maleńkie wgłębienia czy rysy na tych taśmach mogą osłabić końcowy wyrób lub zmusić do kosztownych poprawek. Ręczna kontrola każdego centymetra jest niemożliwa przy prędkościach przemysłowych, dlatego zakłady polegają na wizyjnych systemach komputerowych. W tej pracy przedstawiono nową metodę analizy obrazu, która szybko i niezawodnie wykrywa wady powierzchni taśm stalowych, nadążając za rzeczywistymi liniami produkcyjnymi.

Figure 1. Zautomatyzowany system wizyjny wykrywający wady na szybko poruszających się taśmach stalowych w czasie rzeczywistym.
Figure 1. Zautomatyzowany system wizyjny wykrywający wady na szybko poruszających się taśmach stalowych w czasie rzeczywistym.

Dostrzeganie tego, co się wyróżnia

Autorzy koncentrują się na zadaniu zwanym wykrywaniem wyróżniających się obiektów (salient object detection), które polega na wskazaniu przez komputer najbardziej wizualnie zauważalnych obszarów na obrazie. Na taśmach stalowych tymi obszarami są zwykle wady takie jak plamy, przebarwienia czy rysy. Dotychczasowe metody oparte na głębokim uczeniu radzą sobie z tym lepiej niż ręcznie projektowane filtry, ale wiele z nich jest zbyt wolnych lub zbyt ciężkich do użycia w trybie rzeczywistym. Inne mają trudności, gdy wady różnią się rozmiarem lub występują w zmiennym oświetleniu, co jest powszechne w ruchliwych zakładach.

Patrzenie na szczegóły i na całość

Aby rozwiązać te problemy, badacze zaprojektowali nową sieć nazwaną MSFNet-PD. Jej rdzeń polega na rozbiciu obrazu wejściowego na kilka warstw cech, z których każda uchwyca inny poziom szczegółu. Kluczową ideą jest wieloskalowe łączenie: model analizuje jednocześnie drobne lokalne tekstury i szersze kształty, a następnie łączy te informacje. Pomaga to odróżnić słabo widoczną rysę od normalnej tekstury oraz rozpoznać nieregularne plamy, które nie pasują do typowego wzoru stali. Zamiast używać ciężkich bloków uwagi, projekt opiera się na uproszczonych połączeniach, które utrzymują niskie zapotrzebowanie obliczeniowe.

Rozszerzanie pola widzenia krok po kroku

Drugą koncepcją jest postępująca dylatacja. Mówiąc prościej, model zaczyna od badania małych sąsiedztw pikseli, a następnie stopniowo poszerza swoją perspektywę w miarę jak cechy przesuwają się głębiej przez sieć. Stopniowe zwiększanie „pola widzenia” pozwala systemowi wykrywać zarówno małe, jak i duże wady bez rozmywania istotnych krawędzi. Poprzez ostrożne rozmieszczenie tych filtrów z dylatacją, sieć wychwytuje długie cienkie rysy, drobne inkluzje i szerokie plamy, jednocześnie zachowując wyraźne granice między uszkodzonymi a nieuszkodzonymi obszarami.

Figure 2. Krokowe przetwarzanie wieloskalowe, które przybliża od drobnej tekstury stali do wyraźnego uwydatnienia wad.
Figure 2. Krokowe przetwarzanie wieloskalowe, które przybliża od drobnej tekstury stali do wyraźnego uwydatnienia wad.

Wystarczająco szybkie dla linii produkcyjnej

Zespół przetestował MSFNet-PD na publicznym zestawie zdjęć taśm stalowych obejmującym trzy główne typy wad. Porównali go z szerokim wachlarzem istniejących modeli, od ciężkich systemów o wysokiej dokładności po ultra-lekkie rozwiązania zoptymalizowane pod kątem szybkości. Ich podejście osiąga silną równowagę: dorównuje lub rywalizuje z wieloma precyzyjnymi metodami, jednocześnie działając znacznie szybciej niż większość z nich, przetwarzając tysiące obrazów na sekundę na nowoczesnym procesorze graficznym. Dokładne eksperymenty pokazują, że połączenie kilku rozmiarów dylatacji i łączenie cech na wielu skalach jest kluczowe dla tej równowagi między szybkością a precyzją.

Co to oznacza dla przemysłu

Dla osoby niebędącej specjalistą wniosek jest taki, że badanie oferuje bardziej zaawansowany „mózg kamery” dla linii inspekcyjnych stali. MSFNet-PD potrafi skanować poruszające się taśmy metalowe w czasie rzeczywistym, uwydatniać prawdopodobne wady z ostrymi konturami i robić to przy umiarkowanym zapotrzebowaniu na moc obliczeniową. Choć autorzy zauważają, że potrzebne są dalsze testy na innych materiałach i w różnych zakładach, ich wyniki sugerują, że takie lekkie, wieloskalowe projekty mogą pomóc producentom wykrywać wady wcześniej i bardziej niezawodnie, poprawiając bezpieczeństwo i zmniejszając ilość odpadów bez spowalniania produkcji.

Cytowanie: Zhang, Z., Zou, Y., Liu, X. et al. Multi-scale fusion convolution network with progressive dilation for real-time salient object detection of surface defects on strip steel. Sci Rep 16, 15387 (2026). https://doi.org/10.1038/s41598-026-43386-y

Słowa kluczowe: wady taśmy stalowej, wykrywanie wyróżniających się obiektów, inspekcja w czasie rzeczywistym, uczenie głębokie, wizja przemysłowa