Clear Sky Science · pl

Contrastive learning enhanced MobileMamba for real time industrial defect detection on edge devices

· Powrót do spisu

Mądrzejsze oczy dla fabrycznego metalu

Od samochodów i samolotów po mosty i sprzęty domowe — współczesne życie zależy od metalowych części, które nie mogą pękać, łuszczyć się ani korodować. Wiele zakładów wciąż polega na dużych komputerach albo inspektorach ludziach, by wykrywać drobne wady na szybko poruszających się liniach produkcyjnych. Ten artykuł przedstawia nowy rodzaj kompaktowego systemu sztucznej inteligencji (AI), który potrafi szybko i precyzyjnie wychwycić bardzo małe uszkodzenia na powierzchniach metalowych, nawet gdy działa na energooszczędnych urządzeniach zamontowanych bezpośrednio przy maszynach wytwarzających te elementy.

Dlaczego drobne pęknięcia to poważny problem

Blachy i profile metalowe przechodzą przez etapy spawania, odlewania i cięcia, zanim staną się gotowymi produktami. Po drodze mogą pojawić się pęknięcia, otwory, rysy i inne wady powierzchni. Przeoczone uszkodzenia mogą skrócić żywotność części, a nawet doprowadzić do niebezpiecznych awarii. Systemy widzenia komputerowego oparte na głębokim uczeniu zaczynają automatyzować te kontrole, ale wiele z najdokładniejszych metod jest zbyt wolnych lub zasobożernych, by działać na małych, tanich urządzeniach „edge”, które fabryki wolą instalować przy linii. Istniejące szybkie modele z kolei często mają trudności z bardzo małymi lub niskokontrastowymi wadami i mogą być zmylane przez zaszumione albo wzorzyste tła.

Figure 1
Rys. 1.

Lżejszy, ostrzejszy cyfrowy inspektor

Autorzy przedstawiają MobileMamba — nową lekką sieć detekcyjną zaprojektowaną specjalnie do przemysłowej inspekcji metalu. Bazuje ona na popularnej rodzinie modeli detekcji obiektów YOLO, ale zastępuje kluczowe fragmenty architektury komponentami, które są zarówno wydajniejsze, jak i lepiej „widzą” całość obrazu. Centralnym pomysłem jest użycie niedawnej techniki modelowania sekwencji zwanej Mamba, która potrafi wychwycić wzorce o długim zasięgu w obrazie przy znacznie mniejszym nakładzie obliczeniowym niż sieci oparte na mechanizmach attention. Opakowana w smukły blok konstrukcyjny wykorzystujący konwolucje depthwise, MobileMamba uczy się łączyć drobne lokalne szczegóły, jak włosowate pęknięcie, z szerszym kontekstem rozciągającym się po powierzchni metalu, przy jednoczesnym utrzymaniu niewielkiego rozmiaru modelu i zapotrzebowania na energię.

Nauka modelu, co naprawdę ma znaczenie

W rzeczywistych obrazach inspekcyjnych dominują obszary normalne, pozbawione wad, więc model może łatwo nabrać uprzedzenia polegającego na oznaczaniu wszystkiego jako „OK”. Aby temu przeciwdziałać, badacze dodają dodatkowy cel treningowy oparty na uczeniu kontrastowym. Podczas treningu system stale porównuje cechy pochodzące z regionów z wadami (pierwszy plan) z tymi z czystych obszarów tła, a także kontrastuje poprawne pola z wadą z błędnymi predykcjami. Co kluczowe, nie traktuje wszystkich przykładów tła jednakowo: automatycznie znajduje „trudne” negatywy — fragmenty tła, które wyglądają najbardziej podobnie do wad — i zmusza model, by zwracał na nie szczególną uwagę. Ten dodatkowy składnik funkcji straty jest używany wyłącznie podczas uczenia i znika podczas działania, więc nie spowalnia pracy w czasie rzeczywistym.

Figure 2
Rys. 2.

Weryfikacja na rzeczywistych danych fabrycznych

Zespół przetestował swoje podejście na trzech powszechnie używanych zbiorach danych przemysłowych dotyczących powierzchni stali i aluminium, zawierających różne typy wad, takie jak pęknięcia, inkluzje i wgłębienia po walcowaniu. W porównaniu z kilkoma nowoczesnymi lekkimi detektorami, nowa metoda konsekwentnie osiągała wyższe wyniki detekcji przy jednoczesnym użyciu mniejszej liczby parametrów i mniejszym koszcie obliczeniowym. Na wszystkich trzech zbiorach poprawiła dokładność o około trzy punkty procentowe względem podobnie kompaktowych modeli opartych na YOLO. Autorzy stworzyli następnie jeszcze mniejszą „nano” wersję MobileMamba i wdrożyli ją na taniej płytce edge NVIDIA Jetson Nano. Nawet przy zmniejszonych rozmiarach obrazu ta wersja osiągała prędkości inspekcji w czasie rzeczywistym co najmniej 25 klatek na sekundę, jednocześnie przewyższając inne detektory zaprojektowane dla urządzeń brzegowych pod względem dokładności.

Co to oznacza dla prawdziwych fabryk

Dla osób niebędących specjalistami główny wniosek jest prosty: ta praca dostarcza inspektora AI, który jest jednocześnie szybki i oszczędny na tyle, by działać na małych komputerach przemysłowych, a jednocześnie wystarczająco czuły, by wychwycić drobne, trudne do zauważenia wady na powierzchniach metalowych. Poprzez przeprojektowanie sposobu, w jaki sieć zbiera informacje z obrazu, oraz przez trening ukierunkowany na najtrudniejsze podobne do wad fragmenty tła, autorzy pokazują, że fabryki nie muszą wybierać między szybkością a niezawodnością. Przy dalszych usprawnieniach, takich jak inteligentniejsza kompresja oraz łączenie zwykłych obrazów z obrazami termicznymi lub rentgenowskimi, podejścia takie jak MobileMamba mogą pomóc wprowadzić bezpieczniejszą i bardziej spójną kontrolę jakości na szeroką skalę w liniach produkcyjnych.

Cytowanie: Huang, J., Ariffin, S.A., Yang, Q. et al. Contrastive learning enhanced MobileMamba for real time industrial defect detection on edge devices. Sci Rep 16, 5096 (2026). https://doi.org/10.1038/s41598-026-35515-4

Słowa kluczowe: wykrywanie wad metalu, edge AI, inspekcja przemysłowa, lekkie sieci neuronowe, uczenie kontrastowe