Clear Sky Science · de
Contrastive Learning verbessertes MobileMamba für die Echtzeit‑Erkennung industrieller Defekte auf Edge‑Geräten
Intelligentere Augen für Fabrikmetall
Von Autos und Flugzeugen bis zu Brücken und Haushaltsgeräten hängt das moderne Leben von Metallteilen ab, die nicht reißen, abblättern oder korrodieren dürfen. Noch heute verlassen sich viele Fabriken auf sperrige Computer oder sogar menschliche Inspektoren, um winzige Defekte auf schnell laufenden Produktionslinien zu finden. Dieses Papier stellt ein neues, kompaktes System der künstlichen Intelligenz (KI) vor, das sehr kleine Fehler auf Metalloberflächen schnell und zuverlässig erkennt — selbst wenn es auf stromsparenden Geräten läuft, die direkt neben den Maschinen montiert sind, die diese Teile herstellen.
Warum winzige Risse ein großes Problem sind
Metallbleche und -profile durchlaufen Schweiß-, Guss‑ und Schneidprozesse, bevor sie zu fertigen Produkten werden. Dabei können sie Risse, Löcher, Kratzer und andere Oberflächenfehler bekommen. Übersehene Mängel können die Lebensdauer eines Bauteils verkürzen oder sogar zu gefährlichen Ausfällen führen. Auf Deep‑Learning basierende Computer‑Vision‑Systeme haben begonnen, diese Inspektionsaufgaben zu automatisieren, doch viele der genauesten Methoden sind zu langsam oder zu schwerfällig, um auf kleinen, kostengünstigen „Edge“‑Geräten zu laufen, die Fabriken bevorzugt an der Linie installieren. Bestehende schnelle Modelle hingegen tun sich oft schwer mit sehr kleinen oder kontrastarmen Defekten und lassen sich durch verrauschte oder gemusterte Hintergründe täuschen.

Ein leichterer, schärferer digitaler Inspektor
Die Autorinnen und Autoren stellen MobileMamba vor, ein neues leichtgewichtiges Detektionsnetz, das speziell für die industrielle Metallinspektion entwickelt wurde. Es baut auf der weit verbreiteten YOLO‑Familie von Objekterkennungsmodellen auf, ersetzt aber zentrale Teile der Architektur durch Komponenten, die sowohl effizienter sind als auch besser darin, das Gesamtbild zu erfassen. Eine zentrale Idee ist die Nutzung einer jüngeren Sequenzmodellierungs‑Technik namens Mamba, die Langstreckenmuster in einem Bild mit deutlich geringerem Rechenaufwand erfassen kann als aufmerksamkeitsbasierte Netze. Eingebettet in einen schlanken Baustein mit Depthwise‑Convolutions lernt MobileMamba, feine lokale Details wie einen haarfeinen Riss mit breiterem Kontext über das Metallblech zu verknüpfen — und das alles bei geringer Modellgröße und niedrigem Energiebedarf.
Dem Modell beibringen, worauf es wirklich ankommt
Reale Inspektionsbilder werden von normalen, fehlerfreien Bereichen dominiert, sodass ein Modell leicht dazu neigen kann, alles als „OK" zu klassifizieren. Um dem entgegenzuwirken, fügen die Forschenden ein zusätzliches Trainingsziel auf Basis von Contrastive Learning hinzu. Während des Trainings vergleicht das System fortlaufend Merkmalsmuster aus Defektregionen (Vordergrund) mit solchen aus sauberen Hintergrundbereichen und kontrastiert außerdem korrekte Defektboxen mit falschen Vorhersagen. Entscheidend ist, dass nicht alle Hintergrundbeispiele gleich behandelt werden: Das System findet automatisch die „harten" negativen Proben — Hintergrundausschnitte, die Defekten am ähnlichsten sehen — und zwingt das Modell, ihnen bei der Unterscheidung besondere Aufmerksamkeit zu schenken. Dieser zusätzliche Verlustterm wird nur beim Lernen verwendet und verschwindet im Betrieb, sodass er die Echtzeit‑Leistung nicht verlangsamt.

Leistungsnachweis an realen Fabrikdaten
Das Team testete seinen Ansatz an drei weit verbreiteten industriellen Datensätzen mit Stahl‑ und Aluminiumoberflächen, die verschiedene Fehlerarten wie Risse, Einschlüsse und Rollgruben enthalten. Im Vergleich zu mehreren modernen, leichtgewichtigen Detektoren erreichte die neue Methode durchgängig höhere Erkennungswerte bei gleichzeitig weniger Parametern und geringerem Rechenaufwand. In allen drei Datensätzen steigerte sie die Genauigkeit um etwa drei Prozentpunkte gegenüber ähnlich kompakten YOLO‑basierten Modellen. Die Autorinnen und Autoren bauten anschließend sogar eine noch kleinere „Nano"‑Version von MobileMamba und setzten sie auf einem preisgünstigen NVIDIA Jetson Nano Edge‑Board ein. Selbst bei reduzierten Bildgrößen erreichte diese Version Echtzeit‑Inspektionsraten von mindestens 25 Bildern pro Sekunde und übertraf dabei andere edge‑orientierte Detektoren in der Genauigkeit.
Was das für reale Fabriken bedeutet
Für Nicht‑Fachleute ist das Ergebnis einfach: Diese Arbeit liefert einen KI‑Inspektor, der sowohl schnell und genügsam genug für kleine Industrie‑Computer ist als auch fein genug, um schwer sichtbare Defekte auf Metalloberflächen zu erfassen. Indem sie die Art und Weise neu gestalten, wie das Netz Informationen über ein Bild hinweg sammelt, und es darauf trainieren, sich auf die tückischsten hintergrundähnlichen Erscheinungen zu konzentrieren, zeigen die Autorinnen und Autoren, dass Fabriken nicht zwischen Geschwindigkeit und Zuverlässigkeit wählen müssen. Mit weiteren Verfeinerungen, etwa intelligenterer Kompression und der Kombination normaler Bilder mit Thermal‑ oder Röntgenansichten, könnten Ansätze wie MobileMamba eine sicherere, konsistentere Qualitätskontrolle in vielen Fertigungslinien ermöglichen.
Zitation: Huang, J., Ariffin, S.A., Yang, Q. et al. Contrastive learning enhanced MobileMamba for real time industrial defect detection on edge devices. Sci Rep 16, 5096 (2026). https://doi.org/10.1038/s41598-026-35515-4
Schlüsselwörter: Metallfehlererkennung, Edge‑KI, industrielle Inspektion, leichte neuronale Netze, contrastive learning