Clear Sky Science · de

Eine Methode zur Erkennung von Schutzhelmen unter Tage basierend auf dem YOLOv11-SRA-Modell

2026-01-25 · Zurück zur Übersicht

Warum intelligentere Helmkontrollen unter Tage wichtig sind

Tief unter Tage in Bergwerken und Tunneln sind Schutzhelme für Beschäftigte die letzte Verteidigungslinie gegen Steinschlag, Maschinen und niedrige Decken. In dunklen, staubigen und engen Gängen ist es jedoch schwer für Aufsichtspersonen – und selbst für herkömmliche Kameras – zu erkennen, wer tatsächlich geschützt ist. Dieser Beitrag stellt ein neues Computer-Vision-System vor, das auf einem verbesserten YOLOv11-SRA-Modell basiert und in Echtzeit automatisch Helme und ungeschützte Köpfe erkennt, selbst bei schwacher Beleuchtung, verdeckten Blicken und großen Entfernungen zur Kamera.

Die Gefahren, sich auf manuelle Kontrollen zu verlassen

Traditionelle Helmkontrollen in Bergwerken beruhen nach wie vor stark auf Begehungen durch Personal oder auf Drehkreuzen und Kontrollpunkten, die Arbeiter passieren müssen. Diese Verfahren sind langsam, decken nur wenige Orte ab und können riskantes Verhalten übersehen, sobald sich Personen tiefer ins Bergwerk bewegen. Sensorbestückte Helme mit Tags oder eingebauten Elektronikkomponenten bieten zwar eine gewisse Automatisierung, sind aber teuer, schwer in rauer Umgebung zu warten und erfordern Änderungen an jedem Helm. Mit der Ausweitung des Bergbaus und längeren Schichten stoßen diese älteren Ansätze an ihre Grenzen, wenn es darum geht, rund um die Uhr und bergwerkweit die notwendige Wachsamkeit zur Unfallverhütung sicherzustellen.

Kameras beibringen, Helme unter schwierigen Bedingungen zu erkennen

Jüngste Fortschritte im Deep Learning haben die Bildinterpretation durch Computer grundlegend verändert, insbesondere beim Erkennen von Objekten wie Autos oder Fußgängern. Die YOLO-Familie von Algorithmen ist weit verbreitet, weil sie ein Bild in einem einzigen schnellen Durchgang scannen und Objekte lokalisieren kann – ideal für Live-Video. Untertage-Szenen stoßen diese Systeme jedoch an ihre Grenzen. Helme können als winzige, farbige Flecken auf einem entfernten Kopf erscheinen, halb hinter Rohren oder Maschinen verborgen sein oder sich bei schwacher, ungleichmäßiger Beleuchtung kaum vom Hintergrund abheben. Die Autoren haben YOLOv11-SRA speziell entwickelt, um mit diesen Problemen umzugehen, sodass Bergwerkskameras zuverlässig zwischen geschützten und ungeschützten Beschäftigten unterscheiden können.

Ein dreiteiliges Upgrade für eine verbreitete Vision-Engine

Das neue Modell behält die allgemeine Struktur von YOLOv11 – Eingabe, Backbone, Neck und Detection Head – bei, ergänzt sie jedoch um drei spezialisierte Module. Erstens erlaubt der SAConv-Block dem Netzwerk, ein Bild gleichzeitig auf mehreren "Zoom-Ebenen" zu betrachten, sodass sowohl kleine, entfernte Helme als auch größere Nahaufnahmen ohne zusätzlichen Aufwand erfasst werden. Zweitens lenkt der RCM-Block das Modell darauf, sich auf lange, rechteckige Bereiche zu konzentrieren, die der typischen Form von Kopf und Schultern in einem Tunnel entsprechen, und hilft so, Helmkanten nachzuzeichnen, selbst wenn Ausrüstung oder andere Arbeiter den Blick behindern. Drittens vermischt der ASFF-Block Informationen aus mehreren Bildskalen und ermöglicht es dem System, pixelgenau die Ebene auszuwählen, die jeden Bildbereich am besten beschreibt. Zusammen reduzieren diese Erweiterungen Verwechslungen zwischen Helmen und Hintergrundunordnung und schärfen die Konturen kleiner oder teilweise sichtbarer Helme.

Das System auf die Probe gestellt

Um die Praxistauglichkeit der Konzepte zu prüfen, trainierten und testeten die Forschenden das Modell auf CUMT-HelmeT, einer öffentlichen Sammlung von Untertage-Überwachungsbildern, die mit den Klassen "Helm" und "kein Helm" sowie weiteren gängigen Objekten annotiert ist. Da das Rohdatenset relativ klein ist, erweiterten sie es um das Fünffache durch Zuschneiden, Drehen und Aufhellen der Bilder, um verschiedene Kamerawinkel und Beleuchtungssituationen zu simulieren. Auf diesem anspruchsvollen Benchmark erreichte YOLOv11-SRA eine mittlere durchschnittliche Genauigkeit (mAP) von etwa 84 % und eine Recall-Rate nahe 80 %, womit es mehrere bekannte Detektoren schlug, darunter neuere YOLO-Versionen, RetinaNet, SSD und Faster R-CNN. Trotz der verbesserten Genauigkeit bleibt das Modell kompakt und effizient: Es verwendet weniger Parameter und weniger Rechenaufwand als die meisten Konkurrenten und kann auf einer modernen Grafikkarte nahezu 100 Bilder pro Sekunde analysieren – schnell genug für Echtzeitalarme.

Durch Dunkelheit, Staub und Blendung hindurchsehen

Visuelle Beispiele zeigen, wie sich das System in Situationen verhält, die ältere Methoden regelmäßig überfordern: Helme, die halb verdeckt sind, Szenen, die nur von schwachen Lampen beleuchtet werden, weit entfernte Arbeiter und harte Spiegelungen auf glänzenden Oberflächen. In jedem dieser Fälle liefert YOLOv11-SRA sicherere und konsistentere Erkennungen als Konkurrenzmodelle. Es verpasst seltener kleine oder schwach sichtbare Helme und vermeidet häufiger Fehlalarme, wenn helle Stellen oder Rohre Helmfarben nachahmen. Ablationsstudien – bei denen die Autoren einzelne Module ein- und ausschalten – zeigen, dass jedes Teil einen Beitrag leistet, die größten Gewinne jedoch erzielt werden, wenn alle drei Module kombiniert sind. Das bestätigt, dass das Design als integriertes Ganzes wirkt und nicht nur als Sammlung isolierter Tricks.

Vom Forschungprototypen zu sichereren Schichten

Vereinfacht gesagt zielt diese Arbeit darauf ab, Bergwerkskameras ein schärferes, anpassungsfähigeres "Auge" für grundlegende Schutzkleidung zu geben. Indem Beschäftigte ohne Helm zuverlässiger erkannt werden – selbst in verrauschten, schwach beleuchteten Videostreams – könnte das YOLOv11-SRA-System Aufsichtspersonen ermöglichen, früher einzugreifen und das Risiko von Kopfverletzungen zu verringern. Da das Modell relativ ressourcenschonend ist, lässt es sich auf eingebetteten Geräten nahe an den Kameras statt nur in entfernten Rechenzentren betreiben. Die Autorinnen und Autoren weisen darauf hin, dass breitere Trainingsdaten und weitere Optimierungen die Methode noch robuster machen könnten, doch die vorliegenden Ergebnisse deuten bereits auf intelligentere und skalierbarere Sicherheitsüberwachung in den anspruchsvollen Bedingungen des modernen Untertagebergbaus hin.

Zitation: Wang, L., Wan, X., Shi, X. et al. A method for detecting safety helmets underground based on the YOLOv11-SRA model. Sci Rep 16, 6194 (2026). https://doi.org/10.1038/s41598-026-37148-z

Schlüsselwörter: Sicherheit im Untertagebau, Helmerkennung, Computer Vision, Echtzeitüberwachung, Deep Learning