Clear Sky Science · pl

AE-LFOG-YOLO: niezawodne wykrywanie kasków ochronnych dzięki adaptacyjnym kotwicom i uczeniu odpornemu na oświetlenie

· Powrót do spisu

Dlaczego kontrole kasków mają znaczenie

Na dużych placach budowy i w podziemnych tunelach prosty kask ochronny może przesądzić o różnicy między uniknięciem wypadku a urazem, który zmienia życie. Jednak w chaosie rzeczywistych miejsc pracy ludzie zapominają lub rezygnują z noszenia kasków, a nadzorcy nie są w stanie obserwować każdego zakątka przez cały czas. Niniejsze badanie pokazuje, jak zbudować zautomatyzowany system kamer, który niezawodnie wykrywa, kto ma na sobie kask, a kto nie, nawet gdy tunel jest przyciemniony, oślepiony przez lampy lub zatłoczony pracownikami znajdującymi się w różnych odległościach od kamery.

Wyzwania widzenia w surowym oświetleniu tunelu

Miejsca budowy tuneli to środowiska o skrajnych warunkach wizualnych. Jasne reflektory powodują olśnienia, podczas gdy głębokie kieszenie cienia ukrywają szczegóły. Ludzie poruszają się w kierunku i od kamery, więc kaski pojawiają się w wielu rozmiarach. Standardowe detektory sztucznej inteligencji często zawodzą w takich warunkach: nie wykrywają kasków w ciemnych obszarach, mylą inne zaokrąglone obiekty z kaskami lub mają problemy z bardzo małymi czy odległymi pracownikami. Wiele istniejących systemów próbuje to naprawić przez rozjaśnianie lub oczyszczanie obrazów przed detekcją albo przez drobne modyfikacje popularnych modeli YOLO. Ponieważ jednak te kroki zwykle są dodatkowymi poprawkami, a nie częścią jednego procesu uczenia, pozostawiają pewien potencjał niewykorzystany i nie są odporne na zmiany oświetlenia czy układu sceny.

Figure 1
Figura 1.

Nowy sposób uczenia kamer ignorowania złego oświetlenia

Autorzy proponują ulepszony system nazwany AE‑LFOG‑YOLO, oparty na szeroko stosowanym detektorze YOLOv8. Pierwszy kluczowy pomysł to Moduł Niezależny od Oświetlenia — niewielka jednostka dodana wewnątrz sieci, która uczy się oddzielać „co robi światło” od „jak obiekty naprawdę wyglądają”. Dzieli ona napływające mapy cech na część odzwierciedlającą głównie wzorce oświetlenia oraz część przechowującą bardziej stałe kształty i tekstury, takie jak zaokrąglony brzeg kasku. Dzięki specjalnym operacjom bramkowania oraz gałęzi skupiającej się na krawędziach i narożnikach, moduł osłabia wpływ zmian jasności i uwydatnia stabilną geometrię. Ponieważ dzieje się to wewnątrz detektora, a nie jako oddzielny krok wstępnego przetwarzania, cały system można trenować end-to-end, aby koncentrował się na samych kaskach, zamiast dawać się zwieść plamom olśnień czy ciemności.

Pozwolenie modelowi na ewolucję własnych zwyczajów obserwacyjnych

Drugi główny pomysł dotyczy sposobu, w jaki detektor przewiduje, gdzie mogą pojawić się obiekty. Wiele detektorów zaczyna od stałego zestawu „boxów kotwicowych”, sugerujących prawdopodobne rozmiary i kształty obiektów; są one zazwyczaj wybrane raz na podstawie danych treningowych i już niezmieniane. W tunelach jednak pozorny rozmiar kasku może się dramatycznie zmieniać wraz z odległością kamery i kątem widzenia. AE‑LFOG‑YOLO zastępuje statyczne kotwice procesem dynamicznym nazwanym Adaptive Evolutionary – Light Field Optimized Generation. Po każdej rundzie treningowej system delikatnie zmienia (perturbuje) swoje pudełka kotwicowe, ocenia, jak dobrze pasują do rzeczywistych kasków o różnych rozmiarach, oraz sprawdza, czy ich wymiary mają sens w kontekście podstawowej optyki kamery — jak duży kask powinien wyglądać na matrycy przy typowych odległościach roboczych. Zestawy kotwic o lepszych wynikach przechodzą do następnej rundy. Z czasem detektor „ewoluuje” kotwice, które zarówno pasują do danych, jak i respektują sposób, w jaki kamery rzeczywiście obrazują świat.

Figure 2
Figura 2.

Dopasowanie treningu do jakości rzeczywistych obrazów

Poza zmianą tego, czego model poszukuje, autorzy modyfikują też sposób jego uczenia. Wprowadzają strategię treningową, która przykłada większą wagę do precyzyjnego lokalizowania kasków, gdy jakość obrazu jest słaba, oraz większą wagę do poprawnej klasyfikacji kask / brak kasku, gdy warunki są dobre. Fizycznie uzasadniony wskaźnik, ponownie wyprowadzony z zasad obrazowania kamerowego, informuje system o wiarygodności obrazów na każdym etapie. Jeśli oświetlenie lub ostrość są złe, proces treningowy automatycznie zwiększa znaczenie poprawnego wyznaczenia ramki ograniczającej; gdy warunki się poprawiają, przesuwa nacisk na klasyfikację. Powstaje w ten sposób sprzężenie zwrotne, w którym model ciągle dostosowuje własne priorytety do otoczenia fizycznego, z którym zmierzy się w rzeczywistych tunelach.

Co testy pokazują w praktyce

Naukowcy testują swoje podejście na rzeczywistym zbiorze danych kasków z tunelu i porównują je z kilkoma zaawansowanymi metodami opartymi na YOLO. AE‑LFOG‑YOLO wykrywa kaski z bardzo dużą dokładnością, poprawnie identyfikując około 95 procent kasków przy standardowym progu nakładania się i przewyższając bazowy model YOLOv8 zarówno pod względem precyzji, jak i miary recall. Działa wystarczająco szybko do zastosowań w czasie rzeczywistym i okazuje się szczególnie silny, gdy oświetlenie jest silnie modyfikowane w celu symulacji skrajnej ciemności lub prześwietlenia. W tych trudnych warunkach nowy model utrzymuje wyższe zaufanie, wykrywa więcej małych i odległych pracowników oraz działa w zakresie jasności szerszym o ponad jedną trzecią w porównaniu z bazą, co oznacza, że pozostaje niezawodny w znacznie większym zestawie scenariuszy rzeczywistych.

Jak to pomaga zwiększyć bezpieczeństwo pracowników

Dla osób niebędących specjalistami wniosek jest jasny: ucząc system AI rozumienia nie tylko pikseli, lecz także fizyki tego, jak kamery widzą w trudnych warunkach, badanie to dostarcza inteligentniejszego i bardziej niezawodnego strażnika na ścianie tunelu. AE‑LFOG‑YOLO lepiej ignoruje mylące oświetlenie i dostosowuje się do zmieniających się kątów widzenia, zmniejszając liczbę nieodkrytych przypadków oraz fałszywych alarmów. Zainstalowany przez miesiące na działającej linii transportu szynowego już udowodnił, że może wspierać zespoły ds. bezpieczeństwa w zapewnianiu noszenia kasków przez pracowników, oferując praktyczny krok w kierunku bezpieczniejszych, lepiej monitorowanych placów budowy.

Cytowanie: Liu, S., Wang, J. AE-LFOG-YOLO: robust safety helmet detection via adaptive anchors and illumination invariant learning. Sci Rep 16, 6402 (2026). https://doi.org/10.1038/s41598-026-37326-z

Słowa kluczowe: wykrywanie kasków ochronnych, budowa tuneli, widzenie komputerowe, obrazowanie przy słabym świetle, YOLOv8