Clear Sky Science · pl
RT-FogNet: wykrywanie statków w czasie rzeczywistym przy słabej widoczności na wodach śródlądowych
Widzieć statki przez mgłę
Gdy rzeki i kanały spowija mgła lub olśnienie, ludzkie posterunki i kamery mogą mieć trudności ze sprawnym zauważeniem przepływających łodzi. To nie tylko niedogodność: przeoczenia lub opóźnione wykrycia mogą zagrażać bezpieczeństwu ruchu, spowalniać logistykę i utrudniać działania ratunkowe. W tym badaniu przedstawiono RT-FogNet — inteligentny system kamerowy zaprojektowany do niezawodnego wykrywania statków na wodach śródlądowych nawet przy słabej widoczności, jednocześnie działający wystarczająco szybko for zastosowań w czasie rzeczywistym na zwykłym sprzęcie monitorującym.

Dlaczego rzeki są trudniejsze niż otwarte morza
W odróżnieniu od otwartych oceanów, drogi wodne śródlądowe są wąskie, zatłoczone i wizualnie złożone. Stacjonarne kamery na brzegach muszą radzić sobie z mostami, budynkami, odbiciami na wodzie i częstymi niekorzystnymi warunkami pogodowymi. Mgła, wysoka wilgotność, silne podświetlenie od słońca i nocne oświetlenie obniżają kontrast i rozmywają kontury jednostek. Istniejące detektory w widzeniu komputerowym, także wiele popularnych modeli głębokiego uczenia, zwykle trenowano na jaśniejszych obrazach z satelitów, statków powietrznych lub scen przybrzeżnych. W rezultacie często zawodzą po przeniesieniu na rzeczywiste rzeki śródlądowe — przeoczając małe lub odległe jednostki i myląc odbicia lub struktury tła ze rzeczywistymi statkami.
Inteligentne, dwuetapowe oko nad rzeką
RT-FogNet podchodzi do problemu jako do procesu dwuetapowego, dopasowanego do tego, co rzeczywiście widzi kamera nad rzeką. Najpierw szybko analizuje napływający obraz, by zdecydować, czy widoczność jest ograniczona. Jeśli widok jest czysty, obraz trafia od razu do etapu detekcji, oszczędzając czas i zasoby. Gdy scena jest zamglona lub ma niski kontrast, obraz przechodzi przez specjalny moduł odmgławiania o nazwie Water Surface Image Dehazing (WSID). Moduł ten jest trenowany nie tylko po to, by obrazy wyglądały lepiej dla człowieka, lecz przede wszystkim by zachowywać obrysy i kształty statków podczas usuwania mgły i tłumienia mylących odbić na powierzchni wody.

Jak system uczy się widzieć przez mgłę
Moduł WSID powstał w oparciu o strategię treningową zapożyczoną ze współczesnych metod przywracania obrazu, lecz skompresowaną i dostrojoną pod kątem szybkości. Większa sieć „nauczyciel” najpierw uczy się usuwać mgłę ze syntetycznych obrazów treningowych. Następnie mniejsza sieć „uczeń” uczy się naśladować wyniki nauczyciela, przy znacznie mniejszym zużyciu obliczeń, co czyni ją praktyczną dla rzeczywistych urządzeń. Potem uczeń jest dodatkowo dostrajany na rzeczywistych, zamglonych scenach rzecznych, aby działać dobrze poza laboratorium. W dalszym etapie ulepszony silnik detekcji, oparty na najnowszym modelu YOLOv10, przetwarza odmgławione lub oryginalne obrazy. Kluczowym dodatkiem jest nowy blok przetwarzania cech, który używa starannie rozmieszczonych filtrów do analizy zarówno drobnych detali, jak i szerszych obszarów obrazu, nie rozmywając przy tym małych jednostek. Pomaga to systemowi wykrywać statki o różnych rozmiarach — od maleńkich, odległych łodzi po duże tankowce.
Nowe środowisko testowe oparte na prawdziwych rzekach
Aby ocenić, czy RT-FogNet rzeczywiście działa w praktyce, autorzy zbudowali nowy Zbiór Danych Statków na Drogach Wodnych Śródlądowych (Inland Waterway Ship Dataset, IWSD). Zawiera on ponad dziewięć tysięcy zdjęć wykonanych przez stacjonarne kamery na ruchliwych chińskich rzekach, w tym Jangcy i Wulong. Zestaw obejmuje dziewięć typów jednostek i szeroką gamę warunków: dni bez mgły, zachmurzone niebo, deszcz i mgłę, silne olśnienie na wodzie oraz nocne sceny z ostrym oświetleniem sztucznym. Wiele statków jest małych na zdjęciach, gdyż znajdują się daleko od kamery, a kategorie występują w nierównych liczbach, odzwierciedlając rzeczywiste wzorce ruchu. Ponieważ ponad połowa zdjęć wykonana jest przy utrudnionej widoczności, IWSD stanowi wymagający test dla każdego detektora statków.
O ile lepsze jest nowe podejście?
Testowany na standardowym ogólnego przeznaczenia zbiorze danych, na istniejącym przybrzeżnym zbiorze statków i na nowym zbiorze rzecznym, RT-FogNet konsekwentnie osiąga wysoką dokładność, pozostając jednocześnie wystarczająco szybki do pracy w czasie rzeczywistym. Na szczególnie wymagających danych IWSD pełna wersja RT-FogNet zawierająca etap odmgławiania poprawia średnie wyniki detekcji o ponad 15 punktów procentowych w porównaniu z silnym detektorem bazowym, ze szczególnie dużymi zyskami dla małych i trudno dostrzegalnych jednostek. Nawet z dodatkowym krokiem odmgławiania system nadal przetwarza setki obrazów na sekundę na nowoczesnym sprzęcie, co czyni go odpowiednim do monitoringu rzek na żywo.
Co to oznacza dla bezpieczeństwa dróg wodnych
Dla czytelnika niebędącego specjalistą kluczową konkluzją jest to, że RT-FogNet pokazuje, jak połączenie świadomego oczyszczania sceny z uproszczonym silnikiem detekcyjnym może uczynić monitorowanie kamerowe rzek bardziej niezawodnym i praktycznym. Zamiast jedynie upiększać obrazy dla oka ludzkiego, system jest dostrojony do zachowania wskazówek wizualnych istotnych dla lokalizowania statków, nawet w gęstej mgle czy ostrym oświetleniu. Nowy zbiór danych autorów i sprawdzona konstrukcja stanowią plan działania dla bezpieczniejszego, inteligentniejszego nadzoru ruchliwych dróg wodnych, z potencjałem zmniejszenia liczby wypadków i poprawy zarządzania ruchem w rzeczywistych sieciach rzeczno-kanałowych.
Cytowanie: Yuan, P., Xu, C., Tan, X. et al. RT-FogNet: real-time ship detection under low-visibility conditions in inland waterways. Sci Rep 16, 14094 (2026). https://doi.org/10.1038/s41598-026-44253-6
Słowa kluczowe: wykrywanie statków, mgłą spowite drogi wodne, widzenie komputerowe, inteligentny nadzór, bezpieczeństwo ruchu rzecznego