Clear Sky Science · pl

Model wykrywania celów na zamglonej powierzchni wody oparty na wspólnej optymalizacji

2026-04-02 · Powrót do spisu

Dlaczego ważne są wyraźniejsze widoki na wodzie

Statki, promy i małe bezzałogowe jednostki coraz częściej polegają na kamerach i sztucznej inteligencji, by wykrywać inne jednostki i przeszkody. Jednak w mgle lub zamgleniu kamery rejestrują obraz wyblakły i rozmyty, szczególnie na otwartej wodzie, gdzie fale, odblaski i dystans już utrudniają dostrzeżenie obiektów. W tym badaniu autorzy analizują sprytniejszy sposób oczyszczania zamglonych obrazów i bardziej niezawodnego wykrywania maleńkich łodzi, z celem poprawy bezpieczeństwa nawigacji przy słabej widoczności.

Mgła, małe łodzie i trudny problem wizji

W pogodny dzień nowoczesne systemy wykrywania obiektów zwykle potrafią z dużą dokładnością znaleźć samochody, ludzi i łodzie na obrazie. W scenach mglistych jednak kontrast spada, krawędzie się wygładzają, a kolory bledną, więc drobne cele niemal znikają na tle. Standardowe detektory głębokiego uczenia, które dobrze działają na ostrych obrazach, często przeoczają te słabe kontury, szczególnie gdy drony lub kamery brzegowe obserwują szerokie obszary i każda łódź zajmuje tylko kilka pikseli. Istniejące podejścia albo ponownie trenują modele detekcji bezpośrednio na zaparowanych obrazach, albo łączą oddzielny krok odmgławiania przed wykrywaniem, albo grupują kilka zadań w jednej sieci współdzielonej. Każda strategia pomaga, ale żadna w pełni nie przezwycięża połączonych wyzwań mgły i drobnych celów na wodzie.

Figure 1. System AI przekształca zamglone zdjęcia powierzchni wody w wyraźniejsze obrazy, dzięki czemu małe łodzie i przeszkody lepiej się wyróżniają.

System wspólny, który uczy się patrzeć przez mgłę

Autorzy proponują system wspólny nazwany DTDJO, który podchodzi do problemu z dwóch stron jednocześnie. Po pierwsze, wyspecjalizowana sieć odmgławiająca przetwarza surowy zamglony obraz i próbuje przywrócić bardziej czytelną strukturę i kontrast, koncentrując się na zachowaniu drobnych detali, które mogą należeć do małych łodzi. Po drugie, ulepszona sieć detekcyjna analizuje oczyszczony obraz, aby znaleźć i sklasyfikować cele. Zamiast trenować te dwie części oddzielnie, system jest optymalizowany end-to-end, więc uczenie się usuwania mgły jest kierowane ostatecznym celem poprawnego wykrywania obiektów. Takie wspólne trenowanie zachęca krok odmgławiania do uwypuklania cech najważniejszych dla detekcji, zamiast tylko generować najładniejszy obraz.

Skupienie na drobnych szczegółach

Aby uczynić część odmgławiającą bardziej skuteczną, badacze przeprojektowali sposób, w jaki sieć zwraca uwagę na cechy obrazu. Wprowadzili moduł wieloskalowy, który ogląda wzory o różnych rozmiarach, śledząc jednocześnie, gdzie istotne struktury leżą na obrazie. Pomaga to systemowi przywrócić ostre krawędzie i subtelne tekstury należące do małych, odległych celów. Udoskonalili także sposób łączenia informacji z wczesnych i głębszych warstw, tak aby drobne szczegóły pikselowe i wyższe poziomy reprezentacji wzajemnie się wspierały zamiast konkurować. Aby metoda pozostała praktyczna, zastąpili cięższe bloki matematyczne lżejszymi, wymagającymi mniej obliczeń, przyspieszając przetwarzanie bez utraty jakości.

Figure 2. Proces krokowy, który wyostrza drobne łodzie na zamglonych obrazach wodnych, aby detektor mógł je wykryć.

Pomoc detektorowi w skupieniu na małych łodziach

Poprawa oczyszczonego obrazu to tylko połowa historii. Część detekcyjna DTDJO opiera się na nowoczesnym detektorze jednofazowym, ale autorzy dodają mieszany moduł uwagi, który wzmacnia użyteczne sygnały i tłumi zakłócony background. Moduł ten łączy informacje o tym, które kanały obrazu są najbardziej informacyjne, z informacją o tym, gdzie w przestrzeni leżą najbardziej istotne regiony. W zamglonych scenach wodnych oznacza to uwypuklenie słabych kształtów łodzi i zmniejszenie wpływu fal, refleksów i nieba. Zespół tworzy również nowe zbiory treningowe, biorąc popularne benchmarki detekcyjne i wprowadzając realistyczną mgłę za pomocą fizycznego modelu rozproszenia, co pozwala testować system zarówno na scenach ogólnych, jak i specyficznych dla środowisk wodnych.

Zmierzone korzyści w zamglonych scenach rzeczywistych

Testowany na nowych zestawach danych z mglistymi obrazami z dronów i mieszanych scen wodnych, DTDJO konsekwentnie przewyższa zarówno standardowe detektory, jak i inne metody uwzględniające mgłę. Wykrywa więcej małych i odległych obiektów, mniej przeoczeń łodzi oraz lepiej rozdziela nakładające się cele, które częściowo się zasłaniają. W porównaniu z silnym detektorem bazowym, system wspólny podnosi średnią dokładność wykrywania o kilka punktów procentowych na obu zestawach, co stanowi znaczący wzrost w tak wymagających warunkach. Jednocześnie jego konstrukcja utrzymuje koszty obliczeniowe znacznie poniżej niektórych cięższych modeli wielozadaniowych, co czyni go bardziej odpowiednim do użycia w czasie rzeczywistym.

Czystsze drogi dla bezpieczniejszej nawigacji

Mówiąc prosto, praca ta pokazuje, że jednoczesne trenowanie kroku oczyszczania obrazu i detektora obiektów może pomóc kamerom bardziej niezawodnie dostrzegać małe łodzie w mgle. Ucząc się, które części zamglonego obrazu są naprawdę istotne do znalezienia celów, system oczyszcza tylko tyle widoku, ile potrzeba, i kieruje detektor na właściwe szczegóły. Chociaż badanie koncentruje się na powierzchniach wodnych i kamerach z dronów lub z brzegu, ta sama koncepcja mogłaby wspierać bezpieczniejszą nawigację i nadzór w wielu środowiskach o ograniczonej widoczności, od portów przybrzeżnych po rzeki i nabrzeża.

Cytowanie: Zhang, H., Wang, H. Foggy water surface target detection model based on joint optimization. Sci Rep 16, 15693 (2026). https://doi.org/10.1038/s41598-026-44144-w

Słowa kluczowe: wykrywanie obiektów w mgle, obrazowanie powierzchni wodnej, odmgławianie obrazu, wykrywanie małych łodzi, wizja komputerowa w żegludze