Clear Sky Science · sv
RT-FogNet: realtidsdetektion av fartyg under dålig sikt i inlandsvattenvägar
Se fartyg genom dimma
När floder och kanaler ligger insvepta i dimma eller bländning kan mänskliga utkiksposter och kameror ha svårt att upptäcka passerande båtar i tid. Detta är mer än en olägenhet: missade eller försenade upptäckter kan hota trafiksäkerheten, fördröja logistik och försvåra räddningsinsatser. Denna studie presenterar RT-FogNet, ett intelligent kamerasystem utformat för att pålitligt upptäcka fartyg i inlandsvatten även när sikten är dålig, samtidigt som det är tillräckligt snabbt för realtidsanvändning på vanlig övervakningsutrustning.

Varför floder är svårare än öppet hav
Till skillnad från öppna hav är inlandsvatten snäva, trånga och visuellt röriga. Fast monterade kameror längs flodbankar måste hantera broar, byggnader, reflektioner på vattnet och frekvent dåligt väder. Dimma, hög fuktighet, stark motljus från solen och nattljus minskar kontrasten och suddar ut fartygs konturer. Befintliga detektorer för datorseende, inklusive många populära djupinlärningsmodeller, har vanligtvis tränats på klarare bilder från satelliter, flygplan eller kustscener. Därför misslyckas de ofta när de flyttas till verkliga inlandfloder, de förbiser små eller avlägsna fartyg och förväxlar reflektioner eller bakgrundsstrukturer med verkliga fartyg.
En smart tvåstegsögon för floden
RT-FogNet angriper problemet som en tvåstegssprocess anpassad till vad en flodkamera faktiskt ser. Först kontrollerar den snabbt den inkommande bilden för att avgöra om sikten är dålig. Om vyn är klar går bilden direkt till detektionssteget, vilket sparar tid och energi. Om scenen är dimmig eller lågkontrast routas bilden genom en särskild avhaze-enhet kallad Water Surface Image Dehazing (WSID)-modulen. Denna enhet är tränad inte bara för att göra bilder trevligare för människor utan specifikt för att bevara fartygens konturer och former samtidigt som den tar bort dimma och dämpar vilseledande reflektioner på vattenytan.

Hur systemet lär sig se genom dimma
WSID-modulen är uppbyggd med en träningsstrategi lånad från toppmoderna bildrestaureringstekniker, men komprimerad och finjusterad för hastighet. Ett större "lärare"-nätverk lär sig först att rensa dimma från syntetiska träningsbilder. Ett mindre "elev"-nätverk lär sig sedan att efterlikna lärarens resultat medan det använder långt färre beräkningar, vilket gör det praktiskt för verkliga enheter. Därefter justeras eleven ytterligare på verkliga dimmiga flodscener så att den fungerar väl utanför laboratoriet. Nedströms bearbetas de avhadeade eller ursprungliga bilderna av en förbättrad detektionsmotor baserad på den senaste YOLOv10-modellen. Ett viktigt tillägg är en ny funktionsbearbetningsblock som använder noggrant ordnade filter för att betrakta både fina detaljer och bredare områden i bilden utan att sudda bort små fartyg. Detta hjälper systemet att hitta fartyg i många storlekar, från små avlägsna båtar till stora tankfartyg.
En ny testbädd byggd på verkliga floder
För att avgöra om RT-FogNet verkligen fungerar i praktiken byggde författarna en ny Inland Waterway Ship Dataset (IWSD). Den innehåller mer än nio tusen bilder fångade av fasta kameror längs trafikerade kinesiska floder, inklusive Yangtze och Wulong. Datamängden täcker nio typer av fartyg och en stor variation av förhållanden: klara dagar, mulet väder, regn och dimma, stark bländning på vattnet och nattscener med hårt konstljus. Många av fartygen är små i bilden eftersom de är långt från kameran, och kategorierna är obalanserade i antal, vilket speglar verkliga trafikmönster. Eftersom mer än hälften av bilderna är tagna under utmanande siktförhållanden tjänar IWSD som ett krävande test för alla fartygsdetektorer.
Hur mycket bättre är den nya metoden?
När den testades på en standard allmänt använd datamängd, på en befintlig kustnära fartygsdataset och på den nya inlandflodsdatan, uppnår RT-FogNet konsekvent hög noggrannhet samtidigt som den förblir tillräckligt snabb för realtidsdrift. På den särskilt svåra IWSD-datan förbättrar den fullständiga versionen av RT-FogNet som inkluderar avhaze-steget genomsnittliga detektionspoäng med mer än 15 procentenheter jämfört med en stark baslinjedetektor, med särskilt stora förbättringar på små och svårupptäckta fartyg. Även med det extra avhaze-steget bearbetar systemet fortfarande hundratals bilder per sekund på modern hårdvara, vilket gör det lämpligt för liveövervakning av floder.
Vad detta betyder för vattenvägssäkerhet
För en icke-specialist är huvudslutsatsen att RT-FogNet visar hur kombinationen av scenesmedveten bildrensning och en strömlinjeformad detektionsmotor kan göra kamerabaserad flodövervakning både mer pålitlig och mer praktisk. Istället för att enbart skärpa bilder för det mänskliga ögat är systemet finjusterat för att skydda de visuella ledtrådar som är viktiga för att lokalisera fartyg, även i tjock dimma eller starkt ljus. Författarnas nya inlanddataset och deras utprovade design ger en ritning för säkrare, smartare övervakning av trafikerade vattenvägar, med potential att minska olyckor och förbättra trafikhantering i verkliga flod- och kanalnätverk.
Citering: Yuan, P., Xu, C., Tan, X. et al. RT-FogNet: real-time ship detection under low-visibility conditions in inland waterways. Sci Rep 16, 14094 (2026). https://doi.org/10.1038/s41598-026-44253-6
Nyckelord: fartygsdetektion, dimma på vattenleder, datorseende, intelligent övervakning, säkerhet i flodtrafik