Clear Sky Science · pl
Protokół reagowania kryzysowego „od początku do końca” dla wypadków w tunelach wspomagany uczeniem ze wzmocnieniem
Dlaczego inteligentniejsze akcje ratunkowe w tunelach mają znaczenie
Gdy w tunelu drogowym dochodzi do katastrofy — czy to w wyniku zderzenia, pożaru, czy zawalenia konstrukcji — ludzie mogą zostać uwięzieni w długiej, zadymionej, labiryntowej rurze z bardzo nielicznymi wyjściami. Ratownicy muszą wbiegać do środka w chwili, gdy widoczność spada, temperatura rośnie, a przeszkody blokują drogę. W tym badaniu analizuje się, jak małe latające roboty, czyli drony, sterowane sprytną strategią uczenia, mogłyby stać się szybkim i niezawodnym wsparciem w takich niebezpiecznych sytuacjach — odnajdywać ofiary i wytyczać bezpieczne trasy, jednocześnie trzymając zespoły ludzkie z dala od największych zagrożeń.

Niebezpieczne wąskie gardła pod ziemią
Nowoczesne miasta polegają na tunelach dla autostrad, pociągów i sieci użyteczności publicznej, ale to samo zamknięte zaprojektowanie, które czyni je wydajnymi, sprawia, że wypadki w ich wnętrzu bywają wyjątkowo śmiertelne. Ogień szybko rozprzestrzenia dym, gromadzą się toksyczne gazy, a wąskie przejścia mogą zostać zablokowane przez rozbite pojazdy lub spadający beton. Tradycyjne zespoły ratownicze często wchodzą do środka dysponując ograniczonymi informacjami, zgadując, gdzie się kierować, podczas gdy ich łączność radiowa może mieć problemy z przebiciem przez grube warstwy skały i betonu. Przeszłe katastrofy, m.in. w Chinach i Japonii, pokazały, jak trudno dotrzeć do ofiar na czas, podkreślając potrzebę narzędzi, które potrafią obserwować i przewidywać w sposób niedostępny dla ludzi.
Uczenie dronów eksploracji i poszukiwań
Autorzy proponują system, w którym wiele autonomicznych dronów współpracuje, aby eksplorować uszkodzony tunel, budować mapę na żywo i lokalizować uwięzione osoby. Zamiast podążać za stałą, zaprogramowaną trasą, każdy dron uczy się na podstawie doświadczeń, korzystając z metody zwanej uczeniem ze wzmocnieniem: próbuje działań, obserwuje efekty i stopniowo odkrywa, które wybory prowadzą do szybszych akcji ratunkowych i mniejszej liczby błędów. Tunel jest reprezentowany jako siatka komórek, a drony koncentrują się na „frontierach” — miejscach, gdzie znana przestrzeń styka się z nieznaną — stopniowo poszerzając tę granicę na zewnątrz. Na każdym kroku wybierają spośród małego zestawu ruchów w siatce, aktualizując wewnętrzne tablice, które ruchy najlepiej sprawdzały się w podobnych sytuacjach.

Sprawienie, by wiele robotów współpracowało bez nadmiernej komunikacji
Wysyłanie kilku dronów do jednego tunelu rodzi nowe wyzwanie: jak uniknąć kolizji między nimi i wielokrotnego skanowania tych samych obszarów, zwłaszcza gdy łączność może być zawodna? Zamiast nadzorować je centralnym dowódcą lub wymagać ciągłej łączności radiowej, badacze zaprojektowali prosty system punktacji, który dyskretnie zachęca do dobrego zachowania grupowego. Dron zyskuje wysoki premiowy punkt (reward) po odkryciu nowej ofiary, ale jest karany, jeśli marnuje czas na ponowne odwiedzanie tych samych miejsc, zderza się z innym dronem lub „zawodzi” przez wyczerpanie baterii. Z czasem to przesuwa preferencje każdego drona w stronę nieodkrytych obszarów i trzymania się z dala od współtowarzyszy, więc pewnego rodzaju współpraca wyłania się naturalnie z współdzielonych konsekwencji, mimo że formalnie każdy uczy się samodzielnie.
Zapożyczanie sztuczek od wilków, by uniknąć utknięcia
Czyste uczenie przez próbę i błąd czasem może utknąć w bezpiecznych, ale drugorzędnych nawykach — na przykład zawsze wybierać znany korytarz zamiast ryzykownego skrótu. Aby utrzymać ciekawość dronów, zespół zapożycza pomysły z matematycznego modelu polowania szarych wilków w stadzie. Ten komponent „Grey Wolf Optimization” delikatnie zachęca drony do okazjonalnego naśladowania najlepiej działających wzorców poszukiwań zaobserwowanych dotychczas, jednocześnie zostawiając przestrzeń na eksplorację. W praktyce kształtuje to, które nowe działania są próbowane, pomagając procesowi uczenia się wydostać się z impasów i dostosować, gdy tunel się zmienia — na przykład gdy część trasy nagle zostaje zablokowana przez ogień lub gruz.
Testowanie podejścia w wirtualnych katastrofach
Ponieważ niebezpieczne jest testowanie niezweryfikowanych strategii w prawdziwych tunelach ratunkowych, badacze zbudowali szczegółowe symulacje komputerowe odwzorowujące wąskie korytarze, ślepe zaułki, przeszkody i rozrzucone ofiary. Porównali swój system oparty na uczeniu z kilkoma innymi metodami, w tym czystym losowym błądzeniem i samodzielną optymalizacją bez uczenia. Zarówno w testach z jednym dronem, jak i z wieloma, ich podejście szybciej odnajduje ofiary, eksploruje więcej obszaru z mniejszą liczbą zbędnych kroków i bardziej niezawodnie unika kolizji. Co ważne, robi to przy użyciu lekkich, opartych na tablicach obliczeń zamiast energochłonnych sieci głębokiego uczenia, co oznacza, że mogłoby realistycznie działać na niewielkich pokładowych komputerach podczas rzeczywistej akcji ratunkowej.
Co to może oznaczać dla przyszłych akcji ratunkowych
Badanie pokazuje, że roje stosunkowo prostych dronów, kierowane starannie zaprojektowanymi regułami uczenia i kilkoma pomysłami zapożyczonymi z natury, mogą stać się wartościowymi partnerami dla strażaków i zespołów ratunkowych w katastrofach w tunelach. Dzięki szybkiemu mapowaniu zadymionych, zmiennych środowisk i lokalizowaniu prawdopodobnych miejsc pobytu ofiar bez stałej kontroli człowieka, takie systemy mogłyby zaoszczędzić cenne minuty reakcji i zmniejszyć ryzyko, jakie ponoszą pierwsi ratownicy. Chociaż dotychczasowe prace opierają się na symulacjach i idealnych czujnikach, kładą praktyczne fundamenty pod przyszłe systemy rzeczywiste, które będą musiały działać w rygorze czasu, energii i ograniczeń obliczeniowych w jednych z najbardziej wymagających warunków ratowniczych na Ziemi.
Cytowanie: ur Rehman, H.M.R., Gul, M.J., Younas, R. et al. End-to-end emergency response protocol for tunnel accidents augmentation with reinforcement learning. Sci Rep 16, 6226 (2026). https://doi.org/10.1038/s41598-026-37191-w
Słowa kluczowe: ratownictwo w tunelach, drony poszukiwawczo-ratownicze, wielooagentowe uczenie ze wzmocnieniem, robotyczne zarządzanie katastrofami, autonomiczna eksploracja