Clear Sky Science · pl
Optymalizacja wielokryterialna sterowana głębokim uczeniem ze wzmocnieniem i jej zastosowania w strategii eksploatacji i utrzymania oświetlenia infrastruktury
Inteligentniejsze światła dla bezpieczniejszych tuneli
Jadąc długim tunelem autostradowym, przyjmujemy za pewnik, że oświetlenie pozostanie jasne i stabilne. Tymczasem utrzymanie tysięcy opraw w pracy bez marnowania środków na niepotrzebne naprawy to skomplikowane żonglowanie. W artykule przedstawiono nowy sposób zarządzania oświetleniem tuneli, który wykorzystuje sztuczną inteligencję do ciągłego wyważania dwóch konkurencyjnych celów: zachowania niezawodności oświetlenia dla kierowców oraz kontrolowania całkowitych kosztów.
Dlaczego oświetlenie tuneli jest trudne w zarządzaniu
Oświetlenie tunelowe ma kluczowe znaczenie dla bezpieczeństwa ruchu. Gdy lampy się zużywają lub występują awarie obwodów, poziom światła może nagle spaść, utrudniając kierowcom ocenę odległości i prędkości oraz zwiększając ryzyko wypadków. Tradycyjne utrzymanie opiera się na stałych harmonogramach, prostych progach lub regułach nastawionych na pojedynczy cel, takich jak „minimalizacja kosztów” czy „maksymalizacja żywotności lamp”. Podejścia te słabo radzą sobie w rzeczywistych tunelach, gdzie warunki zmieniają się w czasie, tysiące opraw zużywają się w różnym tempie, a bezpieczeństwo i koszty często stoją w sprzeczności. Autorzy argumentują, że potrzebna jest metoda, która potrafi nieustannie uczyć się na podstawie danych i dostosowywać decyzje wraz ze zmianami systemu.

Nauka cyfrowego agenta utrzymania oświetlenia
Naukowcy zbudowali cyfrowego „agenta”, który uczy się, kiedy i jak naprawiać, wymieniać lub regulować oświetlenie tunelowe, wchodząc w interakcje z symulowanym tunelem. Agent oparty jest na głębokim uczeniu ze wzmocnieniem — gałęzi AI, w której system próbuje działań, obserwuje wyniki i stopniowo wypracowuje strategie maksymalizujące nagrodę. W tym przypadku nagroda łączy koszty operacyjne (zużycie energii, praca personelu, części zamienne oraz kary za naruszenia bezpieczeństwa) i stan systemu (prawdopodobieństwo, że lampy będą nadal działać niezawodnie). Agent widzi szczegółowy obraz tunelu: jasność każdej oprawy, czy wykazuje oznaki awarii, otaczające warunki oświetleniowe oraz symptomy degradacji w czasie. Na każdym kroku wybiera działania dla każdej lampy — nic nie robić, przyciemnić, rozjaśnić, naprawić lub wymienić — i otrzymuje informację zwrotną, jak te wybory wpływają zarówno na koszty, jak i niezawodność.
Modelowanie zużywania się lamp
Aby dać agentowi realistyczne środowisko do nauki, autorzy najpierw skonstruowali model matematyczny opisujący, jak oświetlenie tunelowe się degraduje. Wykorzystali rodzaj procesu losowego przypominającego ruch Browna (proces Wienera), który odzwierciedla zarówno stopniowe odchylenie w kierunku awarii, jak i niepewność wynikającą z rzeczywistych warunków, takich jak wahania temperatury. Na podstawie czterech lat danych eksploatacyjnych z ponad 2000 opraw LED w 7‑kilometrowym tunelu w prowincji Yunnan skompresowali wiele odczytów z czujników do pojedynczego wskaźnika „stanu zdrowia” i pokazali, że model degradacji dobrze odzwierciedla rzeczywistość. Prognozuje, jak rośnie prawdopodobieństwo awarii w czasie i ile pozostałej żywotności ma dana lampa. Model zasila symulowane środowisko, w którym agent trenuje strategie utrzymania bez narażania rzeczywistych kierowców.
Równoczesne wyważanie kosztów i niezawodności
Kluczowym wkładem pracy jest traktowanie kosztów i niezawodności jako równie ważnych celów, zamiast łączenia ich w jedną liczbę. Autorzy przekształcają problem wielocelowy w wiele prostszych podproblemów, z których każdy reprezentuje inny kompromis między niskimi kosztami a wysoką niezawodnością. Dla każdego podproblemu agent uczy się dobrej strategii; razem strategie te tworzą „frontierę” najlepszych możliwych kompromisów. Aby przyspieszyć ten proces, zespół pozwala sąsiednim podproblemom dzielić się zdobytym doświadczeniem, kiedy ich kompromisy są podobne, zamiast trenować każdy od zera. Dodatkowo przekształcają miarę niezawodności tak, by proces uczenia był szczególnie czuły, gdy system zbliża się do niebezpiecznych poziomów awarii, skłaniając agenta do bardziej zdecydowanej reakcji zanim zagrożone zostanie bezpieczeństwo.

Co osiąga nowa strategia
W testach przeciwko kilku powszechnym strategiom utrzymania tuneli — takim jak inspekcje w stałych odstępach, wyzwalacze oparte na jasności czy reguły oparte na wskaźnikach awaryjności — nowe podejście daje lepszy balans między bezpieczeństwem a wydatkami. Obniża całkowite koszty utrzymania i eksploatacji o niemal 30 procent przy jednoczesnym utrzymaniu wysokiej niezawodności i zapobieganiu temu, by agent stał się nadmiernie ostrożny lub zbyt lekkomyślny. Schemat dzielenia parametrów przyspiesza też trening, zmniejszając czas obliczeń i poprawiając pokrycie możliwych kompromisów koszt–niezawodność. Dla laika wniosek jest jasny: metoda ta wykorzystuje dane i uczenie adaptacyjne, by decydować dokładnie, kiedy i gdzie interweniować w tunelu, tak aby światła pozostawały bezpieczne dla kierowców, a podatnicy lub operatorzy płacili mniej w cyklu życia systemu.
Cytowanie: Wang, Z., Tang, J., Wei, P. et al. Deep reinforcement learning-driven multi-objective optimization and its applications on lighting infrastructure operation and maintenance strategy. Sci Rep 16, 8989 (2026). https://doi.org/10.1038/s41598-026-37811-5
Słowa kluczowe: oświetlenie tuneli, predykcyjne utrzymanie, uczenie ze wzmocnieniem, niezawodność infrastruktury, optymalizacja wielokryterialna