Clear Sky Science · sv
Djup förstärkningsinlärningsdriven multiobjektiv optimering och dess tillämpningar för drift- och underhållsstrategier för belysningsinfrastruktur
Smartare belysning för säkrare tunnlar
När vi kör genom en lång vägtunnel tar vi för givet att belysningen ska vara klar och stabil. Att hålla tusentals armaturer driftiga utan att slösa pengar på onödiga reparationer är dock en komplicerad balansakt. Denna artikel presenterar ett nytt sätt att hantera tunnelbelysning som använder artificiell intelligens för att kontinuerligt avväga två konkurrerande mål: att hålla belysningen tillförlitlig för förare och att hålla de totala kostnaderna under kontroll.
Varför tunnelbelysning är svår att hantera
Tunnelbelysning är avgörande för trafiksäkerheten. När lampor åldras eller kretsar fallerar kan ljusnivån plötsligt sjunka, vilket gör det svårare för förare att bedöma avstånd och hastighet och ökar risken för olyckor. Traditionellt underhåll bygger på fasta scheman, enkla trösklar eller mål som fokuserar på en enda aspekt, till exempel ”minimera kostnad” eller ”maximera lampens livslängd”. Dessa angreppssätt fungerar dåligt i verkliga tunnlar, där förhållanden förändras över tid, tusentals armaturer åldras i olika takt och säkerhet och kostnad ofta drar åt motsatta håll. Författarna menar att det som behövs är en metod som ständigt kan lära av data och anpassa beslut när systemet förändras.

Att lära en digital agent att sköta belysningen
Forskarna bygger en digital ”agent” som lär sig hur och när man ska reparera, byta ut eller justera tunnelbelysning genom att interagera med en simulerad tunnel. Denna agent är baserad på djup förstärkningsinlärning, en gren av AI där ett system provar handlingar, observerar resultatet och gradvis lär sig strategier som maximerar en belöning. I det här fallet kombinerar belöningen driftskostnad (energiförbrukning, arbete, reservdelar och säkerhetsstraff) och systemhälsa (sannolikheten att lampor fortsätter fungera pålitligt). Agenten ser en detaljerad bild av tunneln: ljusstyrkan från varje armatur, om den håller på att fallera, den omgivande ljusmiljön och tecken på nedbrytning över tid. Vid varje steg väljer den åtgärder för varje lampa — göra ingenting, öka ljus, dämpa, reparera eller byta ut — och får återkoppling på hur dessa val påverkar både kostnad och tillförlitlighet.
Modellering av hur lampor slits
För att ge agenten en realistisk värld att lära i bygger författarna först en matematisk modell för hur tunnelbelysning försämras. De använder en typ av slumpvandring (en Wiener-process) som fångar både den jämna drivningen mot fel och osäkerheten från verkliga förhållanden som temperatursvängningar. Med fyra års driftsdata från mer än 2 000 LED-armaturer i en 7 kilometer lång tunnel i Yunnan-provinsen kondenserar de många sensormätningar till en enda ”hälsovariant” och visar att denna nedbrytningsmodell stämmer väl överens med verkligheten. Den förutser hur felchansen växer över tid och hur mycket återstående liv en lampa sannolikt har. Denna modell matas in i den simulerade miljön där inlärningsagenten kan öva underhållsstrategier utan att utsätta verkliga förare för risk.
Att väga kostnad och tillförlitlighet samtidigt
En viktig bidrag i arbetet är att behandla kostnad och tillförlitlighet som lika viktiga mål istället för att slå samman dem till ett enda tal. Författarna omvandlar det multiobjektiva problemet till många enklare delproblem, där varje delproblem representerar en annan avvägning mellan låg kostnad och hög tillförlitlighet. För varje delproblem hittar agenten en bra strategi; tillsammans bildar dessa strategier en ”front” av bästa möjliga kompromisser. För att påskynda processen låter teamet närliggande delproblem dela vad de lärt sig när deras avvägningar är lika, istället för att träna varje del från grunden. De omformar också tillförlitlighetsmåttet så att inlärningsprocessen blir särskilt känslig när systemet närmar sig farliga felnivåer, vilket skyndsamt uppmuntrar agenten att agera mer aggressivt innan säkerheten hotas.

Vad den nya strategin uppnår
När metoden testas mot flera vanliga tunnelunderhållsstrategier — som fasta inspektionsintervall, ljusstyrkebaserade triggare eller regler baserade på felfrekvenser — levererar det nya angreppssättet en bättre balans mellan säkerhet och kostnader. Det minskar de totala underhålls- och driftskostnaderna med nästan 30 procent samtidigt som tillförlitligheten hålls hög och förhindrar att agenten blir antingen för försiktig eller för vårdslös. Parameterdelningsschemat gör också träningen mer effektiv, minskar beräkningstiden och förbättrar täckningen av möjliga kostnad–tillförlitlighetsavvägningar. För en lekman är slutsatsen att denna metod använder data och adaptiv inlärning för att avgöra exakt när och var man ska ingripa i en tunnel, så att belysningen förblir säker för förare samtidigt som skattebetalare eller operatörer betalar mindre över systemets livslängd.
Citering: Wang, Z., Tang, J., Wei, P. et al. Deep reinforcement learning-driven multi-objective optimization and its applications on lighting infrastructure operation and maintenance strategy. Sci Rep 16, 8989 (2026). https://doi.org/10.1038/s41598-026-37811-5
Nyckelord: tunnelbelysning, prediktivt underhåll, förstärkningsinlärning, infrastrukturpålitlighet, multiobjektiv optimering