Clear Sky Science · it

Ottimizzazione multi-obiettivo guidata dall'apprendimento per rinforzo profondo e sue applicazioni alla strategia di esercizio e manutenzione dell'illuminazione

2026-02-13 · Torna all'indice

Luci più intelligenti per gallerie più sicure

Quando percorriamo una lunga galleria autostradale diamo per scontato che le luci restino luminose e stabili. Tuttavia mantenere migliaia di apparecchi funzionanti in sicurezza, senza spendere inutilmente in riparazioni non necessarie, è un esercizio complesso di equilibrio. Questo articolo presenta un nuovo modo di gestire l'illuminazione in galleria che utilizza l'intelligenza artificiale per bilanciare continuamente due obiettivi concorrenti: garantire l'affidabilità delle luci per gli automobilisti e contenere i costi complessivi.

Perché le luci in galleria sono difficili da gestire

L'illuminazione in galleria è fondamentale per la sicurezza del traffico. Quando le lampade invecchiano o i circuiti guastano, il livello di illuminazione può calare rapidamente, rendendo più difficile per i conducenti giudicare distanze e velocità e aumentando il rischio di incidenti. La manutenzione tradizionale si basa su programmi fissi, soglie semplici o regole a obiettivo singolo come “minimizzare i costi” o “massimizzare la vita utile delle lampade”. Questi approcci faticano ad adattarsi alle gallerie reali, dove le condizioni cambiano nel tempo, migliaia di apparecchi invecchiano a ritmi diversi e sicurezza e costi spesso vanno in direzioni opposte. Gli autori sostengono che è necessario un metodo in grado di imparare costantemente dai dati e adattare le decisioni man mano che il sistema evolve.

Addestrare un agente digitale a mantenere le luci

I ricercatori costruiscono un «agente» digitale che impara quando e come riparare, sostituire o regolare le luci di galleria interagendo con una galleria simulata. Questo agente si basa sull'apprendimento per rinforzo profondo, un ramo dell'IA in cui un sistema prova azioni, osserva i risultati e impara progressivamente strategie che massimizzano una ricompensa. In questo caso la ricompensa combina i costi operativi (consumo energetico, lavoro, pezzi di ricambio e penalità legate alla sicurezza) e lo stato di salute del sistema (la probabilità che le lampade continuino a funzionare in modo affidabile). L'agente osserva un quadro dettagliato della galleria: la luminosità di ciascun apparecchio, se sta guastando, l'ambiente luminoso circostante e segni di degradazione nel tempo. A ogni passo sceglie azioni per ogni lampada—non fare nulla, aumentare la luminosità, diminuirla, riparare o sostituire—e riceve un feedback su come queste scelte influenzano sia i costi sia l'affidabilità.

Modellare il degrado delle luci

Per dare all'agente un mondo realistico in cui imparare, gli autori costruiscono innanzitutto un modello matematico di come le luci in galleria si degradano. Utilizzano un tipo di processo a cammino casuale (un processo di Wiener) che cattura sia la deriva costante verso il guasto sia l'incertezza dovuta a condizioni reali come le escursioni di temperatura. Usando quattro anni di dati operativi provenienti da oltre 2.000 apparecchi a LED in una galleria di 7 chilometri nella provincia dello Yunnan, comprimono molte letture dei sensori in un unico indicatore di «salute» e mostrano che questo modello di degradazione corrisponde strettamente alla realtà. Esso prevede come cresce nel tempo la probabilità di guasto e quanta vita residua è probabile che resti a una lampada. Questo modello alimenta l'ambiente simulato dove l'agente di apprendimento sperimenta strategie di manutenzione senza mettere a rischio conducenti reali.

Bilanciare costo e affidabilità contemporaneamente

Un contributo chiave del lavoro è trattare costo e affidabilità come obiettivi di pari importanza invece di fonderli in un singolo valore. Gli autori trasformano il problema multi-obiettivo in molti sottoproblemi più semplici, ognuno dei quali rappresenta un diverso compromesso tra basso costo e alta affidabilità. Per ciascun sottoproblema l'agente di apprendimento trova una strategia efficace; prese insieme, queste strategie formano una «frontiera» dei migliori compromessi possibili. Per accelerare il processo, il team permette ai sottoproblemi vicini di condividere quanto hanno appreso quando i loro compromessi sono simili, invece di addestrare ciascuno da zero. Ridisegnano inoltre la misura di affidabilità in modo che il processo di apprendimento diventi particolarmente sensibile quando il sistema si avvicina a livelli di guasto pericolosi, spingendo l'agente a rispondere in modo più aggressivo prima che la sicurezza sia compromessa.

Cosa ottiene la nuova strategia

Rispetto a diverse strategie comuni di manutenzione per gallerie—come ispezioni a intervalli fissi, trigger basati sulla luminosità o regole basate sui tassi di guasto—il nuovo approccio offre un migliore equilibrio tra sicurezza e spesa. Riduce i costi complessivi di manutenzione e gestione di quasi il 30 percento mantenendo alta l'affidabilità e evitando che l'agente di apprendimento diventi troppo prudente o troppo avventato. Lo schema di condivisione dei parametri rende inoltre l'addestramento più efficiente, riducendo il tempo di calcolo e migliorando la copertura dei possibili compromessi costo–affidabilità. Per un lettore non specialista, la conclusione è che questo metodo usa dati e apprendimento adattivo per decidere esattamente quando e dove intervenire in una galleria, in modo che le luci restino sicure per gli automobilisti mentre contribuenti o gestori spendono meno nell'arco di vita del sistema.

Citazione: Wang, Z., Tang, J., Wei, P. et al. Deep reinforcement learning-driven multi-objective optimization and its applications on lighting infrastructure operation and maintenance strategy. Sci Rep 16, 8989 (2026). https://doi.org/10.1038/s41598-026-37811-5

Parole chiave: illuminazione in galleria, manutenzione predittiva, apprendimento per rinforzo, affidabilità delle infrastrutture, ottimizzazione multi-obiettivo