Clear Sky Science · tr
Derin pekiştirmeli öğrenme ile yönlendirilençok amaçlı optimizasyon ve aydınlatma altyapısı işletme ve bakım stratejilerine uygulamaları
Daha Akıllı Işıklar, Daha Güvenli Tüneller
Uzun bir otoyol tünelinden geçerken, ışıkların parlak ve kararlı kalacağını varsayarız. Oysa binlerce armatürün güvenli biçimde çalışır durumda tutulması ve gereksiz onarımlara para harcanmaması karmaşık bir denge gerektirir. Bu makale, tünel aydınlatmasını yönetmek için yapay zekâ kullanan yeni bir yaklaşım sunuyor; bu yaklaşım sürücüler için güvenilirliği koruma ile toplam maliyetleri kontrol altında tutma arasındaki iki rekabet eden hedefi sürekli olarak dengeliyor.
Tünel Işıklarını Yönetmenin Neden Zor Olduğu
Tünel aydınlatması trafik güvenliği için kritik önemdedir. Lambalar eskidiğinde veya devreler arızalandığında aydınlatma düzeyi aniden düşebilir; bu da sürücülerin mesafe ve hızı değerlendirmesini zorlaştırır ve kaza riskini artırır. Geleneksel bakım sabit programlara, basit eşiklere veya "maliyeti minimize et" ya da "lamba ömrünü maksimize et" gibi tek amaçlı kurallara dayanır. Bu yaklaşımlar, koşulların zamanla değiştiği, binlerce armatürün farklı hızlarda eskidiği ve güvenlik ile maliyetin genellikle çatıştığı gerçek tünellerde iyi işlemeyebilir. Yazarlar, gerekenin veriden sürekli öğrenebilen ve sistem değiştikçe kararları uyarlayabilen bir yöntem olduğunu savunuyor.

Işıkları Bakım Yapmayı Öğrenen Dijital Bir Ajan Eğitmek
Araştırmacılar, bir simüle edilmiş tünelle etkileşim kurarak ne zaman ve nasıl onarım, değişim veya ayarlama yapılacağını öğrenen dijital bir "ajan" inşa ediyorlar. Bu ajan derin pekiştirmeli öğrenmeye dayanır; burada bir sistem eylemler dener, sonucu gözlemler ve kademeli olarak ödülü maksimize eden stratejiler öğrenir. Bu durumda ödül işletme maliyetini (enerji kullanımı, işçilik, yedek parça ve güvenlik cezaları) ve sistem sağlığını (lambaların güvenilir çalışmaya devam etme olasılığı) birleştirir. Ajan, her armatürün parlaklığı, arızalanıp arızalanmadığı, çevresel ışık koşulları ve zaman içinde bozulma işaretleri gibi tünelin ayrıntılı bir resmini görür. Her adımda her lamba için hiçbir şey yapmama, parlaklaştırma, karartma, onarma veya değiştirme gibi eylemler seçer ve bu seçimlerin hem maliyet hem de güvenilirlik üzerindeki etkileri hakkında geri bildirim alır.
Işıkların Nasıl Eskidiğini Yakalamak
Ajanın gerçekçi bir dünyada öğrenebilmesi için yazarlar önce tünel ışıklarının nasıl bozulduğuna dair matematiksel bir model kuruyorlar. Sabit bir arızaya doğru sürüklenmeyi ve sıcaklık dalgalanmaları gibi gerçek dünya belirsizliklerini yakalayan bir rastgele yürüyüş süreci türü (Wiener süreci) kullanıyorlar. Yunnan Eyaleti’ndeki 7 kilometrelik bir tüneldeki 2.000’den fazla LED armatürden dört yıllık işletme verisini kullanarak birçok sensör okumalarını tek bir "sağlık" göstergesinde sıkıştırıyor ve bu bozulma modelinin gerçeğe yakın olduğunu gösteriyorlar. Model, arızalanma olasılığının zaman içinde nasıl arttığını ve bir lambanın muhtemelen ne kadar kalan ömre sahip olduğunu tahmin ediyor. Bu model, öğrenme ajanının gerçek sürücüleri riske atmadan bakım stratejilerini uygulayıp pratik yapabildiği simüle edilmiş ortama besleniyor.
Maliyet ve Güvenilirliği Aynı Anda Dengelemek
Çalışmanın önemli katkılarından biri maliyet ve güvenilirliği tek bir sayıya indirgemek yerine eşit derecede önemli hedefler olarak ele almasıdır. Yazarlar çok amaçlı problemi, düşük maliyet ile yüksek güvenilirlik arasındaki farklı takasları temsil eden birçok daha basit alt probleme dönüştürüyor. Her alt problem için öğrenme ajanı iyi bir strateji buluyor; birlikte alındığında bu stratejiler en iyi uzlaşmaları gösteren bir "sınır" oluşturuyor. Bu süreci hızlandırmak için ekip, komşu alt problemlerin takasları benzer olduğunda bunların öğrendiklerini paylaşmasına izin veriyor, böylece her birini baştan eğitmek zorunda kalmıyorlar. Ayrıca güvenilirlik ölçüsünü yeniden şekillendiriyorlar; böylece sistem tehlikeli arıza seviyelerine yaklaştığında öğrenme süreci özellikle hassas hale geliyor ve ajan güvenlik tehditleri ortaya çıkmadan daha agresif yanıtlar vermeye yönlendiriliyor.

Yeni Stratejinin Sağladıkları
Sabit aralıklı denetimler, parlaklığa dayalı tetikleyiciler veya arıza oranlarına dayalı kurallar gibi birkaç yaygın tünel bakım stratejisine karşı test edildiğinde yeni yaklaşım güvenlik ile harcama arasındaki dengeyi daha iyi sağlıyor. Toplam bakım ve işletme maliyetlerini neredeyse %30 oranında azaltırken güvenilirliği yüksek tutuyor ve öğrenme ajanının ya gereğinden fazla temkinli ya da aşırı pervasız hale gelmesini engelliyor. Parametre paylaşım şeması ayrıca eğitimi daha verimli hale getiriyor, hesaplama süresini azaltıyor ve olası maliyet–güvenilirlik takaslarının kapsamını iyileştiriyor. Bir uzman olmayan için çıkarılacak sonuç şu: bu yöntem veriyi ve uyarlamalı öğrenmeyi kullanarak tünelde tam olarak ne zaman ve nerede müdahale edileceğine karar veriyor; böylece ışıklar sürücüler için güvenli kalırken vergi mükellefleri ya da işletmeciler sistemin ömrü boyunca daha az ödüyor.
Atıf: Wang, Z., Tang, J., Wei, P. et al. Deep reinforcement learning-driven multi-objective optimization and its applications on lighting infrastructure operation and maintenance strategy. Sci Rep 16, 8989 (2026). https://doi.org/10.1038/s41598-026-37811-5
Anahtar kelimeler: tünel aydınlatması, öngörücü bakım, pekiştirmeli öğrenme, altyapı güvenilirliği, çok amaçlı optimizasyon