Clear Sky Science · tr
SLA farkındalıklı derin pekiştirmeli öğrenme ile uyarlanabilir EdgeCloud görev zamanlama
Neden daha akıllı dijital trafiğe ihtiyaç var
Köşe başlarındaki akıllı kameralardan bileğimizdeki sağlık sensörlerine kadar milyarlarca küçük cihaz artık veriyi telefonlarımız, yakın kenar sunucuları ve uzak bulut veri merkezleri arasında bir yerde işlenmesi için sürekli gönderiyor. Bu dijital işleri zamanında ve enerji israfı olmadan halletmek şaşırtıcı derecede zor. Çok sayıda iş aynı anda geldiğinde bazıları vaat edilen yanıt sürelerini, yani hizmet düzeyi anlaşmalarını (SLA) kaçırıyor. Bu makale, bu rekabet eden gereksinimleri gerçek zamanlı olarak uyum sağlayabilen öğrenmeye dayalı bir zamanlayıcı kullanarak dengelemenin yeni bir yolunu inceliyor; gecikmeleri ve enerji kullanımını azaltırken bu taahhütleri daha iyi yerine getiriyor.

Bugünün zamanlama kuralları yetersiz kalıyor
Edge–cloud sistemlerindeki çoğu mevcut zamanlayıcı basit kuralları izler: istekleri geldikleri sırayla işleyin, sunucular arasında adil dönüşümlü dağılım yapın veya en yakın son teslim tarihine odaklanın. Bu stratejiler, her görevin kullanıcı için ne kadar önemli olduğunu ve zaman ya da enerji taahhüdünü kaçırma olasılığını göz ardı eder. Daha yeni birçok yöntem, görevleri daha akıllıca yerleştirmek için deneme-yanılma yoluyla öğrenen derin pekiştirmeli öğrenmeye dayanır. Ancak bunların çoğu da genellikle tüm görevleri eşitmiş gibi ele alır ve her görevin gerçek tehlikeye ne kadar yakın olduğunu sürekli okumak yerine sabit eşiklere güvenir. Sonuç olarak, ortalamada iyi görünseler bile en kritik işleri kaçırmaya devam edebilirler.
Görevlere aciliyet ve risk hissi kazandırmak
Yazarlar, her gelen görevi hizmet taahhüdü merceğinden inceleyen bir zamanlayıcı öneriyor. Her görev, gecikmeye duyarlılığı ve tüketebileceği enerjiye göre Altın, Gümüş veya Bronz olmak üzere üç kademeden birine yerleştiriliyor. Sistem daha sonra, o belirli görevin taahhüdünü kaçırma olasılığını tahmin eden SLA İhlali Risk Skoru (SVRS) adında yeni bir nicelik hesaplıyor. Bu skor, son teslim tarihinin ne kadar yakın olduğuna, hedef sunucunun kuyruğunun ne kadar dolu olduğuna ve benzer görevlerin yakın geçmişte orada ne sıklıkta başarısız olduğuna bağlıdır. Yüksek riskli görevler öne çıkarılır, böylece zamanlayıcı bunları geç kaldıktan sonra aciliyeti keşfetmek yerine ekstra özenle ele alabilir.
Öğrenen zamanlayıcının karar alma biçimi
Çerçevenin merkezinde, edge–cloud sisteminin durumunu sürekli gözlemleyen ve her görevi nereye göndereceğine karar veren bir derin pekiştirmeli öğrenme ajanı bulunur. Ajanın dünya görüşü sunucu yüklerini, ağ gecikmesini, görevin SLA kademesini ve SVRS'yi içerir. Hafif bir sinir ağı mimarisi hem mevcut anlık durumu hem de sistemin kısa dönem geçmişini işler, ardından belirli bir kenar düğümüne veya merkezi buluta bir görevi göndermek gibi olası yerleştirme eylemlerini önerir. Herhangi bir seçim yapılmadan önce, eylem budama adımı açıkça güvensiz seçenekleri eler; örneğin kırılgan bir Altın görevin zaten aşırı yüklü ve yüksek riskli bir düğüme gönderilmesi gibi. Bu, karar alanını daraltır ve öğrenmeyi bariz kötü hamlelerden uzaklaştırarak sistemin daha hızlı kararlılığa ulaşmasına yardımcı olur.

Kendi hatalarından öğrenme
Görevler zamanlandıktan sonra, bir izleme modülü gerçekte neler olduğunu takip eder: her iş son teslim tarihinden önce tamamlandı mı ve enerji bütçesi korundu mu? Herhangi bir ihlal kaydedilir ve kademe özel ihlal oranları zaman içinde güncellenir. Bu istatistikler öğrenme döngüsüne iki şekilde geri beslenir. Birincisi, gelecekteki SVRS değerlerini ayarlar; böylece sistem, yakın zamanda kötü davranış göstermiş sunuculara veya desenlere karşı daha temkinli olur. İkincisi, öğrenen ajanın aldığı ödülleri yeniden şekillendirir: yüksek öncelikli görevleri koruduğu için ekstra kredi verilir ve bu görevler başarısız olduğunda daha ağır cezalandırılır. Belirli bir kademedeki ihlal oranları artmaya başlarsa, ceza otomatik olarak yükselir ve zamanlayıcıyı insan müdahalesi olmadan davranışını değiştirmeye yönlendirir.
Deneyler pratikte ne gösteriyor
Fikri test etmek için yazarlar, küçük sensör okumalarından ağır video işlemeye kadar on binlerce sentetik Nesnelerin İnterneti göreviyle uğraşan karma bir edge–cloud kümesini ayrıntılı bir şekilde simüle eden bir simülatör inşa etti. SLA farkındalıklı zamanlayıcılarını, İlk Giren İlk Çıkar (FIFO) ve Round Robin gibi klasik taban çizgilere, enerji odaklı aç gözlü bir yönteme ve SLA bilgisi kullanmayan bir derin pekiştirmeli öğrenme zamanlayıcısına karşı kıyasladılar. Birçok iş yükü karışımında, yeni yaklaşım en iyi taban çizgiye kıyasla SLA ihlallerini yaklaşık üçte iki oranında azalttı, ortalama gecikmeyi yaklaşık üçte bir düşürdü ve enerji kullanımını neredeyse yüzde otuz azalttı. Tasarımın ana parçalarının biri birer çıkarılarak yapılan ablation çalışması, performansta keskin düşüşler gösterdi ve risk skorlama, eylem budama ve geri beslemeye dayalı ödüllerin her birinin kritik rol oynadığını doğruladı.
Günlük bağlı cihazlar için neden önemli
Uzman olmayan biri için ana çıkarım, bilgisayarları sadece daha hızlı yapmanın yeterli olmadığıdır; hangi işin nerede ve ne zaman çalıştırılacağına dair kararlarımız bağlı cihazların deneyimini olumlu ya da olumsuz etkileyebilir. Zamanlayıcıya kullanıcılara verilen taahhütleri anlamayı ve hangi görevlerin gerçekten geç kalma tehlikesi altında olduğunu öngörmeyi öğreterek, bu çalışma edge–cloud sistemlerinin aynı anda daha akıcı ve daha verimli çalışabileceğini gösteriyor. Pratik anlamda bu, sokak kameralarından daha akıcı video, tıbbi sensörlerden daha güvenilir uyarılar ve cihazlar için daha uzun pil ömrü anlamına gelebilir; hepsi yeni donanım eklemeden—sadece dijital trafiği yönlendirmek için SLA farkındalıklı daha akıllı öğrenme algoritmaları kullanılarak.
Atıf: Yamsani, N., P, C.R. SLA aware deep reinforcement learning for adaptive EdgeCloud task scheduling. Sci Rep 16, 10037 (2026). https://doi.org/10.1038/s41598-026-40237-8
Anahtar kelimeler: edge cloud zamanlama, hizmet düzeyi anlaşmaları, derin pekiştirmeli öğrenme, IoT görev devretme, gecikme ve enerji optimizasyonu