Clear Sky Science · tr

Dikkat tabanlı iş yükü tahmini ve heterojen hesaplama ortamları için dinamik kaynak tahsisi

· Dizine geri dön

Daha Akıllı Bilgisayarlar Neden Herkes İçin Önemli

Her izlediğiniz film, açtığınız harita veya konuştuğunuz yapay zeka asistanının arkasında, dev veri merkezlerindeki binlerce bilgisayar sessizce gece gündüz çalışır. Yapay zeka güçlendikçe bu veri merkezleri sınırlarına doğru zorlanıyor: farklı türde işler farklı türde makinelerde yürütülürken maliyet, hız ve enerji kullanımını kontrol altında tutmak gerekiyor. Bu makale, bu bilgisayarların yakın gelecekte neye ihtiyaç duyacağını tahmin etmenin ve işleri farklı donanım türleri arasında yeniden dağıtmanın yeni bir yolunu tanıtıyor; amaç, hizmetlerin hızlı ve güvenilir kalmasını sağlarken daha az elektrik israfı yapmak.

Çok Sayıda İş, Çok Sayıda Makine

Modern veri merkezleri artık tek tip sunuculara dayanmaz. Geleneksel işlemcileri güçlü grafik yongaları, özel yapay zeka kartları ve yeniden programlanabilir devrelerle birleştirirler. Büyük dil modeli eğitimi, gerçek zamanlı öneri servisleri veya görüntü analizi gibi farklı yapay zeka görevleri bu makinelerle çok farklı biçimlerde eşleşir. Bugün işletmeciler genellikle kaynakları sabit kurallarla veya dünkü kullanım verilerine dayanan basit tahminlerle tahsis eder. Talep aniden yükseldiğinde bu yavaş yanıtlara veya hizmet sözleşmelerinin ihlaline yol açabilir; talep düştüğünde ise pahalı donanım boşta kalır, güç tüketir ama çok az iş yapar.

Figure 1
Figure 1.

Nereye Bakılması Önemliyse Oraya Bakmayı Öğrenmek

Yazarlar, keskin AI modellerinden alınan "dikkat (attention)" kavramını veri merkezi yönetimine uyguluyor. Geçmiş kullanım verilerinin tamamını aynı şekilde ele almak yerine, sistem hangi zaman dilimlerinin ve hangi iş türlerinin gelecekte ne olacağını tahmin etmek için en faydalı olduğunu öğreniyor. Modelin bir bölümü her iş yükünün—örneğin bir eğitim işi ya da çevrimiçi bir servis—zaman içinde nasıl değiştiğine odaklanıyor. Diğer bir bölüm ise aynı anda çalışan farklı iş yükleri arasındaki gizli bağlantıları ortaya çıkarmak için yanlamasına bakıyor; örneğin bir eğitim işi paketinin bitmesi genellikle ilgili çevrimiçi sorgularda bir artışa yol açabilir. Bu iki bakış açısını üst üste koyarak sistem, işlemci, bellek ve hızlandırıcılar için gelecekteki talepleri önceki yöntemlerden daha doğru şekilde tahmin edebiliyor.

Tahminleri Daha İyi Kararlara Dönüştürmek

Sadece tahmin yapmak yeterli değildir; veri merkezi buna göre harekete geçmelidir. Çerçevenin ikinci yarısı bu tahminleri her işin nerede çalıştırılacağına dair somut kararlara dönüştürüyor. Yazarlar bunu işleri çabuk bitirmek, mümkün olduğunca az enerji kullanmak ve makineleri boşta değil meşgul tutmak olmak üzere üç hedef arasında bir dengeleme olarak ele alıyor. Zamanlayıcıları veri merkezini farklı cihazların bir ağı olarak temsil ediyor ve işletmecinin tercihleri doğrultusunda bu hedefler arasında ödün veren yerleşimleri seçmek için bir optimizasyon prosedürü kullanıyor. Tahminler hiçbir zaman kusursuz olmadığından, sistem kendi belirsizliğini de tahmin ediyor ve gerektiğinde güvenlik payları bırakıyor; ardından önceliği düşük işleri duraklatmak veya kullanım beklentilerden saptığında işleri taşımak gibi gerçek zamanlı ayarlamalar yapmak için gerçeği izliyor.

Figure 2
Figure 2.

Sistemi Test Etmek

Bu yaklaşımın pratikte nasıl işlediğini görmek için araştırmacılar, işlemciler, GPU'lar ve özel yapay zeka donanımlarının gerçekçi bir bileşimini içeren bir test kümesi kurdular ve Google, Alibaba ve bir akademik laboratuvardan gerçek dünyaya ait ayrıntılı etkinlik kayıtlarıyla beslediler. Yöntemlerini üretimde kullanılan teknikler ve pekiştirmeli öğrenme tabanlı denetleyiciler de dahil olmak üzere popüler tahmin araçları ve zamanlama stratejileriyle karşılaştırdılar. Dikkat tabanlı tahminci özellikle yapay zeka iş yüklerinde sık görülen ani dalgalanmalar için tutarlı biçimde daha doğru tahminler yaptı. Dinamik ayırıcılarıyla birlikte kullanıldığında sistem, toplam donanım kullanımını yaklaşık beşte dördüne yükseltti, ortalama iş tamamlama süresini yaklaşık dörtte bir azalttı ve enerji tüketimini yaklaşık yüzde 15 düşürdü; bütün bunları hizmet ihlallerini çok düşük bir seviyede tutarken başardı.

Günlük Kullanıcılar İçin Anlamı

Uzman olmayanlar için ana çıkarım, veri merkezleri içindeki daha akıllı koordinasyonun yeni çipler veya binalar gerektirmeden yapay zeka servislerini daha hızlı, daha ucuz ve daha çevreci hale getirebilmesidir. Kullanım verilerinin selinde "nereye dikkat edileceğini" öğrenerek bu çerçeve mevcut donanımın daha yararlı iş yapmasına ve daha az boşta kalmasına yardımcı oluyor. Bu da şirketlerin daha hızlı uygulamalar ve daha güçlü yapay zeka araçları sunarken elektrik faturalarını ve karbon ayak izlerini düşürebilecekleri anlamına geliyor. Benzer tahmin ve tahsis sistemleri yayıldıkça ve olgunlaştıkça internetin görünmez mekanizması sadece daha yetenekli değil aynı zamanda daha sürdürülebilir hale gelebilir.

Atıf: Shao, S., Ding, X., Zhao, B. et al. Attention-based workload prediction and dynamic resource allocation for heterogeneous computing environments. Sci Rep 16, 8571 (2026). https://doi.org/10.1038/s41598-026-38622-4

Anahtar kelimeler: veri merkezi zamanlama, Yapay zeka iş yükü tahmini, heterojen hesaplama, enerji verimli hesaplama, kaynak tahsisi