Clear Sky Science · tr

Keskinlik-bilinçli eğitim kullanan fiziksel sinir ağları

· Dizine geri dön

Bu, Yapay Zeka donanımının geleceği için neden önemli

Yapay zeka daha güçlü hale geldikçe, onu sınırlayan şey giderek zekice algoritmalardan çok onları çalıştıran çipler oluyor. Umut verici bir çıkış yolu, sinir ağlarını doğrudan ışık, analog elektronik veya diğer dalga tabanlı sistemler kullanarak fiziksel donanımda kurmak. Bu makale, gerçek dünya karışık olduğunda—aygıtlar hafifçe hatalı yapıldığında, ısı kayması olduğunda veya bileşenler hizadan çıktığında—hâlâ doğru kalan bu “fiziksel sinir ağlarını” eğitmenin yeni bir yolunu tanıtıyor.

Dijital beyinlerden fiziksel makinelere

Günümüz yapay zekâsı tipik olarak grafik işlemciler gibi dijital donanımda çalışır; eğitim, milyonlarca sayısal ağırlığı ayarlamak için geri yayılım algoritmasına dayanır. Fiziksel sinir ağları, bu hesaplamayı fotonik çipler, interferometre ağları veya difraktif optik düzenekler gibi gerçek malzemeler ve aygıtlara kaydırmayı amaçlar; bu sistemlerin davranışı doğal olarak sinir ağı matematiğini taklit eder. Bilginin depolandığı yerde işlenmesi nedeniyle, klasik çiplere göre çok daha hızlı ve enerji verimli olabilirler. Ancak bunları eğitmek zordur: ya dijital bir modeli eğitip donanıma kopyalarsınız ya da doğrudan cihaz üzerinde eğitirsiniz. Her iki yol da, gerçek cihazlar ideal modellerden sapıp zaman içinde kayma gösterdiğinde sorunlar yaşar.

Figure 1
Figure 1.

Fiziksel ağları öğretmenin iki kusurlu yolu

İlk yaklaşım olan in silico eğitim, tüm parametreleri bir bilgisayar modelinde öğrenip sonra bunları donanıma kopyalar. Bu ancak matematiksel model üretilen cihaza neredeyse birebir uyduğunda iyi çalışır; oysa üretim farklılıkları, elektriksel gürültü ve termal etkiler eklendiğinde bu nadiren doğrudur. İkinci yaklaşım olan in situ eğitim, fiziksel cihazı öğrenme sürecine doğrudan dahil ederek parametreler ayarlanırken çıktıları tekrar tekrar ölçer. Bu, modelleme hatalarını atlatsa da başka sorunlar yaratır: gradyan bilgisi elde etmek zor ve maliyetlidir, eğitim cihaz-özel hale gelir ve ortaya çıkan parametreler genellikle nominal olarak aynı olan başka bir çipe aktarılamaz. Her iki durumda da konuşlandırmadan sonra meydana gelen küçük değişiklikler—örneğin hafif bir sıcaklık kayması veya hizalanma hatası—doğruluğu büyük oranda düşürebilir ve pahalı yeniden eğitime zorlayabilir.

Öğrenme manzarasını düzleştirmek

Yazarlar, keskinlik-bilinçli eğitim (SAT) öneriyor; bu, keskinlik-bilinçli minimizasyon adlı makine öğrenmesi fikrinden esinlenmiştir. SAT, yalnızca eğitim verisinde düşük hata veren ayarları bulmakla kalmaz, aynı zamanda temel fiziksel parametreler hafifçe dürtüldüğünde hatanın yavaş değiştiği bölgeleri de arar. Geometrik olarak, geleneksel eğitim genellikle “kayıp manzarası”nda derin ama dar bir vadide sonlanır; akım, faz veya pozisyonlardaki çok küçük kaymalar bile performansın çökmesine yol açar. SAT kasıtlı olarak performansın bu tür bozulmalar altında yüksek kaldığı geniş, düz vadileri arar. Matematiksel olarak, eğitim amaç fonksiyonuna parametre uzayındaki keskin, yüksek eğrilikli bölgeleri cezalandıran bir terim ekler ve bu cezayı ikinci türev hesaplamalarının maliyetine girmeden iki dikkatle seçilmiş gradyan adımıyla verimli şekilde yaklaşıklar.

Figure 2
Figure 2.

Farklı optik platformlarda sağlamlığı kanıtlamak

SAT’in tek bir cihaza bağlı olmadığını göstermek için yazarlar bunu üç ayrı optik sinir ağı platformuna uygular. Farklı dalga boylarında ışığı yönlendiren küçük silikon halkalar olan mikroring rezonatör ağırlık bankalarında, SAT ile eğitilmiş sistemlerin sıcaklık birkaç derece değişse bile yüksek sınıflandırma doğruluğunu koruduğunu gösterirler; oysa standart eğitim ve gürültü enjeksiyonu yöntemleri dramatik şekilde başarısız olur. Bunu CIFAR-10 üzerinde görüntü sınıflandırma, görüntü sıkıştırma ve yeniden yapılandırma ile görüntü üretimi gibi daha zorlu görevlerde de genişletirler; SAT, mütevazı termal kaymalar altında geleneksel yöntemler bozulurken performansı kararlı tutar. Mach–Zehnder interferometre ağlarının simülasyonlarında SAT ile eğitilmiş modeller, gerçekçi üretim hatalarına karşı çok daha toleranslıdır ve kritik olarak bir cihazda eğitilen parametreler, farklı kusurlara sahip diğer çiplere aktarılabildiğinde doğruluk kaybı yaşamaz. Son olarak, bir OLED ekran, lensler ve uzamsal ışık modülatörü kullanan serbest-uzay difraktif optik düzeneğinde SAT, bu hizalanma hataları ile ağ parametreleri arasındaki kesin ilişki açıkça modellenmemiş olsa bile dönüş, piksel kaymaları ve ölçeklenme gibi fiziksel hizalanma bozukluklarına karşı toleransı artırır.

Güvenilir fiziksel yapay zekâya pratik bir yol

Düz bir ifadeyle, bu çalışma, donanım sinir ağlarını gerçek aygıtların kaçınılmaz tuhaflıklarını “affeden” bir şekilde nasıl öğretebileceğimizi gösteriyor. Öğrenmeyi hata manzarasının geniş, kararlı bölgelerine yönlendirerek, keskinlik-bilinçli eğitim fiziksel sinir ağlarını hem daha doğru hem de üretim varyasyonlarına, sıcaklık değişimlerine ve mekanik hizalanma hatalarına karşı daha dayanıklı kılıyor. Ayrıntılı fiziksel modellerle birlikte veya onlarsız kullanılabilmesi ve çeşitli optik donanım türlerinde çalışması nedeniyle, SAT laboratuvar gösterimlerinden gerçek dünya uygulamalarına hızlı, enerji verimli fiziksel yapay zekâ sistemlerini ölçeklendirmek için pratik bir reçete sunuyor.

Atıf: Xu, T., Luo, Z., Liu, S. et al. Physical neural networks using sharpness-aware training. Nat Commun 17, 1766 (2026). https://doi.org/10.1038/s41467-026-68470-9

Anahtar kelimeler: fiziksel sinir ağları, fotonik hesaplama, dayanıklı eğitim, keskinlik-bilinçli optimizasyon, neuromorfik donanım