Clear Sky Science · tr

Çoklu nesne tanıma için parazitlere dayanıklı difraktif derin sinir ağları

· Dizine geri dön

Gürültülü Dünyada Sinyali Görmek

Modern yaşam, bir sahnedeki önemli öğeleri seçmek zorunda olan kameralar ve sensörlerle dolu — yoldaki bir yaya, bir taramada küçük bir tümör, kalabalıktaki şüpheli bir nesne — hatta bunlar etraftaki karışıklıkla çevriliyken bile. Bu makale, tanımayı elektronik çipler yerine ışığın kendisiyle gerçekleştiren yeni bir “tam‑optik” sinir ağı türünü sunuyor. Sonuç, kalabalık ve değişken sahnelerde seçilen nesneleri tanıyabilen, geri kalan her şeyi zararsız arka plan gürültüsü olarak ele alan ve geleceğin makineleri için daha hızlı ve çok daha enerji verimli görme olanağı sağlayabilecek bir sistemdir.

Figure 1
Figure 1.

Neden Işıkla Yapılan Bilgisayarlar Önemli

Geleneksel derin öğrenme sistemleri, milyarlarca küçük anahtar arasında akım taşıyan elektronik işlemciler üzerinde çalışır. Bunlar güçlü olmakla birlikte mikro saniyeler içinde karar verilmesi gerektiğinde yavaştır ve çok fazla enerjiyi ısı olarak harcar. Işık cazip bir alternatif sunar: ışınlar paralel olarak büyük miktarda bilgi taşıyabilir, nihai hız sınırında hareket eder ve elektrik akımları gibi devreleri ısıtmaz. Optik sinir ağları, ışığı dikkatle tasarlanmış yüzeylerle şekillendirerek bu avantajlardan yararlanır; böylece bir ışık demeti bu yüzeylerden geçerken etkili olarak bir tanıma probleminin "hesabını" yapmış olur.

Tek Nesneden Kalabalık Sahnelere

Mevcut optik sinir ağlarının çoğu, temiz bir görüntünün ortasındaki tek bir rakamın hangisi olduğunu belirlemek gibi basit işler ile sınırlıdır. Birden fazla nesne birlikte göründüğünde, üst üste geldiğinde veya hareket ettiğinde — gerçek dünya sahnelerinde görülen koşullar tam da bunlardır — zorlanırlar. Çoklu nesnelerle başa çıkma girişimleri genellikle her nesnenin nerede olabileceğine dair katı kurallar gerektirdi veya ışık tabanlı aşamadan sonra ek elektronik işlemeye dayandı; bu da optik yaklaşımın hız ve güç tasarrufu avantajlarını baltaladı.

Işığa Dikkat Dağıtıcıları Gözardı Etmeyi Öğretmek

Yazarlar, yoğun sahnelerle doğrudan başa çıkan "parazit karşıtı difraktif derin sinir ağı" yani AI D2NN'yi tanıtıyor. Sistem yalnızca iki ultra‑ince desenli katmandan — metasurfuslardan — oluşuyor ve terahertz ışık demeti bunlardan geçiyor. Bu katmanlar, hedef nesnelerden gelen ışığın — burada el yazısıyla yazılmış 0 ile 5 arasındaki rakamlar — çıkış düzleminde altı küçük parlak lekenin birine, her rakam için bir lekeye yönlendirilmesi amacıyla bilgisayar eğitimiyle tasarlanıyor. Aynı zamanda diğer rakamlardan, giysi görüntülerinden, harflerden ve bunların rastgele kombinasyonlarından gelen ışık kasten soluk, neredeyse uniform bir pus hâline getirilerek hiçbir çıkış lekesini tetiklemez hale getiriliyor.

Figure 2
Figure 2.

Fiziksel Bir Işık Bilgisayarı İnşa Etmek ve Test Etmek

Eğitilmiş tasarımı donanıma dönüştürmek için ekip, geçen ışığı hassas gecikmelerle geciktiren küçük silindirik sütunlardan oluşan silikon metasurfuslar üretti. 100'e 100 ızgara halinde düzenlenen bu sütunlar, birleşik etkileri öğrenilmiş ağı gerçekleştiren optik nöronlar gibi davranıyor. Araştırmacılar sistemi, hedef rakamların karışımlarını ve hareketli, karmaşık sahneleri taklit etmek üzere rastgele pozisyon ve boyutlarda yerleştirilmiş 40 farklı türde girişim şekliyle desenlenmiş terahertz demetleriyle test ettiler. Bilgisayar simülasyonlarında optik ağ, bu zorlu durumların yaklaşık yüzde 87’sinde seçilen rakamları doğru tanırken, gerçek deneysel kurulum neredeyse aynı doğruluğa ulaşarak konseptin bir bilgisayar modelinin dışında da çalıştığını gösterdi.

Geleceğin Makineleri İçin Anlamı

Basitçe söylemek gerekirse, bu çalışma; çok az enerji kullanarak ve ışık hızında çalışan, ince kağıt gibi bir optik cihazın karışıklığın arasından bakıp ilgilendiği nesneyi tespit edebileceğini gösteriyor. Tasarım difraksiyonun genel özelliklerine dayandığı için aynı fikir farklı renk veya dalga boylarına ölçeklenebilir ve aynı anda çok daha fazla nesne sınıfını işleyebilmek için diğer optik hilelerle birleştirilebilir. Daha fazla geliştirmeyle, benzer parazit‑karşıtı optik ağlar otonom araçların önemli yol kullanıcılarını hızlıca tanımasına, doktorların taramalarda şüpheli özellikleri gerçek zamanlı işaretlemesine veya ağır elektronik işlemeye ihtiyaç duymayan hafif güvenlik kameralarının tehditleri tespit etmesine yardımcı olabilir.

Atıf: Huang, Z., Liu, Y., Zhang, N. et al. Anti-interference diffractive deep neural networks for multi-object recognition. Light Sci Appl 15, 101 (2026). https://doi.org/10.1038/s41377-026-02188-7

Anahtar kelimeler: optik sinir ağları, çoklu nesne tanıma, metasurfuslar, terahertz görüntüleme, tam-optik hesaplama