Clear Sky Science · tr

Graf sinir ağlarının menzilini küresel kodlamalarla genişletmek

· Dizine geri dön

Moleküllerde uzak bağlantıların neden önemi var

Yeni ilaçlardan daha iyi pillere kadar, günümüzün birçok atılımı binlerce atomun birbirlerini nasıl ittiğini ve çektiğini tahmin edebilen bilgisayar modellerine dayanıyor. Graf sinir ağları adı verilen popüler bir yapay zeka sınıfı bu görev için iş gören bir araç haline geldi. Yine de bu modellerin bir kör noktası var: çoğunlukla yakın komşulara odaklanıyorlar, oysa uzak atomlar elektriksel ve kuantum kuvvetleri aracılığıyla birbirlerini güçlü biçimde etkileyebilir. Bu makale, bu sinir ağlarına küresel bir görüş kazandırarak uzak etkileri “hissetmelerini” ve tahmin etmelerini sağlayan, ama aşırı yavaş veya bellek tüketen bir yapıya dönüşmeyen RANGE adlı yöntemi tanıtıyor.

Mevcut yapay zekanın sadece mahalleyi görmesi

Graf sinir ağları bir molekülü veya malzemeyi düğümler (atomlar) ve kenarlar (ilişkiler) ağı olarak ele alır. Her adımda her düğüm, sabit bir mesafe içindeki yakın komşularıyla konuşarak durumunu günceller. Bu işlemi tekrar etmek bilgi yayılmasını yavaşça sağlar, ancak bu stratejinin iki büyük dezavantajı vardır. Birincisi, mesajlar birçok ara noktadan geçerken bulanıklaşabilir; bu probleme oversmoothing denir. İkincisi, grafın dar yolları bilgi akışını boğabilir; buna oversquashing denir. Her iki sorun da elektrostatik ve dağılım gibi birçok angström ölçeğinde etkili kuvvetleri yakalamaya çalışırken ciddi hale gelir. Etkileşim mesafesini basitçe uzatmak veya daha fazla katman eklemek modelleri pahalı hale getirir ve bu darboğazları tam olarak çözmez.

Küresel iletişim için sanal merkezler eklemek

RANGE (Relaying Attention Nodes for Global Encoding), bu resmi küçük bir dizi sanal “ana düğüm” ekleyerek yeniden düzenler; bu düğümler gerçek bir atoma karşılık gelmez. Bunun yerine küresel merkezler gibi davranırlar. Komşu atomlar arasında sıradan bir mesajlaşma adımından sonra, tüm atomlardan gelen bilgiler bir dikkat mekanizması kullanılarak bu merkezlerde toplanır: her ana düğüm sistemin hangi parçalarına odaklanacağını öğrenir. Bu toplama molekülün durumunun kaba taneli özetlerini oluşturur. İkinci bir yayın adımında, bu özetler yine dikkat kullanılarak her atoma geri gönderilir; böylece her atom her ana düğümün ne kadarına kulak vereceğine karar verirken öz belleğini (self-loop) koruyabilir. Her atom doğrudan her ana düğüme bağlandığı için uzak iletişim tek adımda gerçekleşebilir; bu da grafı uzak bölgelerin birbirini hızlı ve verimli şekilde etkileyebildiği küçük-dünya ağına dönüştürür.

Figure 1
Figure 1.

Diğerlerinin kaçırdığı uzak kuvvetleri görmek

Araştırmacılar RANGE’i birkaç ileri düzey moleküler kuvvet alanı modeline ekleyerek sınadı ve bunları orijinal, tamamen yerel versiyonlarıyla karşılaştırdı. Uzak etkilere bilinen önemin yüksek olduğu zorlu sistemler seçtiler: katkılayıcı gibi davranan ekstra bir sodyum iyonu içeren bir tuz kristali, katkılanmış bir oksit yüzeyine yaklaşan bir altın dimeri ve farklı uzaklıklarda etkileşen organik molekül çiftleri. Standart modeller uzak yük yeniden düzenlenmelerinin veya gizli katkılayıcıların enerji manzarasını nasıl değiştirdiğini büyük ölçüde fark edemedi; uzun menzilli çevre değiştiğinde tahminleri neredeyse kaymadı. Buna karşılık, RANGE ile güçlendirilmiş modeller farklı enerji eğrilerini doğru yakaladı ve eğitim sırasında gördüklerinden daha büyük ayrılıklara genelleyebildi; zorlu yüklü dimerler için hatalar dört kata kadar daha küçük oldu.

Bilgisayarı kırmadan doğruluk

Önemli olarak, RANGE bu geliştirilmiş görüşü diğer küresel yaklaşımların ağır hesaplama maliyeti olmadan sunar. Ewald toplamı veya Fourier tabanlı düzeltmeler gibi fizikten ödünç alınan teknikler, atom sayısının karesiyle yaklaşık olarak büyüyen işlemler gerektirir veya büyük ızgaralara bağlıdır; bu da büyük sistemler ve tekrarlayan simülasyonlar için ağırdır. RANGE tasarım gereği sistem boyutuyla doğrusal ölçeklenir: her ana düğüm tüm atomlara bağlanır, ancak ana düğüm sayısı ölçülü şekilde artar ve onların gereksiz hale gelmesini önleyen bir düzenleme (regularization) şemasıyla kontrol edilir. Daha büyük veri setlerindeki kıyaslamalar, RANGE’in tahmin edilen kuvvetlerdeki hataları tutarlı şekilde azalttığını gösterdi; bu, temel modeller kısa etkileşim kesimleri kullansa bile geçerliydi ve bunu yalnızca ılımlı bir çalışma zamanı ve bellek artışıyla başardı. Ekip ayrıca karmaşık moleküller üzerinde onlarca nanosaniye süren moleküler dinamik simülasyonları çalıştırdı ve RANGE tabanlı kuvvet alanlarının stabil kaldığını ve gerçekçi şekil ve durumları keşfettiğini buldu.

Figure 2
Figure 2.

Moleküler dünyaların daha net bir genel görünümü

Uzman olmayanlar için ana mesaj şudur: RANGE mevcut graf tabanlı yapay zeka modellerine yerel çalışırken aynı zamanda küresel düşünmenin yeni bir yolunu sağlar. Akıllı sanal merkezler ve dikkat odaklı bilgi akışı getirerek, moleküllerde ve malzemelerde uzun menzilli, çok parçacıklı etkileri yakalamayı engelleyen yaygın darboğazların üstesinden gelir. Bu, uzak bölgelerin birbirini ince şekilde etkilediği sistemler — esnek ilaç moleküllerinden genişletilmiş nanoyapılara kadar — için daha güvenilir tahminler anlamına gelir ve bunun için ağır bir hesaplama faturası gerekmez. Bu yöntemler daha büyük ve daha karmaşık ortamlara uygulandıkça, fiziksel etkileşimlerin gerçek uzun menzilli dokusunu daha sadık biçimde yansıtabilen yapay zeka araçları vaat ediyorlar.

Atıf: Caruso, A., Venturin, J., Giambagli, L. et al. Extending the range of graph neural networks with global encodings. Nat Commun 17, 1855 (2026). https://doi.org/10.1038/s41467-026-69715-3

Anahtar kelimeler: graf sinir ağları, uzak mesafe etkileşimleri, moleküler simülasyonlar, makine öğrenimli kuvvet alanları, dikkat mekanizmaları