Clear Sky Science · tr

Bağlantı tahmini için birikimli yerel etkiler ve grafik sinir ağları

2026-02-12 · Dizine geri dön

Gizli bağlantıları anlamak neden önemli

Hayatımızı şekillendiren birçok sistem—sosyal medya, bilimsel iş birlikleri, beyin ağları, hatta web’in kendisi—bağlantılı noktalar ağı olarak tanımlanabilir. Önemli bir soru, gelecekte hangi yeni bağlantıların oluşma olasılığının yüksek olduğudur; örneğin kim kiminle iş birliği yapacak ya da hangi makalenin hangi makaleyi atıflayacağı. Modern grafik sinir ağları bu tür “bağlantı tahmini” için güçlü araçlardır, ancak aynı zamanda kara kutulardır: iyi çalışırlar ama belirli bir kararı neden verdiklerini görmek zordur. Bu makale, bir düğümün tek bir özelliğini değiştirmenin o düğüme olan bağlantıların ortaya çıkma olasılığını nasıl etkilediğini görebilmemiz için genel bir açıklama tekniğini uyarlayarak bu sorunu ele alıyor.

Basit puanlardan opak grafik beyinlerine

Erken dönem ağ bilimi, eksik veya gelecekteki bağlantıları tahmin etmek için basit kurallara dayanıyordu. Örneğin, çok sayıda ortak arkadaşı olan iki kişinin birbirleriyle arkadaş olma olasılığı daha yüksektir ve yüksek bağlantılı web sayfaları genellikle daha fazla bağlantı çeker. Son on yılda, elle tasarlanmış bu puanlar, her düğümün kompakt sayısal tanımlarını veya gömme (embedding) vektörlerini öğrenen yöntemler tarafından aşıldı. Grafik sinir ağları ise bir adım daha ileri giderek bağlantılar boyunca tekrar tekrar mesaj iletir; böylece her düğümün gömme vektörü komşularından ve onların komşularından bilgi toplar. Bu, onları bağlantı tahmininde mükemmel kılar ama aynı zamanda iç işleyişlerinin karışık ve yorumlanmasının zor olduğu anlamına gelir.

Tek bir özelliğin tahminleri nasıl ittiğini görmek

Graf dışındaki dünyada, kara kutu modelleri yorumlamak için popüler bir yöntem Birikimli Yerel Etkiler (Accumulated Local Effects, ALE) olarak adlandırılır. Sadece hangi özelliklerin önemli olduğunu söylemek yerine ALE, modelin tahmininin bir özelliği olası değerleri boyunca biraz yükseltip düşürdüğünüzde nasıl değiştiğini sorar ve sonra bu yerel değişiklikleri düzgün bir eğri halinde toplar. Yazarlar ALE’yi grafik sinir ağlarıyla bağlantı tahmini için uyarlayarak bir düğümün özelliğini bir kerede değiştirir ve o düğüm ile birçok diğer düğüm arasındaki öngörülen bağlantı olasılığının nasıl tepki verdiğini kontrol eder. Bu, örneğin bir makaledeki “Büyük Teknoloji” yazarlardan gelen payını artırmanın veya beyin içindeki bir damar segmentinin dikey konumunu değiştirmenin, modelin tahmin ettiği bağlantı olasılığını nasıl kaydırdığını gösteren bir görselleştirme üretir.

Etkileri hesaplamanın iki yolu: kesin ve hızlı

Grafik sinir ağları ALE’ye bir bükülme ekler: birçok düğümü aynı anda değiştirdiğinizde, mesajlaşma yoluyla birbirlerini etkileyebilirler ve bu da açıklamayı çarpıtabilir. Bu nedenle yazarlar iki stratejiyi karşılaştırır. “Kesin” versiyonda her düğümün özelliği izole şekilde değiştirilir, böylece iki değiştirilmiş düğüm birbirinin gömme vektörünü kirletemez—ancak bu hesaplama açısından pahalıdır. “Yaklaşık” versiyonda ise birçok düğüm aynı anda değiştirilir, veriyi daha çok sıradan bir tablo gibi ele alır ve bu etkileşimleri görmezden gelir; bu çok daha hızlıdır ama önyargı (bias) getirebilir. Kaç düğümün değiştirildiği ve bunların kaç potansiyel ortakla test edildiği sistematik olarak değiştirilerek, yazarlar bu seçimlerin ALE eğrilerini nasıl etkilediğini ölçer.

Sentezik grafikler ve gerçek veri üzerinde test etme

Doğruluğu incelemek için ekip önce gerçek bağlantı oluşum kuralının bilindiği sentetik bir ağ kurar: uç noktaların her ikisinde de özel bir “sinyal” özelliği yüksek olduğunda kenarların oluşma olasılığı daha yüksektir. Burada ALE eğrilerini doğrudan gerçeklikle karşılaştırabilirler. Daha fazla düğüm aynı anda değiştirildikçe, yaklaşık yöntemin gerçek ilişkiden saptığını, kesin yöntemin ise sadık kaldığını bulurlar. Büyük gerçek dünya veri setlerinde—yapay zeka makalelerinin bir atıf ağı ve fare beyni kan damarlarının ayrıntılı 3B haritası—gerçek kural artık görülemediği için, birçok çalışmanın toplulaştırılmış kesin yöntemi altın standart açıklama olarak alır ve yaklaşık yöntemin ne kadar saptığını kontrol ederler. İstatistiksel testler ve permutasyon deneyleri, çoğu model–veri seti kombinasyonunda iki yöntem arasındaki farkların ılımlı olduğunu, ancak yaklaşık eğrilerin çalışmadan çalışmaya daha değişken olduğunu gösterir.

Bu etkiler dünyanın hakkındaki neleri ortaya koyuyor

Metodolojinin ötesinde, ALE eğrileri modellerin gerçekte ne öğrendiğine dair ipuçları sunar. Atıf ağında, makalelerde büyük teknoloji şirketlerine bağlı yazarların daha yüksek bir paya sahip olması durumunda, modele göre o makalelerin atıf alma olasılığının daha yüksek olduğunu gösterir; bu, endüstrinin AI araştırmaları üzerindeki artan etkisi hakkındaki kaygıları yansıtır. Damar grafında ise iki farklı grafik sinir ağı mimarisi, bir damarın beyindeki yüksekliğinin bağlantısallığıyla ilişkisi hakkında zıt eğilimler öğrenir; bu da ALE’nin modelin inançlarını ortaya koyduğunu, bunun zorunlu olarak biyolojik gerçeği yansıtmayabileceğini vurgular. Böyle uyumsuzluklar, model mimarisi, eğitim verileri veya değerlendirme yöntemlerinin yeniden düşünülmesi gereken yerleri işaretleyebilir.

Okuyucular ve uygulayıcılar için çıkarım

Çalışma, Birikimli Yerel Etkiler’in grafik sinir ağlarındaki bağlantı tahminlerini açıklamak için yeniden şekillendirilebileceğini gösteriyor ve bir düğüm özelliğini değiştirmenin bağlantı olasılıklarını nasıl artırıp azaltacağını gösteren sezgisel eğriler sunuyor. Bu eğrileri kesin olarak hesaplamak daha güvenilirdir ancak daha yavaştır; hızlı bir yaklaşım ise genellikle daha fazla gürültüye katlanılabildiği durumlarda, özellikle birçok çalışmanın ortalaması alındığında, çoğu durumda yeterince iyidir. Standart makine öğrenimi modelleri üzerinde açıklama araçları kullanan kişiler için bu, karmaşık grafik tabanlı sistemlerin içine görsel ve tanıdık bir yoldan bakma ve modelin öğrendikleri ile ilgili anlayışımızın uyuşup uyuşmadığını sorgulama olanağı sunar.

Atıf: Kaczyńska, P., Sienkiewicz, J. & Ślęzak, D. Accumulated local effects and graph neural networks for link prediction. Sci Rep 16, 8574 (2026). https://doi.org/10.1038/s41598-026-39000-w

Anahtar kelimeler: grafik sinir ağları, bağlantı tahmini, model açıklanabilirliği, birikimli yerel etkiler, ağ bilimi