Clear Sky Science · tr
Karmaşık ağlarda kritik düğümlerin tespiti için makine öğrenimi tekniklerini entegre etmek
Ağlardaki kilit noktaları bulmanın önemi
Sosyal medyadan hava yolu rotalarına, enerji şebekelerinden e‑posta sistemlerine kadar modern yaşamın birçok parçası ağ olarak düşünülebilir. Bu bağlantı ağlarında bazı noktalar — insanlar, havaalanları, enerji santralleri veya bilgisayarlar — diğerlerinden çok daha önemli olur. Bu kritik noktaları tespit etmek; salgınları yavaşlatmamıza, altyapıyı korumamıza ve bilgiyi verimli şekilde yaymamıza yardımcı olabilir. Bu makale, özellikle bir şey ağ boyunca aktif olarak yayılırken, söz konusu kritik noktaları algılamada modern makine öğreniminin geleneksel yöntemleri nasıl geride bırakabildiğini inceliyor.
Önemli noktaları bulmanın eski yolları
On yıllardır araştırmacılar, bir ağdaki hangi düğümlerin en önemli olduğunu belirlemek için merkezilik (centrality) olarak adlandırılan basit yapısal puanlar kullanıyor. Bu puanlar bir düğümün kaç doğrudan bağlantısı olduğuna, tüm diğer düğümlere ne kadar yakın olduğuna veya en kısa yollar üzerinde ne sıklıkla yer aldığına bakıyor. Yararlı olmakla birlikte bu ölçümlerin dezavantajları da var. Bazıları yalnızca bir düğümün anlık komşuluk çevresine odaklanıp bütünü kaçırıyor. Diğerleri tüm ağı dikkate alıyor ama ağ büyüdükçe hesaplaması pahalı hale geliyor. En önemlisi, bu yöntemler bir düğümün yapısal konumunun tek başına gerçek bir yayılma süreci — örneğin bir hastalık salgını veya viral bir mesaj — üzerindeki etkisini ne kadar güçlü olacağını belirttiğini varsayıyor.
Yayılma davranışını resme katmak
Bu uçurumu kapatmak için yazarlar, bir şeyin ağ boyunca nasıl yayıldığını açıkça modelleyip bu sonuçları makine öğrenimi modellerine gerçek anlamda etkili düğümlerin nasıl göründüğünü öğretmekte kullanıyor. İki yaygın epidemik tipi modelden yararlanıyorlar. Birinde her düğüm duyarlı, enfekte veya iyileşmiş olabilir ve enfeksiyon belirli bir olasılıkla bağlantılar üzerinden yayılır. Diğerinde ise her yeni enfekte olmuş düğüm komşularını enfekte etme konusunda bir kez şans sahibi olur. Bu süreçleri her başlangıç düğümünden tekrar tekrar simüle ederek, yazarlar her düğümün hangi büyüklükte bir salgın tetikleyebileceğini ölçüyor. Bu salgın büyüklükleri daha sonra düğümleri zayıf yayılmacılardan çok güçlü yayılmacılara kadar birkaç etki seviyesine ayıran etiketler kümesine dönüştürülüyor.
Makinelere güçlü düğümleri tanıtmayı öğretmek
Her düğüme bir etiket verildikten sonra, yazarlar yapısal bilgi ile yayılma koşullarını harmanlayan bir özellik profili oluşturuyor. Her düğüm için yerel bağlantı, küresel konum ve komşuların gücünü yakalayan standart merkezilik puanları toplanıyor ve ayrıca simülasyonlarda kullanılan enfeksiyon oranı da ekleniyor. Bu değerler, yöntem farklı boyutlardaki ağlara uyum sağlayabilsin diye normalize ediliyor. Bu etiketlenmiş veri kümesi ile karar ağaçları, rastgele ormanlar, destek vektör makineleri, lojistik regresyon, k‑en yakın komşu ve sinir ağları gibi hazır makine öğrenimi modelleri eğitiliyor. Ayrıca önce benzer özelliklere sahip düğümleri K‑means ile kümelere ayırıp ardından her küme içinde ayrı ayrı bir destek vektör sınıflandırıcısı eğiten hibrit bir yöntem tasarlıyorlar. Bu hibrit yaklaşım, ağın tüm karmaşıklığı altında boğulmadan ince, doğrusal olmayan desenleri yakalamayı hedefliyor.

Yöntemleri teste sokmak
Yazarlar çerçevelerini havayolu rotaları, yol sistemleri, bilimsel iş birlikleri, biyolojik ağlar ve e‑posta alışverişlerini kapsayan yedi gerçek dünya ağında değerlendiriyor. Makine öğrenimi modellerini iki temel senaryoda klasik merkezilik puanlarıyla karşılaştırıyorlar. Birincisinde modeller aynı ağın farklı bölümlerinde eğitilip test ediliyor. Burada hibrit kümeleme‑artı‑sınıflandırma yöntemi tutarlı şekilde en yüksek doğruluk, keskinlik, geri çağırma ve F1‑skorunu elde ediyor; etki seviyelerine göre düğümleri sınıflandırırken sıklıkla geleneksel merkezilikleri 15–45 yüzde puanıyla geride bırakıyor. İkinci senaryoda ise modeller bir ağ üzerinde eğitilip başka bir ağ üzerinde test ediliyor. Bu daha zorlu çapraz‑ağ durumunda klasik aradaki bağlantıya dayalı (betweenness) skorlar makine öğrenimi modellerinden daha iyi performans gösterme eğiliminde oluyor; bu da bir yapıda öğrenilen desenlerin her zaman başka bir yapıya temiz şekilde transfer olmayabileceğini vurguluyor.

Pratikte bunun anlamı
Belirli bir ağ üzerinde ayrıntılı simülasyonlar çalıştırma imkânımız olduğunda — örneğin belirli bir enerji şebekesi, bir sosyal platform veya bir ulaşım sistemi — önerilen makine öğrenimi çerçevesi yalnızca yapıya dayanmanın ötesinde en etkili düğümleri belirlemede daha doğru ve ölçeklenebilir bir yol sunuyor. Düğümlerin nasıl bağlı olduğunu, bulaşmanın gerçekte nasıl aktığını ve kümeleme ile sınıflandırmanın akıllı bir birleşimini kullanarak yöntem, arızası veya etkinleşmesi en büyük farkı yaratacak birkaç öğeyi daha güvenilir şekilde işaretleyebiliyor. Aynı zamanda sonuçlar bize tek bir modelin her yerde en iyi olmadığına dair bir hatırlatma yapıyor: Taze simülasyonlar yapmadan bir ağdan diğerine genelleme yapmak zorunda olduğumuzda basit, yapıya dayalı skorlar hâlâ tercih edilebilir olabilir.
Atıf: ReddyPriya, M., Enduri, M.K., Hajarathaiah, K. et al. Integrating machine learning techniques for critical node identification in complex networks. Sci Rep 16, 8929 (2026). https://doi.org/10.1038/s41598-026-40778-y
Anahtar kelimeler: etkili düğümler, karmaşık ağlar, makine öğrenimi, epidemik yayılma, ağ merkeziliği