Clear Sky Science · tr

HyMSS-GAD: yapısal, bağlamsal ve geometrik akıl yürütme ile çoklu görünümlü grafik anomali tespiti için hibrit çok aşamalı çerçeve

· Dizine geri dön

Ağlardaki tuhaf desenleri fark etmenin önemi

Sosyal medyadan alışveriş sitelerine, finansal sistemlerden biyolojiye kadar günümüz verilerinin çoğu ağlar olarak tanımlanabilir: düğümler (noktalar) bağlantılar (kenarlar) ile birbirine bağlanır. Bu ağların içinde dolandırıcılık, siber saldırılar, hatalı bilimsel kayıtlar veya beklenmedik bilimsel keşifler gibi olguları işaret edebilecek nadir ve alışılmadık desenler gizlidir. Makale, bir ağda bu tür anomalileri üç farklı “bakış”ı birleştirerek arayan yeni bir yöntem olan HyMSS-GAD’i tanıtıyor: her düğümün özellikleri, diğerlerine nasıl bağlandığı ve ağın daha geniş biçimine nasıl uyduğu. Bu karışım, daha eski araçların kaçırdığı ince uyarı işaretlerini yakalamayı ve bir düğümün neden şüpheli olduğunu açıklamayı amaçlıyor.

Figure 1
Figure 1.

Ağın birden fazla yönünü görmek

Grafiklerde tuhaf düğümleri bulmaya yönelik geleneksel yöntemler genellikle bağlı düğümlerin birbirine benzer olduğu varsayımına dayanır. Bu “türdeşler bir arada sürü oluşturur” kuralı bazı sosyal veya atıf ağlarında işe yarar, ancak bağlantıların çok farklı türden varlıkları bağladığı pek çok gerçek sistemde bozulur. Eski modeller ayrıca genellikle ya bağlantı desenine ya da düğüm özniteliklerine odaklanır, her ikisini birlikte değil, ve genellikle tüm bilgiyi tek bir görünümde sıkıştırır. HyMSS-GAD, anomalilerin aynı düğümün birkaç görünümü arasındaki uyuşmazlıklar olarak ortaya çıktığı fikrinden yola çıkar: tanımlayıcı özellikleri, küçük yerel bağlantı desenlerindeki konumu ve ağın genel biçimindeki rolü.

İçerik ve çevre uyuşmadığında öğrenmek

HyMSS-GAD’in ilk aşaması “bağlamsal” aykırılıkları arar: içeriği komşularının önerdikleriyle uyuşmayan düğümler. Her düğüm için yöntem, etrafında küçük bir yerel ağ kurar ve ardından iki paralel betimleme öğrenir: biri özniteliklere (örneğin bir makaledeki kelimeler veya ürün ayrıntıları) dayalı, diğeri ise nasıl bağlandığına dayalı. Öz-denetimli bir öğrenme düzeni, normal düğümlerin bu iki betimlemede uyuşmasını ve tuhaf düğümlerin uyuşmamasını teşvik eder; etiketli örneklere ihtiyaç duyulmaz. Düğüm ile komşuluğu arasındaki büyük uyumsuzluklar bağlamsal anomaliyi gösteren sayısal bir kalıntı haline gelir.

Bağlantılardaki küçük desenleri okumak

İkinci görünüm grafiğin ince yapısına odaklanır. Bir düğümün kaç komşusu olduğu saymak yerine, HyMSS-GAD bunun üçgenler, yıldızlar veya kısa döngüler gibi küçük bağlantı motiflerinde ne sıklıkla göründüğünü ölçer. Bu sayımlar her düğüm için bir “motif profili” oluşturur. Kompakt bir sinir ağı tipik motif profillerinin nasıl göründüğünü öğrenir ve bunları yeniden oluşturmaya çalışır; motif profilleri yeniden oluşturulması zor olan düğümler yüksek yapısal kalıntılar alır. Bu, bir düğümün garip bir yapısal rol oynadığı durumları yakalar—örneğin yoğun kümelenmiş bir bölgede çok az üçgende yer almak ya da çevresiyle uyuşmayan nadir bağlantı desenleri oluşturmak gibi.

Figure 2
Figure 2.

Ağın eğrilerini izlemek

Yerel komşulukların ötesinde, yöntem ağın daha geniş “şeklini” eğrilik (curvature) adı verilen bir kavramla inceler. Basitçe söylemek gerekirse, eğrilik iki bağlı düğümün benzer mi yoksa çok farklı mı çevrelerde yaşadığını ölçer. Sıkı toplulukların içindeki kenarlar genellikle daha yüksek eğriliğe sahip olurken, ayrı bölgeleri birbirine bağlayan veya sınırda yer alan kenarlar daha düşük veya hatta negatif eğriliğe sahip olabilir. HyMSS-GAD, birleşik düğüm betimlemelerinden önceden hesaplanmış eğrilik değerlerini yeniden oluşturmayı öğrenir. Bir düğüm çevresindeki kenarlar için bunu başaramadığında, o düğüm yüksek bir geometrik kalıntı alır; bu da onun olağan küresel modele uymayan bir köprü, darboğaz veya sınır düğümü olabileceğini gösterir.

İpuçlarını bir araya getirmek

Her sinyali her yerde eşit önemli gibi işlememek için HyMSS-GAD, eğrilik adımından önce her düğümün bağlamsal ile yapısal bilgi arasında ne kadar ağırlık vereceğine “karar vermesine” izin veren bir dikkat mekanizması kullanır. Son olarak yöntem, üç kalıntıyı—bağlamsal, yapısal ve geometrik—tek bir anomali skorunda birleştirir. Önemli olarak, bu bileşenleri ayrı tutar, böylece bir analist bir düğümün esas olarak içerik uyuşmazlığı, alışılmadık bağlantı düzeni veya tuhaf geometrik konum nedeniyle mi işaretlendiğini görebilir. Atıf ve e-ticaret grafiklerini içeren çeşitli standart veri setleri üzerindeki testler, bu çok görünümlü, kalıntı tabanlı yaklaşımın yalnızca önde gelen alternatiflerden daha iyi performans göstermediğini, aynı zamanda belirli düğümlerin neden öne çıktığına dair daha net açıklamalar sunduğunu gösteriyor.

Atıf: Khan, W., Ebrahim, N., Elloumi, M. et al. HyMSS-GAD: a hybrid multi-stage framework for multi-view graph anomaly detection with structural, contextual, and geometric reasoning. Sci Rep 16, 12108 (2026). https://doi.org/10.1038/s41598-026-42823-2

Anahtar kelimeler: grafik anomali tespiti, ağ analizi, makine öğrenimi, graf sinir ağları, çokmodlu veri