Clear Sky Science · nl

Geaccumuleerde lokale effecten en grafneurale netwerken voor linkvoorspelling

· Terug naar het overzicht

Waarom het begrijpen van verborgen verbindingen belangrijk is

Vele systemen die ons leven vormen — sociale media, wetenschappelijke samenwerkingen, hersennetwerken en zelfs het web zelf — zijn te beschrijven als netwerken van verbonden punten. Een centrale vraag is welke nieuwe verbindingen waarschijnlijk in de toekomst zullen ontstaan, bijvoorbeeld wie met wie gaat samenwerken of welk artikel welk ander artikel zal citeren. Moderne grafneurale netwerken zijn krachtige middelen voor dit soort “linkvoorspelling”, maar ze zijn ook black boxes: ze presteren goed, maar het is moeilijk te zien waarom ze een bepaalde beslissing nemen. Dit artikel pakt dat probleem aan door een algemene uitlegtechniek aan te passen, zodat we kunnen zien hoe het veranderen van één eigenschap van een knoop de kans beïnvloedt dat er links naar die knoop verschijnen.

Figure 1
Figure 1.

Van eenvoudige scores naar ondoorzichtige grafbreinen

De vroege netwerkwetenschap vertrouwde op eenvoudige regels om ontbrekende of toekomstige links te raden. Zo is de kans groter dat twee mensen vrienden worden als ze veel gemeenschappelijke vrienden hebben, en trekken hoog verbonden webpagina’s vaak nog meer links aan. In het afgelopen decennium zijn deze handgemaakte scores overtroffen door methoden die compacte numerieke beschrijvingen, of embeddings, van elke knoop leren. Grafneurale netwerken gaan een stap verder: ze sturen herhaaldelijk berichten langs de verbindingen zodat de embedding van elke knoop informatie verzamelt van zijn buren en de buren van die buren. Dat maakt ze uitstekend in linkvoorspelling, maar betekent ook dat hun interne werking verstrengeld en moeilijk te interpreteren is.

Zien hoe een enkele eigenschap voorspellingen beïnvloedt

Buiten de wereld van grafen is een populaire manier om black-boxmodellen te interpreteren de methode van Geaccumuleerde Lokale Effecten (ALE). In plaats van alleen te zeggen welke kenmerken belangrijk zijn, onderzoekt ALE hoe de voorspelling van het model verandert wanneer je één kenmerk omhoog of omlaag schuift over zijn mogelijke waarden, en cumuleert deze lokale veranderingen tot een vloeiende curve. De auteurs passen ALE aan voor linkvoorspelling met grafneurale netwerken door steeds de eigenschap van één knoop te veranderen en te controleren hoe de voorspelde waarschijnlijkheid van links tussen die knoop en vele anderen reageert. Dit levert een visualisatie op die bijvoorbeeld laat zien hoe het vergroten van het aandeel “Big Tech”-auteurs op een paper of het veranderen van de verticale positie van een vatensegment in de hersenen de door het model geschatte kans op een verbinding verschuift.

Twee manieren om effecten te berekenen: exact en snel

Grafneurale netwerken voegen een complicatie toe aan ALE: wanneer je veel knopen tegelijk verandert, kunnen ze elkaar via berichtuitwisseling beïnvloeden, wat de uitleg kan vertekenen. De auteurs vergelijken daarom twee strategieën. In de “exacte” versie wordt de eigenschap van elke knoop geïsoleerd aangepast, zodat geen twee gewijzigde knopen elkaars embeddings kunnen besmetten — maar dit is rekentechnisch duur. In de “approximate” versie worden veel knopen tegelijk veranderd, waarmee de data meer als een gewone tabel wordt behandeld en deze interacties worden genegeerd; dit is veel sneller maar kan bias introduceren. Door systematisch te variëren hoeveel knopen worden aangepast en met hoeveel potentiële partners ze worden getest, meten de auteurs hoe deze keuzes de ALE-curven beïnvloeden.

Figure 2
Figure 2.

Testen op synthetische grafen en echte data

Om de nauwkeurigheid te onderzoeken bouwt het team eerst een synthetisch netwerk waarin de werkelijke regel die linkvorming stuurt bekend is: randen zijn waarschijnlijker wanneer een speciaal “signaal”-kenmerk hoog is voor beide eindpunten. Hier kunnen ze ALE-curven rechtstreeks vergelijken met de grondwaarheid. Ze vinden dat naarmate meer knopen tegelijk worden aangepast, de approximatieve methode afwijkt van de echte relatie, terwijl de exacte methode trouw blijft. Op grote datasets uit de echte wereld — een citatienetwerk van kunstmatige intelligentieartikelen en een gedetailleerde 3D-kaart van bloedvaten in de muizenhersenen — is de echte regel niet langer zichtbaar, dus gebruiken ze de exacte methode, geaggregeerd over veel runs, als gouden standaard en kijken ze hoe ver de approximatie hiervan afwijkt. Statistische toetsen en permutatie-experimenten tonen aan dat in de meeste combinatie van model en dataset de verschillen tussen de twee methoden bescheiden zijn, alhoewel de approximatieve curven van run tot run meer variabel zijn.

Wat deze effecten over de wereld onthullen

Buiten de methodologie bieden de ALE-curven inzichten in wat de modellen daadwerkelijk hebben geleerd. In het citatienetwerk geven ze aan dat papers met een hoger aandeel auteurs verbonden aan grote technologiebedrijven volgens het model vaker geciteerd worden, wat echo’s oproept van zorgen over de groeiende invloed van de industrie in AI-onderzoek. In de vatengraf leren twee verschillende grafneurale netwerkarchitecturen tegengestelde trends over hoe de hoogte van een vat in de hersenen samenhangt met zijn connectiviteit, wat benadrukt dat ALE de overtuigingen van het model blootlegt en niet noodzakelijkerwijs biologische waarheid. Zulke discrepanties kunnen wijzen op plekken waar de modelarchitectuur, trainingsdata of evaluatie herziening behoeft.

Samenvatting voor lezers en praktijkmensen

De studie toont aan dat Geaccumuleerde Lokale Effecten aangepast kunnen worden om linkvoorspellingen in grafneurale netwerken uit te leggen, en levert intuïtieve curven die tonen hoe het veranderen van een knoopeigenschap de linkkansen omhoog of omlaag duwt. Het exact berekenen van deze curven is betrouwbaarder maar trager, terwijl een snellere benadering vaak goed genoeg is als men wat extra ruis accepteert, vooral bij middelen over veel runs. Voor mensen die al uitlegtools gebruiken op standaard machine-learningmodellen brengt dit een vertrouwde, visuele manier om in complexe grafgebaseerde systemen te kijken en te bevragen of wat het model geleerd heeft werkelijk overeenkomt met ons begrip van de netwerken die ons interesseren.

Bronvermelding: Kaczyńska, P., Sienkiewicz, J. & Ślęzak, D. Accumulated local effects and graph neural networks for link prediction. Sci Rep 16, 8574 (2026). https://doi.org/10.1038/s41598-026-39000-w

Trefwoorden: grafneurale netwerken, linkvoorspelling, uitlegbaarheid van modellen, geaccumuleerde lokale effecten, netwerkwetenschap