Clear Sky Science · fr
Effets locaux accumulés et réseaux de neurones graphiques pour la prédiction de liens
Pourquoi comprendre les liens cachés est important
De nombreux systèmes qui façonnent notre vie — réseaux sociaux, collaborations scientifiques, réseaux cérébraux, voire le Web lui‑même — peuvent se décrire comme des réseaux de points connectés. Une question centrale est de savoir quelles nouvelles connexions sont susceptibles de se former à l’avenir, par exemple qui va collaborer avec qui ou quel article va citer quel autre. Les réseaux de neurones graphiques modernes sont des outils puissants pour ce type de « prédiction de liens », mais ils fonctionnent souvent comme des boîtes noires : performants, mais difficiles à interpréter. Cet article aborde ce problème en adaptant une technique générale d’explication pour montrer comment la modification d’une seule propriété d’un nœud affecte la probabilité que des liens vers ce nœud apparaissent.

Des scores simples aux cerveaux graphiques opaques
La science des réseaux a d’abord reposé sur des règles simples pour deviner des liens manquants ou futurs. Par exemple, deux personnes ayant de nombreux amis en commun sont plus susceptibles de devenir amies, et des pages Web très connectées ont tendance à attirer encore plus de liens. Au cours de la dernière décennie, ces scores conçus à la main ont été dépassés par des méthodes qui apprennent des descriptions numériques compactes, ou embeddings, pour chaque nœud. Les réseaux de neurones graphiques vont plus loin : ils transmettent à plusieurs reprises des messages le long des liens, de sorte que l’embedding d’un nœud intègre des informations de ses voisins et des voisins de ses voisins. Cela les rend excellents pour la prédiction de liens mais aussi rend leur fonctionnement interne enchevêtré et difficile à interpréter.
Voir comment une seule caractéristique influe sur les prédictions
En dehors du monde des graphes, une méthode populaire pour interpréter des modèles boîte noire s’appelle les Effets Locaux Accumulés (ALE). Plutôt que de se contenter d’indiquer quelles caractéristiques sont importantes, ALE examine comment la prédiction du modèle change lorsqu’on modifie légèrement une caractéristique à travers ses valeurs possibles, puis accumule ces changements locaux en une courbe lisse. Les auteurs adaptent ALE à la prédiction de liens avec des réseaux de neurones graphiques en modifiant la caractéristique d’un nœud à la fois et en vérifiant comment la probabilité prédite de liens entre ce nœud et de nombreux autres réagit. Cela produit une visualisation qui montre, par exemple, comment augmenter la part d’auteurs « Big Tech » sur un article ou modifier la position verticale d’un segment de vaisseau dans le cerveau fait évoluer la probabilité estimée d’une connexion par le modèle.
Deux manières de calculer les effets : exacte et rapide
Les réseaux de neurones graphiques ajoutent une complication à ALE : lorsque vous changez de nombreux nœuds simultanément, ils peuvent s’influencer mutuellement via le passage de messages, ce qui peut fausser l’explication. Les auteurs comparent donc deux stratégies. Dans la version « exacte », la caractéristique de chaque nœud est modifiée isolément, de sorte qu’aucun nœud altéré ne peut contaminer l’embedding d’un autre — mais cela coûte cher en calcul. Dans la version « approximative », de nombreux nœuds sont changés en même temps, traitant les données davantage comme un tableau classique et ignorant ces interactions ; c’est beaucoup plus rapide mais peut introduire un biais. En faisant varier systématiquement le nombre de nœuds modifiés et le nombre de partenaires potentiels testés, les auteurs mesurent comment ces choix affectent les courbes ALE.

Tests sur graphes synthétiques et données réelles
Pour évaluer la précision, l’équipe construit d’abord un réseau synthétique où la règle vraie gouvernant la formation des liens est connue : les arêtes sont plus probables lorsque une caractéristique « signal » est élevée pour les deux extrémités. Là, ils peuvent comparer directement les courbes ALE à la vérité terrain. Ils constatent qu’à mesure que davantage de nœuds sont modifiés simultanément, la méthode approximative s’écarte de la relation vraie, tandis que la méthode exacte reste fidèle. Sur de grands ensembles de données réelles — un réseau de citations d’articles en intelligence artificielle et une carte 3D détaillée des vaisseaux sanguins du cerveau de souris — la règle vraie n’est plus accessible, ils utilisent donc la méthode exacte, agrégée sur de nombreuses exécutions, comme explication de référence et vérifient à quel point la méthode approximative diverge. Des tests statistiques et des expériences de permutation montrent que, dans la plupart des combinaisons modèle–jeu de données, les différences entre les deux méthodes sont modestes, bien que les courbes approximatives soient plus variables d’une exécution à l’autre.
Ce que ces effets révèlent sur le monde
Au‑delà de la méthodologie, les courbes ALE offrent des aperçus de ce que les modèles ont réellement appris. Dans le réseau de citations, elles indiquent que les articles ayant une plus grande fraction d’auteurs affiliés à de grandes entreprises technologiques sont, selon le modèle, plus susceptibles de recevoir des citations, faisant écho aux préoccupations sur l’influence croissante de l’industrie dans la recherche en IA. Dans le graphe de vaisseaux, deux architectures différentes de réseaux de neurones graphiques apprennent des tendances opposées sur la manière dont la hauteur d’un vaisseau dans le cerveau se rapporte à sa connectivité, soulignant qu’ALE révèle les croyances du modèle, pas nécessairement la vérité biologique. De tels désaccords peuvent signaler des endroits où l’architecture du modèle, les données d’entraînement ou l’évaluation méritent d’être repensées.
Conclusion pour lecteurs et praticiens
Cette étude montre que les Effets Locaux Accumulés peuvent être adaptés pour expliquer les prédictions de liens dans les réseaux de neurones graphiques, en fournissant des courbes intuitives qui montrent comment la modification d’une caractéristique de nœud fait monter ou descendre les probabilités de lien. Calculer ces courbes de manière exacte est plus fiable mais plus lent, tandis qu’une approximation plus rapide suffit souvent si l’on accepte un peu plus de bruit, notamment en moyennant sur plusieurs exécutions. Pour ceux qui utilisent déjà des outils d’explication sur des modèles d’apprentissage automatique classiques, cela apporte une manière visuelle et familière de sonder des systèmes complexes basés sur des graphes et de s’interroger sur la correspondance entre ce que le modèle a appris et notre compréhension des réseaux qui nous importent.
Citation: Kaczyńska, P., Sienkiewicz, J. & Ślęzak, D. Accumulated local effects and graph neural networks for link prediction. Sci Rep 16, 8574 (2026). https://doi.org/10.1038/s41598-026-39000-w
Mots-clés: réseaux de neurones graphiques, prédiction de liens, explicabilité des modèles, effets locaux accumulés, science des réseaux