Clear Sky Science · fr

Maximisation d'influence temporelle via des réseaux de neurones graphiques en temps continu et l'apprentissage par renforcement profond

· Retour à l’index

Pourquoi le calendrier compte dans notre monde connecté

Des vidéos virales à la propagation des maladies, une grande partie de la vie moderne dépend de la manière dont les événements se propagent à travers les réseaux sociaux. Les entreprises veulent savoir qui cibler pour qu'une publicité prenne de l'ampleur. Les responsables de santé publique veulent savoir qui vacciner en priorité pour enrayer une épidémie. Pourtant, la plupart des outils utilisés pour choisir ces individus clés traitent les réseaux comme s'ils étaient figés dans le temps, alors que les interactions réelles apparaissent et disparaissent d'un moment à l'autre. Cet article présente une nouvelle approche, appelée TempRL-IM, qui prend le flux du temps au sérieux et montre comment l'utilisation du calendrier précis des connexions peut grandement améliorer notre capacité à diriger l'information et l'influence dans des systèmes sociaux en rapide évolution.

Figure 1
Figure 1.

Des cartes statiques aux réseaux vivants

Les études traditionnelles sur l'influence dans les réseaux commencent par une question simple : si vous pouviez choisir un petit ensemble de personnes à « activer » — par exemple en leur envoyant des échantillons gratuits ou des alertes vitales — lesquelles déclencheraient la plus grande réaction en chaîne ? Les méthodes antérieures répondaient à cela en regardant uniquement un instantané fixe de qui est connecté à qui. Elles supposent que si la personne A est reliée à la personne B, ce lien est toujours disponible pour que l'influence circule. Mais les systèmes réels sont rarement aussi stables. Les échanges d'e-mails, les appels téléphoniques, les messages en ligne et les rencontres en personne augmentent et diminuent tout au long de la journée. Ignorer ce rythme peut mener à de mauvais choix, comme sélectionner quelqu'un qui paraît central sur le papier mais est en réalité inactif pendant la fenêtre temporelle cruciale où l'influence doit se propager.

Écouter le rythme des interactions

Les auteurs soutiennent que les moments exacts où les personnes interagissent — jusque dans la séquence et l'espacement des événements — portent des indices essentiels sur qui est réellement influent. Leur cadre, TempRL-IM, traite chaque contact dans le réseau comme un événement horodaté, à la manière d'une entrée dans un journal détaillé. Plutôt que de découper le temps en tranches grossières, il utilise un réseau de neurones graphiques en temps continu, un type de modèle d'apprentissage automatique qui conserve une mémoire pour chaque personne du réseau. À chaque interaction entre deux personnes, les deux mémoires sont mises à jour, en tenant compte non seulement de qui a parlé à qui, mais aussi de la récence et de la fréquence. Un mécanisme d'attention temporelle se concentre alors sur les voisins et les moments passés les plus pertinents, distillant l'« état » évolutif de chaque personne en une empreinte numérique compacte.

Apprendre à une IA à choisir les bons messagers

Une fois que les motifs changeants du réseau ont été encodés, TempRL-IM transmet ces empreintes à un module de prise de décision basé sur l'apprentissage par renforcement profond. Ici, un agent IA apprend par essais et erreurs à choisir un petit ensemble d'individus « graines » à un instant d'observation donné. Dans des simulations de la propagation de l'influence après ce moment, l'agent reçoit des récompenses plus élevées lorsque ses graines choisies déclenchent de grandes cascades. Au fil de nombreuses itérations, il découvre des stratégies temporelles subtiles — par exemple, favoriser des personnes qui s'activent précisément au lancement d'une campagne, ou celles dont les contacts se rassemblent pendant des périodes cruciales. De manière cruciale, le modèle respecte la causalité : il ne regarde jamais dans le futur pour prendre ses décisions, s'appuyant uniquement sur les événements passés et présents.

Figure 2
Figure 2.

Montrer les bénéfices sur des données réelles

Pour tester TempRL-IM, les chercheurs l'ont appliqué à six réseaux temporels réels, incluant des échanges d'e-mails en entreprise, des messages privés sur des plateformes universitaires, des relations de confiance sur un marché de cryptomonnaie, et la proximité physique entre utilisateurs de téléphones mobiles. Ils ont comparé leur méthode aux algorithmes statiques et basés sur des instantanés les plus répandus, ainsi qu'à des approches récentes d'apprentissage profond. Sur l'ensemble des jeux de données et pour différents nombres de graines, TempRL-IM a systématiquement activé davantage d'individus — typiquement 15 à 28 % de plus que les concurrents d'apprentissage les plus performants — tout en sélectionnant les graines trois à dix fois plus rapidement au moment de la décision. La méthode a également résisté à des conditions bruyantes où certaines interactions étaient supprimées, mal datées ou soudainement intensifiées, et elle s'est bien transférée d'un réseau à un autre présentant des schémas d'activité similaires.

Ce que cela signifie pour les applications courantes

En termes simples, cette étude montre que le choix des personnes à influencer ne dépend pas seulement de leur position dans le réseau, mais aussi du moment où elles sont connectées. En modélisant les réseaux comme des structures vivantes et conscientes du temps et en entraînant une IA à exploiter ces motifs temporels, TempRL-IM peut identifier de meilleurs messagers pour le marketing, des cibles plus précoces pour la vaccination ou les campagnes d'information, et des points de contrôle plus efficaces dans les systèmes de communication ou de transport. La conclusion clé est simple : le timing et la séquence importent, et les outils qui embrassent la chronologie complète de nos interactions peuvent prendre des décisions plus intelligentes et plus rapides dans les toiles complexes et changeantes qui façonnent nos vies.

Citation: Wang, Y., Alawad, M.A., Alfilh, R.H.C. et al. Temporal influence maximization via continuous-time graph neural networks and deep reinforcement learning. Sci Rep 16, 8987 (2026). https://doi.org/10.1038/s41598-026-37640-6

Mots-clés: maximisation d'influence, réseaux sociaux dynamiques, réseaux de neurones graphiques, apprentissage par renforcement, diffusion d'information