Clear Sky Science · zh

通过连续时间图神经网络和深度强化学习实现时序影响力最大化

2026-02-13 · 返回目录

在互联世界中，时机为何重要

从病毒式视频到疾病传播，现代生活的许多方面都取决于事物如何在人的网络中扩散。公司想知道应当针对谁以便广告形成雪球效应。公共卫生官员想知道应先给谁接种疫苗以阻止疫情蔓延。然而，大多数用于挑选关键个体的工具都把网络当作静止不变的，即便真实的互动会时刻出现又消失。本文提出了一种新方法，称为 TempRL-IM，它认真对待时间的流动，并展示了利用连接的精确时间可以大幅提升我们在快速变化的社交系统中引导信息和影响的能力。

从静态地图到有机网络

传统的网络影响力研究从一个简单问题出发：如果你可以选择一小群人进行“激活”——比如给他们发送免费样品或重要提醒——哪些人会引发最大的连锁反应？早期方法只看固定的连接快照来回答这个问题。它们假定如果人 A 与人 B 有联系，那么这种联系始终可用于传播影响。但真实系统很少如此稳定。电子邮件往来、电话通话、在线消息和面对面接触会在一天中起伏。忽视这种节奏会导致糟糕的选择，例如挑选在纸面上看似中心但在关键时间窗口实际上不活跃的人。

倾听互动的心跳

作者认为，人们互动的确切时刻——包括事件的顺序和间隔——包含了谁真正有影响力的重要线索。他们的框架 TempRL-IM 将网络中的每次接触视为带时间戳的事件，就像详尽日志中的一条记录。它不把时间粗略切片，而是使用连续时间图神经网络，这是一类为网络中每个人维护记忆的机器学习模型。每当两人互动时，两者的记忆都会被更新，考虑的不仅是谁与谁交流，还包括交流发生的近期程度和频率。一个时序注意力机制随后关注最相关的历史邻居和时刻，将每个人不断演化的“状态”提炼为紧凑的数值指纹。

教会 AI 选择合适的传播者

一旦网络的动态模式被编码，TempRL-IM 会把这些指纹传给基于深度强化学习的决策模块。在这里，一个 AI 代理通过试错学习，在某一观测时刻选择一小组“种子”个体。在对那一时刻之后影响如何传播的模拟中，当所选种子引发更大级联时，代理会获得更高的奖励。经过多轮训练，它能发现细微的时序策略——例如偏好在活动启动时变得活跃的人，或在关键时期其联系人聚集的个体。关键是，该模型尊重因果关系：在作出决策时绝不窥视未来，只依赖过去和现在的事件。

在真实数据上验证收益

为测试 TempRL-IM，研究者将其应用于六个真实的时序网络，包括公司内部的电子邮件往来、大学社交平台上的私人消息、加密货币市场的信任关系以及手机用户之间的物理接近。他们将该方法与流行的静态和基于快照的算法以及近期的深度学习方法进行了比较。在所有数据集以及不同数量的种子下，TempRL-IM 始终激活了更多个体——通常比最强的基于学习的竞争方法多 15% 到 28%——同时在决策时选择种子的速度快三到十倍。该方法在某些交互被删除、时间被错置或突然增强等噪声条件下也表现稳健，并能较好地从具有相似活动模式的一个网络迁移到另一个网络。

对日常应用的意义

简而言之，这项研究表明，选择影响对象不仅关乎他们在网络中的位置，还关乎他们何时连接。通过将网络建模为有生命、具时间感的结构，并训练 AI 利用这些时序模式，TempRL-IM 能为营销识别更佳的传播者，为疫苗接种或信息活动找到更早的目标，并在通信或交通系统中找到更有效的控制点。关键结论很简单：时机与顺序至关重要，那些拥抱完整交互时间线的工具能在塑造我们生活的复杂、不断变化的网络中做出更聪明、更迅速的决策。

引用: Wang, Y., Alawad, M.A., Alfilh, R.H.C. et al. Temporal influence maximization via continuous-time graph neural networks and deep reinforcement learning. Sci Rep 16, 8987 (2026). https://doi.org/10.1038/s41598-026-37640-6

关键词: 影响力最大化, 动态社交网络, 图神经网络, 强化学习, 信息扩散