Clear Sky Science · zh
TRGCN:一种用于社交网络谣言检测的混合框架
为什么网络谣言关系到每个人
从疫苗恐慌到金融恐慌,一条错误的帖子就可能在社交媒体上扩散开来,影响数百万人的认知与行为。人工核查人员努力跟进,但网络言论的数量与传播速度使得不可能对所有内容逐条人工审查。本研究提出了一种新的计算方法,通过不仅观察人们说了什么,还分析信息如何在用户网络中传播,自动识别可疑故事。

谣言如何在社交网络中流动
作者从将谣言视为一种社会过程入手。在像 Twitter 这样的平台上,一人发布声明,其他人回复、转发、支持或质疑,互动形成了一张分支状的信息网络。有些用户充当枢纽,使谣言在远离原始来源的多级传播中持续存在。谁向谁回复、何时回复的模式,包含了关于该声明可能是真、假、已证实或仍未证实的线索。传统计算模型要么仅关注文本,要么仅关注网络形状,未能全面把握内容与连接如何相互作用的全貌。
早期检测方法的局限
早期方法依赖人工设计的特征,例如帖子被转发的频率、消息长度或用户的基本统计信息。尽管这些方法捕捉到了一些简单模式,但在大型社交网络中复杂、高维的信号面前表现欠佳。之后,循环神经网络和卷积神经网络等深度学习模型学会了更丰富的文本模式和短期时间模式,但并未充分捕捉谣言传播的分支结构。基于图的方法通过将对话视为帖子与用户的网络而改进了情况,然而常见的图模型在跨越多步的长链影响中仍显得吃力。
一种同时关注结构与内容的混合模型
为填补这些空白,研究人员提出了一种称为 TRGCN 的混合框架。它融合了两类强大的神经网络:适合分析网络结构的图卷积网络(Graph Convolutional Networks)以及擅长追踪序列中长程关系的 Transformer 网络。首先,模型将每条帖子转化为基于该词在全部推文集合中重要性的数值表示。同时,它把回复与转发的模式编码为一个图。这两种视角被合并,使传播网络中的每个节点既包含文本含义,又包含其在对话中的位置。

逐步追踪谣言传播路径
随后,TRGCN 在若干阶段中丰富这些节点表示。图模块查看每条帖子及其邻居,以捕捉局部交互模式,例如重复或反驳某一声明的用户群体。一个位置编码方案标注每条帖子距原始来源的深度,帮助模型理解对话的层级。然后数据传入 Transformer 模块,其注意力机制在整个结构上扫描,以捕捉可能连接谣言级联中远端部分的长程与微妙关系。最终,另一层图网络对这些组合信号进行细化,分类阶段估计该事件是非谣言、已证实的谣言、虚假谣言,还是仍未验证。
该方法在实践中表现如何
作者在两个常用的 Twitter 数据集上测试了 TRGCN,这些数据集包含数千个由专家核查标注的谣言事件。他们将该框架与一系列现有方法进行比较,涵盖经典机器学习模型到先进的图模型系统。在两个数据集上,新模型都取得了最高准确率,比其他方法更常正确区分真实、虚假与不确定的故事。额外的消融实验去掉关键组件(如注意力、位置编码或残差连接)后性能均下降,表明模型的优势源自对网络结构、文本内容与长程上下文的精心结合。
这对更安全的在线对话意味着什么
对普通用户与平台审核者而言,核心结论是故事如何在线传播,往往与其所含词语一样具有信息量。通过联合学习消息内容与围绕其的分支对话模式,TRGCN 提供了一种更精确的方法来标记需要进一步审查的误导性声明。虽然它不能替代人工判断,但此类工具可以帮助事实核查者和平台更快地应对有害谣言,促进更健康的信息环境。
引用: Yan, Y., Zhang, S., Yu, D. et al. TRGCN: a hybrid framework for social network rumor detection. Humanit Soc Sci Commun 13, 692 (2026). https://doi.org/10.1057/s41599-026-06946-1
关键词: 社交媒体谣言, 谣言检测, 图神经网络, Transformer 模型, 错误信息