Clear Sky Science · zh

利用内容生产者网络与用户感知来检测在线话语社区

2026-03-03 · 返回目录

为什么在线讨论会分成阵营

任何在选举期间刷过社交媒体的人都体会过对话如何迅速分裂成对立阵营。然而，真正发起那些对话的账号只是微小一部分；我们大多数人主要是点赞、分享或转发。本文探讨了那些少数可见声音如何塑造整体辩论，并展示了一种先观察领袖再观察受众的方法来绘制政治“回声室”。

少数发声者，众多听众

在像 Twitter/X 这样的平台上，参与度高度不均。相对较小的一群用户——政治人物、政党、媒体品牌和其他公众人物——产生了驱动政治讨论的大部分帖子。大多数账号主要消费并再分发这些内容，例如通过转发。作者认为，这些领袖由于发声频繁并携带其公众声誉，通常比普通用户持更明确、更稳定的立场。如果我们能可靠地将这些领袖分组，就可以通过观察大众放大的对象来推断更广泛人群的立场。

识别谁站在一起的两种方法

该研究提出了一个框架，将所有用户分为两类：内容生产者（领袖）与其他所有人（受众）。然后在领袖之间构建关系网络，并在这个更小、更清晰的网络上运行标准的群体发现算法。关键在于如何定义领袖之间的连接。在一种称为 MonoDC 的版本中，领袖在彼此频繁转发时相连，这捕捉了直接的支持和政治圈内的信号。另一种称为 BiDC 的版本中，当领袖被相似的受众转发时，他们就被连接起来，因此即便两位政客从不直接互动，但如果拥有哪些重叠的粉丝也会落入同一阵营。

从社交数据中滤除噪声

原始社交媒体数据噪声极大：有人不断发推，有人很少发帖；有些帖子偶然走红。为避免将随机活动误判为真实结构，作者使用信息论工具对网络进行过滤。他们将观测到的交互与在一个随机化世界中所期望的情况进行比较——在该随机世界里每个用户保持相同的总体活跃水平，但连接被打乱。只有那些明显强于该“随机世界”预测的联系会被保留。对于直接转发版本（MonoDC）这种过滤较轻，但对共享受众版本（BiDC）至关重要，否则简单的受欢迎程度会产生误导性的相似性。

公众人物作为在线阵营的锚点

研究者在 2022 年意大利三场重大政治讨论上对其方法进行了测试：总统选举、一次政府危机和大选。值得注意的是，所有数据都来自平台引入付费认证之前，当时蓝勾主要表示公众认知而不是订阅。作者将已认证账号视为领袖，并手工按政党和选举联盟对数百个账号进行了分类。他们发现，即便在任何过滤之前，这些已认证政治人物之间的转发链接已经呈现出明显的政治分块。当应用基于领袖的统计过滤方法后，与现实世界的政党和联盟的匹配度比在完整未过滤的转发网络上运行的标准算法要强得多。

什么方法有效—什么效果较差

依赖领袖之间直接转发的 MonoDC 在识别个别政党方面尤其有效：政客们主要提升自己一方的声音。按共享受众将领袖分组的 BiDC 更能反映将多个政党囊括在同一伞下的更广泛选举联盟。作者还尝试了替代的领袖选择方式，例如拥有大量粉丝或高“转发指数”的账号。这些基于活跃度的选择表现较差，倾向于包括受众跨意识形态线分布的记者和评论员，从而模糊阵营边界。相比之下，2022 年前的已认证政治人物，其线下角色将他们与特定政党绑定，为绘制在线话语提供了更稳定的骨架。

这对理解数字辩论意味着什么

对普通读者而言，主要结论是：在线政治对话并非一个平面的观点市场。相反，它围绕着相对少数可识别的行为者构建，其他人通过选择转发谁的信息而暴露自己的倾向。通过先识别这些领袖，谨慎过滤他们之间的连接，然后再将普通用户分配到各社区，作者能够从有限数据中重构出很大一部分潜在的政治地图。尽管该方法是在意大利的 Twitter/X 上开发的，原则上也可应用于许多其他平台——在那些平台上，少数可见账号塑造了多数人所见——为研究回声室提供了一种实用路径，即便平台限制数据访问或改变认证规则。

引用: Guarino, S., Mounim, A., Caldarelli, G. et al. Leveraging content producer networks and user perception to detect online discursive communities. Sci Rep 16, 11911 (2026). https://doi.org/10.1038/s41598-026-39477-5

关键词: 社交媒体极化, 政治社群, Twitter 话语, 网络分析, 在线回声室