Clear Sky Science · zh

通过分层k-shell与扩展邻域整合识别有影响力的节点

· 返回目录

为什么有些连接比其他连接更重要

从社交媒体和航空航线到电网与疾病爆发,我们的生活被庞大的连接网络交织在一起。然而在这些网络中,少数节点——人、机场、发电站——却往往扮演着超出其比例的重要角色。找出这些“成败关键”节点,有助于放大有用信息、阻止有害谣言、防止大面积停电或减缓疫情扩散。本文提出了一种称为 HKEN 的新方法,能够比许多现有技术更准确且更高效地挑选出此类网络中最有影响力的节点。

在错综复杂的网络中寻找关键参与者

研究者常将许多现实系统建模为网络:点(节点)由代表关系或相互作用的线(边)连接起来。一个核心问题是,哪些节点对于在网络中传播某种东西最为关键——无论该“东西”是新闻、电力还是病毒。以往的方法大致分为两类。局部方法仅关注节点的直接邻域,计算速度快,但常常无法区分外表相似的节点。全局方法则遍历整个网络结构,通常能给出更可靠的排序,但计算代价高且有时会产生很粗的分组。混合方法试图结合两种视角,但可能变得复杂或高度依赖参数调整。HKEN 旨在在保持相对简单与稳健的同时,捕捉两者的优点。

Figure 1
Figure 1.

融合局部与全局视角

HKEN 首先为每个节点赋予一个初始权重,该权重融合了两种思想。第一是度数,即节点的直接连接数——这是局部重要性的基本指标。第二是节点在更大网络中的位置,由作者所称的 k-shell 值刻画,反映节点是深嵌于网络核心还是处于边缘。由于度数通常远大于 k-shell 值,HKEN 对它们进行了重新刻度,以免某一项主导结果。这样便能基于邻域结构与全局位置,为每个节点生成更为平衡的初步影响力估计。

倾听近处与远处的邻居

接着,HKEN 超越节点的直接邻居,考察两跳范围内的节点。它利用初始权重在网络中的分布设定一个阈值,将邻居划分为“强”与“弱”两类,以区分它们传递影响力的容易程度。距离较近且权重较高的邻居被允许贡献更多。同时,该方法评估邻居自身邻域的紧密程度:若某邻居的局部圈非常密集,信息可能更倾向于在该圈内循环而不易向外传播,其贡献因此会被削弱。HKEN 还检验两个节点邻域的相似性——使用标准的重叠度量——从而使嵌入同一社区的节点相互增强时更强烈。

将原始影响力转化为最终排名

将这些要素结合后,HKEN 首先计算每个节点的“初始影响力”,方法是将节点自身权重与来自两跳以内邻居的经筛选、考虑距离的贡献相加。随后进行第二轮处理,允许直接相连的邻居根据它们共享的局部环境相互提升得分。第二轮有意保留节点自身贡献的显著性,以免高度中心的节点被周围环境掩盖。最终得到每个节点的最终影响力分数,可据此排序以识别网络中最关键的节点。

Figure 2
Figure 2.

在真实网络上的方法测试

为评估 HKEN 的效果,作者在十个多样的真实网络上进行了测试,范围从经典的空手道俱乐部社交图到航空航线、蛋白质相互作用及科研合作图谱。他们将 HKEN 与十二种知名的排名方法进行了比较。由于难以直接知道“真实”的最有影响力节点,他们采用流行病学中的标准传播模型 SIR,模拟从不同种子节点出发时感染如何在各网络中扩散。然后检验每种算法的排序与模拟传播模式的匹配程度。在大多数数据集与条件下,HKEN 的排序与模拟传播的相关性更强,其选出的顶级节点触发的级联更广、更快,同时在大型网络上仍能保持可控的运行时间。

对现实世界的意义

简单来说,这项工作表明,同时关注节点在整体网络中的位置以及其一阶与二阶邻居的行为,能更清晰地识别出真正驱动影响力的对象。HKEN 的分层方法——在局部连接、全局位置与邻域间细微重叠之间取得平衡——比许多现有工具更可靠地挑选出关键节点。这使其成为一项有前景的工具,适用于诸如在社交媒体中锁定舆论领袖、识别电力或交通系统中的脆弱枢纽,或针对性干预以减缓疾病传播等任务,同时效率足以应对当今大型复杂网络的应用需求。

引用: Wang, F., Sun, Z., Wang, G. et al. Identifying influential nodes through hierarchical k-shell and extended neighborhood integration. Sci Rep 16, 10215 (2026). https://doi.org/10.1038/s41598-026-40209-y

关键词: 有影响力的节点, 复杂网络, 信息传播, 网络中心性, SIR 模型