Clear Sky Science · zh
加权高阶网络中的距离
为何在网络中测量距离很重要
从社交媒体到科学研究,现代生活的许多方面都可以用连接网络来描述。但许多真实情形涉及的是群组而非简单的成对关系:一篇论文连接若干学科,一封邮件发给多个收件人,一种药物由多种成分组合而成。在这些高阶网络中,甚至“相距多远”这样的定义也变得棘手。本文介绍了一种用于此类复杂群组体系的新距离度量,使我们能够更好地描绘思想、人物或组成部分彼此之间的关系。
从简单链接到丰富的群组连接
在普通网络中,距离很直观:它是一条从一个节点到另一个节点的最短路径的长度。当每条连接仅连接两个节点时,这种方法运行良好。然而,许多真实数据集更适合用超图来描述,在超图中单个连接可以同时将三个、四个或更多节点连接在一起。一个常见的简化方法是将每个群组拆成许多成对链接,这一过程称为团投影。虽然方便,但该捷径丢弃了关于群组大小和重叠方式的重要信息,从而可能扭曲节点之间的距离。
构建尊重高阶结构的距离
作者提出了一种专为加权超图设计的距离度量,在这种超图中每个群组还带有强度或出现频率。他们的构造依赖于将超图转换为一个伴随结构,其中每个群组变为一个节点,群组之间的重叠变为链接。原始节点之间的距离由通过该“群组网络”运行的路径导出,同时考虑群组的规模和权重强度。所得距离满足我们期望的度量所有标准规则,例如始终非负并满足三角不等式,并且当连接仅为成对时会退化为熟悉的图距离。

权重与重叠如何塑造分离感
通过探索简单示例,研究说明了高阶效应为何重要。当单个群组包含许多节点时,该大群组中的任意两名成员被视为比小群组的成员更远,这反映了共享拥挤语境会削弱直接亲和力的观点。同样,如果两个群组高度重叠,不同群组但位于共享核心内的节点实际上更接近。加入权重后,频繁或强烈的群组交互会缩短距离,但这种缩短既取决于群组规模也取决于群组如何相交。这一更丰富的图景与团投影形成对比:在投影下,即使高阶结构截然不同,相关的成对距离也可能相同,从而掩盖重要信息。
在真实数据上测试该方法
研究者将他们的距离应用于若干真实数据集,包括 arXiv 预印本库、学校接触模式、公司内部邮件、药物成分以及美国参议院委员会。在 arXiv 的案例中,每个科学领域是一个节点,每篇论文形成一个由若干领域组成的群组,群组权重记录某种组合出现的频率。新距离用于研究领域之间的“认知距离”,即学科之间在概念上相距多远。当他们将基于超图的距离与从团投影得到的距离进行比较时,发现某些学科对在两种方法间会从相对接近变为相对遥远,或反之亦然。这些变化表明,投影可能掩盖有意义的结构,尤其当许多论文跨越两个以上学科时更是如此。

这对描绘复杂系统意味着什么
在所有数据集中,作者发现当大多数交互仅涉及两个节点(如典型的课堂接触)时,成对投影方法表现尚可。但在更常见较大群组且权重多样的系统中,投影方法可能严重低估或错误排序距离。该新度量保留了完整的高阶信息,同时在计算上仍然可控,并且自然包含普通图距离作为特例。对非专业读者而言,关键结论是:当我们试图绘制在复杂群组情境中思想、人员或组成部分相距多远时,需要能够超越简单成对链接的工具。基于超图的这种距离观提供了对现代科学与社会所依存的多层次网络中分离更忠实的地图。
引用: del Genio, C.I., Vasilyeva, E., Tupikina, L. et al. Distances in weighted higher-order networks. Commun Phys 9, 178 (2026). https://doi.org/10.1038/s42005-026-02592-w
关键词: 超图距离, 高阶网络, 认知距离, 网络度量, arXiv 数据