Clear Sky Science · zh

基于元学习的少样本知识图谱补全与域选择聚合

2026-03-06 · 返回目录

为何用极少示例教会机器很重要

现代人工智能系统越来越依赖于庞大的“知识图谱”，将人物、地点、事物与概念连接成巨大的事实网络。这些图谱驱动着搜索引擎、推荐系统和问答工具。但在现实世界中，图谱中的许多连接是罕见的、记录不全的或全新出现的。当只有少量示例时，教会机器识别并补全这些稀有链接非常困难。本文提出了一种方法，帮助人工智能在极少样本下学习，同时过滤掉干扰信息，从而更准确地推断知识图谱中缺失的事实。

由简单事实构建的知识地图

知识图谱以简单的三元组陈述来表示信息，例如“人A works_for 公司B”或“城市C is_in 国家D”。每个陈述通过一个关系将两个实体连接起来，数以百万计的这些连接共同形成一幅知识地图。传统技术将每个实体和关系映射为数学空间中的向量，然后学习规则以预测新的连接。当每种关系有大量示例时（例如“born_in”或“located_in”），这些技术表现良好，但当某种关系在数据中仅出现很少次时便会失效。在实践中，稀有关系很常见——比如某种具体病症、利基职位或新出现的合作关系——因此提升这些“少样本”情况下的性能至关重要。

从邻居学习而不被噪音淹没

一种应对示例稀少的方法是查看图中每个实体的“邻居”——与其直接相连的其他事实。例如，在预测某人的配偶时，了解其家庭成员往往比商业合作伙伴更有帮助。现有方法常常将所有临近事实视为同等有用，这会让真正相关的线索被噪音淹没。作者提出了一个邻域选择模块：它首先为每个邻居打分以衡量相关性，仅保留得分最高的邻居，然后采用受循环神经网络启发的门控机制来决定这些邻居信息应在多大程度上更新实体表示。这个两步过程既滤除了离题的邻居，又动态平衡该记住与忽略的信息，在只有少量训练示例时尤为有用。

教系统如何学习新关系

除了清理邻域信息，该方法还处理了在仅见到少量示例链接时系统如何表示关系的问题。作者并非简单地对这些示例求平均，而是构建了一个关系“元学习器”。它将某一关系的所有示例对视为一个短序列，传入门控循环单元以捕捉示例间的模式。一个上下文注意力机制随后使模型更多地关注最有信息量的示例对，而一个小型前馈网络进一步精炼合并信号。残差连接和归一化有助于稳定学习。结果是一个紧凑且任务感知的关系表示，能够捕捉实体交互的细微差别，例如方向性、强度或连接类型。

用元优化学会快速适应

该方法的最后一部分是一个嵌入学习器，借用了元学习的思想——通常称为“学会学习”。在训练期间，系统将许多不同关系视为独立的小任务。对于每个任务，它仅用少量可用示例短暂地调整参数，然后检验其在该关系的新查询上的表现。第二步得到的梯度用于更新一组共享参数，从而使模型随着时间推移在面对从未见过的新关系时更擅长快速适应。该方法建立在一种将实体置于关系特定几何面上的现有技术之上，并在元学习过程中同时更新关系表示与这些几何面，进一步提高预测精度。

这些结果对日常人工智能工具意味着什么

作者在两个广泛使用的基准数据集 NELL‑One 和 Wiki‑One 上测试了他们的方法，并与多种最先进的少样本知识图谱补全系统进行比较。在多个评估指标上，他们的方法表现持续更好，尤其在每种关系有五个示例时提升明显。在邻居信息更丰富的数据集上，增益最为显著，强调了谨慎选择邻居与关系元学习的价值。对于日常应用而言，这意味着即便只有少量示例可用，人工智能系统也能更可靠地补全缺失的知识——例如稀有关系、专业概念或新出现的事实——从而使搜索、推荐和问答等下游工具更准确、更稳健。

引用: Yang, B., Peng, M., Liu, S. et al. Meta learning based few shot knowledge graph completion with domain selected aggregation. Sci Rep 16, 12333 (2026). https://doi.org/10.1038/s41598-026-42198-4

关键词: 知识图谱, 少样本学习, 元学习, 图神经网络, 链接预测