Clear Sky Science · zh
通过基于心理表征的监督让大型模型获得类人认知泛化能力
为何教 AI 像我们思考很重要
现代人工智能可以识别人脸、给照片打标签并生成流畅的文本,但仍难以实现人类日常使用的那种灵活理解。我们看到一只鸟就能识别多种鸟类,或能判断吊床与婴儿车都与躺着休息有关。本文探讨了一种新方法:直接使用大脑活动作为教学信号,帮助计算模型更接近那种类人思维。
当今智能机器的短板
标准深度学习系统的能力提升,主要依赖于更大规模的模型和更多的数据。这种方法在识别袜子、天鹅或汽车等具体任务上很有效。然而,作者显示,单纯增加模型参数对把握诸如“衣物”“鸟类”或“生物与非生物”这类抽象概念的帮助甚微。模型在单次示例学习(one-shot)任务中的表现随规模增大对具体对象有明显改善,但对更高级别的类别改善很少,甚至有所退步。对模型内部如何分离概念的分析表明,与人脑不同,模型并不会自然而然地把生物类与工具及其他物体分开。

让大脑引导机器
为了解决这一差距,研究者设计了所谓的基于心理表征的监督。志愿者在脑成像仪中观看大量自然图像,同时记录他们的大脑活动。研究团队从这些记录中提取出视觉皮层中已知可编码丰富高阶视觉信息的活动模式。与此同时,人工网络处理相同的图像。关键思想是强制网络内部关于对象间相似性与差异性的结构,与大脑中发现的结构对齐。作者将大脑与模型都视为相互连接的概念图,并使用迭代的图匹配程序使二者逐步靠近一致。
与大脑对齐的模型表现如何
经过这种特殊训练后,模型并非仅记住被监督的图像,而是形成了更类人化的概念地图,并能推广到许多未与大脑数据配对的新对象。改进后的模型在抽象类别的一次示例学习上表现更佳,对于动物、交通工具或乐器等概念形成了更紧密的簇。它们的内部层级结构开始类似于 WordNet——一个手工构建的英文词汇关系数据库,尽管模型并未显式训练该结构。在三图中挑选“不同类”时,受大脑引导的模型的选择更接近大量人类判断。此外,它们也更难被小幅但精心设计的图像扭曲所欺骗,表明对对象有更深、更稳健的理解。
洞察更类人化的概念空间
作者进一步研究了“概念流形”,即受大脑引导模型所隐含的低维映射。通过在该映射上移动并将点解码为自然语言描述,他们展示了相邻位置对应语义相关的想法,如不同种类的服装或交通工具。在区域间插值会产生平滑过渡——例如从电子设备滑向动物,跨越交通工具与有蹄哺乳动物之间时落到马上。该系统还能将多幅相关图像浓缩为一句有意义的句子,并执行简单的“概念算术”,通过加减诸如“马”或“摩托车”等元素来调整说明,结果符合人类直觉。

这对未来 AI 的意义
用通俗的话说,这项工作表明,让 AI 系统接受来自人脑的一点引导,可以帮助它们超越纯粹的模式匹配,朝向更接近我们组织知识的方式前进。与其一味做大模型,研究显示塑造其内部概念空间以镜像大脑结构,能提升处理新颖、抽象和异常情境的能力。尽管这种方法仍依赖于个体详细的大脑扫描,但扩大这种基于大脑的训练可能培养出更具适应性、可解释性并与人类感知与推理方式更一致的人工系统。
引用: Chen, J., Qi, Y., Wang, Y. et al. Human-like cognitive generalization for large models via mental representation-guided supervision. Nat Commun 17, 4709 (2026). https://doi.org/10.1038/s41467-026-71267-5
关键词: 基于大脑的学习, 抽象概念, 深度神经网络, 概念层级, 认知泛化