Clear Sky Science · zh

人类一-shot知觉学习的神经与计算机制

· 返回目录

看到隐藏的画面

很多人都经历过那种突然的“啊哈!”瞬间:一张混乱的黑白斑点图忽然变成一只狗或一张脸的清晰影像——一旦看见,就再也无法忘却。该研究探讨的是:一次短暂的清晰影像如何永久性地改变我们对模糊版本的感知,以及这对我们理解大脑——以及未来的人工智能系统——如何从单一范例中学习有何启示。

Figure 1
Figure 1.

从模糊斑块到瞬时识别

研究人员使用了经典的“Mooney 图像”:高度简化的黑白图片,只有在看到它们源自的灰度照片后才容易被识别。志愿者先尝试命名他们在这些困难图像中看到的内容。随后,他们短暂观看了对应的清晰照片,然后再次尝试识别那些困难图像。在那次单一暴露之后,人们能突然识别出曾经神秘的图像,而且这种改进是持久的。通过仔细改变清晰照片——左右翻转、旋转、缩放或在屏幕上移动位置——团队绘制出大脑在这种一次性学习过程中实际存储的视觉信息类型。

大脑把新洞见存在哪里

对图像的不同修改以不同方式影响学习。将清晰图像放大两倍或缩小为一半并不损害学习,表明大脑存储的“模板”对尺寸具有一定弹性。但翻转、旋转或移动图像会削弱学习,尽管并非完全阻断。用同一类别的不同示例替换清晰图像——例如另一只狗的照片——会完全抹除学习效果。这表明大脑并非仅仅存储“这是只狗”这样的概念性信息;相反,它保留的是该特定图像的详细、图画式记忆,包括形状和布局。将这些行为学结果与对视觉系统的既有认识相结合,指向了高级视觉区域,而非早期视觉区或像海马体这样的记忆结构,作为存储这一新知识的可能位置。

在大脑内观察学习展开

为证实这一点,团队使用了超高场 7 特斯拉 MRI 扫描和对癫痫患者脑部放置电极的直接记录。MRI 实验显示,一个称为高级视觉皮层的区域中的神经元,对同一物体的不同版本(在尺寸、位置或朝向上发生变化)作出反应的方式,正好与行为测试的预测一致。在电极记录中,关键变化首先出现在这一高级视觉皮层:学习后,难辨图像触发的活动模式变得更像其清晰对应物所触发的模式,而且这一变化在这里比在初级视觉区发生得更早。该时序表明该区域是新“先验”被存储并重新激活的地点,然后它向较早的视觉区域发送反馈,帮助理解模糊输入。

Figure 2
Figure 2.

构建能一次学习的机器

研究人员还构建了一个深度神经网络模型,旨在模拟这种能力。其系统使用现代视觉变换器作为“自下而上”的视觉引擎,配合一个特殊模块来存储先验信息,并在随后看到相关图像时发送“自上而下”的反馈。在类 Mooney 任务上训练后,该模型表现出真正的一次性学习:在仅一次暴露于清晰图像后准确率显著跃升,远超简单重复可以解释的效果。它在具体图像上的许多成功与失败也与人类观察者相似,且从清晰图像中学到的内部特征能够预测哪些图片人们会或不会学会识别。当团队将模型存储的先验信息与人脑扫描进行比较时,发现最接近的匹配出现在与实验强调的相同高级视觉区域。

这对大脑与机器为何重要

总体来看,这些发现表明,我们那种突然的“我现在看见了!”时刻,源于高级视觉区域在单次经历后快速调整其连接,存储了详细的图画式先验,之后可重新激活以重塑我们对噪声输入的解释。这种快速而稳定的学习形式,植根于高级视觉皮层并由自上而下反馈支持,为构建能够从极少样本学习的人工智能系统提供了蓝图。它也为理解当感知过度依赖先验预期时可能出现的问题提供了起点,例如某些伴有幻觉的精神疾病情形。

引用: Hachisuka, A., Shor, J.D., Liu, X.C. et al. Neural and computational mechanisms underlying one-shot perceptual learning in humans. Nat Commun 17, 1204 (2026). https://doi.org/10.1038/s41467-026-68711-x

关键词: 一次性学习, 视觉感知, 高级视觉皮层, 知觉学习, 深度神经网络