Clear Sky Science · zh

特定领域的图式重用支持灵长类大脑中灵活的学习如何学习

· 返回目录

为何以往经验使新学习变得更容易

为什么在一类熟悉的技能家族中学习新技能常常感觉更容易——比如多年打网球后学羽毛球,或在用过好几部智能手机后适应新手机?本文探讨了灵长类大脑如何完成这一“捷径”。通过研究猴子在一系列视觉到运动任务中的学习,作者揭示了大脑如何储存可重用的“决策模板”,同时保持足够的灵活性来应对新情形,为神经科学和人工智能提供了线索。

大脑中捕捉普遍规则的模式

研究者关注心理学中称为图式(schema)的概念——一种捕捉相关经历共同结构的心理框架。在神经层面,他们用“图式的神经相关性”(neural correlates of schema,NCS)来指代大脑的这种表现:当在不同背景下应用相似规则时,会反复出现的稳定活动模式。一个关键问题是,大脑如何在保留这些能加速未来学习的稳定模式的同时,不至于变得僵化以致无法在环境变化时适应。这一权衡被称为稳定性—可塑性困境,也是设计需要不断学习且不“遗忘”已学内容的人工神经网络时面临的主要挑战。

Figure 1
Figure 1.

教猴子新规则并重访旧规则

为探究这一点,三只猕猴被训练执行视觉-运动映射任务。在每次试验中,触摸屏上出现一张图片,经过短暂延迟后猴子必须按下两个按钮之一,例如上或下,以获得奖励。在每个训练会话中,动物首先学习图片与动作之间的一个新映射(任务A),随后学习一到两个其他新映射(任务B,有时还有任务C),然后重访最初的映射(重访-A),在某些情况下最后学习原始规则的反向(反向-A),即相同图片现在要求按相反的按钮。研究者在猴子执行任务时记录了背外侧前运动皮层中数百个神经元的活动,该区域参与运动规划与决策。

相似任务变得更容易——但相反规则更难

在行为上,猴子表现出典型的“学习如何学习”效应。新的但相似的任务(B 与 C)比第一个任务A学习得更快,而当它们返回到原始映射(重访-A)时,再学得更快。与之形成鲜明对比的是,直接与之前学到的规则冲突的反向映射(反向-A)则需要更长时间才能掌握。这个模式表明,当新任务共享相同的底层规则时,以往知识会有所帮助;但当新规则与旧规则冲突时,过去的经验反而会拖慢速度。神经记录提供了这一现象的解释:它们揭示了哪些任务要素被编码为稳定的、可重用的模式,哪些则允许发生变化。

将稳定的选择与变化的视觉分离

通过先进的分析方法,作者将前运动皮层的群体活动分解为两个主要的“子空间”——携带不同类型信息的神经活动模式集合。一个子空间捕捉猴子的决策(例如选择上方还是下方按钮)。另一个子空间则捕捉视觉图像的细节。在与决策相关的子空间中,相同的选择形成了稳定、低维的轨迹,这些轨迹在任务A、B、C和重访-A之间被重复使用,即使图片发生改变也如此。新任务与原任务的轨迹越相似,猴子学习所需的试次数就越少。相反,在反向任务中,这些决策模式没有被重用:神经轨迹发生了变化,学习也更慢。同时,视觉子空间在任务之间更自由地变化,并未显示出相同的稳定重用特性。

Figure 2
Figure 2.

将信息流几乎保持为直角

一个显著发现是这两个子空间之间的几何关系。数学上,它们几乎正交——在神经活动空间中以接近90度的角度排列。这种近直角的排列意味着视觉信息表征的变化对决策模式的影响极小,反之亦然。换言之,大脑似乎在一个领域中保存稳定、可重用的决策图式,同时在另一个领域保持对新感官细节的灵活性,并将两者分隔得足够开以避免干扰。这种架构可能是处理复杂行为的脑区中普遍存在的原则。

对大脑与机器的意义

对普通读者来说,结论是大脑似乎通过有条理地组织内部活动来解决稳定性—可塑性困境。它在一个受保护、稳定的子空间中储存规则的“要旨”——决定采取哪种行动——同时在其他子空间留出空间以容纳新的视觉和情境细节。相似任务因此可以通过重用已有的决策模板快速学会,而直接对立的规则则需要大脑从头建立新的模式。除了说明动物如何高效地从经验中学习,这项工作还为构建能够像大脑一样既记住重要内容又灵活适应新事物的人工智能系统提供了策略暗示。

引用: Tian, K., Zhao, Z., Chen, Y. et al. Domain-specific schema reuse supports flexible learning to learn in the primate brain. Nat Commun 17, 2150 (2026). https://doi.org/10.1038/s41467-026-68692-x

关键词: 图式学习, 神经表征, 认知灵活性, 视觉-运动学习, 稳定性-可塑性