Clear Sky Science · zh

全局误差信号引导局部优化以计算不匹配

2026-03-12 · 返回目录

为什么我们不会对自己的动作感到惊讶

当你点击鼠标播放一首歌时，随之而来的声音不会让你感到惊讶。但如果没有你的操作音乐突然响起，它会立刻吸引你的注意。日常中这种对预期与意外感觉的差异，依赖于大脑预测自身运动带来感官后果并仅突出不匹配之处的能力。本文探讨了神经网络如何学习可靠地进行这种比较，以及当这种学习受损时会出现什么问题。

大脑如何预测自身的感官世界

科学家早就知道，大脑会将运动指令的内部副本（称为副放电）发送到感觉区域。该信号携带了我们移动时应当看到或听到的预测。如果来自外界的输入刺激与该预测相符，感觉反应会被抑制；若不相符，某些神经元会强烈响应，发出预测误差信号。作者关注两类此类神经元：一类在刺激比预测强时响应（正预测误差），另一类在预测强于实际刺激时响应（负预测误差）。二者共同使大脑能够检测缺失与意外的感觉，例如在我们动作时某个声音未发生，或没有相应动作却出现了声音。

用于局部连线的全局教学信号

乍看之下，计算不匹配似乎很简单：用刺激减去预测再取绝对值。但真实的皮层回路面临若干障碍。脑区间的长程连接大多为兴奋性，而要抵消输入则需要局部抑制细胞。此外，感觉皮层神经元通常以很低的基线发放率工作，这使得同时表示正负偏差变得更复杂。本文的核心主张是一个生物学上可行的“三因素”学习规则，它允许局部抑制性突触在单一的全局教学信号作用下自行重塑。该信号被认为由脑干释放的神经调质（如去甲肾上腺素）携带，反映总体不匹配的大小，而无需知道是哪一个特定突触导致了不匹配。

局部回路如何学会发出惊讶信号

在模型中，每个锥体细胞同时收到刺激和预测输入，并通过局部中间神经元传递抑制。最初，抑制大致均匀，无法抵消正确的输入，因此预期事件仍会引起强烈反应。在学习期间，当预测与刺激通常匹配时，全局信号呈某一符号，并驱动类似Hebb的调整，以平衡总体兴奋与抑制，使系统沿着一条“慢学习”线移动，在预期条件下总体活动保持低。在较少出现的不匹配试次中，全局信号的符号翻转，相同的局部规则变为反Hebbian（anti-Hebbian），将突触权重沿该线微调，直到每个神经元变得专门化。一个亚群成为正预测误差神经元，主要在刺激超过预测时被激活；另一亚群成为负预测误差神经元，在预测超过刺激时响应。作者在数学上证明，这一简单规则以仅使用生物学可实现的成分，收敛到与梯度下降相同的最优解。

将模型与真实脑数据联系起来

研究者随后从简化单元转向更真实的神经元模型，检验学习到的回路是否重现小鼠的已知实验结果。在一种范式中，小鼠学会在跑步机上跑动会引起视觉运动；随后，在移动期间短暂暂停视觉场景会在视觉皮层引起强烈的不匹配反应。模型显示了相同的模式：学习后，对预期运动的活动受到抑制，而突然的暂停会引发大幅响应，尤其是在通常被视觉输入抑制的负预测误差神经元中。当作者模拟扰动不同类别的抑制细胞，或阻断支持可塑性的NMDA受体时，网络发出不匹配信号的能力以与药理学和光遗传学发现一致的方式退化。最后，模型预测学习后神经元应分裂为两组，对刺激和预测强度呈相反相关性。对现有小鼠数据的再分析证实了这一点：只有在运动—视觉耦合正常的动物中才出现明显的双峰模式，符合不同正、负预测误差族群的存在。

这对感知与心理健康意味着什么

该研究支持一种统一观点：一种全脑范围的误差广播细化特定局部连接，使感觉区域擅长抵消可预测之处并突出意外之处。在日常生活中，这让我们的感知在自我运动时保持稳定，同时对突发事件敏感。相同的机制还可能在技能学会后，减轻高级脑区的细节预测负担，释放认知资源。由于副放电和预测误差信号的紊乱已与幻觉和妄想有关，所提出的机制也为理解当抑制性学习或神经调节误差信号出问题时这类症状如何产生，提供了一个具体的神经电路框架。

引用: Meng, J.H., Wang, XJ. Global error signal guides local optimization in mismatch calculation. Nat Commun 17, 3868 (2026). https://doi.org/10.1038/s41467-026-70354-x

关键词: 预测编码, 副放电, 抑制性可塑性, 神经调节, 预测误差神经元