Clear Sky Science · zh

具有共享潜在结构的任务的神经群体几何与最佳编码

2026-02-04 · 返回目录

大脑如何在嘈杂世界中发现隐藏规则

我们每天轻而易举地发现模式：红灯代表停车，拥挤的街道意味着放慢脚步，某个姿势表明宠物即将跳跃。这些能力背后是大脑发现世界中隐藏或“潜在”结构并在多种任务间重复利用的能力。本文提出了一个看似简单却深刻的问题：是什么让一种神经群体活动模式相比另一种更适合快速且准确地解决许多相关任务？

控制神经编码的隐藏旋钮
Figure 1.

作者在群体层面研究脑活动，把许多神经元的放电视为高维空间中的点。他们关注那些共享一组潜在变量的任务——例如物体的形状、大小与位置，或动物的位置与速度。下游神经元或电路以简单的线性规则读出这些模式，类似于在点云中画一平面将“类别 A”与“类别 B”分开。作者没有对每个神经元做精细模拟，而是推导出一个解析公式，预测在给定神经活动几何结构的情况下，这样的读出对新样本的泛化能力。令人惊讶的是，他们发现性能只由四个统计量决定，这四项捕捉了神经元对潜在变量的响应强度、不同变量之间的分离清晰度、噪声的排列方式以及活动占据的有效维度数。

良好泛化的四个简单要素

第一个要素是单个神经元与潜在变量之间的整体相关性：当潜在变量的微小变化能在神经响应上引起明显位移时，下游读出拥有更多可用信号。第二和第三个要素描述了“因子化”：理想情况下，不同潜在变量沿独立方向编码，而随机噪声则漂移到与这些信号轴正交的方向。这使得单一线性边界更容易在依赖相同隐藏结构的多项任务之间迁移。第四个要素是有效维度，它衡量群体在活动空间中真正使用了多少个方向。更高的维度通常会把噪声分散到更多方向上，从而提高可靠性，但必须与信号与行为相关变量的对齐程度权衡。

在人工与生物大脑中检验理论
Figure 2.

为检验他们的理论，作者首先将其应用于人工神经网络。在对多项相关分类问题训练的多层感知机，以及一个用于视频中追踪小鼠身体部位的深度网络中，他们在每一层测量了这四个几何量。所预测的误差与基于这些内部表征训练的简单读出的实际表现高度吻合。随后他们转向真实大脑数据。猕猴视觉区的记录显示，从眼睛到高级视觉皮层的信号传递过程中，几何结构以减少泛化误差的方式演化：与潜在变量的相关性增加，干扰性变异被推离信号方向，某些形式的维度性被重新塑造。在啮齿类进行空间交替任务学习的过程中，行为和读出性能在训练数日内均有所改善，而海马体与前额叶活动的几何变化以系统性方式反映了理论的预测。

学习如何重写神经空间

由于他们的公式将几何直接与性能联系起来，作者可以探讨在不同学习阶段“最优”神经编码应如何。早期，当训练样本稀少时，最好的编码是低维且与最有信息量的潜在变量强烈对齐，有效地压缩掉不太有用的特征。随着经验积累，最优解发生转变：任务相关结构的表征扩展到更多维度，且单个神经元与单个变量之间的紧密相关反而会放松。换言之，大脑似乎以对任务的聚焦、低维草图起步，随着学习逐渐填充为更丰富、更分布式的表示。

这对理解生物与机器有何意义

对普通读者而言，核心信息是：群体层面的脑活动并非仅仅是一团脉冲噪声；它具有形状，而这个形状很重要。通过识别四个可测量的几何特征，这些特征控制了简单读出在相关任务间泛化的能力，这项工作提供了一个比较生物与人工神经网络的通用话语体系。它暗示随着动物和机器的学习，它们会将内部活动从紧凑、强对齐的编码重组为更高维、更好因子化的表示，同时仍然保护与任务相关的信息免受噪声干扰。这种几何视角有助于解释为何相同的大脑回路能在多种情境中灵活复用隐藏结构，从而支持日常智能背后看似轻松的泛化能力。

引用: Wakhloo, A.J., Slatton, W. & Chung, S. Neural population geometry and optimal coding of tasks with shared latent structure. Nat Neurosci 29, 682–692 (2026). https://doi.org/10.1038/s41593-025-02183-y

关键词: 神经群体几何, 潜变量编码, 多任务学习, 可解缠表示, 神经网络的泛化