Clear Sky Science · zh

卷积神经网络模型描绘听觉皮层局部回路的编码子空间

· 返回目录

计算机如何帮助我们听见世界

日常生活充满了重叠的声音:说话声、音乐、脚步声和交通噪音同时挤满我们的耳朵。我们的大脑可以轻松地将这混杂的声音分离开来,但听觉皮层究竟使用了哪些技巧仍不十分清楚。本研究展示了如何利用现代深度学习工具(类似于语音和图像识别中使用的工具),剖开它们以揭示脑细胞关心的声音特征——以及这些特征在微小的局部电路中如何组织。

Figure 1
图 1。

从野外声景到脑活动

研究人员在清醒的雪貂听觉皮层中记录了数千个单个神经元的电活动,同时让动物聆听一个庞大的自然声音库:包含语音片段、音乐、环境噪声和动物叫声。团队没有使用简单的纯音,而选择这种丰富的声音输入以更好地匹配日常听觉的复杂性。他们将每个声音转换为声谱图——一个展示能量如何随时间分布在不同频率上的时频图,然后训练卷积神经网络(CNN)逐毫秒地预测每个神经元的放电情况。与其他感觉区类似,这个深度网络的表现优于假定每个神经元仅通过单一固定“滤波器”监听的经典线性模型。

将深度网络“扁平化”为简单的声音空间

高性能的 CNN 常被批评为黑箱:它们能拟合数据但难以解释。为了解决这一点,作者开发了一种方法,将深度模型“扁平化”为每个神经元的简单低维声音空间。首先,他们在每个时刻计算动态感受野,通过询问对输入声谱图做微小改变会如何改变该神经元在 CNN 输出中的预测。这产生了大量逐时刻的滤波器,捕捉模型的预测如何依赖于近期声音。然后他们使用一种统计技术将这些众多滤波器总结为少量主成分——通常只有 3 到 13 个——这些主成分共同定义了神经元的调谐子空间:实际上影响其活动的那一小组声音模式。

Figure 2
图 2。

在共享子空间中读出非线性反应

一旦将声音投影到神经元的调谐子空间,团队测量了在该降维空间中不同位置处放电率如何变化,形成他们所称的子空间感受野。这些表面通常是弯曲且多峰的,揭示了简单模型无法捕捉的丰富非线性行为:一些神经元对若干不同的声音模式有强烈响应,另一些对沿某一维度的正负偏差均敏感,许多则呈现由抑制区环绕的敏感小口袋。关键是,一个只使用子空间投影加上适度非线性读出的新模型,几乎能像原始 CNN 那样准确地预测神经活动,捕捉了其解释方差的 95% 以上。这表明深度模型的复杂性可以被提炼为对每个神经元“在听什么”的紧凑、可解释的描述。

邻近神经元如何共享与分工

由于记录覆盖了同一皮层柱中的许多神经元,作者得以探究局部群体如何共享声音编码的任务。他们发现位于同一位置的神经元大多占据相同的调谐子空间:它们偏好的声音模式来自一组共同的低维特征,可能反映早期处理阶段的共同输入。然而在该共享空间内,每个神经元的高活动区域仅占据一小块,这些小块的重叠程度并不比随机分布时更大。换句话说,邻近神经元听相似类型的声音,但对不同的具体组合有强烈响应,形成了对空间的稀疏平铺。这一布局解释了为什么相邻细胞在面对相同自然声音时经常放电截然不同,尽管它们共享诸如最佳频率等广泛偏好。

不同细胞类型,不同角色

团队还利用峰形差异和记录深度将推定的兴奋性和抑制性神经元区分开来,并将它们归入皮层层次。窄峰的抑制细胞倾向于具有更宽的子空间感受野,意味着它们在共享声音空间的更大区域内有响应。它们的非线性调谐更可能形成盆状(bowl-like)形态,即沿某一维度的任一方向大幅波动都会引发强响应。相比之下,兴奋性细胞更常呈现尖峰状、丘状的调谐,限于更窄的输入范围。总体上,这些模式支持这样一种图景:宽带调谐的抑制性神经元帮助在更窄调谐的兴奋性邻居之间雕刻出稀疏、选择性的编码,且这些效应在不同皮层层次间的平衡有所变化。

为何该框架重要

这项工作表明,直接在脑数据上训练的深度神经网络可以被翻译成直观的地图,展示感觉神经元编码的内容以及局部回路如何组织。通过表明一小组共享的声音特征支撑着许多相邻神经元的响应,而单个细胞又在该空间内开辟出独特的小生态位,研究提供了一个关于听觉皮层中稀疏编码、增益控制与不变性的具体框架。更广泛地说,相同的“扁平化”策略可以应用于其他脑区,将强大但不透明的深度学习模型转化为关于自然神经回路执行何种计算的明确假设。

引用: Wingert, J.C., Parida, S., Norman-Haignere, S.V. et al. Convolutional neural network models describe the encoding subspace of local circuits in auditory cortex. Nat Neurosci 29, 876–887 (2026). https://doi.org/10.1038/s41593-026-02216-0

关键词: 听觉皮层, 卷积神经网络, 神经编码, 稀疏编码, 感觉子空间