Clear Sky Science · zh

PS-SNN：用于类增量学习的可扩展脉冲神经网络的模式分离学习

2026-03-09 · 返回目录

为什么教机器“记住”很重要

现代人工智能系统令人印象深刻，但它们有一个严重的盲点：当学习新内容时，往往会遗忘以前学到的东西。这种“健忘”是机器人、手机和其他必须在不断变化的世界中持续学习而不重新从头训练的设备面临的一大障碍。关于 PS-SNN 的论文提出了一种受大脑启发的方法，帮助能效很高的脉冲神经网络随时间学习新的类别，同时保留已有知识，指向能够在低功耗硬件上运行的更聪明、更可靠的人工智能。

随时间遗忘的问题

大多数人工智能模型在固定数据集上训练一次然后部署。然而在现实中，数据是分批到来的：相机可能在下个月看到以前从未标注过的新类型对象。当一个标准神经网络在这些新类别上更新时，其内部的“特征空间”会被重塑，早期类别的性能常常崩溃——这一现象称为灾难性遗忘。在类增量学习中这尤其具有挑战性，因为系统必须识别迄今为止见过的所有类别，而不知道它们来自哪个训练阶段。脉冲神经网络以类似生物神经元的短促电脉冲进行通信，因其适合低能耗芯片而具有吸引力，但它们也面临同样的问题，并且相比传统深度网络受到的关注要少得多。

来自大脑的生长与分离启示

神经科学为终身学习提供了两种互补的思路。首先，大脑可以产生新的神经元，尤其是在称为海马体的区域，这使得它能够存储新的记忆而不覆盖旧记忆。其次，海马体的另一个部分——齿状回，被认为充当“模式分离器”：即使是相似的经历也会被映射为不同且不重叠的活动模式，从而避免相互干扰。现有针对脉冲网络的持续学习方法通常侧重于改变网络结构或重用旧数据，但它们仍依赖随机初始化的输出层，这可能导致随着新任务到来类别的内部表示发生漂移和重叠。作者认为，这一被忽视的分类器设计是造成不稳定性的关键来源。

PS-SNN 如何重塑学习流程

PS-SNN 将这两种受大脑启发的思想结合到为类增量学习设计的脉冲网络中。当新的类别组到来时，网络通过添加新的特征提取模块来增长，而早先的模块则被冻结，呼应了神经发生并保留先前知识。与此同时，方法并非每次都从头学习新的输出层，而是为每个可能的类别分配一个预先计算好的特征空间方向。这些方向被构造为相互正交，意味着每个类别从一开始就锚定在一个独特且不重叠的位置。在称为模式分离学习的第一训练阶段中，分类器保持固定，只有特征提取器进行调整，迫使每个类别基于脉冲的表示紧密聚集在其分配的方向周围，从而减少旧任务与新任务之间的冲突。

在不破坏记忆的情况下微调决策

正交锚点大大提高了稳定性，但它们也很刚性。为恢复灵活性，PS-SNN 增加了第二阶段称为模式精炼学习。在这里，特征提取器被冻结，仅调整分类器，使用经过精心平衡的旧样本和新样本混合，确保没有某一组类别占主导地位。该阶段微调已经良好分离的类别方向之间的决策边界，提高判别能力——尤其是在视觉上相似的类别之间——而不扰动在第一阶段稳定下来的底层表示。系统还维护一个小型的回放记忆来保存过去的样本，这有助于在两阶段中提供指导，同时保持存储开销适中。

这些结果对未来人工智能的意义

在类别分多次到来的标准图像基准上测试时，PS-SNN 显著优于早期基于脉冲的持续学习方法，甚至可与多种领先的传统深度网络相媲美或超越，同时保持基于脉冲计算的节能优势。通过将可扩展的网络结构与固定且良好分离的类别锚点相结合，该方法大幅减少了通常破坏长期学习的内部表示缓慢漂移。对非专业读者来说，结论是这项工作使人工智能更接近大脑那种在不断学习同时不遗忘的能力，且这种形式有望在未来嵌入日常设备的类脑芯片上高效运行。

引用: Hu, K., Wen, L., Zhang, T. et al. PS-SNN: pattern separation learning for expandable spiking neural networks in class-incremental learning. Sci Rep 16, 12653 (2026). https://doi.org/10.1038/s41598-026-42970-6

关键词: 持续学习, 脉冲神经网络, 灾难性遗忘, 类脑计算, 模式分离