Clear Sky Science · zh
用于类模拟内存计算的可扩展且鲁棒的多比特自旋电子突触
更智能的存储为何对日常 AI 至关重要
从语音助手到照片应用,现代人工智能在很大程度上依赖深度神经网络——这些程序需要处理数以百万计的微小数值“权重”来做出决策。在内存与处理器之间来回移动这些权重所消耗的能量,往往远超过实际计算所需的能量。本文探讨了一种新的磁性存储单元,这种单元既能存储这些权重,又能在数据所在位置直接协助执行计算,有望实现更快、更高效的 AI 硬件。
把类脑计算带入存储芯片
当今计算机采用经典的“冯·诺依曼”架构,数据在内存和独立处理器之间不断往返。神经网络本质上涉及大量的矩阵–向量乘法,这种数据搬运瓶颈对它们影响尤为明显。一种有前景的替代方案是内存计算:一个由内存单元组成的大型网格(交叉阵列)既保存网络权重,又能把输入电压直接转成输出电流以表示计算结果。虽然许多实验性存储器件被尝试用于此目的,但它们常常表现出噪声和漂移问题,当每个单元需表示不仅仅是0或1时,这些问题尤其成风险。

把磁性存储从开/关变成“模拟”
作者在磁性随机存取存储器(MRAM)基础上进行改进,MRAM 是一种非易失性技术,已因速度、耐用性以及与标准芯片工艺的兼容性而备受重视。传统 MRAM 单元是一个磁性隧道结:两层磁性材料由绝缘层隔开。取决于两层磁化方向是同向还是相反,单元的电阻低或高,从而编码单比特。这里的关键变化是重新设计“自由”磁层,使其不再是一个整体同时翻转的均匀块体。新设计在较厚的颗粒化磁性层上方放置一层非常薄的连续薄膜。颗粒化层由许多微小磁性晶粒组成,每个晶粒在略有不同的电流下可以翻转方向,因此总体电阻可以落在若干个中间、稳定的级别,而不仅仅是“低”和“高”。
多少种磁性状态是有用的?
通过对磁动力学的详细计算机建模,团队表明向该复合层注入自旋极化电流会导致逐粒翻转的渐进过程。随着电流扫描,平均磁化强度及由此带来的电阻呈现平滑的 S 形曲线,使近连续的模拟状态成为可能。作者接着考察了制程差异和写入周期之间的随机热效应如何扰动这些电阻级别。他们发现,中间态的噪声稍大,而极端态(完全朝某一方向翻转)仍然非常紧凑且鲁棒。对于实际尺寸的器件(边长约50–75纳米),他们得出结论:在不过分产生错误的情况下,四个可靠可区分的电阻级别——相当于每单元2比特——是可行的。

从单个单元到完整的 AI 加速器
要实现实用,这种多级 MRAM 必须被精确读取并集成进完整的计算系统。作者设计并模拟了一个感测电路,使用快速的“闪存式”模数转换器来区分每个单元的四个电阻级别。他们探讨了最高与最低导电状态之间对比度如何影响读取速度、能耗和感测电路的面积,显示更好的对比度直接带来更快、更节能的读取表现。随后,他们将每单元2比特的 MRAM 模型嵌入一个模拟的内存加速器中,运行 ResNet-18 神经网络处理 CIFAR-10 图像数据集。与使用标准1比特 MRAM 单元的基线方案相比,多比特版本大致将存储密度提高一倍,并将所需交叉阵列的数量减半。这转化为芯片面积、能耗和延迟最高可约减少1.8倍,并在能量—延迟综合指标上超过3倍的改进,同时基本保持网络的识别准确率。
与其他存储方案相比如何
该研究还将这种方法与阻变存储、相变存储以及依赖于域壁或自旋纹的其他磁性概念进行比较。虽然这些替代方案也能够产生类模拟行为,但它们常常需要更大器件或特殊形状,且更不稳定。相比之下,颗粒化 MRAM 单元在保留主流 MRAM 制造友好性和耐久性的同时,获得了额外的存储级别。系统级测试表明,在实际变异条件下,基于 MRAM 的突触比基于更具变异性的阻变存储的类似设计能更好地保持神经网络的准确性,尤其是在为进一步节能而使网络变稀疏时。
这对未来日常 AI 意味着什么
简单来说,作者展示了一种方法,使经验证的磁性存储技术能够不仅存储零和一,而且在紧凑的单元内直接存储小幅度的模拟权重值。通过精心设计的分层结构,把磁性行为分散到许多微小晶粒中,他们获得了多个稳定的电阻级别,足够稳健以应对真实 AI 任务。当这些单元排列成大型阵列并配以合适的感测电路时,它们可以在显著减少数据移动的同时执行深度学习的核心计算。如果在硬件中实现,这类多比特自旋电子突触有望让未来的 AI 系统——无论是在数据中心、智能手机还是嵌入式传感器中——在不牺牲准确率的前提下更快、能效更高。
引用: Gupte, K.K., Mugdho, S.S., Huang, C. et al. Scalable and robust multi-bit spintronic synapses for analog in-memory computing. npj Unconv. Comput. 3, 8 (2026). https://doi.org/10.1038/s44335-026-00055-7
关键词: 内存计算, 自旋电子存储器, MRAM, 类神经形态硬件, 深度神经网络