Clear Sky Science · zh

基于二维超离子导体的多模态离子门控晶体管,用于深度学习中的内存计算

· 返回目录

受大脑启发的更智能芯片

现代人工智能成果显著,但能耗巨大,这在很大程度上源于当前芯片不断在存储器和处理器之间来回传输数据。本文介绍了一种新型微小电子器件,其行为更接近神经元之间的突触。通过在同一位置同时处理计算和信号整形,这类器件可使未来的人工智能硬件更快、能耗更低,潜在应用包括智能手机、汽车和医疗可穿戴设备中的边缘传感器等。

Figure 1
Figure 1.

为什么现有人工智能硬件效率低下

大多数人工智能算法依赖两个核心步骤:用乘加将信号组合起来,然后通过一个弯曲的“激活”步骤决定哪些模式重要。传统芯片将这些步骤放在不同的模块中进行。数据必须在数字与模拟之间转换并在芯片上多次移动,这既耗时又费电。工程师希望有一种物理器件既能存储连接强度又能实现激活类的非线性,但典型电子元件通常只擅长其中一项。若强行让它们兼顾两者,往往会变得不稳定或不够精确。

一种新的晶体管构建单元

作者提出了一种由超薄层状晶体构成的晶体管,以一种出人意料的方式解决了这一难题。该器件使用一种称为CdPS3-Li的二维材料作为特殊的离子导电层,并与另一种作为电流载体的二维半导体MoS2叠层。CdPS3-Li层含有能在某些方向上容易移动但在其他方向上受限的锂离子,同时还存在可捕获电荷的空位。当施加电脉冲时,锂离子会漂移到与MoS2层的界面并停留在那里,从而强烈改变器件的导电性。而当器件被光照射时,在MoS2层产生的电荷会被拉入这些空位,导致丰富的时间相关响应。

将光与电转化为类脑信号

得益于这种设计,同一晶体管自然能够支持两种迥异但互补的行为。在电脉冲作用下,它表现出许多稳定的电阻等级,这些等级平滑且可预测地变化,类似于神经网络中的可调权重。这些电阻等级是非易失性的,脉冲结束后仍能保持,器件可以可靠地在数十个不同状态之间切换而不易损耗。相反,在光脉冲下,电流会先上升然后以曲线方式衰减,这种衰减可以用深度学习中常用的激活函数近似拟合。通过调节光脉冲的强度、持续时间和次数,研究人员可以控制响应衰减的速度,从而在硬件中“编程”出不同的激活特性。

Figure 2
Figure 2.

从单个器件到可工作的人工智能阵列

为证明这不仅是实验室的趣味,团队构建了这些晶体管的阵列并将其连接起来以运行真实神经网络的部分运算。其中一个阵列执行乘加(multiply-and-accumulate)步骤:每个器件存储的电阻代表一个权重,通过在网格上施加电压,电流会按照电路物理规则自然叠加。第二个较小的阵列则暴露于精确时序的光脉冲下,其衰减电流实现了激活步骤。通过将这两个模块与常规控制电子学协调,研究人员训练出一个识别手写数字的网络,达到了超过97%的准确率——与纯数字系统相当,但使用的是本质上结合了存储与处理功能的元件。

这对日常技术意味着什么

对非专业读者而言,关键观点是这些基于离子且对光敏感的晶体管比传统硅开关更像生物突触。它们可以记忆连接强度,对电学与光学刺激表现不同,并且每次操作的能耗非常低。虽然它们还无法在短期内替代你手机中的芯片,但它们指向一种更高密度、更高效且更类脑的人工智能硬件未来。这类进展最终可能使强大的学习系统适配于小型电池供电设备,将更智能的感知与决策能力带到数据产生的近端。

引用: Tong, B., Du, T., Du, J. et al. Multimodal ion-gated transistor based on 2D superionic conductor for in-memory computing in deep learning. Nat Commun 17, 4127 (2026). https://doi.org/10.1038/s41467-026-70587-w

关键词: 类脑计算, 内存计算, 离子门控晶体管, 二维材料, 深度学习硬件