Clear Sky Science · zh

基于双极异质结构晶体管的非线性与动态响应的物理回声状态网络

· 返回目录

这对日常科技有何意义

从语音助手到天气应用,今天许多智能工具都依赖于识别随时间变化的模式,例如语音、心跳或风暴路径。传统计算芯片难以高效处理这种基于时间的数据,因为它们并非为模仿大脑而设计。本文报告了一种新型硬件构件——称为双极晶体管的小型器件——将它们连线起来以模拟一种受大脑启发的网络:回声状态网络。其结果是一个物理计算系统,能够识别图像、解读信号并预测复杂过程的演变,同时使用极少的能量。

Figure 1
Figure 1.

一种新型的类脑电路

传统芯片将存储与处理分开,频繁在两者之间传输数据,浪费时间和能量。类脑计算则走另一条路:试图将记忆与处理结合在一起,形成更像大脑中神经元与突触的网络。回声状态网络是这类网络的一种特殊形式。它将输入信号送入由大量互联单元构成的固定网络(称为水库),信号在其中被混合并随时间回响。只有最终的读出层需要训练,从而大大简化了学习过程。作者提出了一个关键问题:这个水库能否直接由物理器件构建,而不是在软件中模拟,使硬件本身自然地完成繁重运算?

将双极晶体管作为人工神经元与突触

研究团队制备了由有机—无机叠层材料构成的晶体管:一层氧化锌和一层名为P3HT的聚合物。通过精确选择每层的厚度,他们制造出能够同等方便传导正电荷与负电荷的器件——即双极导电性。这些晶体管在某一工作区呈近似线性响应,而在另一工作区的响应平滑地呈S形弯曲,类似许多神经网络中作为激活函数使用的tanh函数。在线性区,它们充当可调节的连接(突触)执行加权求和;在饱和区,它们表现得像将信号压缩到有限范围内的神经元。由于每个器件的电流还依赖于近期的电压变化,硬件天然具备短期记忆,使水库具有内在的时间感知能力。

从手写数字到类天气的混沌系统

为测试这一物理回声状态网络,研究者将这些双极晶体管排列成阵列,并与简单的输入和输出电路相连。首先他们在众所周知的图像数据集上进行模式识别任务。通过将平展的手写数字和服饰图像输入晶体管水库,在基本工作模式下他们获得了约95%的数字识别准确率和86%的服饰识别率;当通过巧妙的脉冲编码进一步利用器件的动态行为时,准确率分别接近97%和87%。随后他们超越静态图像,处理真实的时间序列问题。该系统以极低误差预测了洛伦兹吸引子(经典的类天气混沌动力学模型)的运动,并预测了真实台风中心随时间的移动与形态演变。

聆听心跳与解读情感

由于许多现实问题涉及多种数据类型,团队还探索了多模态任务。他们将心电图信号同时转换为一维波形和二维时频图像,分别输入同一双极水库。通过组合得到的内部态,系统对心电信号模式的分类比单一模式更为准确。在另一项研究中,他们将水库作为前端,用于分析包含人声、文本和面部表情的数据集。当这些音频、语言和视觉特征先经过双极网络处理再传递给标准软件分类器时,识别准确率明显高于仅用软件。所有试验中,双极器件均优于更简单的n型或p型晶体管,这得益于它们对正负信号的平衡响应和更丰富的内部动力学。

Figure 2
Figure 2.

这对未来智能设备意味着什么

对非专业读者来说,关键结论是:这项工作将一个数学概念——回声状态网络——转化为可触的硬件,其中每个晶体管在某种程度上既像一个微小、响应迅速的神经元又像一个突触。由于水库的内部连接不需要训练,且器件本身同时提供非线性与短期记忆,所得系统能够以更简单的算法并可能以更低的能耗处理诸如图像识别、信号分析和时间序列预测等任务。这为未来更自然地处理信息流的芯片指明了方向,使传感器、可穿戴设备和预测工具更智能、更高效,而无需依赖当今深度学习体系所需的大量计算开销。

引用: Zhong, WM., Zhang, W., Zeng, YX. et al. Physical echo state network based on the nonlinearity and dynamic response of ambipolar heterostructure transistors. Nat Commun 17, 3321 (2026). https://doi.org/10.1038/s41467-026-70171-2

关键词: 类脑硬件, 回声状态网络, 双极晶体管, 时间序列预测, 水库计算