Clear Sky Science · zh
编程脉冲特性对电荷俘获型IGZO突触晶体管权重更新特性的影响
受大脑启发的更智能AI硬件
当今的人工智能多运行在耗电较高的数字芯片上。这项研究探索了一条不同的路径,采用更像大脑突触、能够直接在硬件中存储学习信息的特殊电子器件。研究人员展示了如何通过精细控制电压脉冲的时序,使这些微小器件在保持极低能耗的同时具有更好的记忆能力,这是朝向在手机、传感器和边缘设备中实现更高效AI迈出的一步。

像突触一样学习的小开关
这项工作聚焦于由无定形铟镓锌氧化物制成的薄膜晶体管,这是一种已在某些显示技术中使用的透明半导体。在这些器件中,沟道下方的低温二氧化硅层包含许多缺陷,能暂时俘获并释放电子。每个晶体管的行为类似突触,其强度由有多少电子停留在这些陷阱中决定,就像生物突触在神经元间信号传递时会强化或减弱。通过向晶体管栅极发送一系列电脉冲,团队可以逐步降低或提高流过器件的电流,模拟学习过程中突触权重的变化。
脉冲时序如何塑造电子记忆
一个关键问题是每个编程脉冲的宽度如何影响这种电子记忆。作者将三种脉冲宽度进行比较,分别为1.5秒、3秒和6秒,同时严格控制脉冲幅度、总训练时间和占空比等其它条件。短脉冲携带的能量较少,因此较少电子会移动到更深的陷阱中,而非常长的脉冲在读取步骤期间则给器件更多时间发生弛豫或恢复。当三种脉冲方案在相同的总开/关时间条件下比较时,中等时长的3秒脉冲在最弱与最强突触状态之间产生了最大的摆幅,意味着它在存储学习权重方面提供了最大的可用范围。
将真正的学习与简单弛豫区分开来
由于晶体管在读取过程中会自然向原始状态漂移,团队进行了第二组实验以将这种恢复与真正的学习区分开。这一次他们固定脉冲数量和脉冲间的恢复时间,调整占空比以便更长的脉冲仍在相同的读取条件下进行。在这种更公平的比较下,脉冲越长,越多电子被俘获进氧化物,器件越深入其记忆状态。结果是动态比(衡量器件电导可调范围的指标)稳步增加,其中6秒脉冲提供了最宽且最可控的权重范围。

从单个器件到识别手写数字
为了解这对实际计算意味着什么,研究人员将测得的器件行为输入到一个模拟的模拟AI加速器中。他们对一个用于识别MNIST数据集中手写数字的人工神经网络建模,将许多此类突触晶体管连成一个虚拟的交叉阵列。由于这些器件在亚阈值区工作、电流非常低,噪声和恢复效应会使存储的权重变得模糊。即便如此,该网络在脉冲宽度分别为1.5、3和6秒时实现了约80%、87%和90%的识别准确率。这种可用权重范围与识别准确率之间的密切对应表明,对电荷俘获的更好控制能直接提升学习质量。
为什么脉冲设计对未来低功耗AI很重要
通俗地说,这项研究表明这些氧化物晶体管通过脉冲的持续时间和强度来记忆信息,就像大脑突触随重复活动发生变化一样。非常短的脉冲无法将足够电荷推入深层记忆状态,而非常长的脉冲又必须与读取过程中器件的遗忘速度相平衡。通过调整脉冲宽度以及器件在脉冲间的休息频率,工程师可以在不提高工作电压的情况下扩大记忆范围并提升模式识别能力。这一见解指向一种受大脑启发的硬件,能够通过在庞大突触晶体管网格中直接存储和更新知识来高效运行AI任务。
引用: Ko, Y., Ryu, J., Pi, J. et al. Influence of programming-pulse properties on weight-update characteristics of charge-trapping IGZO synaptic transistors. Sci Rep 16, 15031 (2026). https://doi.org/10.1038/s41598-026-44949-9
关键词: 类脑硬件, 突触晶体管, IGZO, 编程脉冲宽度, 模拟人工智能