Clear Sky Science · zh
飞秒焦阈值可重构全光非线性激活器用于皮秒脉冲光学神经网络
为什么微小的光脉冲可能为未来人工智能提供动力
当今的人工智能依赖大规模、耗电的电子芯片集群运行。随着我们对更智能的手机、汽车和数据中心的需求增加,电力消耗和散热正成为主要瓶颈。本文报道了一种用光替代电子完成部分计算的方法:利用微小的光学器件充当神经网络中的“激活”开关。这些开关以极低的光能级和极快的速度工作,展示了超快、能效高的人工智能硬件的前景。
从缓慢、高热的电子技术到快速、低热的光子学
传统芯片通过金属线和晶体管移动电荷。这种方式曾大大推动了计算能力,但在速度和能效上都接近极限。光学神经网络用在波导中传播的光子代替移动的电荷——本质上是在芯片上引导的微小光路。光可以快速传输信息、同时承载多种波长,并且几乎不产生热量。然而,要构建实用的全光神经网络,需要一个关键元件:紧凑的器件能以非线性方式接收光信号并输出变换后的信号,就像大脑中的神经元只有在输入超过阈值时才会触发。直到现在,这类全光“激活”元件往往太大、太慢或太耗能。

一个能弯曲信号的微观光陷阱
作者首先设计了一个硅光子晶体腔——在硅片上打孔形成的薄板,可在特定波长处捕获并减慢光。通过精确排列一列孔,他们创建了一个微小区域,使短光脉冲在其中发生驻波,增强其强度。这会放大硅的克尔效应:当腔内光强变大时,材料的折射率会发生微小变化。这种微小的变化会推动腔的谐振峰位移,从而改变穿过的脉冲透过量。通过选择输入波长相对于腔谐振峰的位置,研究者可以使器件表现出多种机器学习中使用的激活曲线,包括线性、类似ReLU(整流线性)和类似Sigmoid的响应。即使在纯硅版本中,该激活器的尺寸仅约15微米乘10微米——比一粒灰尘还小——响应时间不到2皮秒(即2万亿分之一秒)。
加入石墨烯以实现超低能耗开关
为了进一步降低激活阈值,团队在硅腔上集成了一层单原子厚的石墨烯。石墨烯天然吸收光,但在高强度下其吸收会饱和:一旦大量电子被激发,额外的光子更容易透过。将这种“可饱和吸收”与腔的慢光增强组合后,器件的饱和能量降到仅约4飞焦耳——相当于几万个电信光子携带的能量——响应时间约为1皮秒。在相邻波长上,同一结构还能利用硅的克尔效应按需重塑其激活曲线,在Sigmoid样、ReLU样和近线性行为之间切换,阈值低至约30飞焦耳。从速度和所需能量来看,这一性能指标较以往片上光学激活器提高了数个数量级。

在芯片上构建脉冲驱动的光学“大脑”
将这些激活器作为构建模块,作者勾画了一个由超快光脉冲驱动而非连续光束驱动的完整光学神经网络架构。高重复率脉冲激光产生一列皮秒尖峰,数据由高速调制器编码并在多波长间分配。在芯片上,专用的波分器件使用非易失性相变材料对这些颜色进行路由和加权,该材料能在不消耗能量的情况下记住设置。在线性加权之后,信号穿过石墨烯‑硅激活器,印上所需的非线性响应,然后光被路由到下一层。仿真显示,当激活能量低于约30飞焦耳时,这种系统的计算密度可达每平方毫米约10^3万亿次/秒(10^3 trillion ops/s/mm^2)级别,能效接近每瓦每平方毫米10^6万亿次运算(10^6 trillion ops/W/mm^2)——远超典型电子加速器。
这对日常人工智能意味着什么
为检验这些特殊光学激活是否能模拟电子激活的行为,团队将测得的激活曲线输入软件模型,并在标准分类任务上进行训练,从简单的二维图形到手写数字(MNIST)以及复杂的彩色图像(CIFAR‑10)。石墨烯‑硅激活在性能上与或优于简单的线性响应,尤其在更难的图像任务上,ReLU样行为表现出明显优势。通俗地说,这项工作表明,一块经过精细结构设计的拇指大小的硅‑石墨烯芯片,未来有望用微小的光脉冲而非电流来完成人工智能计算的关键步骤。如果与成熟的光子学技术规模化并集成,这类全光非线性激活器可能为下一代人工智能带来更快、更冷却、更高效的硬件。
引用: Liu, R., Wang, Z., Zhong, C. et al. Femto-joule threshold reconfigurable all-optical nonlinear activators for picosecond pulsed optical neural networks. Light Sci Appl 15, 128 (2026). https://doi.org/10.1038/s41377-025-02175-4
关键词: 光学神经网络, 石墨烯光子学, 光子晶体腔, 非线性激活, 节能人工智能硬件