Clear Sky Science · zh
通过复值网络量化实现的超高效物理场计算
为何缩小智能模型至关重要
我们周围许多看不见的技术——无线网络、医学扫描仪与全息显示器——都依赖于波。准确模拟与控制这些波至关重要,但用现有的人工智能工具去实现往往既缓慢又耗能。该研究展示了一种方法,能够在不牺牲实现高分辨图像和可靠信号所需精细细节的前提下,大幅压缩并加速一类直接处理波信息的特殊AI模型。

波、数值与隐藏的结构
光、声与无线电波都携带两个信息量:强度以及它们在时空中波峰的相位位置。数学家将这两者整合为“复数”,它天然描述了干涉和振动等模式。复值神经网络通过直接在这对量上运算来利用这一点,使其成为从全息图生成到雷达与声学分析等任务的有力工具。但问题在于:以全数值精度运行此类模型在内存、计算和能耗方面代价高昂,从而限制了它们在便携设备和实时系统中的应用。
为何常规捷径会破坏波信息
一种常见的瘦身AI模型方法叫做量化——用更少位数存储每个权重和激活,而不是使用全精度数值。对普通实值网络这通常很有效。然而,大多数现有方法把复数的实部和虚部当作不相关的通道来处理。这忽视了波系统中强度与相位之间的紧密耦合。其结果是各部分的舍入误差不再相互抵消或匹配,扰乱了决定波如何相加或相消的精细相位关系。在实际应用中,这可能引入非物理噪声、使全息图模糊,并降低合成孔径雷达等系统的性能。
一种更聪明的复波舍入方法
作者提出了一种新策略,使每个复数的两半在压缩过程中彼此“感知”。他们的框架对实部和虚部进行联合量化,使得舍入误差被塑造成既保留复数合成值的大小又保留方向的形式。他们还引入了一种自适应方案,逐层决定实际需要多少位数。直接接触物理波场的层保留更高精度,而处理更抽象特征的深层可以安全地使用更少位数。训练过程分为两个阶段:先学习网络中理想的位宽分布,然后使用这些选择对模型进行再训练以恢复精度。

以极低成本获得更清晰的全息图
为检验他们的想法,团队为计算机生成全息建立了一种超低位宽网络,全息是一类对微小数值误差极为敏感的应用,这类误差会导致散斑和伪影。他们的设计包含一个相位生成器、一个将复波场转换为相位图的模块,以及一个用于降低因不完美光学模型引起的振铃伪影的补偿器。训练时使用的损失函数评估的是传播后的光场,而不仅仅是像素差异,因此直接惩罚在真实光学系统中会产生影响的误差。与一个名为 HoloNet 的领先全息网络相比,新模型在标准图像质量度量上重建质量约提高了4分贝,同时将计算量削减约99%并将内存使用减少近三个数量级。在实验室的二维和三维全息光学实验中,压缩后的模型仍能提供干净、散斑减少的图像。
不仅限于全息:音频、无线与雷达
优势并不限于光学。作者在另外三种基于波的任务上测试了他们的量化复值网络:从音频信号识别说话人、分类无线调制模式以及识别合成孔径雷达数据中的目标。在每种情况下,量化的复值模型都能达到接近或优于全精度基线的准确率,同时将位运算次数和内存需求削减约80–90%。在桌面处理器和 Android 智能手机上,该方法相比早期的全息网络带来了显著加速,表明复杂的基于波的AI模型可以在边缘设备上高效运行,而不必仅依赖强大的数据中心。
这对未来波技术意味着什么
通过尊重复数的特殊结构而不是将其各部分分开对待,这项工作提供了一套实用方案,用于构建轻量、高效且仍然遵循波物理规律的AI工具。所提出的量化方案让复值网络保留支撑清晰全息、干净音频、可靠无线链路和精确雷达成像的微妙相位信息,同时大幅减少计算开销。因此,高保真物理场计算更容易与移动设备和嵌入式系统兼容,为便携式全息显示、更智能的传感器以及依赖波的节能科学仪器开辟了道路。
引用: Geng, Z., Li, Z., Zhou, M. et al. Ultra-efficient physical field computing by complex-valued network quantization. Nat Commun 17, 3762 (2026). https://doi.org/10.1038/s41467-026-70319-0
关键词: 复值神经网络, 模型量化, 计算机生成全息, 基于波的信号处理, 边缘人工智能