Clear Sky Science · zh

通过复值网络量化实现的超高效物理场计算

2026-03-10 · 返回目录

为何缩小智能模型至关重要

我们周围许多看不见的技术——无线网络、医学扫描仪与全息显示器——都依赖于波。准确模拟与控制这些波至关重要，但用现有的人工智能工具去实现往往既缓慢又耗能。该研究展示了一种方法，能够在不牺牲实现高分辨图像和可靠信号所需精细细节的前提下，大幅压缩并加速一类直接处理波信息的特殊AI模型。

波、数值与隐藏的结构

光、声与无线电波都携带两个信息量：强度以及它们在时空中波峰的相位位置。数学家将这两者整合为“复数”，它天然描述了干涉和振动等模式。复值神经网络通过直接在这对量上运算来利用这一点，使其成为从全息图生成到雷达与声学分析等任务的有力工具。但问题在于：以全数值精度运行此类模型在内存、计算和能耗方面代价高昂，从而限制了它们在便携设备和实时系统中的应用。

为何常规捷径会破坏波信息

一种常见的瘦身AI模型方法叫做量化——用更少位数存储每个权重和激活，而不是使用全精度数值。对普通实值网络这通常很有效。然而，大多数现有方法把复数的实部和虚部当作不相关的通道来处理。这忽视了波系统中强度与相位之间的紧密耦合。其结果是各部分的舍入误差不再相互抵消或匹配，扰乱了决定波如何相加或相消的精细相位关系。在实际应用中，这可能引入非物理噪声、使全息图模糊，并降低合成孔径雷达等系统的性能。

一种更聪明的复波舍入方法

作者提出了一种新策略，使每个复数的两半在压缩过程中彼此“感知”。他们的框架对实部和虚部进行联合量化，使得舍入误差被塑造成既保留复数合成值的大小又保留方向的形式。他们还引入了一种自适应方案，逐层决定实际需要多少位数。直接接触物理波场的层保留更高精度，而处理更抽象特征的深层可以安全地使用更少位数。训练过程分为两个阶段：先学习网络中理想的位宽分布，然后使用这些选择对模型进行再训练以恢复精度。

以极低成本获得更清晰的全息图

为检验他们的想法，团队为计算机生成全息建立了一种超低位宽网络，全息是一类对微小数值误差极为敏感的应用，这类误差会导致散斑和伪影。他们的设计包含一个相位生成器、一个将复波场转换为相位图的模块，以及一个用于降低因不完美光学模型引起的振铃伪影的补偿器。训练时使用的损失函数评估的是传播后的光场，而不仅仅是像素差异，因此直接惩罚在真实光学系统中会产生影响的误差。与一个名为 HoloNet 的领先全息网络相比，新模型在标准图像质量度量上重建质量约提高了4分贝，同时将计算量削减约99%并将内存使用减少近三个数量级。在实验室的二维和三维全息光学实验中，压缩后的模型仍能提供干净、散斑减少的图像。

不仅限于全息：音频、无线与雷达

优势并不限于光学。作者在另外三种基于波的任务上测试了他们的量化复值网络：从音频信号识别说话人、分类无线调制模式以及识别合成孔径雷达数据中的目标。在每种情况下，量化的复值模型都能达到接近或优于全精度基线的准确率，同时将位运算次数和内存需求削减约80–90%。在桌面处理器和 Android 智能手机上，该方法相比早期的全息网络带来了显著加速，表明复杂的基于波的AI模型可以在边缘设备上高效运行，而不必仅依赖强大的数据中心。

这对未来波技术意味着什么

通过尊重复数的特殊结构而不是将其各部分分开对待，这项工作提供了一套实用方案，用于构建轻量、高效且仍然遵循波物理规律的AI工具。所提出的量化方案让复值网络保留支撑清晰全息、干净音频、可靠无线链路和精确雷达成像的微妙相位信息，同时大幅减少计算开销。因此，高保真物理场计算更容易与移动设备和嵌入式系统兼容，为便携式全息显示、更智能的传感器以及依赖波的节能科学仪器开辟了道路。

引用: Geng, Z., Li, Z., Zhou, M. et al. Ultra-efficient physical field computing by complex-valued network quantization. Nat Commun 17, 3762 (2026). https://doi.org/10.1038/s41467-026-70319-0

关键词: 复值神经网络, 模型量化, 计算机生成全息, 基于波的信号处理, 边缘人工智能