Clear Sky Science · zh

利用基于 CNTFET 技术的电流模式 4 到 2 压缩器设计低功耗高速近似乘法器

2026-01-07 · 返回目录

更清晰的图像，消耗更少能量

每当你的手机拍照、播放视频或运行 AI 滤镜时，它都会执行数以百万计的小乘法运算。将这些计算全部精确完成会消耗大量能量并降低速度，然而人眼往往无法察觉微小的数值误差。本文展示了一种有意“放宽”部分运算精度的新型电路，通过这种方式在保持图像在视觉上与精确结果无异的同时，显著降低功耗和延迟。

为何不完美的算术仍能呈现完美画面

许多现代应用——如图像处理、视频和机器学习——天然对小误差具有容忍性。单个像素亮度的微小变化或滤波响应的轻微偏移通常对人眼不可见。作者利用这一点，采用近似乘法器：通过牺牲部分算术精度来换取功耗、芯片面积和速度上的大幅节省。他们聚焦于 8×8 乘法器，这是数字信号处理中的常见构件，并不仅评估数值误差，还使用峰值信噪比（PSNR）和结构相似性（MSSIM）等标准指标，衡量这些近似如何实际影响最终图像质量。

用于快速乘法器的新型构件

设计的核心是一个称为 4:2 压缩器的组件，它将四个输入位和一个进位输入压缩为两个输出“和”和“进位”。传统压缩器使用电压模式的 CMOS 或 FinFET 晶体管，在极小工艺下更难扩展。本文则将电流模式逻辑与 7 纳米的碳纳米管场效应晶体管（CNTFET）相结合。通过将信息视为电流而非仅仅是电压，电路可以直接对电流求和，而无需大量门限检测电路。CNTFET 的阈值电压可通过改变纳米管直径来调节，使设计者能够用非常少的晶体管构建多数门、异或等基本门电路，具备较高的噪声裕度和较低的每次操作能耗。

六种“足够好”的压缩器变体

作者提出了六种新的 4:2 压缩器设计。四种是单模近似压缩器，各自以不同方式简化内部逻辑以减少功耗、延迟或误差。另两种为双功能压缩器，可通过电源门控在精确和近似行为间切换，从而在任一时刻只激活电路的一部分。针对这些选项，他们仔细测量了误差距离（输出偏离精确值的幅度）、输出仍然精确的频率，以及电路对工艺、电压和温度变化的鲁棒性。得益于 CNTFET 的电流模式方法，新型压缩器对此类变化的敏感性比可比的 CMOS 或 FinFET 设计低 30–50%，同时仅消耗约 12–25 微瓦并具有亚纳秒级的内部延迟。

面向图像和 AI 的两种乘法器设计

利用这些压缩器，团队构建了两种 8×8 Dadda 乘法器。第一种在每一列都使用近似压缩器，以最大化能量节省。第二种则采取更有选择性的策略：完全舍弃四个最低有效输出列（截断）、在中间列使用近似压缩器，并在最高有效列保留精确压缩器，因为那里出现错误会更易被察觉。HSPICE 和 MATLAB 的仿真显示，对于最佳配置，功耗降至约 0.52 mW，延迟降至 1.88 ns，功延乘积降至 0.97 pJ——相比之前的近似乘法器有显著改进。

对真实图像意味着什么

为验证这些节省在实际中的效果，作者运行了标准图像任务，如对两幅基准图像（经典的“摄影师”和“月球”）以及锐化处理进行乘法运算，并比较了精确乘法器与其近似设计生成的图像。尽管某些情况下内部算术误差可达 ±2，最佳提出的乘法器仍将结构相似性（MSSIM）从早期近似设计的大约 60% 提升到约 97%，并将 PSNR 提升了 15–20%。在视觉上，图像保持清晰细节，而底层硬件则显著降低能耗并加快运行速度，使该方法对低功耗相机、便携视觉系统和对电池寿命与速度更敏感而非绝对精确算术的边缘 AI 设备具有吸引力。

引用: Foroutan, P., Navi, K. Design of low power and high speed approximate multipliers utilizing current mode 4 to 2 compressors based on CNTFET technology. Sci Rep 16, 4834 (2026). https://doi.org/10.1038/s41598-026-35104-5

关键词: 近似乘法器, CNTFET, 图像处理, 低功耗电路, 电流模式逻辑