Clear Sky Science · zh
利用基于 CNTFET 技术的电流模式 4 到 2 压缩器设计低功耗高速近似乘法器
更清晰的图像,消耗更少能量
每当你的手机拍照、播放视频或运行 AI 滤镜时,它都会执行数以百万计的小乘法运算。将这些计算全部精确完成会消耗大量能量并降低速度,然而人眼往往无法察觉微小的数值误差。本文展示了一种有意“放宽”部分运算精度的新型电路,通过这种方式在保持图像在视觉上与精确结果无异的同时,显著降低功耗和延迟。
为何不完美的算术仍能呈现完美画面
许多现代应用——如图像处理、视频和机器学习——天然对小误差具有容忍性。单个像素亮度的微小变化或滤波响应的轻微偏移通常对人眼不可见。作者利用这一点,采用近似乘法器:通过牺牲部分算术精度来换取功耗、芯片面积和速度上的大幅节省。他们聚焦于 8×8 乘法器,这是数字信号处理中的常见构件,并不仅评估数值误差,还使用峰值信噪比(PSNR)和结构相似性(MSSIM)等标准指标,衡量这些近似如何实际影响最终图像质量。 
用于快速乘法器的新型构件
设计的核心是一个称为 4:2 压缩器的组件,它将四个输入位和一个进位输入压缩为两个输出“和”和“进位”。传统压缩器使用电压模式的 CMOS 或 FinFET 晶体管,在极小工艺下更难扩展。本文则将电流模式逻辑与 7 纳米的碳纳米管场效应晶体管(CNTFET)相结合。通过将信息视为电流而非仅仅是电压,电路可以直接对电流求和,而无需大量门限检测电路。CNTFET 的阈值电压可通过改变纳米管直径来调节,使设计者能够用非常少的晶体管构建多数门、异或等基本门电路,具备较高的噪声裕度和较低的每次操作能耗。
六种“足够好”的压缩器变体
作者提出了六种新的 4:2 压缩器设计。四种是单模近似压缩器,各自以不同方式简化内部逻辑以减少功耗、延迟或误差。另两种为双功能压缩器,可通过电源门控在精确和近似行为间切换,从而在任一时刻只激活电路的一部分。针对这些选项,他们仔细测量了误差距离(输出偏离精确值的幅度)、输出仍然精确的频率,以及电路对工艺、电压和温度变化的鲁棒性。得益于 CNTFET 的电流模式方法,新型压缩器对此类变化的敏感性比可比的 CMOS 或 FinFET 设计低 30–50%,同时仅消耗约 12–25 微瓦并具有亚纳秒级的内部延迟。

面向图像和 AI 的两种乘法器设计
利用这些压缩器,团队构建了两种 8×8 Dadda 乘法器。第一种在每一列都使用近似压缩器,以最大化能量节省。第二种则采取更有选择性的策略:完全舍弃四个最低有效输出列(截断)、在中间列使用近似压缩器,并在最高有效列保留精确压缩器,因为那里出现错误会更易被察觉。HSPICE 和 MATLAB 的仿真显示,对于最佳配置,功耗降至约 0.52 mW,延迟降至 1.88 ns,功延乘积降至 0.97 pJ——相比之前的近似乘法器有显著改进。
对真实图像意味着什么
为验证这些节省在实际中的效果,作者运行了标准图像任务,如对两幅基准图像(经典的“摄影师”和“月球”)以及锐化处理进行乘法运算,并比较了精确乘法器与其近似设计生成的图像。尽管某些情况下内部算术误差可达 ±2,最佳提出的乘法器仍将结构相似性(MSSIM)从早期近似设计的大约 60% 提升到约 97%,并将 PSNR 提升了 15–20%。在视觉上,图像保持清晰细节,而底层硬件则显著降低能耗并加快运行速度,使该方法对低功耗相机、便携视觉系统和对电池寿命与速度更敏感而非绝对精确算术的边缘 AI 设备具有吸引力。
引用: Foroutan, P., Navi, K. Design of low power and high speed approximate multipliers utilizing current mode 4 to 2 compressors based on CNTFET technology. Sci Rep 16, 4834 (2026). https://doi.org/10.1038/s41598-026-35104-5
关键词: 近似乘法器, CNTFET, 图像处理, 低功耗电路, 电流模式逻辑