Clear Sky Science · ru
Проектирование энергоэффективных и высокоскоростных приближённых умножителей с использованием 4‑в‑2 компрессоров в токовом режиме на базе CNTFET‑технологии
Более чёткие изображения при меньшем энергопотреблении
Каждый раз, когда ваш телефон делает снимок, стримит видео или применяет фильтр на основе ИИ, он выполняет миллионы мелких умножений. Выполнять все эти вычисления точно дорого по энергии и замедляет систему, тогда как человеческий глаз часто не замечает небольших численных ошибок. В этой статье показано, как целенаправленно «ослаблять» часть вычислений с помощью нового типа схем, снижая энергопотребление и задержку, при этом оставляя изображения визуально неотличимыми от точных результатов.
Почему неточная арифметика всё ещё может выглядеть идеально
Многие современные приложения — такие как обработка изображений, видео и машинное обучение — по природе своей допускают небольшие ошибки. Незначительное изменение яркости одного пикселя или небольшое смещение отклика фильтра обычно незаметно для человека. Авторы используют это, применяя приближённые умножители: схемы, которые жертвуют частью арифметической точности ради существенной экономии энергии, площади кристалла и скорости. Они сосредотачиваются на 8×8 умножителях, распространённом элементе в цифровой обработке сигналов, и оценивают не только числовую ошибку, но и то, как эти приближения действительно влияют на качество финального изображения с помощью стандартных метрик, таких как отношение сигнал/шум в пикселе (PSNR) и структурное сходство (MSSIM). 
Новый тип строительного блока для быстрых умножителей
В основе конструкции лежит компонент под названием 4:2 компрессор, который сводит четыре входных бита и вход переноса в два выхода — «сумму» и «перенос». Традиционные компрессоры используют транзисторы в напряженческом режиме (CMOS или FinFET), которые сложнее масштабировать при очень малых размерах. В этой работе вместо этого комбинируют логику в токовом режиме с 7‑нанометровыми полевыми транзисторами на углеродных нанотрубках (CNTFET). Рассматривая информацию как токи, а не только как напряжения, схемы могут непосредственно суммировать токи без громоздкой логики порогового обнаружения. CNTFET, у которых пороговое напряжение можно настраивать изменением диаметра нанотрубки, позволяют конструкторам строить элементы большинства, XOR и другие базовые вентили с очень небольшим числом транзисторов, с высокими запасами шума и низким энергопотреблением на операцию.
Шесть вариантов «достаточно хороших» компрессоров
Авторы предлагают шесть новых конструкций 4:2 компрессоров. Четыре — однорежимные приближённые компрессоры, каждый из которых исследует разные способы упрощения внутренней логики для уменьшения потребляемой мощности, задержки или ошибки. Ещё два — это компрессоры с двумя режимами, которые могут переключаться между точным и приближённым поведением с помощью power‑gating, так что активна только одна часть схемы. По всем вариантам тщательно измеряют расстояние ошибки (насколько выход может отклоняться от идеала), как часто выходы остаются точными и насколько схемы устойчивы к изменениям процесса, напряжения и температуры. Благодаря подходу на базе CNTFET в токовом режиме новые компрессоры на 30–50% менее чувствительны к таким вариациям по сравнению с сопоставимыми CMOS или FinFET‑решениями, при этом потребляют всего около 12–25 мкВт с внутренними задержками субнаносекундного порядка. 
Две конструкции умножителей для изображений и ИИ
Используя эти компрессоры, команда строит два 8×8 умножителя по схеме Дадда. Первый тип применяет приближённые компрессоры во всех столбцах, максимально экономя энергию. Второй тип более избирателен: он полностью отбрасывает четыре наименее значимых столбца выхода (усечение), использует приближённые компрессоры в средних столбцах и сохраняет точные компрессоры в старших столбцах, где ошибки будут визуально заметны. Моделирование в HSPICE и MATLAB показывает, что для лучшей конфигурации мощность падает до примерно 0,52 мВт, задержка — до 1,88 нс, а произведение мощности на задержку — до 0,97 пДж, что является существенным улучшением по сравнению с предыдущими приближенными умножителями.
Что это означает для реальных изображений
Чтобы проверить практическую значимость этих экономий, авторы прогоняют стандартные задачи обработки изображений, такие как умножение двух эталонных изображений (классические «cameraman» и «moon») и повышение резкости. Они сравнивают изображения, полученные с помощью точных умножителей и их приближённых дизайнов. Несмотря на внутренние арифметические ошибки до ±2 в некоторых случаях, лучший предложенный умножитель улучшает структурное сходство (MSSIM) с примерно 60% в ранних приближённых разработках до примерно 97%, а PSNR увеличивается на 15–20%. Визуально изображения остаются чёткими и детализированными, при этом аппаратная часть потребляет значительно меньше энергии и работает быстрее, делая этот подход привлекательным для маломощных камер, портативных систем компьютерного зрения и периферийных ИИ‑устройств, где время работы от батареи и скорость важнее безупречной арифметики.
Цитирование: Foroutan, P., Navi, K. Design of low power and high speed approximate multipliers utilizing current mode 4 to 2 compressors based on CNTFET technology. Sci Rep 16, 4834 (2026). https://doi.org/10.1038/s41598-026-35104-5
Ключевые слова: приближённые умножители, CNTFET, обработка изображений, низкопотребляющие схемы, логика в токовом режиме