Clear Sky Science · de

Entwurf energiearmer und hochperformanter angenäherter Multiplikatoren unter Verwendung von Strommodus‑4‑zu‑2‑Kompressoren auf Basis von CNTFET‑Technologie

· Zurück zur Übersicht

Scharfere Bilder bei geringerem Energieverbrauch

Jedes Mal, wenn Ihr Telefon ein Foto macht, ein Video streamt oder einen KI‑Filter ausführt, werden Millionen kleiner Multiplikationen durchgeführt. All diese Rechnungen exakt auszuführen kostet Energie und verlangsamt Abläufe, doch das menschliche Auge kann kleine numerische Fehler oft nicht wahrnehmen. Diese Arbeit zeigt, wie man bewusst einen Teil dieser Rechenarbeit „entschärft“ und dafür eine neue Art von Schaltung verwendet, um Energie und Verzögerung zu reduzieren, während Bilder visuell von exakten Ergebnissen kaum zu unterscheiden bleiben.

Warum ungenaue Mathematik dennoch perfekt wirken kann

Viele moderne Anwendungen – etwa Bildverarbeitung, Video und maschinelles Lernen – tolerieren kleine Fehler naturgemäß. Eine geringe Helligkeitsänderung eines Pixels oder eine winzige Verschiebung der Filterantwort ist für uns meist unsichtbar. Die Autoren nutzen dies, indem sie angenäherte Multiplikatoren einsetzen: Schaltungen, die etwas Rechengenauigkeit gegen große Einsparungen bei Energie, Fläche und Geschwindigkeit eintauschen. Sie konzentrieren sich auf 8×8‑Multiplikatoren, einen gängigen Baustein der digitalen Signalverarbeitung, und bewerten nicht nur numerische Fehler, sondern auch, wie sich diese Annäherungen tatsächlich auf die finale Bildqualität auswirken, mithilfe standardisierter Metriken wie Peak Signal‑to‑Noise Ratio (PSNR) und strukturähnlicher Maßzahlen (MSSIM).

Figure 1
Figure 1.

Ein neuer Baustein für schnelle Multiplikatoren

Im Kern des Entwurfs steht eine Komponente namens 4:2‑Kompressor, die vier Eingangsbits und einen Eingangsträger in zwei Ausgänge, „Summe“ und „Carry“, reduziert. Traditionelle Kompressoren verwenden spannungsbasierte CMOS‑ oder FinFET‑Transistoren, die bei sehr kleinen Technologien schwerer skalieren. Diese Arbeit kombiniert stattdessen Strommodus‑Logik mit 7‑Nanometer‑Carbon‑Nanotube‑Field‑Effect‑Transistoren (CNTFETs). Indem Informationen als Ströme statt nur als Spannungen betrachtet werden, können die Schaltungen Ströme direkt aufsummieren, ohne aufwändige Schwellwert‑Detektionslogik. CNTFETs, deren Schwellenspannung durch Änderung des Nanoröhrchendurchmessers einstellbar ist, erlauben den Entwurf von Majority‑, XOR‑ und anderen Grundgattern mit sehr wenigen Transistoren, hohen Rauschabständen und geringer Energie pro Operation.

Sechs Varianten „gut genug“ Kompressoren

Die Autoren schlagen sechs neue 4:2‑Kompressor‑Designs vor. Vier sind einmodale angenäherte Kompressoren, die jeweils verschiedene Wege zur Vereinfachung der internen Logik und zur Reduktion von Leistung, Verzögerung oder Fehler erkunden. Zwei weitere sind duale Kompressoren, die mittels Power‑Gating zwischen exaktem und angenähertem Verhalten umschalten können, sodass jeweils nur ein Teil der Schaltung aktiv ist. Über diese Optionen hinweg messen sie sorgfältig die Fehlerdistanz (wie weit ein Ausgang vom idealen Wert abweichen kann), wie oft Ausgänge noch exakt sind und wie robust die Schaltungen gegenüber Prozess‑, Spannungs‑ und Temperaturvariationen sind. Dank des CNTFET‑Strommodusansatzes sind die neuen Kompressoren 30–50 % weniger empfindlich gegenüber solchen Variationen als vergleichbare CMOS‑ oder FinFET‑Entwürfe, bei einem Verbrauch von nur etwa 12–25 Mikrowatt und sub‑nanosekündigen internen Verzögerungen.

Figure 2
Figure 2.

Zwei Multiplikator‑Designs für Bildverarbeitung und KI

Mit diesen Kompressoren baut das Team zwei 8×8‑Dadda‑Multiplikatoren. Der erste Typ verwendet angenäherte Kompressoren in jeder Spalte und maximiert so die Energieeinsparung. Der zweite Typ geht selektiver vor: Er lässt die vier am wenigsten signifikanten Ausgabespalten vollständig weg (Trunkierung), verwendet angenäherte Kompressoren in den mittleren Spalten und behält in den höchsten Spalten exakte Kompressoren, wo Fehler visuell offensichtlich wären. Simulationen in HSPICE und MATLAB zeigen, dass für die beste Konfiguration die Leistung auf etwa 0,52 mW sinkt, die Latenz auf 1,88 ns und das Leistungs‑Latenz‑Produkt auf 0,97 pJ – große Verbesserungen gegenüber früheren angenäherten Multiplikatoren.

Was das für echte Bilder bedeutet

Um zu prüfen, ob diese Einsparungen in der Praxis relevant sind, führen die Autoren standardisierte Bildaufgaben durch, wie das Multiplizieren zweier Benchmark‑Bilder (dem klassischen „Cameraman“ und dem „Moon“) und Schärfen. Sie vergleichen die von exakten Multiplikatoren erzeugten Bilder mit denen ihrer angenäherten Entwürfe. Trotz interner arithmetischer Fehler von bis zu ±2 in einigen Fällen verbessert der beste vorgeschlagene Multiplikator die strukturelle Ähnlichkeit (MSSIM) von etwa 60 % bei früheren angenäherten Designs auf rund 97 % und erhöht die PSNR um 15–20 %. Visuell bleiben die Bilder scharf und detailreich, während die zugrunde liegende Hardware deutlich weniger Energie verbraucht und schneller arbeitet – ein attraktiver Ansatz für energiearme Kameras, tragbare Visionsysteme und Edge‑KI‑Geräte, bei denen Batterielaufzeit und Geschwindigkeit wichtiger sind als perfekte Arithmetik.

Zitation: Foroutan, P., Navi, K. Design of low power and high speed approximate multipliers utilizing current mode 4 to 2 compressors based on CNTFET technology. Sci Rep 16, 4834 (2026). https://doi.org/10.1038/s41598-026-35104-5

Schlüsselwörter: approximate multipliers, CNTFET, image processing, low power circuits, current mode logic