Clear Sky Science · pl

Projekt niskomocowych i szybkich mnożników przybliżonych wykorzystujących kompresory 4 do 2 w trybie prądowym oparte na technologii CNTFET

· Powrót do spisu

Wyraźniejsze obrazy przy mniejszym zużyciu energii

Za każdym razem, gdy twój telefon wykonuje zdjęcie, odtwarza wideo lub stosuje filtr AI, przeprowadza miliony drobnych mnożeń. Wykonywanie tych wszystkich obliczeń dokładnie kosztuje energię i spowalnia działanie, podczas gdy ludzkie oko często nie dostrzega niewielkich błędów numerycznych. W artykule pokazano, jak celowo „poluzować” część tych obliczeń za pomocą nowego typu układów, zmniejszając zużycie energii i opóźnienia przy zachowaniu wizualnie nieodróżnialnych od dokładnych rezultatów obrazów.

Dlaczego niedoskonała matematyka może wyglądać na doskonałą

Wiele współczesnych zastosowań — takich jak przetwarzanie obrazu, wideo czy uczenie maszynowe — naturalnie toleruje drobne błędy. Niewielka zmiana jasności pojedynczego piksela lub drobne przesunięcie odpowiedzi filtra zazwyczaj pozostaje dla nas niewidoczne. Autorzy wykorzystują to, stosując mnożniki przybliżone: układy, które zamieniają część dokładności arytmetycznej na znaczne oszczędności energii, przestrzeni układu i czasu działania. Skupiają się na mnożnikach 8×8, powszechnym elemencie w przetwarzaniu sygnałów cyfrowych, i oceniają nie tylko błąd numeryczny, ale także to, jak te przybliżenia wpływają na końcową jakość obrazu przy użyciu standardowych miar, takich jak stosunek sygnału do szumu (PSNR) oraz strukturalne podobieństwo (MSSIM).

Figure 1
Figure 1.

Nowy typ bloku konstrukcyjnego dla szybkich mnożników

W sercu projektu znajduje się element zwany kompresorem 4:2, który redukuje cztery bity wejściowe i wejście przeniesienia do dwóch wyjść: „sumy” i „przeniesienia”. Tradycyjne kompresory używają tranzystorów CMOS w trybie napięciowym lub FinFET, które stają się trudniejsze do skalowania przy bardzo małych wymiarach. W tej pracy połączono zamiast tego logikę w trybie prądowym z 7‑nanometrowymi polami efektu tranzystorów opartymi na nanorurkach węglowych (CNTFET). Postrzegając informacje jako prądy zamiast tylko napięć, układy mogą bezpośrednio sumować prądy bez ciężkiej logiki detekcji progów. CNTFETy, których napięcie progowe można dostroić przez zmianę średnicy nanorurek, pozwalają projektantom zbudować bramki majority, XOR i inne podstawowe bramki przy użyciu bardzo niewielu tranzystorów, osiągając wysokie marginesy szumu i niskie zużycie energii na operację.

Sześć odmian „wystarczająco dobrych” kompresorów

Autorzy proponują sześć nowych projektów kompresorów 4:2. Cztery z nich to jednofunkcyjne kompresory przybliżone, z których każdy bada inną metodę upraszczania logiki wewnętrznej w celu redukcji mocy, opóźnienia lub błędu. Dwa pozostałe to kompresory o podwójnej funkcji, które mogą przełączać się między zachowaniem dokładnym a przybliżonym przy użyciu odcięcia zasilania, dzięki czemu tylko część układu jest aktywna w danym momencie. W ramach tych opcji autorzy starannie mierzą odległość błędu (jak daleko wyjście może odbiegać od ideału), jak często wyjścia są nadal dokładne oraz jak odporne są układy na zmiany procesu, napięcia i temperatury. Dzięki podejściu CNTFET w trybie prądowym nowe kompresory są o 30–50% mniej wrażliwe na takie wariacje niż porównywalne projekty CMOS lub FinFET, przy jednoczesnym poborze energii rzędu zaledwie 12–25 μW i wewnętrznych opóźnieniach poniżej nanosekundy.

Figure 2
Figure 2.

Dwa projekty mnożników dla obrazów i AI

Wykorzystując te kompresory, zespół zbudował dwa mnożniki Dadda 8×8. Pierwszy typ używa kompresorów przybliżonych w każdej kolumnie, maksymalizując oszczędność energii. Drugi typ stosuje bardziej selektywne podejście: całkowicie pomija cztery najmniej znaczące kolumny wyjściowe (przycinanie), używa kompresorów przybliżonych w kolumnach środkowych i zachowuje kompresory dokładne w najbardziej znaczących kolumnach, gdzie błędy byłyby wizualnie zauważalne. Symulacje w HSPICE i MATLAB pokazują, że dla najlepszej konfiguracji moc spada do około 0,52 mW, opóźnienie do 1,88 ns, a iloczyn moc‑opóźnienie do 0,97 pJ — znaczna poprawa w porównaniu z wcześniejszymi przybliżonymi mnożnikami.

Co to znaczy dla rzeczywistych obrazów

Aby sprawdzić, czy te oszczędności mają praktyczne znaczenie, autorzy przeprowadzili standardowe zadania obrazowe, takie jak mnożenie dwóch obrazów testowych (klasyczny „cameraman” i „moon”) oraz wyostrzanie. Porównali obrazy wygenerowane przez mnożniki dokładne i ich projekty przybliżone. Pomimo wewnętrznych błędów arytmetycznych sięgających w niektórych przypadkach ±2, najlepszy proponowany mnożnik poprawia wskaźnik strukturalnego podobieństwa (MSSIM) z około 60% w wcześniejszych projektach przybliżonych do około 97% i zwiększa PSNR o 15–20%. Wizualnie obrazy pozostają ostre i szczegółowe, podczas gdy sprzęt zużywa znacznie mniej energii i działa szybciej, co czyni to podejście atrakcyjnym dla aparatów niskiej mocy, przenośnych systemów wizji oraz urządzeń edge AI, gdzie żywotność baterii i szybkość są ważniejsze niż perfekcyjna arytmetyka.

Cytowanie: Foroutan, P., Navi, K. Design of low power and high speed approximate multipliers utilizing current mode 4 to 2 compressors based on CNTFET technology. Sci Rep 16, 4834 (2026). https://doi.org/10.1038/s41598-026-35104-5

Słowa kluczowe: mnożniki przybliżone, CNTFET, przetwarzanie obrazu, układy niskiego poboru mocy, logika w trybie prądowym