Clear Sky Science · sv

Design of low power and high speed approximate multipliers utilizing current mode 4 to 2 compressors based on CNTFET technology

· Tillbaka till index

Skarpare bilder med mindre energi

Varje gång din telefon tar ett foto, strömmar video eller kör ett AI‑filter utförs miljontals små multiplikationer. Att göra all denna matematik exakt kräver energi och saktar ner processerna, men det mänskliga ögat ser ofta inte små numeriska fel. Denna artikel visar hur man avsiktligt kan ”lätta” på delar av beräkningen med en ny typ av kretsar, vilket minskar effektförbrukning och fördröjning samtidigt som bilderna förblir visuellt omöjliga att skilja från exakta resultat.

Varför ofullkomlig matematik ändå kan se perfekt ut

Många moderna tillämpningar — som bildbehandling, video och maskininlärning — tål små fel naturligt. En svag förändring i ljusstyrkan hos en pixel eller en obetydlig förskjutning i ett filter är vanligtvis osynlig för oss. Författarna utnyttjar detta genom att använda approxima‑ tionsmultiplikatorer: kretsar som byter bort en del aritmetisk noggrannhet mot stora vinster i effekt, yta och hastighet. De fokuserar på 8×8‑multiplikatorer, en vanlig byggsten i digital signalbehandling, och utvärderar inte bara numeriska fel utan också hur dessa approximationer faktiskt påverkar slutlig bildkvalitet med standardmått som peak signal‑to‑noise ratio (PSNR) och strukturell likhet (MSSIM).

Figure 1
Figure 1.

En ny slags byggsten för snabba multiplikatorer

I hjärtat av konstruktionen finns en komponent som kallas 4:2‑kompressor, som reducerar fyra ingångsbitar och en carry‑ingång till två utgångar, ”sum” och ”carry”. Traditionella kompressorer använder voltage‑mode CMOS eller FinFET‑transistorer, vilka blir svårare att skala vid mycket små geometrier. Detta arbete kombinerar istället current‑mode‑logik med 7‑nanometers kolnanorörs‑fält‑effekttransistorer (CNTFET). Genom att betrakta information som strömmar snarare än enbart spänningar kan kretsarna summera strömmar direkt utan tunga tröskelavkännande kretsar. CNTFET:er, vars tröskelspänning kan justeras genom att ändra nanorörens diameter, gör det möjligt att bygga majoritets‑, XOR‑ och andra grundläggande grindar med mycket få transistorer, höga brusskyddsmarginaler och låg energi per operation.

Sexton varianter av ”tillräckligt bra” kompressorer

Författarna föreslår sex nya 4:2‑kompressordesigner. Fyra är enkelläges approximativa kompressorer, där varje variant utforskar olika sätt att förenkla intern logik för att minska effekt, fördröjning eller fel. Två är dual‑funktionella kompressorer som kan växla mellan exakt och approximativ funktion via strömbrytning, så att bara en del av kretsen är aktiv åt gången. För dessa alternativ mäter de noggrant felavstånd (hur mycket en utgång kan avvika från perfekt), hur ofta utgångar förblir exakta och hur robusta kretsarna är mot variationer i process, spänning och temperatur. Tack vare CNTFET‑current‑mode‑metoden är de nya kompressorerna 30–50 % mindre känsliga för sådana variationer än jämförbara CMOS‑ eller FinFET‑designer, samtidigt som de endast förbrukar cirka 12–25 mikrowatt med subnanosekunders interna fördröjningar.

Figure 2
Figure 2.

Två multiplikatordesigner för bilder och AI

Med dessa kompressorer bygger teamet två 8×8 Dadda‑multiplikatorer. Den första typen använder approximativa kompressorer i varje kolumn för maximal energibesparing. Den andra typen är mer selektiv: den tar bort helt de fyra minst signifikanta utgångskolumnerna (trunkering), använder approximativa kompressorer i mittkolumnerna och behåller exakta kompressorer i de mest signifikanta kolumnerna där fel skulle vara visuellt uppenbara. Simuleringar i HSPICE och MATLAB visar att för den bästa konfigurationen sjunker effekten till cirka 0,52 mW, latenstiden till 1,88 ns och effekt‑fördröjningsprodukten till 0,97 pJ — stora förbättringar jämfört med tidigare approximativa multiplikatorer.

Vad detta betyder för verkliga bilder

För att testa om dessa vinster spelar roll i praktiken kör författarna standardbilduppgifter, som att multiplicera två referensbilder (de klassiska ”cameraman” och ”moon”) och skärpning. De jämför bilder producerade av exakta multiplikatorer och deras approximativa designer. Trots interna aritmetiska fel upp till ±2 i vissa fall förbättrar den bästa föreslagna multiplikatorn strukturell likhet (MSSIM) från cirka 60 % i tidigare approximativa designer till ungefär 97 %, och ökar PSNR med 15–20 %. Visuellt förblir bilderna skarpa och detaljrika, medan hårdvaran bakom förbrukar betydligt mindre energi och kör snabbare, vilket gör tillvägagångssättet attraktivt för låg‑effektkameror, bärbara visionssystem och edge‑AI‑enheter där batteritid och hastighet väger tyngre än perfekt aritmetik.

Citering: Foroutan, P., Navi, K. Design of low power and high speed approximate multipliers utilizing current mode 4 to 2 compressors based on CNTFET technology. Sci Rep 16, 4834 (2026). https://doi.org/10.1038/s41598-026-35104-5

Nyckelord: approximate multipliers, CNTFET, image processing, low power circuits, current mode logic