Clear Sky Science · sv

Lågströms omprogrammerbar DNA-baseavläsare med en effektiv HMM-accelerator för realtids nanopore-sekvensering

· Tillbaka till index

Varför små DNA-sekvenserare behöver smartare kretsar

Handhållna DNA-sekvenserare kan numera läsa ett mänskligt genom på timmar istället för år, vilket öppnar möjligheter för sängkantdiagnostik, utbrottsövervakning och fältbiologi långt från stora laboratorier. Men medan sensordelen blivit liten och snabb förbrukar beräkningarna som behövs för att omvandla råa elektriska svängningar till bokstäverna A, C, G och T fortfarande mycket energi. Denna artikel beskriver en specialiserad lågströmskrets som utför detta översättningssteg—kallat basecalling—mycket effektivare, vilket gör realtids, batteridriven DNA-analys mer praktiskt.

Från elektriska svängningar till genetisk kod

Moderna nanopore-sekvenserare drar DNA-strängar genom ett pyttelitet hål och mäter hur jonflödet förändras när baserna passerar. Istället för fyra rena signalnivåer producerar enheten en brusig tidsserie där varje mätning speglar flera intilliggande baser samtidigt. Det gör avkodningen till ett mönsterigenkänningsproblem under starkt brus. Basecalling-algoritmer måste sålla i dessa fluktuerande signaler och härleda vilka DNA-segment som mest sannolikt gav upphov till dem, eftersom alla senare steg—som att sammanställa genom eller hitta mutationer—avhänger av att denna första etapp blir rätt.

Figure 1
Figure 1.

En probabilistisk karta för brusiga signaler

Författarna bygger vidare på en teknik kallad Dolt Markov-modell (Hidden Markov Model), som behandlar DNA-avkodning som ett rörelsemönster genom ett nätverk av möjliga korta basmönster samtidigt som man observerar inkommande signal. Varje tillstånd i detta nätverk motsvarar en liten block av baser, och övergångar mellan tillstånd representerar hur DNA-strängen kan glida genom nanoporen. Med Viterbi-algoritmen söker systemet efter den mest sannolika vägen genom dessa tillstånd som skulle kunna ha producerat den observerade signalen. Detta tillvägagångssätt är attraktivt för hårdvara: det är matematiskt stringent, hanterar brus naturligt och kan skalas upp genom att lägga till fler tillstånd, samtidigt som kärnoperationerna—addering, jämförelser och lagring av numeriska poäng—är tillräckligt enkla för att hårdkodas på en krets.

Att utforma en slimmad, återanvändbar basecalling-motor

En enkel hårdvaruimplementation skulle avsätta separat logik för varje möjligt tillstånd och varje möjlig övergång, vilket ger hög hastighet men en mycket stor och energikrävande krets. I stället introducerar författarna en serial-parallell arkitektur som återanvänder mindre byggstenar över tiden. De börjar med att utforma en effektiv 16-tillstånds bearbetningsenhet och tillämpar sedan smart schemaläggning och delning så att denna block kan hantera en fullständig 64-tillstånds modell, och till och med återanvändas upprepade gånger för att stödja upp till 4096 tillstånd när det behövs. Viktiga knep inkluderar att organisera tillståndsövergångar så att många tillstånd delar samma aritmetikhårdvara, dela upp stora jämförelser i små fyra-ingångars steg och förberäkna kostsamma funktioner som logaritmer utanför kretsen. Tillsammans byter dessa val en måttlig ökning i bearbetningscykler mot en dramatisk minskning i kretsarea.

Att balansera hastighet, noggrannhet och batteritid

Tillverkad i en standard 130-nanometersprocess bearbetar den föreslagna basecallern ungefär 8 miljoner DNA-baser per sekund—snabbt nog för att hålla jämna steg med realtidssekvensering—samtidigt som den endast förbrukar 200 milliwatt effekt. Dess avkodningsnoggrannhet (94,3 %) överträffar flera mjukvaruverktyg som använder samma modelleringsmetod och slår marginellt en tidigare hårdvaruaccelerator, samtidigt som den använder fyra till sex gånger mindre effekt än många konkurrerande konstruktioner. Jämfört med djupinlärningsbaserade basecallers, som når några procentenheter högre noggrannhet men kräver wattklassad effekt och komplex hårdvara, offrar denna krets viss topprestanda i utbyte mot enklare, mer förutsägbar och betydligt energieffektivare drift. Mätningar och simuleringar bekräftar att fastpunktaritmetiken är tillräckligt exakt för att matcha flyttalsreferenser när den konfigureras med lämpliga bitbredder.

Figure 2
Figure 2.

Mot fickstor genomik

För icke-specialister är huvudbudskapet att detta arbete för DNA-avkodning närmare något som kan köras i en telefonstor enhet eller en fältanpassad analysator utan att förlita sig på skrymmande datorer eller effektkrävande grafikprocessorer. Genom att varsamt omforma en väletablerad statistisk metod till en kompakt, återanvändbar hårdvarumotor visar författarna att det är möjligt att läsa genom snabbt, noggrant och med måttlig energiförbrukning. I framtiden föreställer de sig att denna metod kan kombineras med lättare djupinlärningstekniker, men redan i sin nuvarande form erbjuder kretsen en stark grund för nästa generations mobila och inbyggda DNA-sekvenseringssystem.

Citering: Shahraki, A.S., Magierowski, S., Abbasi, M. et al. Low power reprogrammable DNA basecaller with an efficient HMM accelerator for real time nanopore sequencing. Sci Rep 16, 11425 (2026). https://doi.org/10.1038/s41598-026-41649-2

Nyckelord: nanopore-sekvensering, DNA-baseavläsning, lågeffekthårdvara, Dolt Markov-modell, ASIC-accelerator