Clear Sky Science · nl

Laag-energetische herprogrammeerbare DNA-basecaller met een efficiënte HMM-versneller voor realtime nanopore-sequencing

· Terug naar het overzicht

Waarom kleine DNA-sequencers slimere chips nodig hebben

Handformaat DNA-sequencers kunnen nu een menselijk genoom in uren in plaats van jaren lezen, waardoor mogelijkheden ontstaan voor beddiagnostiek, uitbraaktracering en veldbiologie ver van grote laboratoria. Hoewel de sensortechniek klein en snel is geworden, vergt de berekening om ruwe elektrische golfpatronen om te zetten in de letters A, C, G en T nog steeds veel stroom. Dit artikel beschrijft een speciaal laag-energetisch circuit dat deze vertaalslag—basecalling—veel efficiënter uitvoert, waardoor realtime DNA-analyse op batterijen praktischer wordt.

Van elektrische pieken tot genetische code

Moderne nanopore-sequencers trekken DNA-strengen door een piepklein gaatje en meten hoe de ionenstroom verandert terwijl de basen passeren. In plaats van vier heldere signaalniveaus levert het apparaat een ruisachtige tijdreeks waarbij elke meting meerdere naburige basen tegelijk weerspiegelt. Dat maakt het decoderen van de sequentie tot een patroonherkenningsprobleem met veel ruis. Basecalling-algoritmen moeten deze fluctuerende signalen doorzoeken en afleiden welke DNA-streken waarschijnlijk hun oorsprong vormen, omdat alle volgende stappen—zoals het assembleren van genomen of het vinden van mutaties—afhankelijk zijn van een correcte eerste stap.

Figure 1
Figure 1.

Een probabilistisch routeplan voor rumoerige signalen

De auteurs bouwen voort op een techniek genaamd het Hidden Markov Model, dat DNA-decodering behandelt als het bewegen door een netwerk van mogelijke korte basepatronen terwijl het inkomende signaal wordt geobserveerd. Elke staat in dit netwerk komt overeen met een klein blokje basen, en overgangen tussen staten geven aan hoe de DNA-streng door de nanopore kan schuiven. Met het Viterbi-algoritme zoekt het systeem het meest waarschijnlijke pad door deze staten dat het waargenomen signaal zou kunnen hebben geproduceerd. Deze benadering is aantrekkelijk voor hardware: hij is wiskundig solide, gaat op natuurlijke wijze met ruis om en kan opgeschaald worden door meer staten toe te voegen, terwijl de kernbewerkingen—optellen, vergelijken en opslaan van numerieke scores—simpel genoeg zijn om in hardware te implementeren.

Het ontwerpen van een slanke, herbruikbare basecalling-engine

Een directe hardware-implementatie zou aparte schakelingen toewijzen aan elke mogelijke staat en elke mogelijke overgang, wat hoge snelheid oplevert maar een zeer grote en stroomvretende chip tot gevolg heeft. In plaats daarvan introduceren de auteurs een serieel-parallelle architectuur die kleinere bouwblokken in de tijd hergebruikt. Eerst ontwerpen ze een efficiënt 16-staten verwerkingsblok en passen dan slimme planning en delen toe zodat dit blok een volledig 64-staten model kan afhandelen, en zelfs herhaaldelijk kan worden hergebruikt om tot 4096 staten te ondersteunen wanneer dat nodig is. Belangrijke trucs zijn het organiseren van staatsovergangen zodat veel staten dezelfde rekenhardware delen, het opsplitsen van grote vergelijkingen in kleine vier-ingangsfasen, en het vooraf berekenen van kostbare functies zoals logaritmen buiten de chip. Samen ruilen deze keuzes een bescheiden toename in verwerkingscycli in voor een dramatische vermindering van de schakelingcomplexiteit.

Het balanceren van snelheid, nauwkeurigheid en batterijduur

Gefabriceerd in een standaard 130-nanometer chipproces verwerkt de voorgestelde basecaller ongeveer 8 miljoen DNA-basen per seconde—snel genoeg om realtime sequencing bij te houden—terwijl hij slechts 200 milliwatt verbruikt. De decoderingnauwkeurigheid (94,3%) overtreft verschillende softwaretools die dezelfde modelleeraanpak gebruiken en steekt ietsjes boven een eerdere hardwareversneller uit, terwijl hij vier tot zes keer minder vermogen gebruikt dan veel concurrerende ontwerpen. Vergeleken met deep-learning basecallers, die een paar procentpunten hogere nauwkeurigheid bereiken maar watts aan vermogen en complexe hardware vereisen, offert deze chip wat piekprestaties op in ruil voor eenvoudigere, beter voorspelbare en veel energie-efficiëntere werking. Metingen en simulaties bevestigen dat de vaste-kommarekenkunde precies genoeg is om de floating-point referentie-uitkomsten te evenaren wanneer geschikt gekozen bitbreedtes worden toegepast.

Figure 2
Figure 2.

Op weg naar zakformaat genomica

Voor niet-specialisten is de belangrijkste conclusie dat dit werk DNA-decodering dichterbij brengt iets dat in een telefoonformaat apparaat of een veldgeschikte analyser kan draaien zonder afhankelijk te zijn van omvangrijke computers of stroomvretende grafische processoren. Door een goed begrepen statistische methode zorgvuldig te hervormen tot een compact, herbruikbaar hardwareblok laten de auteurs zien dat het mogelijk is genomen snel, nauwkeurig en met zuinig energiegebruik te lezen. In de toekomst voorzien zij een combinatie van deze aanpak met lichtere deep-learningtechnieken, maar zelfs in de huidige vorm biedt de chip een sterke basis voor de volgende generatie mobiele en ingebedde DNA-sequencing systemen.

Bronvermelding: Shahraki, A.S., Magierowski, S., Abbasi, M. et al. Low power reprogrammable DNA basecaller with an efficient HMM accelerator for real time nanopore sequencing. Sci Rep 16, 11425 (2026). https://doi.org/10.1038/s41598-026-41649-2

Trefwoorden: nanopore-sequencing, DNA-basecalling, laag-energetische hardware, Hidden Markov Model, ASIC-versneller