Clear Sky Science · ru
Энергоэффективный перепрограммируемый дешифратор оснований ДНК с ускорителем HMM для секвенирования нанопором в реальном времени
Почему крошечным секвенаторам ДНК нужны более умные чипы
Карманные секвенаторы ДНК теперь могут считывать человеческий геном за часы вместо лет, открывая возможности для постельной диагностики, отслеживания вспышек заболеваний и полевой биологии вдали от крупных лабораторий. Но хотя сенсорная часть стала маленькой и быстрой, вычисления, необходимые для преобразования сырых электрических сигналов в буквы A, C, G и T, по‑прежнему потребляют много энергии. В этой статье описан кастомный низкопотребляющий чип, который выполняет этот этап — называемый «бейсколлинг» — гораздо эффективнее, делая практичнее анализ ДНК в режиме реального времени на батарее.
От электрических «зигзагов» к генетическому коду
Современные нанопорные секвенаторы протягивают цепочки ДНК через крошечное отверстие и измеряют, как меняется поток ионов по мере прохождения оснований. Вместо четырёх чистых уровней сигнала устройство даёт зашумлённую временную последовательность, где каждое измерение отражает сразу несколько соседних оснований. Это превращает расшифровку последовательности в задачу распознавания шаблонов при сильном шуме. Алгоритмы бейсколлинга должны просеять эти меняющиеся сигналы и вывести, какие участки ДНК с наибольшей вероятностью их породили, потому что все последующие этапы — например сборка геномов или поиск мутаций — зависят от правильности этого первого шага.

Вероятностная карта для зашумлённых сигналов
Авторы опираются на метод, называемый Скрытой моделью Маркова, который рассматривает декодирование ДНК как перемещение по сети возможных коротких паттернов оснований при наблюдении входного сигнала. Каждое состояние в этой сети соответствует небольшому блоку оснований, а переходы между состояниями моделируют, как нить ДНК может сдвигаться через нанопору. С помощью алгоритма Витерби система ищет наиболее вероятный путь через эти состояния, который мог бы породить наблюдаемый сигнал. Этот подход привлекателен для аппаратной реализации: он математически обоснован, естественно учитывает шум и масштабируется за счёт добавления состояний, при этом его базовые операции — сложение, сравнение и хранение числовых оценок — достаточно просты, чтобы их можно было реализовать аппаратно на кристалле.
Проектирование компактного и многоразового движка для бейсколлинга
Прямая аппаратная реализация выделила бы отдельную схему для каждого возможного состояния и перехода, что дало бы высокую скорость, но огромный и энергоёмкий чип. Вместо этого авторы предлагают сериал-параллельную архитектуру, которая повторно использует меньшие блоки во времени. Они сначала разрабатывают эффективный блок обработки на 16 состояний, а затем применяют хитрое расписание и шаринг, чтобы этот блок мог обслуживать модель на 64 состояния и даже многократно переиспользоваться для поддержки до 4096 состояний при необходимости. Ключевые приёмы включают организацию переходов так, чтобы многие состояния делили одно и то же арифметическое оборудование, разбиение больших сравнений на небольшие четырёхвходовые стадии и предварительный вынос дорогостоящих функций, таких как логарифмы, за пределы кристалла. Вместе эти решения меняют умеренное увеличение числа тактов на драматическое сокращение аппаратной логики.
Баланс между скоростью, точностью и временем работы от батареи
Изготовленный по стандартному 130-нанометровому техпроцессу, предложенный бейсколлер обрабатывает около 8 миллионов оснований ДНК в секунду — достаточно быстро, чтобы идти в ногу с секвенированием в реальном времени — при потреблении всего 200 милливатт. Его точность декодирования (94,3%) превосходит ряд программных инструментов с тем же модельным подходом и немного опережает предыдущий аппаратный ускоритель, при этом он потребляет в четыре — шесть раз меньше энергии, чем многие конкурирующие разработки. По сравнению с нейросетевыми бейсколлерами, которые достигают на несколько процентных пунктов большей точности, но требуют ватт мощности и сложного аппаратного обеспечения, этот чип жертвует частью пикового результата в обмен на более простую, предсказуемую и значительно более энергоэффективную работу. Измерения и моделирование подтверждают, что фиксированная арифметика при выборе подходящих разрядностей достаточна по точности, чтобы соответствовать эталонным результатам на плавающей точке.

К карманной геномике
Для неспециалистов главный вывод в том, что эта работа приближает расшифровку ДНК к устройству, которое может работать внутри телефона‑размера или полевого анализатора без опоры на громоздкие компьютеры или энергоёмкие графические процессоры. Тщательно переработав хорошо изученный статистический метод в компактный, переиспользуемый аппаратный движок, авторы демонстрируют, что можно быстро, точно и экономно по энергии считывать геномы. В будущем они видят возможное сочетание этого подхода с более лёгкими методами глубокого обучения, но и в нынешнем виде чип предоставляет прочную основу для следующего поколения мобильных и встроенных систем секвенирования ДНК.
Цитирование: Shahraki, A.S., Magierowski, S., Abbasi, M. et al. Low power reprogrammable DNA basecaller with an efficient HMM accelerator for real time nanopore sequencing. Sci Rep 16, 11425 (2026). https://doi.org/10.1038/s41598-026-41649-2
Ключевые слова: секвенирование нанопором, дешифрование оснований ДНК, низкопотребляющее железо, Скрытая модель Маркова, ускоритель ASIC