Clear Sky Science · ru
Подход теории информации к количественной оценке зависимой от последовательности реакции нуклеиновых кислотных моторов с применением к нанопоровому секвенированию ДНК
Чтение ДНК с помощью крошечных машин
Каждая клетка вашего тела полагается на микроскопические машинки, которые перемещаются по ДНК, копируя и ремонтируя её. Те же типы машин теперь используются в быстрых устройствах для секвенирования ДНК. В этом исследовании задаётся внешне простой, но важный вопрос: помимо привычных электрических сигналов в нанопоровом секвенировании, сколько дополнительной информации о последовательности ДНК скрыто в том, как эти крошечные моторы движутся — как долго они останавливаются и как часто делают шаг назад? Используя инструменты теории информации, авторы показывают, что эти тонкие движения могут существенно повысить точность чтения ДНК, и описывают, как можно проектировать лучшие молекулярные моторы для будущих технологий секвенирования.

Как нанопоры превращают ДНК в сигналы
Нанопоровое секвенирование работает за счёт протягивания одной нитки ДНК через крошечное отверстие в мембране при одновременном измерении потока ионов через пору. Когда разные участки оснований ДНК занимают самое узкое место поры, они частично блокируют ток по-разному, создавая характерный электрический паттерн, который можно расшифровать в последовательность. Моторный фермент, здесь хеликаз Hel308, захватывает ДНК и подаёт её через пору маленькими шагами. Каждое «прочтение» поэтому — не просто трасса тока, но и подробная запись движения хеликаза: как долго он ждёт на каждой позиции и случается ли у него обратный соскок.
Использование теории информации для измерения скрытых подсказок
Авторы применяют понятие взаимной информации, чтобы количественно оценить, насколько сильно последовательность ДНК контролирует разные наблюдаемые величины: ионный ток, время пребывания Hel308 на каждом шаге и вероятность его назадшага. Взаимная информация, измеряемая в битах, отвечает на вопрос: в среднем сколько можно узнать о базе ДНК по данному сигналу? Проанализировав тысячи измерений, исследователи обнаружили, что ионный ток наиболее чувствителен к короткому участку примерно из четырёх оснований, расположенных в сужении поры, тогда как движение Hel308 в основном определяется основаниями, находящимися на расстоянии 16–21 нуклеотидов. В частности, основания в двух позициях (примерно в 17-й и 20-й нуклеотидах от поры) сильно влияют на время пребывания фермента и на вероятность обратного шага. Сочетание информации о времени пребывания и обратных шагах раскрывает о этих основаниях больше, чем любая из характеристик по отдельности.
Построение карт от движения к последовательности
Устройства для секвенирования часто опираются на «k-мерные» модели, которые связывают небольшую группу из k соседних оснований с характерным сигналом. Здесь авторы адаптируют эту идею к движению хеликаза. Они строят модели, в которых определённые пары или триплеты оснований в ключевых позициях совместно определяют паттерн времён пребывания и обратных шагов. Теория информации показывает, что некоторые комбинации — например основания в позициях 17 и 20 или тримеры, включающие позиции 16, 17 и 20 — несут значительно больше информации, чем любое отдельное основание. Иными словами, фермент «ощущает» не только одно основание за раз; он реагирует на небольшие последовательностные мотивы, разбросанные вдоль нитки, и эти реакции можно системно сопоставить.

Моделированное секвенирование показывает большой выигрыш
Чтобы проверить, насколько полезна эта дополнительная информация, основанная на движении, команда смоделировала прогон нанопорового секвенирования, используя реалистичные модели как для тока, так и для кинетики. Затем они применили алгоритм декодирования, чтобы восстановить последовательности ДНК из трёх типов входных данных: только ток, только кинетика или оба вместе. Только ионный ток уже даёт хорошее качество, тогда как кинетика в одиночку менее точна. Но при комбинировании обоих сигналов уровень ошибок резко падает — примерно в четыре-пять раз при высокой покрытости по сравнению с использованием только тока. Примечательно, что умеренное число прочтений, в которых используются оба сигнала, может превзойти значительно большее число прочтений, использующих лишь ток, что означает более быстрое и точное секвенирование при полном учёте кинетических данных.
Настройка самого молекулярного мотора
Исследователи также изучали, как изменение хеликаза может дополнительно повысить производительность. Руководствуясь структурными данными, они мутировали отдельные аминокислоты в Hel308, контактирующие с ДНК, и исследовали, как эти изменения влияют на времена пребывания и обратные шаги. Большинство мутаций мало меняли поведение, но некоторые вызывали крупные, систематические сдвиги в продолжительности задержек и частоте назадшагов, при этом сохраняя чувствительность к последовательности. Две позиции в белке, в частности, отражали ключевые позиции последовательности, выделенные анализом информации, что указывает на прямую связь между конкретными аминокислотами и способностью фермента чувствовать последовательность. В исследовании также показан компромисс: мутант, несущий немного больше информации за шаг, движется медленнее, поэтому его суммарная информация в секунду оказывается похожей на исходный фермент.
Почему это важно для будущего чтения ДНК
Для неспециалиста ключевая мысль состоит в том, что нанопоровые секвенаторы умеют не только считывать электрические паттерны от ДНК; они могут ещё «слушать», как ведёт себя молекулярный мотор, идя по нитке. Эта работа даёт строгий способ измерить, сколько дополнительной информации о последовательности содержится в этом движении, и показывает, что её включение может значительно повысить точность, особенно в трудных участках вроде повторов или при расширенных генетических алфавитах. Применяя теорию информации как инструмент проектирования и скрининга, учёные могут системно создавать моторные ферменты, чьи паузы и запинки делают последовательности ДНК легче для чтения, что открывает дорогу к более быстрому, надёжному и универсальному секвенированию.
Цитирование: Craig, J.M., Laszlo, A.H., Brinkerhoff, H. et al. An information theory approach to quantifying the sequence-dependent response of nucleic acid motors with applications to nanopore DNA sequencing. Nat Commun 17, 3231 (2026). https://doi.org/10.1038/s41467-026-69867-2
Ключевые слова: нанопоровое секвенирование, кинетика хеликаз, теория информации, ферменты-моторы ДНК, k-мерные модели