Clear Sky Science · ru

Подход теории информации к количественной оценке зависимой от последовательности реакции нуклеиновых кислотных моторов с применением к нанопоровому секвенированию ДНК

· Назад к списку

Чтение ДНК с помощью крошечных машин

Каждая клетка вашего тела полагается на микроскопические машинки, которые перемещаются по ДНК, копируя и ремонтируя её. Те же типы машин теперь используются в быстрых устройствах для секвенирования ДНК. В этом исследовании задаётся внешне простой, но важный вопрос: помимо привычных электрических сигналов в нанопоровом секвенировании, сколько дополнительной информации о последовательности ДНК скрыто в том, как эти крошечные моторы движутся — как долго они останавливаются и как часто делают шаг назад? Используя инструменты теории информации, авторы показывают, что эти тонкие движения могут существенно повысить точность чтения ДНК, и описывают, как можно проектировать лучшие молекулярные моторы для будущих технологий секвенирования.

Figure 1
Figure 1.

Как нанопоры превращают ДНК в сигналы

Нанопоровое секвенирование работает за счёт протягивания одной нитки ДНК через крошечное отверстие в мембране при одновременном измерении потока ионов через пору. Когда разные участки оснований ДНК занимают самое узкое место поры, они частично блокируют ток по-разному, создавая характерный электрический паттерн, который можно расшифровать в последовательность. Моторный фермент, здесь хеликаз Hel308, захватывает ДНК и подаёт её через пору маленькими шагами. Каждое «прочтение» поэтому — не просто трасса тока, но и подробная запись движения хеликаза: как долго он ждёт на каждой позиции и случается ли у него обратный соскок.

Использование теории информации для измерения скрытых подсказок

Авторы применяют понятие взаимной информации, чтобы количественно оценить, насколько сильно последовательность ДНК контролирует разные наблюдаемые величины: ионный ток, время пребывания Hel308 на каждом шаге и вероятность его назадшага. Взаимная информация, измеряемая в битах, отвечает на вопрос: в среднем сколько можно узнать о базе ДНК по данному сигналу? Проанализировав тысячи измерений, исследователи обнаружили, что ионный ток наиболее чувствителен к короткому участку примерно из четырёх оснований, расположенных в сужении поры, тогда как движение Hel308 в основном определяется основаниями, находящимися на расстоянии 16–21 нуклеотидов. В частности, основания в двух позициях (примерно в 17-й и 20-й нуклеотидах от поры) сильно влияют на время пребывания фермента и на вероятность обратного шага. Сочетание информации о времени пребывания и обратных шагах раскрывает о этих основаниях больше, чем любая из характеристик по отдельности.

Построение карт от движения к последовательности

Устройства для секвенирования часто опираются на «k-мерные» модели, которые связывают небольшую группу из k соседних оснований с характерным сигналом. Здесь авторы адаптируют эту идею к движению хеликаза. Они строят модели, в которых определённые пары или триплеты оснований в ключевых позициях совместно определяют паттерн времён пребывания и обратных шагов. Теория информации показывает, что некоторые комбинации — например основания в позициях 17 и 20 или тримеры, включающие позиции 16, 17 и 20 — несут значительно больше информации, чем любое отдельное основание. Иными словами, фермент «ощущает» не только одно основание за раз; он реагирует на небольшие последовательностные мотивы, разбросанные вдоль нитки, и эти реакции можно системно сопоставить.

Figure 2
Figure 2.

Моделированное секвенирование показывает большой выигрыш

Чтобы проверить, насколько полезна эта дополнительная информация, основанная на движении, команда смоделировала прогон нанопорового секвенирования, используя реалистичные модели как для тока, так и для кинетики. Затем они применили алгоритм декодирования, чтобы восстановить последовательности ДНК из трёх типов входных данных: только ток, только кинетика или оба вместе. Только ионный ток уже даёт хорошее качество, тогда как кинетика в одиночку менее точна. Но при комбинировании обоих сигналов уровень ошибок резко падает — примерно в четыре-пять раз при высокой покрытости по сравнению с использованием только тока. Примечательно, что умеренное число прочтений, в которых используются оба сигнала, может превзойти значительно большее число прочтений, использующих лишь ток, что означает более быстрое и точное секвенирование при полном учёте кинетических данных.

Настройка самого молекулярного мотора

Исследователи также изучали, как изменение хеликаза может дополнительно повысить производительность. Руководствуясь структурными данными, они мутировали отдельные аминокислоты в Hel308, контактирующие с ДНК, и исследовали, как эти изменения влияют на времена пребывания и обратные шаги. Большинство мутаций мало меняли поведение, но некоторые вызывали крупные, систематические сдвиги в продолжительности задержек и частоте назадшагов, при этом сохраняя чувствительность к последовательности. Две позиции в белке, в частности, отражали ключевые позиции последовательности, выделенные анализом информации, что указывает на прямую связь между конкретными аминокислотами и способностью фермента чувствовать последовательность. В исследовании также показан компромисс: мутант, несущий немного больше информации за шаг, движется медленнее, поэтому его суммарная информация в секунду оказывается похожей на исходный фермент.

Почему это важно для будущего чтения ДНК

Для неспециалиста ключевая мысль состоит в том, что нанопоровые секвенаторы умеют не только считывать электрические паттерны от ДНК; они могут ещё «слушать», как ведёт себя молекулярный мотор, идя по нитке. Эта работа даёт строгий способ измерить, сколько дополнительной информации о последовательности содержится в этом движении, и показывает, что её включение может значительно повысить точность, особенно в трудных участках вроде повторов или при расширенных генетических алфавитах. Применяя теорию информации как инструмент проектирования и скрининга, учёные могут системно создавать моторные ферменты, чьи паузы и запинки делают последовательности ДНК легче для чтения, что открывает дорогу к более быстрому, надёжному и универсальному секвенированию.

Цитирование: Craig, J.M., Laszlo, A.H., Brinkerhoff, H. et al. An information theory approach to quantifying the sequence-dependent response of nucleic acid motors with applications to nanopore DNA sequencing. Nat Commun 17, 3231 (2026). https://doi.org/10.1038/s41467-026-69867-2

Ключевые слова: нанопоровое секвенирование, кинетика хеликаз, теория информации, ферменты-моторы ДНК, k-мерные модели