Clear Sky Science · pl
Podejście teorii informacji do ilościowego określania zależnej od sekwencji reakcji silników kwasów nukleinowych z zastosowaniami w sekwencjonowaniu DNA nanoporem
Odczytywanie DNA za pomocą maleńkich maszyn
Każda komórka w twoim ciele polega na mikroskopijnych maszynach, które przemieszczają się po DNA, kopiując je i naprawiając. Te same typy maszyn napędzają obecnie szybkie urządzenia do sekwencjonowania DNA. W pracy tej zadano pozornie proste pytanie o dużych implikacjach: poza zwykłymi sygnałami elektrycznymi używanymi w sekwencjonowaniu nanoporem, ile dodatkowych informacji o sekwencji DNA ukrytych jest w sposobie poruszania się tych maleńkich maszyn — w czasie ich pauz i częstotliwości cofnięć? Korzystając z narzędzi teorii informacji, autorzy pokazują, że te subtelne ruchy mogą znacząco zwiększyć dokładność odczytu DNA, i opisują, jak inżynierować lepsze molekularne silniki dla przyszłych technologii sekwencjonowania.

Jak nanopory zamieniają DNA w sygnały
Sekwencjonowanie nanoporem polega na przeciąganiu pojedynczego łańcucha DNA przez maleńki otwór w membranie przy jednoczesnym pomiarze przepływu jonów przez por. Gdy różne grupy zasad DNA zajmują najwęższą część poru, częściowo blokują prąd w charakterystyczny sposób, tworząc wzorzec elektryczny, który można rozszyfrować na sekwencję. Enzym-motor, tu helikaza o nazwie Hel308, chwyta DNA i przesuwa je przez por w małych krokach. Każde odczytanie sekwencji to zatem nie tylko ślad prądu, lecz także szczegółowy zapis ruchu helikazy: jak długo zatrzymuje się na każdej pozycji i czy czasem się cofa.
Wykorzystanie teorii informacji do pomiaru ukrytych wskazówek
Autorzy stosują pojęcie informacji wzajemnej, aby zmierzyć, jak silnie sekwencja DNA kontroluje różne obserwowalne wielkości: prąd jonowy, czas, jaki Hel308 spędza na każdym kroku, oraz prawdopodobieństwo cofnięcia się. Informacja wzajemna, mierzona w bitach, odpowiada na pytanie: średnio, ile możemy dowiedzieć się o zasadzie DNA z danego sygnału? Analizując tysiące pomiarów, stwierdzają, że prąd jonowy jest najbardziej czuły na krótki odcinek około czterech zasad położonych w przewężeniu poru, podczas gdy ruch Hel308 zależy głównie od zasad położonych 16–21 pozycji dalej. W szczególności zasady w dwóch pozycjach (około 17. i 20. nukleotydu od poru) silnie wpływają na czas przebywania enzymu i prawdopodobieństwo cofnięcia. Połączenie informacji o czasie przebywania i zachowaniu cofania ujawnia więcej o tych zasadach niż każda cecha osobno.
Budowanie map od ruchu do sekwencji
Urządzenia sekwencjonujące często polegają na modelach „k-mer”, które łączą małą grupę k sąsiednich zasad z charakterystycznym sygnałem. Tutaj autorzy adaptują ten pomysł do ruchu helikazy. Konstruują modele, w których konkretne pary lub trójki zasad na kluczowych pozycjach wspólnie determinują wzorzec czasów przebywania i cofnięć. Teoria informacji pokazuje, że niektóre kombinacje — takie jak zasady na pozycjach 17 i 20, albo trimery obejmujące pozycje 16, 17 i 20 — niosą znacznie więcej informacji niż jakakolwiek pojedyncza zasada. Innymi słowy, enzym nie „wyczuwa” tylko jednej zasady na raz; reaguje na niewielkie motywy sekwencyjne rozłożone wzdłuż nici, a te reakcje można systematycznie zmapować.

Symulowane sekwencjonowanie pokazuje duży zysk
Aby sprawdzić, jak użyteczne w praktyce mogą być te dodatkowe informacje oparte na ruchu, zespół zasymulował przebiegi sekwencjonowania nanoporem, używając realistycznych modeli zarówno prądu, jak i kinetyki. Następnie zastosowali algorytm dekodujący, aby odtworzyć sekwencje DNA z trzech typów wejścia: tylko z prądu, tylko z kinetyki lub z obu jednocześnie. Sam prąd jonowy już dobrze działa, podczas gdy kinetyka sama w sobie jest mniej dokładna. Ale gdy połączono oba sygnały, wskaźniki błędów spadają gwałtownie — w przybliżeniu czterokrotnie do pięciokrotnie przy dużym pokryciu w porównaniu z użyciem tylko prądu. Co ważne, niewielka liczba odczytów wykorzystujących oba sygnały może przewyższyć wiele odczytów wykorzystujących jedynie prąd, co sugeruje szybsze i dokładniejsze sekwencjonowanie, jeśli dane kinetyczne zostaną w pełni wykorzystane.
Dostrajanie samego silnika molekularnego
Badacze zbadali także, jak modyfikacja helikazy mogłaby dodatkowo poprawić wydajność. Kierując się danymi strukturalnymi, wprowadzili mutacje pojedynczych aminokwasów w Hel308, które kontaktują się z DNA, i przeanalizowali, jak te zmiany wpłynęły na czasy przebywania i cofnięcia. Większość mutacji miała niewielki efekt, ale kilka spowodowało duże, systematyczne przesunięcia w długości zatrzymań i częstotliwości cofnięć, przy zachowanej wrażliwości na sekwencję. Dwie pozycje w białku w szczególności odzwierciedlały kluczowe pozycje sekwencji wskazane przez analizę informacji, sugerując bezpośrednie powiązanie między konkretnymi aminokwasami a zachowaniem enzymu w wykrywaniu sekwencji. Praca pokazuje też kompromis: mutant niosący nieco więcej informacji na krok porusza się wolniej, więc jego całkowita informacja na sekundę jest podobna do enzymu pierwotnego.
Dlaczego to ma znaczenie dla przyszłego odczytu DNA
Dla czytelnika niebędącego specjalistą najważniejsze jest to, że sekwensery nanoporowe potrafią robić więcej niż tylko odczytywać wzorce elektryczne z DNA; mogą też „słuchać”, jak zachowuje się silnik molekularny, gdy przemieszcza się po nici. Ta praca dostarcza rygorystycznego sposobu pomiaru, ile dodatkowych informacji o sekwencji niesie ten ruch, i pokazuje, że ich uwzględnienie może znacznie poprawić dokładność, zwłaszcza w trudnych regionach, takich jak powtórzenia czy rozszerzone alfabety genetyczne. Wykorzystując teorię informacji jako narzędzie projektowe i przesiewowe, naukowcy mogą systematycznie inżynierować enzymy motorowe, których pauzy i zacięcia ułatwiają odczyt sekwencji DNA, otwierając drogę do szybszych, bardziej niezawodnych i wszechstronnych technologii sekwencjonowania.
Cytowanie: Craig, J.M., Laszlo, A.H., Brinkerhoff, H. et al. An information theory approach to quantifying the sequence-dependent response of nucleic acid motors with applications to nanopore DNA sequencing. Nat Commun 17, 3231 (2026). https://doi.org/10.1038/s41467-026-69867-2
Słowa kluczowe: sekwencjonowanie nanoporem, kinetyka helikazy, teoria informacji, enzymy motorowe DNA, modele k-mer