Clear Sky Science · pl
Argument z teorii informacji wyjaśniający ograniczenie biologicznych alfabetów do 4 nukleotydów i 20 aminokwasów
Dlaczego małe alfabety życia mają znaczenie
Wszystkie formy życia na Ziemi zapisują swoje „teksty” genetyczne i białkowe przy pomocy zaskakująco małych alfabetów: zaledwie czterech chemicznych liter dla DNA i RNA oraz dwudziestu dla białek. Chemicy potrafią wyobrazić sobie wiele więcej budulców — dlaczego zatem biologia ogranicza się do tych zestawów? W artykule przedstawiono argument, że odpowiedź leży w tym, jak łatwo te molekuły mogą się fałdować do użytecznych kształtów i jak skutecznie ewolucja potrafi przeszukiwać przestrzeń możliwych sekwencji. Łącząc idee z fizyki i teorii informacji, autorzy pokazują, że znane alfabety życia są wystarczająco duże, by molekuły fałdowały się niezawodnie i jednocześnie były podatne na ewolucję.
Od splątanych nici do użytecznych kształtów
Białka i RNA zaczynają jako elastyczne łańcuchy, które kręcą się przez niezliczone możliwe kształty. Tylko niewielka część tych kształtów jest stabilna i funkcjonalna. Aby życie działało, łańcuch musi szybko znaleźć swoje prawidłowe, złożone formy, nie próbując każdej możliwości losowo. Autorzy stosują soczewkę teorii informacji: gdy łańcuch się fałduje, „zyskuje informację”, wybierając jedną rodzinną postać spośród wielu alternatyw. Ten zysk można zmierzyć jako to, o ile zmniejsza się zakres możliwych kształtów na pozycję wzdłuż łańcucha. Porównują to z informacją zdobytą, gdy ewolucja odsiewa losowe sekwencje do tych, które faktycznie się fałdują, pokazując, że oba procesy muszą być zbalansowane, aby fałdowanie było szybkie i niezawodne.

Dopasowanie liter cyfrowych do ruchów fizycznych
Kluczowy wniosek to proste matematyczne powiązanie trzech rzeczy: rozmiaru chemicznego alfabetu, liczby kształtów, jakie każda pozycja w niepofałdowanym łańcuchu może przyjąć, oraz liczby różnych budulców, które faktycznie pojawiają się na tej pozycji w prawdziwych, ewoluowanych molekułach. Dla polimeru fałdującego się do dobrze określonej struktury teoria przewiduje, że liczba dostępnych pofałdowanych kształtów na pozycję oraz efektywna różnorodność liter stosowanych tam powinny być mniej więcej równe pierwiastkowi kwadratowemu z całkowitego rozmiaru alfabetu. Gdy autorzy podstawiają do wzorów pomiary z prawdziwych białek i RNA, stwierdzają, że średnia liczba pofałdowanych kształtów na pozycję i efektywna różnorodność liter per pozycja dobrze zgadzają się z tą przewidywaną wartością, zarówno dla jednego, jak i drugiego typu biopolimeru.
Dlaczego cztery nukleotydy i około dwadzieścia aminokwasów
W przypadku RNA badania eksperymentalne dotyczące giętkości szkieletu i użycia par zasad sugerują, że każdy nukleotyd ma około dwóch i pół istotnych pofałdowanych kształtów. Podniesienie tej wartości do kwadratu daje rozmiar alfabetu bardzo bliski czterem, dokładnie temu, czego używa życie. Dla białek szacunki dotyczące swobody łańcucha głównego i zmienności sekwencji wskazują na około cztery do pięciu efektywnych kształtów i efektywnych „liter” na pozycję, co prowadzi do optymalnego alfabetu rzędu około dwudziestu lub kilku tuzinów aminokwasów. Fakt, że współczesna biologia używa dwudziestu chemicznie odmiennych aminokwasów, pasuje do dolnego końca tego zakresu i jest zgodny z dodatkowymi ograniczeniami praktycznymi, takimi jak złożoność maszynerii syntezy białek i możliwość utrzymania różnych typów łańcuchów bocznych jako rozróżnialnych.
Wskazówki dotyczące wczesnych, luźnych białek życia
Następnie autorzy wykorzystują ramy teoretyczne jako okno na wczesną ewolucję. Łączą swoje wzory z wcześniejszymi rekonstrukcjami momentów, w których różne aminokwasy pojawiały się w kodzie genetycznym. Na najwcześniejszych etapach alfabet wydaje się być zbyt mały, aby wspierać stabilne, porządnie złożone białka w ogóle. Zamiast tego teoria przewiduje łańcuchy, które pozostawały bardzo elastyczne i nieuporządkowane, a mimo to mogły tworzyć krople lub luźne sieci, uważane za istotne dla prymitywnych, niemembranowych struktur przypominających komórki. W miarę dodawania kolejnych aminokwasów alfabet przekraczał próg, gdzie możliwe stały się pofałdowane białka — najpierw sprzyjając wewnętrznie nieuporządkowanym, lecz funkcjonalnym łańcuchom, a dopiero później pozwalając na ostro zdefiniowane struktury trójwymiarowe i wydajne katalizatory.

Co to znaczy dla ograniczeń życia
Mówiąc prostymi słowami, badanie sugeruje, że istnieje optymalny punkt między zbyt małą liczbą chemicznych liter, co utrudnia kodowanie specyficznych kształtów, a zbyt dużą, co czyni poszukiwanie użytecznych molekuł niemożliwie wolnym. Cztery nukleotydy i dwadzieścia aminokwasów na Ziemi leżą bardzo blisko tego optymalnego punktu, biorąc pod uwagę, jak „luźne” te łańcuchy są w wodzie. Poniżej tych rozmiarów alfabetów ewolucja miałaby trudności ze znalezieniem dobrze złożonych molekuł; powyżej nich dodawanie liter przynosiłoby niewielkie korzyści, ponieważ pojedyncza stabilna struktura może już być zakodowana. W tym ujęciu alfabety życia nie są arbitralne: są rozwiązaniami bliskimi minimalnym, które pozwalają cząsteczkom bogatym w informację zarówno szybko się fałdować, jak i efektywnie ewoluować.
Cytowanie: Galpern, E.A., Ferreiro, D.U. & Sánchez, I.E. An information-theoretic argument for the restriction of the current biological alphabets to 4 nucleotides and 20 amino acids. Sci Rep 16, 10751 (2026). https://doi.org/10.1038/s41598-026-46009-8
Słowa kluczowe: kod genetyczny, fałdowanie białek, struktura RNA, ewolucja molekularna, alfabety biopolimerów