Clear Sky Science · pl
POLYT5: encodująco-dekodujący model podstawowy języka chemicznego do generatywnego projektowania polimerów
Nauczanie komputerów języka tworzyw
Tworzywa sztuczne i inne polimery są wszędzie — od obudów telefonów i przewodów zasilających po akumulatory w pojazdach elektrycznych. Jednak odkrywanie nowych polimerów o odpowiednim połączeniu wytrzymałości, elastyczności i właściwości elektrycznych jest powolne i kosztowne. Ten artykuł przedstawia POLYT5, system sztucznej inteligencji, który uczy się „języka” polimerów, aby jednocześnie przewidywać ich własności i wymyślać obiecujące nowe materiały, pomagając naukowcom szybko projektować materiały do zaawansowanej elektroniki i magazynowania energii.

Dlaczego trudno znaleźć nowe polimery
Projektowanie nowego polimeru przypomina poszukiwanie jednej użytecznej sentencji w bibliotece wszystkich możliwych kombinacji liter. Chemicy mogą modyfikować elementy budulcowe i testować wyniki, ale liczba możliwości jest astronomiczna. Tradycyjne metody uczenia maszynowego pomagają w przewidywaniu własności znanych polimerów, jednak te narzędzia zwykle opierają się na ręcznie opracowanych deskryptorach numerycznych i nadal wymagają, by ludzie zgadywali, które struktury testować. Ogólne duże modele językowe potrafią generować molekuły, ale często brakuje im chemicznego „zdrowego rozsądku” potrzebnego do wiarygodnego projektowania materiałów — tworzą wzory, które na papierze wyglądają poprawnie, lecz są nierealistyczne lub niesyntezowalne w laboratorium.
Wyposażyć SI w słownictwo skoncentrowane na polimerach
POLYT5 rozwiązuje to wyzwanie, trenując model językowy specjalnie na strukturach polimerów, zamiast na ogólnym tekście. Autorzy zebrali rozległy zestaw treningowy: ponad 12 000 rzeczywistych polimerów z literatury oraz ponad 100 milionów hipotetycznych polimerów wygenerowanych przy użyciu dobrze ugruntowanych reakcji stosowanych przez chemików. Aby wprowadzić te struktury do modelu językowego, przekształcili każdy polimer w odporną reprezentację tekstową gwarantującą chemiczną poprawność. Specjalne tokeny oznaczają końce jednostki powtarzalnej i kodują proste informacje o własnościach. Wykorzystując architekturę enkoder–dekoder T5, POLYT5 uczy się rekonstruować zamaskowane fragmenty tych ciągów, stopniowo internalizując powtarzające się wzorce — takie jak powszechne szkielety i grupy funkcyjne — oraz zależności między nimi a zachowaniem materiału.
Od czytania polimerów do przewidywania ich zachowania
Po tym szeroko zakrojonym treningu POLYT5 jest dopracowywany do zadań praktycznych. Jeden zestaw modeli przewiduje kluczowe własności polimerów: temperaturę przejścia szkła (gdzie tworzywo staje się miększe), temperatury topnienia i rozkładu, szerokość przerwy energetycznej (band gap), stałą dielektryczną (jak dobrze magazynuje energię elektryczną) oraz rozpuszczalność w różnych cieczach. Na tysiącach przykładów przewidywania modelu dobrze pokrywają się ze znanymi wartościami, z błędami porównywalnymi lub lepszymi niż wcześniejsze podejścia uczenia maszynowego. Co ważne, POLYT5 potrafi obsługiwać wiele różnych właściwości przy tej samej reprezentacji bazowej, redukując potrzebę dedykowanych cech czy osobnych narzędzi dla każdego zadania.

Poprosić model o wynalezienie nowych materiałów
Ta sama ramówka może działać też w odwrotnym kierunku: zamiast przewidywać własności dla danego polimeru, POLYT5 może generować struktury polimerów odpowiadające pożądanemu celowi. Autorzy skupili się na temperaturze przejścia szkła, ponieważ ma ona kluczowe znaczenie dla stabilności mechanicznej i termicznej w urządzeniach. Podając modelowi docelową wartość — na przykład 500 kelwinów — prosili go o wygenerowanie tekstowych reprezentacji hipotetycznych polimerów, które miałyby zmięknąć w przybliżeniu przy tej temperaturze. Zespół badał, jak ustawienia próbkowania wpływają na równowagę między różnorodnością a poprawnością, ostatecznie wygenerowano ponad sześć milionów unikalnych, chemicznie sensownych kandydatów skoncentrowanych wokół wybranej temperatury, pozostających jednocześnie strukturalnie odmiennymi od znanych polimerów.
Znaleźć kilka pereł wśród milionów
Aby pokazać realny wpływ, badacze skierowali POLYT5 na konkretny cel: polimery do wysokowydajnych izolatorów elektrycznych i urządzeń do magazynowania energii. Z milionów wygenerowanych kandydatów zastosowali wieloetapowy cyfrowy filtr wykorzystujący własne predyktory POLYT5. Polimery musiały mieć stosunkowo wysoką stałą dielektryczną, szeroką przerwę energetyczną, dobrą stabilność termiczną i praktyczne okna przetwarzania. Musiały też rozpuszczać się w powszechnych, przyjaznych środowisku rozpuszczalnikach jak woda lub etanol oraz wydawać się syntetycznie dostępne według standardowych reguł chemicznych. Ten lejek zawęził pole do około 18 000 obiecujących opcji. Spośród nich zespół wybrał jednego kandydata, którego synteza była prosta. Po otrzymaniu go w laboratorium i zmierzeniu jego własności, wyniki eksperymentalne dobrze zgadzały się z przewidywaniami POLYT5, mieszcząc się w oczekiwanych zakresach błędu.
Ułatwienie dostępu do zaawansowanego projektowania polimerów
Ponad samym modelem, autorzy zbudowali „agentyczny” interfejs SI, który pozwala użytkownikom pracować z POLYT5 poprzez naturalną rozmowę w języku naturalnym. Ogólny model językowy interpretuje pytania typu „Przewidź stałą dielektryczną tego polimeru” lub „Zaproponuj polimery o wysokiej temperaturze topnienia, które rozpuszczają się w etanolu”, a następnie przekierowuje je do odpowiednich narzędzi POLYT5. To rozwiązanie ukrywa złożoność formatów tekstowych opisu chemii i wyboru modeli, udostępniając potężne możliwości projektowania polimerów zarówno specjalistom, jak i nieekspertom. Mówiąc wprost, POLYT5 pokazuje, że nauczenie SI czytania i pisania językiem tworzyw może znacznie przyspieszyć poszukiwanie nowych, wysokowydajnych materiałów, potencjalnie skracając drogę od ekranu komputera do działających urządzeń.
Cytowanie: Sahu, H., Xiong, W., Savit, A. et al. POLYT5: an encoder-decoder foundation chemical language model for generative polymer design. npj Artif. Intell. 2, 30 (2026). https://doi.org/10.1038/s44387-026-00087-1
Słowa kluczowe: projektowanie polimerów, model języka chemicznego, odkrywanie materiałów, polimery dielektryczne, generatywna sztuczna inteligencja