Clear Sky Science · pl

Termodynamicznie spójny model uczenia maszynowego dla nadmiarowej energii Gibbsa

· Powrót do spisu

Dlaczego to ma znaczenie dla codziennej chemii

Współczesne życie opiera się na mieszankach cieczy — od paliw i czynników chłodniczych po leki i ekologiczne rozpuszczalniki. Projektowanie tych mieszanin w sposób bezpieczny i wydajny wymaga znajomości wzajemnych oddziaływań między cząsteczkami. Jednak zmierzenie tych oddziaływań dla każdej możliwej kombinacji jest niemożliwe. W artykule przedstawiono nowe narzędzie oparte na uczeniu maszynowym, zwane HANNA, które uczy się zachowania mieszanin ciekłych bezpośrednio z danych, a jednocześnie respektuje podstawowe prawa termodynamiki. Obiecuje szybsze, szersze i bardziej wiarygodne przewidywania przydatne w projektowaniu procesów chemicznych i odkrywaniu materiałów.

Figure 1
Figure 1.

Ukryta energia kształtująca mieszaniny ciekłe

Gdy łączy się różne ciecze, ich cząsteczki przyciągają się lub odpychają w sposób, który może być subtelny. Efekty te opisuje wielkość zwana „nadmiarową energią Gibbsa”, która informuje, o ile mieszanina odbiega od zachowania idealnego. Z tej jednej funkcji inżynierowie mogą wyprowadzić kluczowe własności, takie jak współczynniki aktywności, które z kolei decydują, czy mieszanina tworzy jedną fazę ciekłą, czy rozdziela się na dwie, czy para i ciecz współistnieją, oraz jak składniki się w nich rozkładają. Niestety nadmiarowej energii Gibbsa nie da się zmierzyć bezpośrednio. Trzeba ją wnioskować z żmudnych eksperymentów nad równowagami para–ciecz i ciecz–ciecz lub z efektów cieplnych, a przebadana została tylko niewielka część wszystkich istotnych mieszanin.

Ograniczenia tradycyjnych narzędzi predykcyjnych

Przez dziesięciolecia inżynierowie polegali na modelach takich jak NRTL, UNIQUAC i rodzinie UNIFAC do szacowania zachowania mieszanin. Metody te przybliżają oddziaływania za pomocą parametrów dopasowywanych do danych eksperymentalnych, często na poziomie par binarnych. Choć potężne, mają istotne ograniczenia: aby przewidzieć nową mieszaninę, zazwyczaj potrzebne są parametry dla każdego binarnego podsystemu, który w niej występuje, a dla nowych związków takie parametry mogą nie istnieć. Nawet podejścia oparte na grupach, jak UNIFAC, które rozkładają cząsteczki na elementy składowe, są ograniczone do ustalonego katalogu grup i mogą mieć trudności z złożonymi gatunkami, takimi jak ciekłe sole jonowe. Ponadto wiele klasycznych modeli ma problemy z jednoczesnym dokładnym opisem zarówno równowag para–ciecz, jak i ciecz–ciecz przy użyciu jednego zestawu parametrów.

Sieć neuronowa przestrzegająca praw fizyki

HANNA rozwiązuje te wyzwania, łącząc nowoczesne sieci neuronowe z na stałe wbudowanymi zasadami termodynamicznymi. Jako dane wejściowe wymaga jedynie struktur molekularnych składników (zakodowanych jako ciągi SMILES), temperatury i składu mieszaniny. Model języka chemicznego (ChemBERTa-2) najpierw zamienia każdą cząsteczkę na numeryczny odcisk palca. Te odciski trafiają do wyspecjalizowanej architektury sieci zbudowanej tak, by spełniać kluczowe wymogi spójności: respektuje relację Gibbsa–Duhema, zachowuje się poprawnie, gdy jeden składnik staje się czystym lub nieskończenie rozcieńczonym, oraz daje ten sam wynik niezależnie od kolejności składników. Z tych ograniczeń HANNA przewiduje nadmiarową energię Gibbsa dla każdej pary binarnej w mieszaninie, a następnie wykorzystuje geometryczny schemat projekcji, by rozszerzyć te przewidywania na mieszaniny wieloskładnikowe, bez wprowadzania dodatkowych parametrów dopasowujących.

Figure 2
Figure 2.

Trenowanie na rzeczywistych danych, nie tylko na równaniach

Aby HANNA była szeroko użyteczna, autorzy wytrenowali ją na wyjątkowo dużej i zróżnicowanej bazie danych eksperymentalnych. Zawiera ona dane para–ciecz z pełnymi składami faz, dane para–ciecz z jedynie całkowitym ciśnieniem, rozdziały faz ciecz–ciecz, współczynniki aktywności przy nieskończonym rozcieńczeniu oraz nadmiarowe entalpie, obejmujące ponad 800 000 punktów danych i ponad 4 000 odrębnych związków, w tym ciekłe sole jonowe i inne trudne gatunki. Kluczową innowacją jest zastępczy solver, który emuluje solidny algorytm termodynamiczny do wykrywania i lokalizowania rozdziałów ciecz–ciecz. Ten zastępczy solver jest różniczkowalny, więc HANNA może być trenowana „end-to-end” względem mierzonych składów faz bez odwoływania się do wolnych, iteracyjnych obliczeń w pętli uczenia. Dodatkowe składniki funkcji straty zachęcają HANNĘ do rozpoznawania krzywizny związanej z separacją faz i do generowania gładkich przewidywań, które sensownie zachowują się nawet poza zakresem treningowym.

Jak nowy model wypada w porównaniu

Po treningu HANNA była testowana tylko na systemach wyłączonych z treningu, a jej wyniki porównano z wiodącymi klasycznymi i uczeniowymi modelami. Dla mieszanin binarnych konsekwentnie przewidywała współczynniki aktywności, składy faz i nadmiarowe entalpie dokładniej niż szeroko stosowana zmodyfikowana metoda UNIFAC (Dortmund), a jednocześnie bardziej niezawodnie identyfikowała luki niemieszalności ciecz–ciecz. Dla mieszanin trój- i nawet czteroskładnikowych, których nie widziała podczas treningu, HANNA pozostała konkurencyjna lub lepsza, mimo że opierała się wyłącznie na danych binarnych i projekcji geometrycznej. Przewyższała także kilka niedawnych sieci neuronowych opartych na grafach, które albo nie miały ścisłej spójności termodynamicznej, albo były ograniczone do specjalnych warunków, takich jak temperatura pokojowa czy nieskończone rozcieńczenie.

Co to oznacza dla nauki i przemysłu

Dla osoby niebędącej specjalistą główne przesłanie jest takie, że HANNA działa jak wysoko poinformowane, fizycznie ugruntowane „wyrocznia” dla mieszanin ciekłych. Mając jedynie wzory chemiczne, potrafi przewidzieć, czy dwie lub więcej cieczy zmiesza się, rozdzieli na warstwy, czy wykazuje złożone zachowanie fazowe — i robi to w szerokim zakresie temperatur. Co istotne, robi to z poszanowaniem zasad termodynamiki, zmniejszając ryzyko wyników niefizycznych, które mogą występować w nieskrępowanych modelach uczenia maszynowego. Ponieważ pełny model i kod są udostępnione otwarcie i dostępne przez interfejs internetowy, inżynierowie mogą od razu zacząć używać HANNY w symulacjach procesów i do przesiewania rozpuszczalników. Choć autorzy zauważają pozostające ograniczenia — takie jak nietestowana wydajność daleko poza zakresem temperatur użytych w treningu oraz dla silnych elektrolitów — praca ta stanowi ważny krok w kierunku projektowania procesów chemicznych napędzanego danymi i zgodnego z termodynamiką.

Cytowanie: Hoffmann, M., Specht, T., Göttl, Q. et al. Thermodynamically consistent machine learning model for excess Gibbs energy. Nat Commun 17, 3485 (2026). https://doi.org/10.1038/s41467-026-71430-y

Słowa kluczowe: mieszaniny ciekłe, termodynamika, uczenie maszynowe, nadmiarowa energia Gibbsa, równowagi fazowe