Clear Sky Science · pl

Optymalizacja transferu między dziedzinami dla uniwersalnych modelów atomistycznych opartych na uczeniu maszynowym

2026-03-03 · Powrót do spisu

Inteligentniejsze symulacje dla rzeczywistych materiałów

Projektowanie nowych baterii, katalizatorów i materiałów elektronicznych coraz częściej zależy od symulacji komputerowych śledzących ruch atomów. Najbardziej zaufane symulacje, oparte na mechanice kwantowej, są niezwykle dokładne, lecz zbyt wolne, by przeszukiwać miliony kandydatów. Szybsze modele uczone maszynowo potrafią naśladować obliczenia kwantowe, jednak często działają tylko w wąskich zakresach — na przykład jedynie w kryształach albo tylko dla cząsteczek. W artykule proponuje się sposób budowy jednego uniwersalnego modelu, nazwanego SevenNet‑Omni, który zachowuje dokładność w wielu typach materiałów, od powierzchni metali i cieczy molekularnych po porowate rusztowania, a jednocześnie jest wystarczająco szybki do zastosowań przy dużej skali poszukiwań.

Dlaczego dzisiejsze modele atomistyczne słabo przenoszą się między dziedzinami

Obecne interatomowe potencjały uczone maszynowo zwykle trenuje się na jednej, starannie dobranej bazie danych: jednej dla kryształów nieorganicznych, innej dla molekuł przypominających leki, jeszcze innej dla powierzchni katalitycznych. Każda baza powstaje z własnymi ustawieniami obliczeń kwantowych, więc leżące u podstaw powierzchnie energii różnią się subtelnie i nieliniowo. Proste łączenie tych danych — na przykład przesuwanie lub skalowanie energii — wprowadza szum i prowadzi do modeli, które dobrze opisują swoją „rodzinną” dziedzinę, lecz zawodzą przy obcych chemiach lub przy nieznacznie innych metodach kwantowych. W miarę jak problemy materiałowe coraz częściej mieszają dziedziny, np. reakcje molekuł na stałych powierzchniach w roztworze, brak przenoszalności stał się poważnym wąskim gardłem.

Wspólny kręgosłup z delikatną specjalizacją

Autorzy rozwiązują ten problem, traktując każdą bazę danych jako odrębne „zadanie” w jednej wielozadaniowej sieci neuronowej. Wewnątrz modelu jedna grupa parametrów tworzy wspólny kręgosłup, chwytający ogólne reguły wiązań atomowych, podczas gdy mniejsze, specyficzne dla zadania parametry dopracowują zachowanie dla konkretnych zestawów danych. Analiza matematyczna pokazuje, że jeśli część specyficzna dla zadania stanie się zbyt duża, model w praktyce zapamiętuje każdą bazę i traci zdolność do uogólniania. Aby temu zapobiec, autorzy stosują selektywną regularizację: bezpośrednio karzą duże wartości parametrów specyficznych dla zadań, ale pozwalają wspólnemu kręgosłupowi rosnąć w razie potrzeby. To skłania sieć do wyjaśniania jak największej części zachowań przez wspólną fizykę, używając jedynie skromnych poprawek dla poszczególnych dziedzin.

Łączenie odległych światów za pomocą kilku kluczowych przykładów

Nawet przy regularizacji niektóre obszary przestrzeni chemicznej występują tylko w jednej bazie, więc wspólny kręgosłup nie otrzymuje tam wskazówek. Aby to naprawić, zespół wprowadza „zbiór mostowy” między dziedzinami. Starannie wybierają niewielki ułamek — około jednej na tysiąc — konfiguracji z kilku baz i przeliczają je ponownie przy użyciu wspólnej, ujednoliconej konfiguracji kwantowo‑mechanicznej. Te struktury mostowe działają jak dwujęzyczne zwroty w podręczniku języka: bezpośrednio łączą to, jak dwie różne metody kwantowe opisują tę samą scenę atomową. Po uwzględnieniu w treningu silnie wzmacniają powiązania między zadaniami, wyrównując powierzchnie energii bez potrzeby brutalnego ponownego liczenia wszystkiego. Testy systematyczne pokazują, że regularizacja i zbiór mostowy wzajemnie się wzmacniają, poprawiając wyniki ponad to, co każde z rozwiązań osiąga osobno.

Budowa i testowanie uniwersalnego silnika atomowego

W oparciu o te pomysły autorzy trenują SevenNet‑Omni na 15 publicznych zestawach danych obejmujących około 242 milionów struktur atomowych, pokrywających molekuły, kryształy, katalizatory, metal‑organiczne rusztowania i różne poziomy teorii kwantowej. Następnie mierzą wydajność modelu w sytuacjach zarówno znanych, jak i wymagających: stabilność kryształów, granice ziaren w metalach, defekty w stalach, bariery skrętu w molekułach przypominających leki, hybrydowe perowskity organiczno‑nieorganiczne, adsorpcję w porowatych strukturach istotnych dla wychwytywania dwutlenku węgla oraz reakcje na powierzchniach metali ważne dla konwersji wodoru i dwutlenku węgla. W tych testach SevenNet‑Omni często dorównuje albo przewyższa wyspecjalizowane modele trenowane dla jednej dziedziny i zachowuje „dokładność chemiczną” dla wielu energii reakcji i adsorpcji. Potrafi też dokładnie odtworzyć wyniki kosztownej metody kwantowej (r²SCAN), ucząc się, jak ta metoda odnosi się do tańszych, bardziej rozpowszechnionych danych.

Co to oznacza dla odkrywania nowych materiałów

Dla osób spoza dziedziny kluczowy wniosek jest taki, że SevenNet‑Omni zachowuje się jak doświadczony naukowiec pracujący w wielu poddziedzinach. Zamiast przeuczać się na jeden wąski problem, uczy się szerokich zasad chemicznych i elastycznie stosuje je w nowych sytuacjach, od wychwytywania gazów w porowatych ciałach stałych po reakcje na elektrodach metalowych. Artykuł pokazuje, że jest to możliwe dzięki ostrożnemu dzieleniu informacji między zestawami danych przy jednoczesnym lekkim ograniczaniu ich różnic oraz przez dodanie niewielkiej liczby starannie dobranych „przykładów tłumaczących” między metodami kwantowymi. W miarę pojawiania się większych i bardziej zróżnicowanych baz danych ta strategia treningowa oferuje skalowalną drogę ku prawdziwie uniwersalnym, godnym zaufania modelom atomowym, które mogą przyspieszyć odkrycia w chemii, fizyce i nauce o materiałach.

Cytowanie: Kim, J., You, J., Park, Y. et al. Optimizing cross-domain transfer for universal machine learning interatomic potentials. Nat Commun 17, 3432 (2026). https://doi.org/10.1038/s41467-026-70195-8

Słowa kluczowe: interatomowe potencjały uczone maszynowo, wielodziedzinowe modelowanie materiałów, transfer learning, uniwersalny potencjał atomistyczny, odkrywanie materiałów