Clear Sky Science · pl
Wielomodalny duży model językowy do nauki o materiałach
Dlaczego nowe materiały mają znaczenie w codziennym życiu
Od lepszych baterii do telefonów, przez wydajniejsze panele słoneczne, po szybsze komputery — wiele technologii jutra zależy od odkrywania i doskonalenia nowych materiałów. Jednak ustalenie, które kombinacje atomów dadzą dokładnie oczekiwane właściwości, przypomina szukanie igieł w kosmicznej stogu siana. W tym artykule przedstawiono MatterChat, system sztucznej inteligencji zaprojektowany do rozmowy z naukowcami w codziennym języku, a jednocześnie „widzący” szczegółową strukturę atomową materiałów, pomagający przewidywać ich zachowanie i sposoby wytworzenia w laboratorium.

Cyfrowy asystent, który widzi atomy i czyta słowa
MatterChat łączy dwa bardzo różne rodzaje informacji: precyzyjne, trójwymiarowe rozmieszczenie atomów w ciele stałym oraz tekstowe pytania i wiedzę stosowaną przez naukowców. Z jednej strony system przyjmuje strukturę krystaliczną, którą da się przedstawić jako sieć atomów i wiązań. Przetwarza ją za pomocą potężnych, inspirowanych fizyką modeli, wytrenowanych na setkach tysięcy znanych materiałów, aby wygenerować zwarte numeryczne odciski palców dla każdego atomu i jego otoczenia. Z drugiej strony duży model językowy — oparty na otwartoźródłowym systemie Mistral 7B — zamienia pytanie użytkownika, np. o stabilność czy właściwości elektroniczne, na wewnętrzną reprezentację. Specjalnie zaprojektowany moduł „mostu” uczy się wyrównywać te dwa światy, tak by model językowy mógł bezpośrednio rozumować o tym, co robią atomy.
Uczenie systemu za pomocą bogatego katalogu materiałów
Do treningu MatterChat autorzy wykorzystali dużą bazę zawierającą 142 899 materiałów nieorganicznych z Materials Project. Dla każdego materiału użyli nie tylko pełnej struktury atomowej, lecz także dwunastu rodzajów opisowych informacji. Obejmowały one podstawowe identyfikatory, takie jak wzór chemiczny, typ symetrii i rodzina krystaliczna, oraz dziewięć kluczowych właściwości, w tym informację, czy materiał jest metaliczny czy izolujący, szerokość przerwy elektronowej, zachowanie magnetyczne i kilka miar stabilności termodynamicznej. Parując każdą strukturę z wieloma pytaniami i odpowiedziami w formie tekstowej na temat tych właściwości, system nauczył się łączyć wzory w rozmieszczeniu atomów ze słownictwem, jakiego używają naukowcy do opisu i analizy materiałów.
Od prostych wyszukiwań do rozumowania w stylu naukowym
Po wytrenowaniu MatterChat potrafi robić więcej niż tylko powtarzać wpisy z bazy danych. Gdy użytkownik dostarczy strukturę, system odpowie na szeroki wachlarz pytań, np. rozpozna wzór chemiczny, oceni, czy materiał powinien dać się otrzymać w laboratorium, albo oszacuje energie, które normalnie wymagają kosztownych obliczeń kwantowo-mechanicznych. Autorzy pokazują przykłady, w których MatterChat formułuje szczegółowe oceny konkretnych materiałów, w tym komentarze dotyczące stabilności, przerw elektronowych i magnetyzmu. W niektórych przypadkach idzie dalej, generując prawdopodobne, krok po kroku receptury laboratoryjne do syntezy dobrze znanych związków, takich jak azotek galu czy granat żelaza i itranu, czerpiąc z ogólnej wiedzy naukowej zgromadzonej w modelu językowym, a jednocześnie osadzając odpowiedzi w dostarczonej strukturze krystalicznej.

Przewyższając uniwersalne chatboty w twardych liczbach
Uderzającym wynikiem jest to, że MatterChat lepiej przewiduje ilościowe właściwości materiałów niż zarówno tradycyjne modele językowe, jak i kilka specjalistycznych narzędzi uczenia maszynowego opartych na fizyce. W dziewięciu testach porównawczych jest bardziej dokładny przy decyzjach, na przykład, czy ciało stałe jest metaliczne, stabilne czy magnetyczne. Dla wielkości ciągłych, takich jak energia formacji czy przerwa energetyczna, jego przewidywania są bliższe wartościom uzyskanym z wymagających symulacji komputerowych. Dzieje się tak nawet wtedy, gdy testowany jest na oddzielnym zbiorze nowo odkrytych związków z projektu GNoME, które nie były użyte podczas treningu. Autorzy analizują także wewnętrzne reprezentacje systemu i pokazują, że podobne struktury grupują się razem, a zmiany stabilności płynnie śledzą się na tej wewnętrznej mapie, co wskazuje, że model nauczył się chemicznie znaczących wzorców.
Co to może oznaczać dla odkrywania nowych materiałów
Dla osób niezaznajomionych z tematem główny wniosek jest taki, że MatterChat działa jak partner do rozmowy, który zarówno rozumie język naukowy, jak i ma szczegółowe wyczucie rozmieszczenia atomów w ciałach stałych. Łącząc te zdolności, może szybko odpowiadać na pytania, które kiedyś wymagały eksperckiej intuicji i kosztownych obliczeń, oraz sugerować realistyczne ścieżki syntezy obiecujących kandydatów. Choć autorzy zauważają, że system wciąż ma problemy z ekstremalnie precyzyjnymi liczbami i czasem może zbyt pewnie zgadywać, twierdzą, że jego modułowa konstrukcja i dobre wyniki stanowią ważny krok w stronę narzędzi AI, które pomagają naukowcom poruszać się po ogromnej przestrzeni możliwych materiałów, przyspieszając drogę od pomysłów do działających technologii.
Cytowanie: Tang, Y., Xu, W., Cao, J. et al. A multimodal large language model for materials science. Nat Mach Intell 8, 588–601 (2026). https://doi.org/10.1038/s42256-026-01214-y
Słowa kluczowe: odkrywanie materiałów, wielomodalna sztuczna inteligencja, struktury krystaliczne, predykcja właściwości, naukowe chatboty