Clear Sky Science · pl

GENIUS: agentyczne AI do autonomicznego projektowania i wykonywania protokołów symulacyjnych

· Powrót do spisu

Mądrzejsze narzędzia do odkrywania nowych materiałów

Projektowanie lepszych baterii, katalizatorów i urządzeń elektronicznych coraz częściej opiera się na symulacjach komputerowych, które przewidują zachowanie materiałów jeszcze zanim zostaną wytworzone w laboratorium. Jednak uruchamianie tych symulacji zwykle wymaga specjalisty znającego skomplikowane polecenia oprogramowania i tysiące technicznych opcji. W artykule przedstawiono GENIUS — system sztucznej inteligencji działający jak ekspert-asystent, który automatycznie przekształca polecenia w zwykłym języku od naukowców w działające konfiguracje symulacji. Obniżając barierę techniczną, GENIUS ma pozwolić znacznie większej liczbie badaczy na stosowanie zaawansowanych obliczeń kwantowych w codziennej pracy.

Figure 1
Figure 1.

Ukryte tarcie stojące za wirtualnymi eksperymentami

Współczesne badania materiałowe w dużej mierze opierają się na symulacjach atom po atomie, które pozwalają szybko i tanio testować pomysły. Programy takie jak Quantum ESPRESSO potrafią obecnie dorównać dokładności eksperymentalnej dla wielu kryształów, ale w codziennym użyciu są często domeną specjalistów. Przygotowanie pojedynczego obliczenia może wymagać przeszukiwania gęstej dokumentacji, wyboru kompatybilnych parametrów i debugowania zagadkowych komunikatów błędów. Nawet doświadczeni użytkownicy mogą spędzać godziny na walce z plikami wejściowymi zamiast zajmować się nauką. Ta luka między możliwościami oprogramowania a tym, co większość naukowców potrafi wygodnie używać, nazywana jest często „luka wiedzy i wykonywania” (know‑do gap) i spowalnia przekładanie teorii na technologie praktyczne.

Warstwa AI między ludźmi a kodem

GENIUS zaprojektowano jako inteligentną warstwę pośrednią między badaczem a programem symulacyjnym. Użytkownik zaczyna od zapytania w wolnej formie, na przykład prośby o optymalizację geometrii konkretnego materiału dwuwymiarowego z użyciem określonej metody kwantowej. GENIUS rozkłada to zapytanie, korzystając z dużych modeli językowych i ustrukturyzowanego „grafu wiedzy”, który koduje, jak 247 kluczowych ustawień Quantum ESPRESSO odnosi się między sobą i do leżącej u ich podstaw fizyki. Na tej podstawie szkicuje kompletny plik wejściowy zgodny z składnią i zasadami oprogramowania. Co istotne, GENIUS nie polega wyłącznie na pamięci modelu językowego; uzasadnia swoje wybory odwołując się do wyselekcjonowanej dokumentacji i baz danych o badanym materiale, co znacznie zmniejsza ryzyko wymyślonych lub niespójnych ustawień.

Uczenie się na błędach bez ręcznego debugowania

Nawet starannie przygotowane symulacje mogą nie powieść się za pierwszym razem. Aby to obsłużyć, GENIUS zawiera zautomatyzowaną pętlę odzyskiwania po błędach. Gdy Quantum ESPRESSO odrzuca plik wejściowy, program generuje komunikat błędu. GENIUS odczytuje ten komunikat, konsultuje się z grafem wiedzy, by zinterpretować, co poszło nie tak, i proponuje poprawioną wersję wejścia. Prosty, lecz zdyscyplinowany system kontroli śledzi te próby, decydując, kiedy ponowić próbę z tym samym modelem językowym, kiedy zacząć od czystego szablonu, a kiedy eskalować do potężniejszego modelu. Pętla trwa, aż symulacja przejdzie wczesne kontrole lub system uzna, że dalsze próby są mało prawdopodobne. Przez cały ten proces logi zapisują każdą decyzję, pozostawiając czytelny ślad do późniejszej inspekcji lub interwencji człowieka.

Figure 2
Figure 2.

Jak system sprawdza się w praktyce

Aby ocenić odporność GENIUS-a, autorzy zebrali 295 rzeczywistych zapytań od chemików i fizyków, którzy regularnie korzystają z symulacji kwantowych, choć niekoniecznie z Quantum ESPRESSO. Zapytania obejmowały zadania od prostych po bardzo szczegółowe. Zespół zmierzył, czy GENIUS potrafi przekształcić każde żądanie w plik wejściowy, który program potrafi zinterpretować i rozpocząć wykonywanie w krótkim, jednominutowym oknie walidacyjnym. Około 80 procent zapytań doprowadziło do działającej konfiguracji. Około 14 procent udało się za pierwszym podejściem, podczas gdy większość pozostałych została uratowana przez zautomatyzowaną pętlę obsługi błędów. Szansa „uratowania” nieudanego uruchomienia szybko maleje przy kolejnych próbach i ustala się w pobliżu 7‑procentowej podstawy, co pokazuje, że większość problemów możliwych do naprawy rozwiązywana jest wcześnie. Proste podejścia oparte jedynie na modelach językowych, bez grafu wiedzy i logiki sterowania, rzadko generowały poprawne pliki wejściowe, podkreślając wartość architektury GENIUS-a, a nie tylko większych modeli.

Udostępnianie zaawansowanych symulacji większej liczbie naukowców

Z perspektywy laika GENIUS to krok w kierunku uczynienia wysoce technicznych symulacji kwantowych tak przystępnymi, jak nowoczesna wyszukiwarka. Zamiast pamiętania tajemnych poleceń, badacze opisują, czego chcą, a system sam składa, testuje i naprawia niezbędne instrukcje. Pod maską GENIUS łączy ustrukturyzowaną wiedzę dziedzinową, wielokrotne modele językowe i ostrożną strategię ponawiania, by trzymać błędy pod kontrolą. Choć obecne prace koncentrują się na jednym powszechnie używanym pakiecie symulacyjnym, ta sama koncepcja może zostać zaadaptowana do innych kodów tam, gdzie istnieje jasna dokumentacja i komunikaty o błędach. Zmniejszając lukę know‑do, rozwiązania takie jak GENIUS mogą pomóc większej liczbie laboratoriów, firm i studentów wprowadzić zaawansowane narzędzia obliczeniowe do codziennego odkrywania materiałów.

Cytowanie: Soleymanibrojeni, M., Aydin, R., Guedes-Sobrinho, D. et al. GENIUS: an agentic AI framework for autonomous design and execution of simulation protocols. Commun Mater 7, 115 (2026). https://doi.org/10.1038/s43246-026-01167-0

Słowa kluczowe: symulacje materiałów, autonomiczne przepływy pracy, agentyczne AI, teoria funkcjonału gęstości, Quantum ESPRESSO