Clear Sky Science · sv
GENIUS: ett agentbaserat AI-ramverk för autonom design och körning av simuleringsprotokoll
Smartare verktyg för att upptäcka nya material
Att ta fram bättre batterier, katalysatorer och elektroniska enheter bygger i allt högre grad på datorsimuleringar som förutsäger hur material beter sig innan de någonsin tillverkas i labbet. Men att köra dessa simuleringar kräver ofta en specialist som behärskar komplicerade programkommandon och tusentals tekniska valmöjligheter. Denna artikel presenterar GENIUS, ett artificiellt intelligenssystem som fungerar som en expertassistent och automatiskt förvandlar naturtalsförfrågningar från forskare till fungerande simuleringsuppsättningar. Genom att sänka den tekniska tröskeln syftar GENIUS till att låta många fler forskare använda kraftfulla kvantmekaniska beräkningar i sitt dagliga arbete.

Den dolda friktionen bakom virtuella experiment
Modern materialforskning förlitar sig i hög grad på atom‑för‑atom‑simuleringar för att snabbt och billigt pröva idéer. Program som Quantum ESPRESSO kan nu nå experimentell noggrannhet för många kristaller, men i vardagsanvändning är de ofta begränsade till specialister. Att sätta upp en enda beräkning kan kräva att man gräver sig igenom tung dokumentation, väljer kompatibla parametrar och felsöker kryptiska felmeddelanden. Även erfarna användare kan lägga timmar på att brottas med indatafiler istället för att ägna sig åt vetenskapen. Klyftan mellan vad mjukvaran kan göra och vad de flesta forskare bekvämt kan använda kallas ofta för "know‑do gap" och bromsar översättningen av teori till verkliga teknologier.
Ett AI‑mellanskikt mellan människor och kod
GENIUS är utformat som ett intelligent mellanskikt som ligger mellan forskaren och simuleringsprogrammet. En användare börjar med en fri textförfrågan, till exempel att be om en geometrisk optimering av ett specifikt tvådimensionellt material med en angiven kvantmetod. GENIUS bryter ner denna förfrågan med hjälp av stora språkmodeller och en strukturerad "kunskapsgraf" som kodar hur Quantum ESPRESSO:s 247 nyckelinställningar förhåller sig till varandra och till den underliggande fysiken. Därifrån utarbetar systemet en komplett indatafil som respekterar mjukvarans syntax och interna regler. Avgörande är att GENIUS inte förlitar sig enbart på språkmodellens minne; det förankrar sina val i kurerad dokumentation och databasinformation om det faktiska material som studeras, vilket kraftigt minskar påhittade eller inkonsekventa inställningar.
Lärande från misstag utan mänsklig felsökning
Även noggrant förberedda simuleringar kan misslyckas vid första försöket. För att hantera detta innehåller GENIUS en automatiserad felåterställningsslinga. När Quantum ESPRESSO avvisar en indatafil genererar programmet ett felmeddelande. GENIUS läser det meddelandet, konsulterar sin kunskapsgraf för att tolka vad som gick fel och föreslår en korrigerad version av indatan. Ett enkelt men disciplinerat styrsystem spårar dessa försök och beslutar när man ska försöka igen med samma språkmodell, när man ska starta om från en ren mall och när man ska eskalera till en kraftfullare modell. Denna slinga fortsätter tills simuleringen passerar tidiga kontroller eller systemet bedömer att ytterligare försök sannolikt inte hjälper. Under hela processen loggas varje beslut, vilket ger en klar spårbarhet för senare granskning eller mänsklig intervention.

Hur väl systemet presterar i praktiken
För att bedöma hur robust GENIUS är samlade författarna 295 verkliga uppmaningar från kemister och fysiker som regelbundet använder kvantsimuleringar, men inte nödvändigtvis Quantum ESPRESSO själv. Dessa uppmaningar sträckte sig från enkla till mycket detaljerade uppgifter. Teamet mätte om GENIUS kunde omvandla varje begäran till en indatafil som programmet kunde parsa och starta att köra inom ett kort, enminuters valideringsfönster. Ungefär 80 procent av alla uppmaningar ledde till en fungerande uppsättning. Cirka 14 procent lyckades vid första försöket, medan majoriteten av de övriga räddades av den automatiska felhanteringsslingan. Chansen att "rädda" ett misslyckat kör sjönk snabbt för varje ytterligare försök och landade nära en 7 procentenhetsbaslinje, vilket visar att de flesta åtgärdbara problemen löses tidigt. Enkla språkmodellbaslinjer, utan kunskapsgraf och styrlogik, producerade sällan giltiga indatapaket alls, vilket understryker värdet av GENIUS arkitektur snarare än bara större modeller.
Öppna avancerade simuleringar för fler forskare
Ur ett allmänt perspektiv är GENIUS ett steg mot att göra högtekniska kvantsimuleringar lika lättillgängliga som en modern sökmotor. Istället för att memorera otydliga kommandon beskriver forskare vad de vill ha, och systemet sätter samman, testar och reparerar nödvändiga instruktioner automatiskt. Under ytan kombinerar GENIUS strukturerad domänkunskap, flera språkmodeller och en omsorgsfull omprovsstrategi för att hålla fel i schack. Medan det nuvarande arbetet fokuserar på ett allmänt använt simuleringspaket, skulle samma design kunna anpassas till andra koder där tydlig dokumentation och felmeddelanden finns. Genom att krympa know‑do‑gapet kan ramverk som GENIUS hjälpa fler laboratorier, företag och studenter att göra avancerade beräkningsverktyg till en del av vardagligt materialupptäckande.
Citering: Soleymanibrojeni, M., Aydin, R., Guedes-Sobrinho, D. et al. GENIUS: an agentic AI framework for autonomous design and execution of simulation protocols. Commun Mater 7, 115 (2026). https://doi.org/10.1038/s43246-026-01167-0
Nyckelord: materialsimulering, autonoma arbetsflöden, agentbaserad AI, dichtefunktionalteori, Quantum ESPRESSO