Clear Sky Science · sv

Mot slutet till slutet-automatisering av AI-forskning

· Tillbaka till index

Varför en robotforskare spelar roll

Föreställ dig en outtröttlig digital forskare som kan hitta på idéer, skriva datorprogram, köra experiment, rita diagram och till och med utarbeta och granska vetenskapliga artiklar med nästan ingen mänsklig hjälp. Denna artikel beskriver ett sådant system, kallat ”AI-forskaren”. Den visar att modern artificiell intelligens nu kan hantera nästan varje steg i ett forskningsprojekt inom maskininlärning, vilket antyder en framtid där upptäckter kommer snabbare — men som också väcker allvarliga frågor om förtroende, jobb och vetenskapens hälsa.

Figure 1
Figure 1.

Från idé till färdig artikel

AI-forskaren är utformad för att gå igenom hela livscykeln för en studie, ungefär som en doktorand. Först föreslår den forskningsriktningar inom ett valt område av maskininlärning, förklarar varför varje idé kan vara intressant och skissar en plan för hur den kan testas. Därefter kontrollerar den dessa idéer mot onlinedatabaser för forskning för att undvika att den bara kopierar befintligt arbete. Endast idéer som verkar genuint nya går vidare. Nästa steg är att systemet skriver och redigerar den kod som behövs för att köra experimenten, åtgärdar många av sina egna buggar och för ett löpande ”labblogg” över vad det försökt och vad som hände.

Två sätt att låta systemet utforska

Forskarna byggde två versioner av denna digitala forskare. I det ”mallbaserade” läget förser människor systemet med ett enkelt startprogram och systemet modifierar det gradvis för att utforska närliggande frågor. I det ”mallfria” läget börjar AI:n nästan från noll: den hittar på idéer, designar experiment och skriver kod på egen hand, endast vägledd av breda instruktioner som temat för en konferensworkshop. Denna öppna version använder en förgreningssökning genom många parallella experiment"vägar", där de mest lovande gynnas och de som kraschar eller ger dåliga resultat beskärs. Mer datorkraft låter den utforska fler grenar och tenderar att ge starkare slutstudier.

Figure 2
Figure 2.

Att lära en AI att agera som en sakkunniggranskare

Att bedöma kvaliteten hos en oändlig ström av AI-skrivna artiklar är en utmaning, så teamet byggde också en automatiserad granskare. Detta verktyg läser forskningsartiklar, betygsätter dem utifrån stringens och bidrag, listar styrkor och svagheter och ger en rekommendation om accept eller avslag enligt samma riktlinjer som en ledande maskininlärningskonferens. När den testades på tusentals verkliga artiklar med kända beslut motsvarade den automatiserade granskaren människors omdömen ungefär lika väl som människor överensstämmer sinsemellan. Den presterade liknande även på nyare artiklar som inte fanns i dess träningsdata, vilket tyder på att den verkligt lärt sig granskningsuppgiften snarare än att memorera utfall.

Att pröva AI-forskaren i praktiken

För att se hur väl deras system faktiskt presterar i fält bad författarna det generera fullständiga artiklar för en workshop vid en ledande maskininlärningskonferens. Med etiskt godkännande och organisatörernas medverkan skickades tre AI-genererade manus in sida vid sida med människoskrivna. Granskare informerades om att vissa bidrag kunde vara AI-skrivna, men inte vilka. Ett av de tre AI-skapade bidragen fick granskningspoäng som skulle ha räckt för antagning till workshopen; författarna drog sedan tillbaka det enligt en förhandsöverenskommen protokoll. De andra två artiklarna nådde inte upp till standarden. Sammantaget producerade systemet arbete som ännu inte är i nivå med den bästa mänskliga forskningen, men som redan ibland räcker för att passera verklig kollegial granskning.

Löften, fallgropar och vägen framåt

Även om AI-forskaren fortfarande gör misstag — såsom ytliga idéer, kodfel och vilseledande referenser — antyder studien att när underliggande AI-modeller och beräkningsresurser förbättras kommer sådana system troligen att bli mycket bättre. Det kan dramatiskt påskynda upptäckter inom områden där experiment kan köras på datorer eller i automatiserade laboratorier. Samtidigt kan enkel artikelgenerering översvämma tidskrifter med lågkvalitativt arbete, sudda ut gränserna kring författarskap och meriter, och möjliggöra riskfyllda eller oetiska experiment. Författarna menar att det vetenskapliga samfundet nu behöver tydliga regler och skyddsåtgärder medan tekniken fortfarande är i sin linda, så att automatiserade forskare bidrar till att stärka snarare än försvaga vetenskapen.

Citering: Lu, C., Lu, C., Lange, R.T. et al. Towards end-to-end automation of AI research. Nature 651, 914–919 (2026). https://doi.org/10.1038/s41586-026-10265-5

Nyckelord: automatiserad vetenskaplig forskning, AI-forskare, maskininlärningsexperiment, automatiserad granskning, vetenskaplig integritet