Clear Sky Science · nl
Naar end-to-end automatisering van AI-onderzoek
Waarom een robotwetenschapper ertoe doet
Stel je een onvermoeibare digitale onderzoeker voor die ideeën kan bedenken, computerprogramma’s kan schrijven, experimenten kan uitvoeren, grafieken kan maken en zelfs wetenschappelijke artikelen kan opstellen en beoordelen met vrijwel geen menselijke hulp. Dit artikel beschrijft zo’n systeem, genoemd “De AI-wetenschapper.” Het toont aan dat moderne kunstmatige intelligentie nu bijna elke stap van een onderzoeksproject in machine learning aankan, wat wijst op een toekomst waarin ontdekkingen sneller plaatsvinden — maar ook serieuze vragen oproept over vertrouwen, banen en de gezondheid van de wetenschap zelf.

Van idee tot voltooid artikel
De AI-wetenschapper is ontworpen om de volledige levenscyclus van een studie te doorlopen, vergelijkbaar met wat een promovendus zou doen. Eerst stelt het onderzoeksrichtingen voor binnen een gekozen gebied van machine learning, legt uit waarom elk idee interessant kan zijn en schetst een plan om het te testen. Vervolgens controleert het deze ideeën tegen online onderzoeksdatabases om te voorkomen dat het bestaande werken simpelweg kopieert. Alleen ideeën die echt nieuw lijken, gaan door. Daarna schrijft en bewerkt het systeem de code die nodig is om experimenten uit te voeren, lost veel van zijn eigen bugs op en houdt een doorlopend “labdagboek” bij van wat het geprobeerd heeft en wat er gebeurde.
Twee manieren waarop het systeem kan verkennen
De onderzoekers bouwden twee versies van deze digitale wetenschapper. In de "template-gebaseerde" modus leveren mensen een eenvoudig startprogramma en past het systeem dit geleidelijk aan om verwante vragen te verkennen. In de "template-vrije" modus begint de AI vrijwel vanaf nul: het bedenkt ideeën, ontwerpt experimenten en schrijft zelfstandig code, geleid alleen door brede instructies zoals het thema van een conferentieworkshop. Deze open-einde versie gebruikt een takkerende zoekstrategie door veel parallelle experiment"paden", waarbij de meest veelbelovende worden bevorderd en diegene die crashen of slechte resultaten opleveren worden weggeknipt. Meer rekenkracht laat het meer takken verkennen en heeft de neiging sterkere eindstudies op te leveren.

Een AI leren optreden als peer reviewer
Het beoordelen van de kwaliteit van een eindeloze stroom AI-geschreven artikelen is een uitdaging, dus bouwde het team ook een Geautomatiseerde Reviewer. Dit hulpmiddel leest onderzoeksartikelen, beoordeelt ze op degelijkheid en bijdrage, somt sterke en zwakke punten op en doet een acceptatie- of afwijzingsaanbeveling volgens dezelfde richtlijnen als een topconferentie in machine learning. Getest op duizenden echte artikelen met bekende beslissingen, kwamen de oordelen van de Geautomatiseerde Reviewer ongeveer even goed overeen met die van menselijke reviewers als mensen onderling overeenkomen. Het presteerde vergelijkbaar zelfs op recente artikelen die niet in zijn trainingsgegevens zaten, wat suggereert dat het echt de reviewedoelstelling geleerd had in plaats van uitkomsten te memoriseren.
De AI-wetenschapper op de proef stellen
Om te zien hoe goed hun systeem in de praktijk presteert, vroegen de auteurs het volledige artikelen te genereren voor een workshop op een toonaangevende machine learning-conferentie. Met ethische goedkeuring en medewerking van de organisatoren werden drie door AI gegenereerde manuscripten samen met menselijke inzendingen ingediend. Reviewers kregen te horen dat sommige inzendingen mogelijk door AI waren geschreven, maar niet welke. Een van de drie AI-gecreëerde artikelen behaalde beoordelingsscores die voldoende zouden zijn geweest voor acceptatie bij de workshop; de auteurs trokken het daarna terug volgens een vooraf afgesproken protocol. De andere twee artikelen voldeden niet aan de norm. Over het geheel genomen produceerde het systeem werk dat nog niet gelijkstaat aan het beste menselijke onderzoek, maar het is al goed genoeg om af en toe echte peer review te doorstaan.
Beloften, valkuilen en de weg vooruit
Hoewel De AI-wetenschapper nog steeds fouten maakt — zoals oppervlakkige ideeën, programmeerfouten en misleidende citaties — suggereert de studie dat naarmate onderliggende AI-modellen en rekenmiddelen verbeteren, dergelijke systemen waarschijnlijk veel beter zullen worden. Dat zou ontdekkingen dramatisch kunnen versnellen in vakgebieden waar experimenten op computers of in geautomatiseerde laboratoria kunnen worden uitgevoerd. Tegelijkertijd kan gemakkelijke artikelgeneratie tijdschriften overspoelen met werk van lage kwaliteit, onduidelijkheid scheppen rond auteurschap en credits, en riskante of onethische experimenten mogelijk maken. De auteurs betogen dat de wetenschappelijke gemeenschap nu duidelijke regels en waarborgen nodig heeft, terwijl de technologie nog in opkomst is, zodat geautomatiseerde onderzoekers de wetenschap versterken in plaats van verzwakken.
Bronvermelding: Lu, C., Lu, C., Lange, R.T. et al. Towards end-to-end automation of AI research. Nature 651, 914–919 (2026). https://doi.org/10.1038/s41586-026-10265-5
Trefwoorden: geautomatiseerd wetenschappelijk onderzoek, AI-wetenschapper, machine learning-experimenten, peer review-automatisering, wetenschappelijke integriteit