Clear Sky Science · nl
Generatieve AI in academisch schrijven: een vergelijking tussen door mensen geschreven en door ChatGPT gegenereerde titels van onderzoeksartikelen
Waarom de manier waarop we wetenschappelijke artikelen titelen ertoe doet
Als je online naar medisch onderzoek zoekt, is de eerste indruk die je krijgt de titel van het artikel. In slechts een paar woorden moet deze duidelijk maken waar de studie over gaat en waarom het belangrijk is. Nu generatieve AI-tools zoals ChatGPT onderzoekers helpen tekst op te stellen, stelt deze studie een actuele vraag: kan AI echt nabootsen hoe experts die cruciale titels formuleren, en wat kan er verloren of gewonnen gaan als we dat laten gebeuren?
AI en mensen naast elkaar bestuderen
De onderzoekers stelden twee zorgvuldig afgestemde verzamelingen titels samen binnen de algemene geneeskunde. De ene bevatte 300 titels geschreven door mensen en gepubliceerd in drie van ’s werelds meest invloedrijke medische tijdschriften: The Lancet, JAMA en The BMJ. De andere bevatte 300 titels gegenereerd door ChatGPT, elk gebaseerd op de samenvatting van precies hetzelfde artikel. Dit ontwerp stelde de auteurs in staat menselijke en AI-keuzes direct te vergelijken terwijl de onderliggende studie gelijk bleef. Ze onderzochten de titels vervolgens met zowel eenvoudige tellingen als statistische tests, met een focus op lengte, structuur en welk soort informatie werd benadrukt.

Hoe vergelijkbaar zijn AI- en menselijke titels?
Op het eerste gezicht leken de titels van ChatGPT opvallend op die van medische onderzoekers. De gemiddelde lengte was vrijwel identiek, waarbij beide titelseries rond de twintig woorden schommelden. Zowel mensen als de AI gaven sterk de voorkeur aan meerledige titels die uit twee delen bestonden, en bijna al deze titels waren compacte zelfstandignaamwoord-achtige zinnen in plaats van volzinnen. Deze stijl, lang gebruikelijk in de geneeskunde, stelt auteurs in staat veel detail te vermelden terwijl de titel grammaticaal eenvoudig blijft. De nauwe overeenkomst toont dat ChatGPT deze genregewoonten uit de teksten waarop het getraind is heeft overgenomen en ze met aanzienlijke nauwkeurigheid kan reproduceren.
Verborgen verschillen in stijl en focus
Onder deze oppervlakkige gelijkenis kwamen echter belangrijke verschillen aan het licht. ChatGPT maakte nog intensiever gebruik van tweedelige titels dan menselijke auteurs, wat duidt op een neiging de voorkeur te geven aan sterk informatieve, uitgewerkte formaten. Toen de auteurs keken naar wat de titels kozen te benadrukken, legden zowel mensen als de AI vooral de nadruk op onderzoeksmethoden, in overeenstemming met de sterke nadruk in de geneeskunde op studiedesign en transparantie. Toch produceerde de AI relatief meer titels die draaiden om databronnen en expliciete resultaten, en minder titels die simpelweg het onderwerp noemden of methoden combineerden met informatie over datasets op een flexibeler manier. Menselijke auteurs gebruikten daarentegen een iets bredere mix van strategieën—soms kozen ze voor kortere, enkel onderwerpgerichte titels of subtiele variaties die bepaalde aspecten van een studie meer op de voorgrond plaatsten.

Wat dit betekent voor schrijven met AI
Deze patronen wijzen op een dubbelzijdige eigenschap van door AI ondersteund schrijven. Enerzijds suggereert de nauwe overeenstemming tussen ChatGPT en menselijke praktijken dat generatieve AI een nuttig hulpmiddel kan zijn om titels te maken die passen binnen vastgestelde medische normen, vooral voor studenten of onderzoekers die in een tweede taal schrijven. Anderzijds loopt het model het risico titels na verloop van tijd formeler en voorspelbaarder te maken door zijn sterke neiging naar bepaalde vertrouwde patronen—veelledigheid, naamwoordrijke constructies, methodengeoriënteerdheid en vaak een nauwe koppeling aan datasets of resultaten. Als schrijvers te veel leunen op AI-voorstellen zonder ze kritisch te bevragen, kan de variatie en creativiteit in wetenschappelijke titels geleidelijk afnemen, met subtiele effecten op hoe onderzoek wordt gepresenteerd, gevonden en geïnterpreteerd.
Hulp van machines in evenwicht brengen met menselijk oordeel
In eenvoudige woorden concludeert de studie dat ChatGPT heel goed is in het imiteren van de gebruikelijke manier waarop medische titels worden geschreven, maar minder vaardig is in het bewust buigen of oprekken van die regels. Het volgt de meerderheid in plaats van het script opnieuw te bedenken. De auteurs pleiten ervoor dat docenten en onderzoekers kritische AI-geletterdheid moeten ontwikkelen: de gewoonte om AI-gegenereerde titels als concepten te behandelen die beoordeeld en herzien moeten worden, niet als definitieve producten die kritiekloos worden geaccepteerd. Op deze manier kan generatieve AI schrijvers helpen disciplineconventies te leren en toe te passen, terwijl menselijk oordeel de nuance, klemtoon en incidentele vindingrijkheid behoudt die wetenschappelijke communicatie levendig en helder houden.
Bronvermelding: Ibrahim, S.K.M., Mahmoud, Z.A.Z. Generative AI in academic writing: a comparison of human-authored and ChatGPT-generated research article titles. Humanit Soc Sci Commun 13, 394 (2026). https://doi.org/10.1057/s41599-026-06956-z
Trefwoorden: generatieve AI, academisch schrijven, medisch onderzoek, artiektitels, ChatGPT