Clear Sky Science · nl
Invloed van oplossings-efficiëntie en positieve instructie op additieve en subtractieve oplossingsstrategieën bij mensen, GPT-4 en GPT-4o
Waarom minder doen opvallend moeilijk is
Wanneer we in het dagelijks leven dingen proberen te verbeteren—een e-mail herschrijven, een kamer herinrichten, een beleid herontwerpen—denken we meestal aan wat we kunnen toevoegen, niet aan wat we kunnen wegnemen. Deze stille neiging om toe te voegen in plaats van te schrappen kan ons leven vullen met rommel, opgeblazen software en te ingewikkelde regels. Het artikel onderzoekt hoe sterk deze “meer is beter”-gewoonte werkelijk is en of nieuwe kunstmatige intelligenties zoals GPT-4 en GPT-4o deze menselijke bias delen, verzachten of zelfs versterken.

Waarom toevoegen het wint van wegnemen in ons denken
Psychologen hebben aangetoond dat mensen vaak oplossingen over het hoofd zien die iets wegnemen, zelfs wanneer schrappen eenvoudiger of effectiever zou zijn. Toevoegen voelt natuurlijk en wordt versterkt door cultuur en taal: woorden als “meer” en “hoger” worden geassocieerd met verbetering en succes, terwijl “minder” kan klinken als verlies of falen. Deze bias komt in veel domeinen naar voren, van de gezondheidszorg die extra behandelingen bevoordeelt boven het stoppen van schadelijke gewoonten, tot milieubeleid dat recycling benadrukt in plaats van simpelweg minder afval produceren. De huidige studie vraagt of deze menselijke neiging tot toevoeging ook terug te zien is in krachtige taalmodellen die op enorme tekstverzamelingen zijn getraind.
Mensen en AI testen met eenvoudige puzzels
De onderzoekers voerden twee grote studies uit waarin menselijke deelnemers werden vergeleken met GPT-4 en vervolgens met diens opvolger GPT-4o. Zowel mensen als AI kregen twee soorten problemen. In een ruimtelijke “symmetrie”-taak moesten ze een klein rasterpatroon perfect symmetrisch maken door vakjes aan of uit te zetten, wat zowel door vullen (toevoegen) als door legen (wegnemen) kon worden bereikt. In een linguïstische “samenvatting”-taak kregen ze een nieuwsartikel en een bestaande samenvatting en moesten ze die aanpassen binnen woordbegrenzingen, opnieuw met de mogelijkheid om woorden toe te voegen of te schrappen. Het team manipuleerde ook twee belangrijke factoren: of toevoegen en wegnemen even efficiënt waren of dat schrappen duidelijk minder stappen vereiste, en of de instructies neutraal waren geformuleerd (“wijzig”) of positief geladen (“verbeter”).

Wat mensen deden versus wat de machines deden
In beide studies kwam een duidelijk patroon naar voren: mensen en taalmodellen gaven allemaal de voorkeur aan additieve oplossingen, maar de modellen deden dat veel sterker. Mensen voelden een robuuste neiging om vakjes of woorden toe te voegen, en letten toch op efficiëntie. Wanneer schrappen de snellere route was, waren ze merkbaar meer geneigd elementen te verwijderen. GPT-4 gedroeg zich daarentegen vaak precies andersom—hij produceerde juist meer additieve antwoorden op momenten waarop schrappen efficiënter zou zijn geweest. GPT-4o verminderde deze discrepantie enigszins in de tekstgebaseerde samenvattingstaak, waar zijn keuzes dichter bij het menselijk gedrag lagen, maar in de rastertaak negeerde het model efficiëntie grotendeels nog steeds. In veel condities, vooral voor GPT-4o, bereikten additieve reacties bijna plafonniveaus.
Hoe positieve formulering keuzes beïnvloedt
De emotionele toon van de instructies deed er ook toe, maar op specifieke manieren. In de ruimtelijke rastertaak veranderde het werkwoord van neutraal (“wijzig”) naar positief (“verbeteren”) de strategieën van mensen of modellen niet betrouwbaar. In de samenvattingstaak was het verhaal echter anders. Wanneer de instructies herhaaldelijk positieve bewoording gebruikten, produceerden zowel de GPT-modellen als, in de tweede studie, menselijke deelnemers meer additieve reacties. Dit sluit aan bij bredere taalkundige statistieken die laten zien dat woorden gerelateerd aan verbetering vaker gepaard gaan met ideeën van toevoegen dan van wegnemen. Het suggereert dat subtiele emotionele framing in prompts zowel mensen als AI in de richting van “meer” kan duwen, zelfs wanneer “minder” zou volstaan.
Waarom deze bevindingen ertoe doen voor alledaagse beslissingen
Voor een algemene lezer is de kernboodschap dat onze hersenen, en de AI’s die we bouwen, een sterke voorkeur delen voor oplossingen die toevoegen in plaats van schrappen—en dat huidige taalmodellen deze neiging vaak versterken. Mensen tonen nog enige flexibiliteit en passen zich aan wanneer schrappen duidelijk efficiënter is, maar de modellen volgen grotendeels patronen die in de taal waarin ze zijn getraind zijn ingebed. Nu deze systemen steeds vaker helpen bij het schrijven van beleid, het ontwerpen van systemen of het voorstellen van alledaagse verbeteringen, kunnen ze ons ongemerkt naar complexere, meer rommelige antwoorden sturen. Het onderkennen van deze gedeelde “voegingsbias” is een eerste stap naar het ontwerpen van hulpmiddelen en gewoonten die ons eraan herinneren niet alleen te vragen “Wat kunnen we toevoegen?” maar ook “Wat kunnen we weghalen?”
Bronvermelding: Uhler, L., Jordan, V., Buder, J. et al. Influence of solution efficiency and valence of instruction on additive and subtractive solution strategies in humans, GPT-4, and GPT-4o. Commun Psychol 4, 41 (2026). https://doi.org/10.1038/s44271-026-00403-0
Trefwoorden: voegingsbias, substractief redeneren, grote taalmodellen, mens–AI vergelijking, besluitvorming