Clear Sky Science · nl
Weerklinken van macht: onderzoek naar geopolitieke vooringenomenheid in grote taalmodellen uit de VS en China
Waarom dit belangrijk is voor gewone lezers
Wanneer u een AI-chatbot vraagt naar wereldgebeurtenissen, gaat u er misschien van uit dat die neutraal is. Dit artikel laat zien dat antwoorden van toonaangevende systemen uit de Verenigde Staten en China ongemerkt kunnen neigen naar de politieke gezichtspunten van hun thuislanden. Begrijpen hoe deze verborgen kleur ontstaan en hoe sterk ze zijn, helpt burgers, journalisten en beleidsmakers te bepalen wanneer ze AI kunnen vertrouwen en wanneer ze de uitspraken met voorzichtigheid moeten benaderen.
Hoe de onderzoekers deze chatbots testten
De auteurs vergeleken twee geavanceerde chatbots: GPT-4o van OpenAI in de VS en DeepSeek-R1 van een Chinees bedrijf. Ze stelden een set van 50 vragen samen over wereldpolitiek, oorlogen, mensenrechten en betwiste regio’s, vergelijkbaar met de soorten vragen die mensen op sociale media en online fora plaatsen. Alle vragen werden in het Engels gesteld via de openbare webinterfaces van beide tools, met eenvoudige, éénmalige prompts zoals een gewone gebruiker zou doen. De volledige dataset van vragen en antwoorden werd vervolgens open gedeeld ter ondersteuning van vervolgonderzoek.
Wat ze in de antwoorden maten
Om verder te komen dan oppervlakkige indrukken combineerde het team kwantitatieve en menselijke analyse. Eerst zetten ze elk antwoord om in een numerieke representatie die de betekenis vastlegt, en maten vervolgens hoe dicht of ver de twee systemen bij elkaar lagen voor elke vraag. Ten tweede vroegen ze de modellen om in te schatten hoe sterk Amerikaanse en Chinese gezichtspunten op diezelfde vragen zouden kunnen afwijken. Ten derde inspecteerden ze de tekst handmatig, met aandacht voor toon, keuze van voorbeelden en welke feiten werden benadrukt of weggelaten. Deze mix van instrumenten stelde hen in staat zowel openlijke discrepanties als subtielere verschuivingen in kadering te ontdekken.
Waar de chatbots het eens waren en waar niet
Verrassend genoeg produceerden de twee systemen vaak grotendeels vergelijkbare antwoorden, zelfs over gevoelige kwesties zoals klimaatverantwoordelijkheid, de oorsprong van de COVID-19-pandemie of de erfenis van het nazisme. Beide neigden ertoe gebalanceerde overzichten te geven en vermeden extreme beweringen. Toch traden er belangrijke verschillen op. GPT-4o vertoonde wat de auteurs een “zachte” Westers-centrische bias noemen, bijvoorbeeld door liberale democratische ideeën of de rol van de NAVO en de Verenigde Naties in de uitleg te benadrukken. DeepSeek daarentegen echoode soms meer rechtstreeks Chinese staatsnarratieven en weigerde in enkele gevallen vragen te beantwoorden over onderwerpen die in China zeer gevoelig zijn, zoals de status van Taiwan of specifieke binnenlandse controverses. Deze weigeringen werden op het niveau van de webinterface geïmplementeerd als harde blokken in plaats van als eenvoudige hiaten in de mogelijkheden van het model. 
Verborgen aansturing in hoe verhalen worden verteld
De studie benadrukt dat de meest zorgwekkende invloed mogelijk niet duidelijke censuur is maar zachte sturing. In sommige antwoorden waren beide modellen het eens over basale feiten maar kaderden ze die anders: de ene benadrukte individuele vrijheden en electorale concurrentie, terwijl de andere stabiliteit, soevereiniteit of collectief welzijn accentueerde. In de loop van de tijd kan dergelijke zachte bias vormen wat gebruikers als “gezond verstand” gaan zien wanneer ze de chatbot als neutrale hulp beschouwen. Omdat meer dan de helft van de Amerikaanse volwassenen dergelijke tools al gebruikt, en ouderen bekend staan als kwetsbaar voor misleidende informatie, kunnen zelfs kleine, herhaalde duwtjes de publieke opvattingen over oorlogen, handelsconflicten of mensenrechten kantelen zonder dat mensen het merken. 
Wat dit betekent voor mensen en beleid
De auteurs concluderen dat zowel Amerikaanse als Chinese chatbots geopolitieke vingerafdrukken dragen, maar dat hun gedrag geen eenvoudige spiegel van overheidslijnen is. Training op enorme, gemengde wereldwijde data lijkt volledige ideologische controle te beperken, waardoor bedrijven voor de meest gevoelige kwesties eerder op onderwerpblokkades vertrouwen. Toch roept de aanwezigheid van zowel harde censuur als zachte kadering vragen op over vertrouwen, transparantie en het risico van grootschalige opinievorming. Voor lezers is de les helder: beschouw AI-uitkomsten over wereldzaken als één perspectief onder velen, niet als een neutrale bron van waarheid, en combineer ze met menselijk oordeel en diverse informatiebronnen.
Bronvermelding: Pacheco, A.G.C., Cavalini, A. & Comarela, G. Echoes of power: investigating geopolitical bias in US and China large language models. Humanit Soc Sci Commun 13, 675 (2026). https://doi.org/10.1057/s41599-026-06577-6
Trefwoorden: geopolitieke vooringenomenheid, grote taalmodellen, ChatGPT, DeepSeek, politieke communicatie