Clear Sky Science · nl
Vergelijking van prestaties van kunstmatige intelligentie en zorgprofessionals bij chirurgische en interventionele videoanalyse: een systematische review en meta-analyse
Slimmere ogen in de operatiekamer
Elk jaar ondergaan honderden miljoenen mensen operaties en minimaal invasieve procedures die via video worden begeleid—denk aan colonoscopieën, kijkoperaties of kleine camera’s die in bloedvaten worden ingebracht. In zulke momenten kan het vermogen van een arts om subtiele waarschuwingssignalen op een scherm te zien het verschil betekenen tussen het vroegtijdig opsporen van kanker of het missen ervan. Deze studie stelt een vraag die voor iedere toekomstige patiënt belangrijk is: wanneer chirurgische en interventionele video’s worden geanalyseerd, hoe goed presteren systemen voor kunstmatige intelligentie vergeleken met menselijke clinici, en wat gebeurt er wanneer beide samenwerken?

Orde scheppen in een vloed van chirurgische video
De moderne geneeskunde neemt tegenwoordig enorme aantallen procedurevideo’s op, van endoscopieën van het maag-darmkanaal tot robotgeassisteerde operaties. Deze opnames zitten vol informatie: kleine poliepen in de dikke darm, vroege tumoren in maag of slokdarm, fijne zenuwen die vermeden moeten worden, of stappen in een complexe ingreep. Onderzoekers trainen AI-systemen om deze beelden te scannen, verdachte gebieden te markeren en zelfs te herkennen in welke fase van een procedure een chirurg zich bevindt. Tot nu toe stelden de meeste studies AI tegenover artsen in kunstmatige één-op-één confrontaties, in plaats van te onderzoeken hoe de technologie realistisch gebruikt zou kunnen worden—als hulp aan de zijde van de clinicus. Deze review had tot doel de verspreide bewijzen binnen verschillende specialismen systematisch te verzamelen en te analyseren.
Wat de onderzoekers onderzochten
Het team doorzocht grote medische en technische databases en begon met bijna 38.000 artikelen. Na het toepassen van strikte criteria—alleen primaire studies die AI gebruikten op echte chirurgische of interventionele video’s en de prestaties direct vergeleken met die van zorgprofessionals—bleven er slechts 146 studies over. Deze besloegen een breed scala aan procedures, vooral gastro-intestinale endoscopieën, maar ook long-, schildklier-, hersen-, hart- en urologische ingrepen. De meeste maakten gebruik van moderne deep-learningmethoden, zoals convolutionele neurale netwerken, getraind om ziekte te detecteren, anatomie te herkennen, de reinheid van de darm te beoordelen of stappen in een operatie te identificeren. Zesentwintig van deze studies rapporteerden voldoende details om de auteurs in staat te stellen resultaten te poolen en uit te rekenen hoe vaak AI en mensen het bij het rechte eind hadden of fouten maakten.
AI alleen versus artsen, en AI als teamgenoot
Wanneer de onderzoekers AI vergeleken met onondersteunde clinici die naar dezelfde video’s keken, pikten AI-systemen over het algemeen meer echte problemen op (hogere sensitiviteit) zonder meer valse alarmen te veroorzaken (vergelijkbare specificiteit). Dit patroon hield stand zowel wanneer modellen op vertrouwde data werden getest als wanneer ze werden geconfronteerd met nieuwe, externe datasets. De meest klinisch relevante bevinding trad echter op wanneer AI als assistent werd gebruikt. Over een breed scala aan taken waren clinici die AI-voorspellingen konden zien beter in het vinden van ziekte en minder geneigd om normaal weefsel fout te classificeren dan zij die alleen werkten. Deze verbetering was vooral opvallend voor niet-experts, zoals trainees, die het meeste profijt hadden van AI-advies. Voor ervaren specialisten presteerden AI-assistentie en AI alleen ongeveer op hetzelfde niveau, wat suggereert dat in deskundige handen de mens–machinecombinatie de beste standalone-algoritmen kan evenaren.
Kloof tussen laboratoriumomstandigheden en de praktijk
Ondanks deze veelbelovende cijfers benadrukt de review een kloof tussen hoe AI momenteel wordt getest en hoe het in echte klinische omgevingen moet functioneren. Veel studies schonen hun data door onscherpe of laagkwalitatieve videoframes te verwijderen, terwijl in echte operatiekamers en endoscopiekamers juist vaak met zulke imperfecties moet worden omgegaan. Andere studies analyseerden geïsoleerde snapshots in plaats van continue video, waarmee de uitdaging van het volgen van beweging en timing werd omzeild. Weinig studies evalueerden AI in real time aan het bed van de patiënt, en de meeste waren afhankelijk van hoogwaardige apparatuur die mogelijk niet beschikbaar is in ziekenhuizen met beperkte middelen. Ook waren de rapportagepraktijken inconsistent: belangrijke details over hoe modellen werden afgestemd en gevalideerd ontbraken vaak, wat het moeilijk maakt voor anderen om de resultaten te reproduceren of eerlijk te beoordelen.

Vertrouwde mens–AI partnerschappen opbouwen
De auteurs betogen dat AI in chirurgie en interventionele geneeskunde vanaf het begin ontwikkeld en getest moet worden als een partner voor clinici, niet als vervanging. Dat betekent studies ontwerpen die de echte werkomstandigheden weerspiegelen, diverse videodatasets tussen centra delen en duidelijke rapportagestandaarden hanteren zodat andere teams gepubliceerde resultaten kunnen verifiëren en verbeteren. Het houdt ook in dat clinici worden getraind om AI’s sterke punten en vooroordelen te begrijpen, in plaats van blindelings vertrouwen op of het afwijzen van zijn suggesties. Hoewel de meta-analyse laat zien dat AI al vaak het niveau van onondersteunde menselijke prestaties kan evenaren of overtreffen bij veel video-gebaseerde taken, ligt het meest betekenisvolle voordeel in hoe het menselijk oordeel kan aanscherpen. Voor patiënten is de conclusie niet dat machines de operatiekamer zullen overnemen, maar dat zorgvuldig ontworpen mens–AI teams procedures veiliger, diagnoses eerder en uitkomsten beter zouden kunnen maken.
Bronvermelding: Rafati Fard, A., Williams, S.C., Smith, K.J. et al. Comparing artificial intelligence and healthcare professional performance in surgical and interventional video analysis: a systematic review and meta-analysis. npj Digit. Med. 9, 323 (2026). https://doi.org/10.1038/s41746-026-02401-2
Trefwoorden: chirurgische video-AI, computerondersteunde endoscopie, mens–AI samenwerking, medische beeldanalyse, klinische besluitvorming ondersteuning