Clear Sky Science · nl
Impact van kunstmatige intelligentie als tweede beoordelaar bij borstkankerscreening inclusief arbitrage
Waarom deze studie ertoe doet voor vrouwen en gezinnen
Borstscreening is een van de meest gebruikte middelen om kanker vroeg op te sporen, wanneer behandeling effectiever en minder ingrijpend is. Toch steunt het systeem op een grote, hoogopgeleide groep specialisten die mammogrammen visueel beoordelen. In het Verenigd Koninkrijk zijn er niet genoeg radiologen om gemakkelijk aan de vraag te voldoen, wat zorgen wekt over vertragingen en gemiste kankers. Deze studie stelt een vraag die miljoenen vrouwen raakt: kan een systeem voor kunstmatige intelligentie (AI) veilig een deel van het leeswerk overnemen naast menselijke experts zonder aan nauwkeurigheid in te boeten — en misschien zelfs helpen om kankers eerder te vinden?

Hoe borstscrening tegenwoordig werkt
In het NHS Breast Screening Programme worden vrouwen van 50 tot 70 jaar elke drie jaar uitgenodigd voor een mammogram. Iedere set beelden wordt normaal gesproken onafhankelijk gelezen door twee getrainde mammografielezers, zoals radiologen of gespecialiseerde radiografen. Als de twee het niet eens zijn, of als het lokale beleid dit vereist, gaat de casus naar een speciale bespreking genaamd arbitrage, waarbij lezers samen beslissen of de vrouw moet worden opgeroepen voor verder onderzoek. Dit dubbellees-systeem is ontworpen om twee doelen in balans te brengen: zoveel mogelijk kankers opsporen en onnodige oproepen vermijden die angst, extra onderzoeken en kosten veroorzaken.
Wat de onderzoekers wilden testen
Het team bestudeerde mammogrammen en klinische gegevens van 50.000 vrouwen die waren gescreend bij twee ziekenhuisdiensten in Londen. Omdat deze vrouwen meerdere jaren follow-up hadden, konden de onderzoekers niet alleen zien welke kankers tijdens de screening werden ontdekt, maar ook welke later tussen screenings optraden (zogenaamde intervalkankers) of bij het volgende routinematig bezoek. Ze vergeleken twee trajecten met dezelfde historische beelden: de standaardmethode met twee menselijke lezers, en een AI-geassisteerde methode waarbij de eerste lezer menselijk was en de tweede de door Google ontwikkelde AI. Zaken die een definitieve beslissing nodig hadden, gingen naar arbitragepanels van 22 ervaren lezers, die werkten zoals zij dat in echte klinieken zouden doen.
Hoe goed de AI het deed tegenover menselijke experts
In het algemeen presteerde het gebruik van AI als tweede lezer minstens even goed als twee mensen, zodra arbitrag beslissingen waren meegenomen. Het AI-geassisteerde traject liet een zeer vergelijkbaar vermogen zien om vrouwen met daadwerkelijk kanker te signaleren (sensitiviteit) en degenen zonder kanker gerust te stellen (specificiteit), en voldeed daarmee aan strikte statistische criteria voor “niet-inferioriteit”. Sterker nog, de specificiteit was licht hoger met AI, wat betekende dat minder vrouwen onterecht werden opgeroepen, en de kankerdetectiesnelheid was vrijwel identiek tussen de twee benaderingen. Omdat AI in de meeste gevallen één van de menselijke lezingen verving, daalde het totale aantal routinematige lezingen met ongeveer de helft, wat zich vertaalde in een geschatte vermindering van 36–44% in leestijd, zelfs na rekening te hebben gehouden met extra inspanning bij arbitrage.

Waar AI hielp — en waar het tekortschiet
Voor de arbitrage was het AI-systeem eerder geneigd dan individuele menselijke lezers om kankers te signaleren die later tussen screenings of bij het volgende routineronde verschenen, wat suggereert dat het soms subtiele veranderingen kan zien die mensen missen. Veel van deze potentiële vroege waarschuwingssignalen werden echter tijdens arbitrage teruggedraaid, vooral wanneer lezers werden beïnvloed door oudere beelden die de AI niet had geanalyseerd of door extra door AI gemarkeerde plekken die uiteindelijk onschuldig bleken. In een kleine maar belangrijke subset van 93 vrouwen beoordeelde de AI correct dat er iets mis was, maar besloten de arbitragepanels niet tot oproeping; de meeste van deze vrouwen ontwikkelden later interval- of volgende-ronde-kankers. Tegelijkertijd annuleerde menselijke arbitrage correct veel door AI getriggerde oproepen bij vrouwen die uiteindelijk kankervrij bleken, waardoor de algehele specificiteit verbeterde. Over verschillende leeftijdsgroepen, etniciteiten, borstdensiteiten en kankertypes heen, kwam het AI-geassisteerde traject over het algemeen overeen met de prestaties van de standaardzorg, hoewel de resultaten voor enkele kleinere subgroepen minder zeker waren.
Wat dit kan betekenen voor toekomstige screening
De studie suggereert dat AI veilig de rol van tweede lezer in borstscrening kan overnemen zonder de kwaliteit van de zorg te verminderen, terwijl het de druk op een krappe beroepsgroep verlicht. Tegelijkertijd belicht het ook de grenzen van huidige systemen: op zichzelf toonde AI potentieel om kankers eerder te signaleren, maar die voordelen werden verwaterd wanneer mensen, begrijpelijk terughoudend, sommige AI-aanwijzingen terzijde schoven. De auteurs stellen dat het verbeteren van hoe AI haar suggesties uitlegt, het verminderen van afleidende valse alarmen en het trainen van clinici in wanneer ze het hulpmiddel moeten vertrouwen of juist betwijfelen, meer van het potentieel kan ontsluiten. Als deze mens–machinepartnerschappen worden verfijnd en zorgvuldig getest in praktijkproeven, kan AI-ondersteunde screening niet alleen bestaande programma’s in stand houden maar ook helpen dat meer vrouwen hun kanker in een stadium wordt ontdekt waarin behandeling het meest succesvol is.
Bronvermelding: Warren, L.M., Venton, J., Young, K.C. et al. Impact of using artificial intelligence as a second reader in breast screening including arbitration. Nat Cancer 7, 507–521 (2026). https://doi.org/10.1038/s43018-026-01128-z
Trefwoorden: borstkankerscreening, mammografie, kunstmatige intelligentie, radiologie werklast, medische arbitrage