Clear Sky Science · nl
Prospectieve evaluatie van de integratie van kunstmatige intelligentie in borstkankerscreening in meerdere workflow-instellingen: de GEMINI-studie
Waarom dit belangrijk is voor vrouwen en klinieken
Borstscreening redt levens, maar legt ook een zware druk op specialisten en kan angst veroorzaken wanneer vrouwen onnodig worden teruggeroepen. Deze studie, uitgevoerd binnen een echt National Health Service (NHS) borstkankerscreeningprogramma in Schotland, stelde een praktische vraag: kan kunstmatige intelligentie (AI) artsen helpen meer kankers te vinden terwijl terugroepingen en werkbelasting onder controle blijven? In plaats van één enkele opzet te testen, verkenden de onderzoekers vele manieren om AI in het dagelijkse screeningsproces in te passen, en boden ze daarmee een routekaart voor klinieken met verschillende drukpunten en prioriteiten.

Hoe borstscreensing tegenwoordig werkt
In het Verenigd Koninkrijk worden vrouwen van 50 tot 71 jaar elke drie jaar uitgenodigd voor een mammogram. Elke set borstfoto’s wordt onafhankelijk gelezen door twee getrainde menselijke lezers. Als zij het niet eens zijn, neemt een derde expert de definitieve beslissing. Deze "dubbele lezing" verhoogt de veiligheid maar vraagt veel specialistische tijd. Tegelijkertijd hebben gezondheidssystemen te maken met toenemende aantallen vrouwen die komen voor screening en tekorten aan radiologen. Elk nieuw hulpmiddel moet dus meer doen dan alleen kankers herkennen; het moet ook in het bestaande systeem passen en helpen bij het beheren van beperkte personeelscapaciteit.
Wat de GEMINI-studie wilde testen
De GEMINI-studie volgde 10.889 vrouwen die in 2023 routineonderzoek ondergingen in één regio van het VK. Iedereen kreeg de gebruikelijke zorg: hun mammogrammen werden gelezen door twee menselijke experts, met arbitrage indien nodig. Op de achtergrond analyseerde een commercieel AI-systeem genaamd Mia ook de beelden en bewaarde stilletjes zijn oordeel. Het onderzoeksteam gebruikte vervolgens twee hoofdideeën. Ten eerste probeerden ze AI als een "extra veiligheidsnet": als AI een terugroeping suggereerde maar het screeningsteam dat niet deed, werden haar beelden opnieuw door een menselijke beoordelaar bekeken. Ten tweede gebruikten ze de opgeslagen AI-uitvoer om verschillende "triage"-opzetten te simuleren, waarbij AI gelegentlich de tweede lezer zou vervangen om tijd te besparen. In totaal modelleerden ze 17 verschillende workflows die deze benaderingen combineerden.
Wat er gebeurde toen AI als extra beoordelaar fungeerde
Wanneer AI het oneens was met de routinematige beslissing om niet terug te roepen, bekeken senior lezers die mammogrammen nogmaals. Van de 1.345 zulke gevallen werden 55 vrouwen teruggeroepen voor vervolgonderzoek, en werden 11 extra borstkankers gevonden die anders bij dat bezoek gemist zouden zijn. Het merendeel hiervan waren invasieve kankers, en veel waren relatief klein. Belangrijk is dat het heronderzoek van deze extra gevallen snel was: ongeveer negen van de tien werden in minder dan een minuut gelezen, vergelijkbaar met of sneller dan een typisch mammogram. Dit suggereert dat ervaren lezers de AI-aanwijzingen efficiënt konden gebruiken, echte zorgen bevestigden en onschuldige veranderingen met vertrouwen konden afdoen door vergelijking met eerdere beelden.

Hoe triage met AI de werkdruk kan verlichten
Het team vroeg zich vervolgens af hoe AI veilig enkele van de tweede menselijke lezingen kon vervangen. In "triage"-workflows bleef een akkoord tussen de eerste menselijke lezer en AI geldig, en was een tweede lezer voor die gevallen niet nodig. In "triage negatives"-workflows werd deze kortsluiting alleen gebruikt wanneer beiden overeenkwamen dat geen terugroeping nodig was, wat extra terugroepingen voorkomt maar toch werk bespaart. Afhankelijk van de voor AI ingestelde besluitdrempels konden deze gesimuleerde strategieën de totale leestijd met ongeveer een derde tot bijna de helft verminderen. Sommige versies verminderden het aantal gevonden kankers licht, terwijl andere de kankerdetectie behielden en zelfs het aandeel vrouwen dat werd teruggeroepen voor vervolgonderzoek verlaagden.
Het beste evenwicht vinden voor elke kliniek
De belangrijkste workflow die de auteurs voorkeur gaven combineerde een "triage negatives"-opzet met de extra-beoordelaarrol voor AI. In deze configuratie werden alle kankers die bij routinematige screening werden gevonden nog steeds opgespoord, plus de 11 extra kankers die door AI werden benadrukt. Dit verhoogde de kankerdetectiegraad met ongeveer 10 procent—ongeveer één extra kanker per 1.000 gescreende vrouwen—terwijl de terugroepingsgraad nagenoeg ongewijzigd bleef en de menselijke leestijd met maximaal 31 procent werd verminderd. Andere geteste workflows boden verschillende afwegingen, zoals grotere besparingen in werkbelasting en minder valse alarmen, ten koste van het missen van een klein aantal kankers die de primaire workflow wel had gevonden.
Wat dit betekent voor de toekomstige borstscreensing
Voor niet‑specialisten is de kernboodschap dat AI niet op het punt staat artsen in borstscreensing te vervangen, maar kan dienen als een flexibele assistent. In deze real‑world evaluatie hielp één AI‑systeem, mits zorgvuldig gebruikt, meer kankers te vinden zonder het aantal terugroepingen te verhogen en terwijl een substantieel deel van de deskundige leestijd werd vrijgemaakt. Omdat de studie veel mogelijke opzetten verkende, kunnen zorgverleners de configuratie kiezen die het beste bij hun behoeften past, of dat nu het maximaliseren van kankerdetectie is, het verminderen van onnodige terugroepingen, of het verlichten van personeelstekorten. Verder onderzoek in andere regio’s, met verschillende AI-hulpmiddelen en langer vervolgonderzoek, zal nodig zijn, maar deze studie laat zien dat doordacht geïntegreerde AI borstscreensing zowel scherper als duurzamer kan maken.
Bronvermelding: de Vries, C.F., Lip, G., Staff, R.T. et al. Prospective evaluation of artificial intelligence integration into breast cancer screening in multiple workflow settings: the GEMINI study. Nat Cancer 7, 484–493 (2026). https://doi.org/10.1038/s43018-026-01126-1
Trefwoorden: borstkankerscreening, kunstmatige intelligentie, mammografie, radiologiewerkbelasting, kankerdetectie