Clear Sky Science · nl

Prestaties van borstkanker‑risicovoorspellingsalgoritmes over mammografiesystemen in het Britse screeningsprogramma

2026-03-08 · Terug naar het overzicht

Waarom dit van belang is voor vrouwen en gezinnen

Borstscreensing redt levens doordat tumoren vroeg worden ontdekt, maar veel tumoren verschijnen nog steeds in de jaren tussen routinematige mammogrammen en vaak in een gevorderder stadium. Deze studie stelt een eenvoudige maar belangrijke vraag: kan kunstmatige intelligentie (AI) een "normaal" mammogram lezen en stilletjes vrouwen signaleren die in feite een hoog kortetermijnrisico hebben, zodat zij extra controles kunnen krijgen voordat een kanker groeit en uitzaait?

Meer zien in een normaal mammogram

De meeste nationale screeningsprogramma's, waaronder dat van het VK, nodigen vrouwen uit voor een mammogram elke drie jaar. Als er niets verdachts wordt gezien, krijgt men te horen dat de scan "negatief" is en keert men terug naar het gewone leven. Toch is ongeveer 30% van de borstkankers bij gescreende vrouwen een "intervalkanker" die tussen geplande bezoeken verschijnt en doorgaans een slechtere prognose heeft. Recentelijk hebben krachtige AI‑systemen geleerd om mammogrammen te scannen die voor menselijke lezers normaal lijken en elke vrouw een kortetermijn‑risicoscore toe te kennen. Het idee is deze verborgen informatie te gebruiken om de screeningsfrequentie te personaliseren en te bepalen wie gevoeliger onderzoeken zoals MRI of contrastverrijkte mammografie zou moeten krijgen.

Vier AI‑tools aan de tand voelen

De onderzoekers bestudeerden 112.621 negatieve screeningsmammogrammen van twee locaties van het NHS Breast Screening Programme in Engeland, die één volledige driejarige ronde van 2014 tot 2017 besloegen en vrouwen vijf jaar opvolgden. De twee locaties gebruikten verschillende digitale mammografiemachines (Philips en GE), wat de variatie in de praktijk weerspiegelt. Tijdens de follow‑up ontwikkelden 1.225 vrouwen borstkanker, inclusief 396 intervalkankers en aanvullende kankers die bij de volgende screeningsronde werden gevonden. Vier toonaangevende AI‑risicoalgoritmen — drie commerciële en één academisch model — werden lokaal op elk mammogram uitgevoerd om een risicoscore voor toekomstige kanker te genereren, en hun prestaties werden vergeleken.

Hoe goed de algoritmen toekomstige kankers zagen aankomen

Alle vier de AI‑systemen konden, beter dan toeval, onderscheid maken tussen vrouwen die wel en niet kanker zouden ontwikkelen, maar ze presteerden niet even goed. Één algoritme (aangeduid als DL‑1) toonde consequent de sterkste prestaties, terwijl een ander (DL‑3) achterbleef. Wanneer het team zich richtte op intervalkankers — die kort na een "normale" scan verschijnen — bereikte het beste model nauwkeurigheidsniveaus die vergelijkbaar zijn met, of beter dan, eerdere studies met één algoritme. Belangrijk is dat drie van de vier tools op zowel Philips‑ als GE‑beelden vergelijkbaar presteerden, wat suggereert dat ze met ten minste enige verschillen in scannerhardware overweg kunnen, hoewel één algoritme duidelijk slechter presteerde op één systeem.

Wat gebeurt er als we handelen op hoge risicoscores?

De praktische vraag voor screeningsdiensten is hoeveel vrouwen moeten worden teruggeroepen op basis van AI‑scores. De onderzoekers bekeken daarom klinisch relevante drempels. Als alleen de 4% vrouwen met de hoogste risicoscores (volgens elk instrument) werden geselecteerd voor extra aandacht, vingen de twee beste algoritmen samen ongeveer één op de vijf van alle toekomstige kankers en meer dan een kwart van de intervalkankers. Wanneer de drempel werd versoepeld naar de hoogste 14% van de risicoscores — dichter bij terugroepingpercentages die in sommige Noord‑Amerikaanse programma's worden gezien — verdubbelde de opbrengst ruwweg: het sterkste model identificeerde ongeveer 42% van alle toekomstige kankers en de helft van de intervalkankers. Echter, elk algoritme neigde een deels andere subset kankers te signaleren, met relatief weinig overlap, wat erop wijst dat ensembles of strategieën met meerdere tools mogelijk meer tumoren vinden dan elk afzonderlijk model.

Sterke punten, leemten en vervolgstappen

Dit werk valt op omdat het gebruikmaakt van volledige, routinematige gegevens van twee grote NHS‑screeningcentra in plaats van een nauw geselecteerde onderzoekspopulatie, en het is de eerste studie die meerdere genoemde AI‑risicotools naast elkaar evalueert in de Britse context. Tegelijkertijd zijn er beperkingen. Vrouwen met implantaten of niet‑standaard beeldweergaven werden uitgesloten, en de studie omvatte slechts twee mammografiemerken, waardoor de prestaties op andere apparatuur of bij verschillende etnische groepen onzeker blijven. Omdat de analyse retrospectief was, werden sommige kankers die mogelijk eerder gevonden zouden zijn met risicogebaseerde aanvullende beeldvorming niet meegeteld, wat betekent dat het werkelijke voordeel groter kan zijn dan gerapporteerd.

Wat dit betekent voor toekomstige borstscreensing

Voor een niet‑specialistische lezer is de conclusie dat moderne AI inderdaad waarschuwingssignalen kan vinden in "normale" mammogrammen die voorspellen welke vrouwen waarschijnlijker zijn om op korte termijn borstkanker te ontwikkelen, met name intervalkankers die anders moeilijk vroeg op te sporen zijn. De beste algoritmen zouden in principe screeningsprogramma's in staat kunnen stellen om een relatief kleine groep vrouwen met hoger risico vaker of met gevoeliger onderzoeken te screenen, terwijl anderen doorgaan met de standaard driejaarlijkse controles. Toch laten de verschillen tussen tools, en tussen beeldvormingssystemen, zien dat geen enkel AI‑model zonder zorgvuldige toetsing overal kan worden ingevoerd. De auteurs pleiten voor grote prospectieve trials met meerdere algoritmen, samen met afstemming op lokale scanners en populaties, voordat AI‑gestuurde, risicogebaseerde borstscreensing veilig routinezorg kan worden.

Bronvermelding: Rothwell, J., Payne, N., Kilburn-Toppin, F. et al. Performance of breast cancer risk prediction algorithms across mammography systems in the UK screening programme. npj Digit. Med. 9, 330 (2026). https://doi.org/10.1038/s41746-026-02507-7

Trefwoorden: borstkankerscreening, kunstmatige intelligentie, mammografie, risicovoorspelling, intervalkankers