Clear Sky Science · nl
Subgroepprestaties van een commercieel model voor digitale borsttomosynthese bij borstkankeropsporing
Waarom dit ertoe doet voor vrouwen en gezinnen
Borstkankerscreening redt levens, maar geen enkele test is perfect. Artsen wenden zich nu tot kunstmatige intelligentie (AI) om te helpen bij het lezen van complexe 3D-borströntgenfoto's. Deze studie bekeek nauwkeurig hoe een veelgebruikt AI-systeem presteert voor verschillende groepen vrouwen en verschillende soorten borstveranderingen, en bracht daarmee in kaart waar het hulpmiddel goed functioneert en waar het moeite heeft. 
Een nadere blik op een nieuw soort mammogram
Traditionele mammogrammen zijn vlakke, tweedimensionale röntgenfoto's. Veel klinieken gebruiken tegenwoordig digitale borsttomosynthese, een 3D-achtig onderzoek opgebouwd uit vele dunne plakjes van de borst. Het kan kankers zichtbaar maken die verborgen zouden blijven in over elkaar ligend weefsel, vooral bij dichte borsten, maar de beelden kosten meer tijd om te beoordelen en kunnen nog steeds kleine calciumplekjes missen die vroege ziekte signaleren. Daarom hebben bedrijven AI-tools ontwikkeld om verdachte gebieden voor radiologen te markeren. Tot nu toe richtten de meeste evaluaties van deze tools zich op de algehele nauwkeurigheid, niet op hoe ze zich gedragen voor specifieke patiëntengroepen of tumortypen.
Grote real-world test van een AI-hulp
Onderzoekers van de Emory University bestudeerden een commercieel AI-systeem genaamd INSIGHT DBT, toegepast op 3D-borstbeelden van meer dan 167.000 screeningsonderzoeken bij meer dan 61.000 vrouwen. Ze vergeleken AI-scores met werkelijke uitkomsten en maakten onderscheid tussen duidelijk negatieve onderzoeken, goedaardige biopsieën en bewezen kankers. De hoofdvraag was hoe goed de AI routine-screeningskankers onderscheidt van onderzoeken die geen kanker bleken te zijn. Over alle vrouwen samen liet de AI sterke prestaties zien: in de meeste gevallen rangschikte het systeem kwaadaardige en goedaardige onderzoeken correct en het correspondeerde met de resultaten uit de oorspronkelijke regulatoire beoordeling. De prestaties waren vergelijkbaar over leeftijds-, ras- en etnische groepen, een belangrijke bevinding voor billijkheid in zorg.
Waar de AI uitblinkt en waar hij tekortschiet
Bij nadere analyse kwamen er duidelijke patronen naar voren. De AI presteerde het best bij het opsporen van invasieve kankers die vaste massa's vormen of zichtbare vervormingen in het borstsweefsel veroorzaken; het markeerde de meeste van deze gevallen correct. Hij was minder betrouwbaar voor kankers die binnen de melkgangen blijven, bekend als in situ-ziekte, en voor kankers die zich vooral manifesteren als fijne clusters van kleine calciumafzettingen. Voor deze vroege laesies miste het systeem bijna de helft en daalde de algehele nauwkeurigheid. Dicht borstweefsel verminderde de prestaties ook enigszins, vermoedelijk omdat dicht weefsel subtiele tekenen kan verbergen. 
Wat de scorepatronen onthullen
Door het volledige bereik van AI-scores te bestuderen in plaats van alleen ja/nee-beslissingen, zagen de onderzoekers dat onderzoeken met zorgwekkendere pathologie vaak hogere scores kregen. Goedaardige en laagrisico-uitkomsten werden meestal laag gescoord, terwijl invasieve kankers zich concentreerden aan de hoge kant van de schaal. Echter, enkele niet-kankergeassocieerde vervormingen kregen hoge scores, wat leidde tot valse alarmen, en sommige zeldzame subtypes van invasieve kanker en in situ-laesies werden te laag gescoord. De AI gaf zelfs aan ongeveer een derde van de kankers die tussen reguliere screenings opdoken hoge scores, wat suggereert dat het soms aanwijzingen ziet die mensen missen, hoewel de praktische impact hiervan in de echte wereld onzeker blijft.
Gevolgen voor patiënten en clinici
Voor de niet-specialist is de conclusie dat dit AI-hulpmiddel radiologen zinvol kan ondersteunen bij het lezen van complexe 3D-borstbeelden, zonder duidelijke verschillen tussen grote demografische groepen. Het is echter geen zelfstandige kankerdetector. Het is minder betrouwbaar voor de vroegste, calciumgebaseerde kankers en bij zeer dichte borsten, en het kan nog steeds onnodige vervolgonderzoeken veroorzaken bij sommige goedaardige gevallen. De auteurs stellen dat het essentieel is deze sterke punten en blinde vlekken te begrijpen voordat men op AI vertrouwt in de dagelijkse screening, zodat artsen het gebruiken als een zorgvuldige partner in plaats van een vervanging.
Bronvermelding: Brown-Mulry, B., Isaac, R.S., Lee, S.H. et al. Subgroup performance of a commercial digital breast tomosynthesis model for breast cancer detection. Nat Commun 17, 4249 (2026). https://doi.org/10.1038/s41467-026-70637-3
Trefwoorden: borstkankerscreening, digitale borsttomosynthese, medische AI, mammografie, DCIS