Clear Sky Science · sv
Diagnostisk noggrannhet, rättvisa och klinisk implementering av AI för bröstcancerscreening: resultat från multicentriska retrospektiva och prospektiva tekniska genomförbarhetsstudier
Smartare screening för vardagskvinnor
Bröstcancerscreening räddar liv, men den belastar också vårdsystemen och kan missa cancer eller utlösa stressande falska larm. Denna studie ställer en enkel fråga med stora konsekvenser: kan ett program med artificiell intelligens (AI) säkert hjälpa till att avläsa mammografier i Storbritanniens nationella screeningsprogram, hitta fler farliga cancerfall samtidigt som det avlastar hårt pressade specialister — och göra detta rättvist för kvinnor från olika bakgrunder?

Så fungerar screeningen i dag
I många länder, inklusive Storbritannien, bjuds kvinnor mellan 50 och 70 år in till regelbundna mammografier. I Storbritannien läses varje bild vanligen oberoende av två mänskliga experter; om de är oense granskar en panel fallet. Detta dubbelavläsningssystem är utformat för att vara säkert, men det är tidskrävande och beroende av att det finns tillräckligt med utbildade läsare — något många vårdsystem har svårt med. Tidigare datorverktyg gav begränsad hjälp och tillförde ibland mer brus än klarhet, så myndigheter har krävt stark ny evidens innan de litar på modern AI i nationella program.
Sätta AI på prov i verkliga kliniker
Forskarna utvärderade Googles uppdaterade mammografi‑AI i två stora faser inom Storbritanniens National Health Service. Först körde de systemet på nästan 116 000 tidigare screeningar från fem regioner och följde kvinnorna i mer än tre år för att se vilka cancerfall som faktiskt uppstod. De jämförde därefter AI:s prestanda med den första mänskliga läsaren, den andra läsaren och panelens slutliga beslut. I en andra fas installerades AI tyst i 12 screeningsajter och fick bearbeta över 9 000 nya undersökningar i realtid — utan att påverka vården — för att studera hur den beter sig i dagligt bruk och hur dess inställningar kan behöva justeras.
Vad AI såg — och vad den fångade
I den stora retrospektiva datamängden var AI:n mer känslig än den första mänskliga läsaren: den upptäckte fler cancerfall totalt samtidigt som den höll sin andel falska larm inom en förinställd säkerhetsgräns. Om systemet användes som en av läsarna i dubbelavläsningsflödet skulle det ha ökat cancerupptäckten från cirka 7,5 till 9,3 cancerfall per 1 000 kvinnor, och det markerade korrekt en av fyra cancer som ursprungligen missades och först upptäcktes senare, antingen mellan screeningar eller vid nästa rutinbesök. Vinsterna var särskilt starka bland kvinnor som kom för sin första screening — vanligtvis den svåraste gruppen att tolka eftersom det saknas tidigare bilder. Vid dessa första besök kallade AI både tillbaka färre kvinnor och upptäckte ändå något fler fall, särskilt invasiva tumörer som utgör det största hotet.
Rättvisa, arbetsbelastning och verkliga hinder
Teamet undersökte noggrant om AI:n behandlade olika grupper av kvinnor rättvist. Över ålder, brösttäthet, socioekonomisk status och de begränsade etnicitetsdata som fanns noterade de inga konsekventa tecken på skadlig bias: sensitivitet och specificitet hölls inom snäva gränser jämfört med mänskliga läsare, även om några mycket små delgrupper hade stor osäkerhet. De modellerade också hur användning av AI som andra läsare skulle omforma arbetsbördan. Antalet mänskliga screeningavläsningar före panelgranskning skulle kunna halveras nästan, vilket skulle minska läsartiden med cirka en tredjedel, även om fler fall skulle eskaleras till panelen. I den live genomförbarhetsfasen levererade AI:n resultat inom minuter — betydligt snabbare än rutinmässig mänsklig avläsning — men teamet upptäckte en förändring i hur nyare bilder såg ut jämfört med äldre träningsdata. En initial driftpunkt var för känslig, vilket orsakade högre återkallelsefrekvens, och behövde omkalibreras nedåt med hjälp av färsk lokal data.

Bygga ett AI‑redo screeningsystem
Utöver noggrannhet blottlade studien praktiska hinder för säker utrullning. Många screeningscenter förlitar sig fortfarande på pappersformulär och föråldrad mjukvara som inte automatiskt kan lagra AI‑resultat eller förklara varför en bild återkallas — funktioner som regulatorer och kliniker behöver. Författarna menar att fullt digitala, standardiserade arbetsflöden och bättre insamling av demografiska data kommer att vara avgörande för att övervaka prestanda och rättvisa över tiden. De betonar också att AI‑trösklar inte kan ”sättas och glömmas”: bildutrustning, läsarbeteenden och populationssammansättning förändras, så systemet måste kontinuerligt kontrolleras och justeras, med tydliga nationella regler och tekniskt stöd.
Vad detta betyder för patienter
Resultaten tyder på att ett noggrant utplacerat AI‑system skulle kunna hjälpa nationella bröstscreeningsprogram att upptäcka fler allvarliga cancerfall tidigare, särskilt bland kvinnor som går på sin första mammografi, samtidigt som arbetsbördan för överansträngda specialister minskas. Ändå understryker författarna att framgång kräver mer än en exakt algoritm. Vårdtjänster måste ha löpande omkalibrering, rigorös övervakning för drift och bias, uppgraderad IT‑infrastruktur och genomtänkt integration i befintliga mänskliga arbetsflöden. Med dessa skyddsåtgärder på plats kan AI bli en betrodd extra läsare som förbättrar både effektiviteten och rättvisan i bröstcancerscreening istället för en svart låda som tillför nya risker.
Citering: Kelly, C.J., Wilson, M., Warren, L.M. et al. Diagnostic accuracy, fairness and clinical implementation of AI for breast cancer screening: results of multicenter retrospective and prospective technical feasibility studies. Nat Cancer 7, 494–506 (2026). https://doi.org/10.1038/s43018-026-01127-0
Nyckelord: bröstcancerscreening, medicinsk artificiell intelligens, mammografi, hälsovårdens rättvisa, klinisk implementering