Clear Sky Science · de
Auswirkungen des Einsatzes künstlicher Intelligenz als Zweitbefunder beim Brustscreening einschließlich Schiedsspruch
Warum diese Studie für Frauen und Familien wichtig ist
Brustscreening ist eines der am weitesten verbreiteten Instrumente, um Krebs früh zu erkennen, wenn Therapien wirksamer und weniger belastend sind. Das System beruht jedoch auf einer großen, hochqualifizierten Fachkräftebasis, die Mammographiebilder visuell beurteilen. Im Vereinigten Königreich reichen die verfügbaren Radiologen nicht aus, um die Nachfrage entspannt abzudecken, was Bedenken hinsichtlich Verzögerungen und übersehener Krebserkrankungen aufwirft. Diese Studie stellt eine Frage, die Millionen von Frauen betrifft: Kann ein KI-System sicher einen Teil der Befundarbeit gemeinsam mit menschlichen Expertinnen und Experten übernehmen, ohne an Genauigkeit einzubüßen — und möglicherweise sogar helfen, Krebs früher zu erkennen?

Wie Brustscreening heute funktioniert
Im Breast Screening Programme des National Health Service werden Frauen im Alter von 50 bis 70 Jahren alle drei Jahre zu einer Mammographie eingeladen. Jede Bildserie wird üblicherweise unabhängig von zwei geschulten Mammographie-Befundenden gelesen, etwa Radiologinnen und Radiologen oder spezialisierten Radiographie-Fachkräften. Wenn die beiden Befunde nicht übereinstimmen oder wenn die lokale Richtlinie es vorsieht, wird der Fall einer besonderen Diskussion unterzogen, dem sogenannten Schiedsverfahren (arbitration), in dem die Befundenden gemeinsam entscheiden, ob die Frau zur weiteren Abklärung zurückgerufen werden sollte. Dieses Doppelbefundungs-System ist darauf ausgelegt, zwei Ziele auszubalancieren: so viele Krebserkrankungen wie möglich zu entdecken und gleichzeitig unnötige Rückrufe zu vermeiden, die Ängste, zusätzliche Untersuchungen und Kosten verursachen.
Was die Forschenden testen wollten
Das Team untersuchte Mammographien und klinische Aufzeichnungen von 50.000 Frauen, die in zwei Krankenhausversorgungen in London gescreent wurden. Da diese Frauen mehrere Jahre nachverfolgt wurden, konnten die Forschenden nicht nur feststellen, welche Krebserkrankungen beim Screening entdeckt wurden, sondern auch welche später zwischen zwei Screenings auftraten (sogenannte Intervallkrebse) oder bei der nächsten Routineuntersuchung. Sie verglichen zwei Wege mit denselben historischen Bildern: den Standardansatz mit zwei menschlichen Befundenden und einen KI-unterstützten Ansatz, bei dem die erste Befundung durch eine Person erfolgte und die zweite durch das von Google entwickelte KI-System. Alle Fälle, die eine abschließende Entscheidung benötigten, wurden an Schiedspanels mit 22 erfahrenen Befundenden weitergeleitet, die so arbeiteten, wie sie es in echten Kliniken tun würden.
Wie gut die KI gegenüber menschlichen Experten abschnitt
Insgesamt lieferten Einsätze der KI als Zweitleser, nachdem Schiedsentscheidungen berücksichtigt wurden, mindestens vergleichbare Ergebnisse wie zwei Menschen. Der KI-unterstützte Weg zeigte eine sehr ähnliche Fähigkeit, Frauen mit tatsächlich bestehendem Krebs zu erkennen (Sensitivität), und Frauen ohne Krebs zu beruhigen (Spezifität) und erfüllte strenge statistische Kriterien für „Nicht-Unterlegenheit“ (Noninferiority). Tatsächlich war die Spezifität mit KI leicht höher, was bedeutete, dass weniger Frauen unnötig zurückberufen wurden, und die Krebsentdeckungsrate war zwischen den beiden Ansätzen praktisch identisch. Da die KI in den meisten Fällen einen der menschlichen Befunde ersetzte, fiel die Gesamtzahl der routinemäßigen Befundungen ungefähr halbiert aus, was selbst nach Berücksichtigung des zusätzlichen Aufwands bei Schiedsverfahren eine geschätzte Reduktion der Befundzeiten um 36–44 % bedeutet.

Wobei die KI half — und wo sie Mängel zeigte
Vor dem Schiedsverfahren war das KI-System eher als einzelne menschliche Befundende dazu geneigt, Krebserkrankungen zu markieren, die später zwischen den Screenings oder bei der nächsten Routineuntersuchung erschienen, was darauf hindeutet, dass es manchmal subtile Veränderungen erkennt, die Menschen übersehen. Viele dieser potenziellen Frühwarnungen wurden jedoch im Schiedsverfahren zurückgenommen, insbesondere wenn die Befundenden von älteren Bildern beeinflusst wurden, die die KI nicht analysiert hatte, oder von zusätzlichen KI-markierten Stellen, die sich als harmlos herausstellten. In einer kleinen, aber wichtigen Untergruppe von 93 Frauen beurteilte die KI korrekt, dass etwas nicht in Ordnung war, doch die Schiedspanels entschieden gegen einen Rückruf; die meisten dieser Frauen entwickelten später Intervall- oder beim nächsten Screening erkannte Krebserkrankungen. Gleichzeitig strich die menschliche Schiedsentscheidung viele durch die KI ausgelöste Rückrufe korrekt, bei Frauen, die letztlich krebsfrei blieben, wodurch die Gesamtspezifität verbessert wurde. Über verschiedene Altersgruppen, Ethnien, Brustdichten und Krebsarten hinweg entsprach der KI-unterstützte Weg insgesamt weitgehend der Leistung der Standardversorgung, wobei die Ergebnisse für einige kleinere Untergruppen jedoch unsicherer waren.
Was das für zukünftiges Screening bedeuten könnte
Die Studie legt nahe, dass KI sicher die Rolle eines Zweitlesers beim Brustscreening übernehmen kann, ohne die Versorgungsqualität zu verringern, und zugleich den Druck auf ein angespanntes Personal verringert. Sie macht aber auch die Grenzen aktueller Systeme deutlich: Allein zeigte die KI Potenzial, Krebs früher zu markieren, doch diese Vorteile wurden abgeschwächt, wenn die Menschen — verständlicherweise vorsichtig — einige KI-Hinweise überstimmten. Die Autorinnen und Autoren argumentieren, dass eine bessere Verständlichkeit der KI-Erklärungen, eine Reduktion ablenkender Fehlalarme und die Schulung von Klinikerinnen und Klinikern darin, wann dem Werkzeug zu vertrauen oder es zu hinterfragen ist, mehr von seinem Potenzial freisetzen könnten. Wenn diese Mensch‑Maschine-Partnerschaften verfeinert und sorgfältig in realen Studien geprüft werden, könnte KI-unterstütztes Screening nicht nur bestehende Programme aufrechterhalten, sondern auch dazu beitragen, dass mehr Frauen ihre Krebserkrankungen in einem Stadium entdecken, in dem eine Behandlung mit höherer Erfolgsaussicht möglich ist.
Zitation: Warren, L.M., Venton, J., Young, K.C. et al. Impact of using artificial intelligence as a second reader in breast screening including arbitration. Nat Cancer 7, 507–521 (2026). https://doi.org/10.1038/s43018-026-01128-z
Schlüsselwörter: Brustkrebs-Screening, Mammographie, künstliche Intelligenz, Arbeitsbelastung in der Radiologie, medizinische Schiedsentscheidung