Clear Sky Science · it
Impatto dell’uso dell’intelligenza artificiale come secondo lettore nello screening mammografico compresa l’arbitration
Perché questo studio è importante per donne e famiglie
Lo screening mammografico è uno degli strumenti più diffusi per individuare il cancro in fase precoce, quando il trattamento è più efficace e meno aggressivo. Tuttavia, il sistema dipende da una vasta e specializzata forza lavoro che esamina le immagini mammografiche a occhio nudo. Nel Regno Unito non ci sono abbastanza radiologi per soddisfare comodamente la domanda, con il rischio di ritardi e di tumori non rilevati. Questo studio pone una domanda che riguarda milioni di donne: un sistema di intelligenza artificiale (IA) può assumersi in sicurezza parte del lavoro di lettura insieme agli esperti umani senza compromettere l’accuratezza — e forse aiutare a rilevare i tumori più precocemente?

Come funziona oggi lo screening mammografico
Nel National Health Service Breast Screening Programme, alle donne di età compresa tra 50 e 70 anni viene offerta una mammografia ogni tre anni. Ogni serie di immagini viene normalmente letta in modo indipendente da due lettori esperti in mammografia, come radiologi o radiografe specializzate. Se i due lettori non concordano, o se la politica locale lo richiede, il caso passa a una discussione speciale chiamata arbitrage (arbitration), durante la quale i lettori decidono insieme se richiamare la donna per ulteriori accertamenti. Questo sistema a doppia lettura è pensato per bilanciare due obiettivi: individuare il maggior numero possibile di tumori evitando richiami non necessari che causano ansia, esami aggiuntivi e costi.
Cosa hanno voluto verificare i ricercatori
Il team ha analizzato mammografie e cartelle cliniche di 50.000 donne sottoposte a screening in due servizi ospedalieri di Londra. Poiché queste donne avevano diversi anni di follow-up, i ricercatori hanno potuto vedere non solo quali tumori erano stati rilevati allo screening, ma anche quali sono comparsi successivamente tra uno screening e l’altro (i cosiddetti tumori d’intervallo) o al turno di screening successivo. Hanno confrontato due percorsi usando le stesse immagini storiche: l’approccio standard con due lettori umani e un approccio assistito da IA in cui il primo lettore era umano e il secondo era il sistema di IA sviluppato da Google. I casi che necessitavano di una decisione finale sono stati inviati a pannelli di arbitrage composti da 22 lettori esperti, che hanno operato come in una clinica reale.
Quanto l’IA si è confrontata con gli esperti umani
Complessivamente, l’uso dell’IA come secondo lettore ha avuto prestazioni almeno pari a quelle di due esseri umani, una volta considerate le decisioni dell’arbitration. Il percorso assistito dall’IA ha mostrato una capacità molto simile di segnalare le donne che avevano effettivamente il cancro (sensibilità) e di rassicurare chi non lo aveva (specificità), soddisfacendo criteri statistici rigorosi di “non inferiorità”. Anzi, la specificità è risultata leggermente superiore con l’IA, il che significa meno richiami non necessari, e il tasso di rilevamento dei tumori è stato praticamente identico tra i due approcci. Poiché l’IA ha sostituito una delle letture umane nella maggior parte dei casi, il numero totale di letture di routine è diminuito di circa la metà, traducendosi in una stima di riduzione del tempo di lettura del 36–44% anche dopo aver considerato il tempo aggiuntivo speso in arbitrage.

Dove l’IA ha aiutato — e dove ha mostrato limiti
Prima dell’arbitration, il sistema di IA era più propenso rispetto ai singoli lettori umani a segnalare tumori che poi sono comparsi tra gli screening o al turno successivo, suggerendo che talvolta può individuare cambiamenti sottili che gli umani trascurano. Tuttavia, molti di questi possibili avvisi precoci sono stati ribaltati durante l’arbitration, soprattutto quando i lettori erano influenzati da immagini più datate che l’IA non aveva analizzato o da punti evidenziati dall’IA che si sono rivelati innocui. In un piccolo ma significativo sottogruppo di 93 donne, l’IA aveva correttamente ritenuto che ci fosse qualcosa di anomalo, ma i pannelli di arbitrage hanno deciso di non richiamare; la maggior parte di queste donne ha poi sviluppato tumori d’intervallo o rilevati al turno successivo. Allo stesso tempo, l’arbitration umana ha annullato correttamente molti richiami suggeriti dall’IA in donne che si sono rivelate sane, migliorando la specificità complessiva. Tra diverse fasce d’età, etnie, densità mammaria e tipi di tumore, il percorso assistito dall’IA in genere ha eguagliato le prestazioni dell’assistenza standard, sebbene i risultati per alcuni sottogruppi più piccoli risultino meno certi.
Cosa potrebbe significare per il futuro dello screening
Lo studio suggerisce che l’IA può assumersi in sicurezza il ruolo di secondo lettore nello screening mammografico senza ridurre la qualità delle cure, alleggerendo al contempo la pressione su una forza lavoro sotto stress. Evidenzia però anche i limiti dei sistemi attuali: da sola, l’IA ha mostrato potenziale nel segnalare tumori in fase più precoce, ma questi vantaggi si sono attenuati quando gli esseri umani, comprensibilmente cauti, hanno annullato alcuni avvisi dell’IA. Gli autori sostengono che migliorare il modo in cui l’IA spiega le sue segnalazioni, ridurre i falsi allarmi distraenti e formare i clinici su quando fidarsi o mettere in discussione lo strumento potrebbe liberare maggiore potenziale. Se queste collaborazioni uomo-macchina saranno perfezionate e testate con cura in studi clinici reali, lo screening supportato dall’IA potrebbe non solo sostenere i programmi attuali ma anche contribuire a far rilevare i tumori in uno stadio in cui il trattamento ha maggiori probabilità di successo per più donne.
Citazione: Warren, L.M., Venton, J., Young, K.C. et al. Impact of using artificial intelligence as a second reader in breast screening including arbitration. Nat Cancer 7, 507–521 (2026). https://doi.org/10.1038/s43018-026-01128-z
Parole chiave: screening del cancro al seno, mammografia, intelligenza artificiale, carico di lavoro in radiologia, arbitration medica