Clear Sky Science · it
Prestazioni degli algoritmi di previsione del rischio di cancro al seno attraverso i sistemi di mammografia nel programma di screening del Regno Unito
Perché questo è importante per donne e famiglie
Lo screening mammografico salva vite individuando i tumori precocemente, eppure molti tumori emergono ancora negli anni tra una mammografia di routine e l’altra, spesso in stadio più avanzato. Questo studio pone una domanda semplice ma rilevante: l’intelligenza artificiale (IA) può leggere una mammografia definita “normale” e segnalare in modo silenzioso le donne che in realtà hanno un alto rischio a breve termine, così da offrire loro controlli aggiuntivi prima che un cancro cresca e si diffonda?

Vedere di più in una mammografia normale
La maggior parte dei programmi nazionali di screening, incluso quello del Regno Unito, invita le donne a sottoporsi a mammografia ogni tre anni. Se non si trova nulla di sospetto, viene comunicato che l’esame è “negativo” e si ritorna alla routine abituale. Eppure circa il 30% dei tumori al seno nelle donne sottoposte a screening sono “cancro intervalare” che compaiono tra le visite programmate e tendono ad avere una prognosi peggiore. Recentemente, potenti sistemi di IA hanno imparato a esaminare mammografie che appaiono normali ai lettori umani e ad assegnare a ogni donna un punteggio di rischio a breve termine. L’idea è usare queste informazioni nascoste per personalizzare la frequenza dello screening e chi dovrebbe ricevere test più sensibili come la risonanza magnetica o la mammografia con mezzo di contrasto.
Mettere alla prova quattro strumenti di IA
I ricercatori hanno esaminato 112.621 mammografie di screening negative provenienti da due centri del NHS Breast Screening Programme in Inghilterra, coprendo un intero ciclo triennale dal 2014 al 2017 e seguendo le donne per cinque anni. I due siti utilizzavano diversi apparecchi digitali per mammografia (Philips e GE), rispecchiando la variabilità del mondo reale. Durante il follow‑up, 1.225 donne hanno sviluppato un cancro al seno, inclusi 396 tumori intervalari e tumori aggiuntivi trovati al round di screening successivo. Quattro algoritmi di rischio IA di primo piano — tre commerciali e un modello accademico — sono stati eseguiti localmente su ogni mammografia per generare un punteggio di rischio futuro e confrontarne le prestazioni.
Quanto bene gli algoritmi hanno individuato i tumori futuri
Tutti e quattro i sistemi di IA sono stati in grado di distinguere, meglio del caso, tra donne che avrebbero sviluppato o meno un cancro, ma non hanno reso tutti allo stesso modo. Un algoritmo (etichettato DL‑1) ha mostrato costantemente le migliori prestazioni, mentre un altro (DL‑3) è rimasto indietro. Quando il team si è concentrato sui tumori intervalari — quelli che compaiono poco dopo una scansione “normale” — il modello migliore ha raggiunto livelli di accuratezza simili o superiori a quelli riscontrati in precedenti studi con singoli algoritmi. È importante che tre dei quattro strumenti si siano comportati in modo simile sia sulle immagini Philips sia su quelle GE, suggerendo che possono gestire almeno alcune differenze nell’hardware di scansione, sebbene un algoritmo abbia reso sensibilmente peggio su un sistema.
Cosa succede se interveniamo sui punteggi di rischio più alti?
La domanda pratica per i servizi di screening è quante donne richiamare in base ai punteggi IA. I ricercatori hanno pertanto esaminato soglie clinicamente significative. Se venissero selezionate per attenzione aggiuntiva solo le donne nel 4% con rischio più alto (secondo i punteggi di ciascuno strumento), i due migliori algoritmi insieme avrebbero catturato circa una donna su cinque di tutti i tumori futuri e più di un quarto dei tumori intervalari. Quando la soglia è stata allentata per includere il 14% superiore dei punteggi di rischio — più vicina ai tassi di richiamo osservati in alcuni programmi nordamericani — il rendimento è più o meno raddoppiato: il modello più forte ha identificato circa il 42% di tutti i tumori futuri e la metà dei tumori intervalari. Tuttavia, ogni algoritmo tendeva a segnalare un sottoinsieme in parte diverso di tumori, con relativamente poca sovrapposizione, suggerendo che approcci ensemble o multi‑strumento potrebbero trovare più tumori rispetto a un singolo modello.

Punti di forza, lacune e prossimi passi
Questo lavoro si distingue perché utilizza dati completi e di routine provenienti da due grandi centri di screening del NHS piuttosto che un campione di ricerca selezionato in modo ristretto, ed è il primo a valutare fianco a fianco diversi strumenti di rischio IA nominati nell’ambiente del Regno Unito. Al contempo, esistono limitazioni. Sono state escluse le donne con impianti o con proiezioni di imaging non standard, e lo studio ha interessato solo due marche di mammografi, per cui le prestazioni su altri apparecchi o in gruppi etnici diversi restano incerte. Poiché l’analisi è stata retrospettiva, alcuni tumori che avrebbero potuto essere trovati prima con imaging aggiuntivo basato sul rischio non sono stati contati, il che significa che il beneficio reale potrebbe essere maggiore di quanto riportato.
Cosa significa per il futuro dello screening mammografico
Per il lettore non specialista, la conclusione è che l’IA moderna può effettivamente trovare segnali di allarme in mammografie “normali” che predicono quali donne hanno maggiori probabilità di sviluppare presto un cancro al seno, in particolare i tumori intervalari che altrimenti sono difficili da intercettare precocemente. I migliori algoritmi potrebbero, in linea di principio, permettere ai programmi di screening di offrire test più frequenti o più sensibili a un gruppo relativamente piccolo di donne a rischio più elevato, mentre le altre continuerebbero con i controlli standard ogni tre anni. Tuttavia, le differenze tra gli strumenti e tra i sistemi di imaging indicano che nessun singolo modello di IA è pronto per essere adottato ovunque senza accurati test. Gli autori propongono grandi trial prospettici che usino più algoritmi, insieme a messa a punto per scanner e popolazioni locali, prima che lo screening basato sul rischio guidato dall’IA possa diventare cura di routine in sicurezza.
Citazione: Rothwell, J., Payne, N., Kilburn-Toppin, F. et al. Performance of breast cancer risk prediction algorithms across mammography systems in the UK screening programme. npj Digit. Med. 9, 330 (2026). https://doi.org/10.1038/s41746-026-02507-7
Parole chiave: screening del cancro al seno, intelligenza artificiale, mammografia, predizione del rischio, cancro intervalare