Clear Sky Science · it

Classificazione multi-classe dei tumori cerebrali usando una backbone ResNet101 integrata con un modulo di attenzione deformabile multi-scala e avanzate tecniche di data augmentation

· Torna all'indice

Perché conta classificare le scansioni cerebrali

Quando i medici esaminano le scansioni cerebrali per cercare tumori, devono determinare non solo se un tumore è presente ma anche quale tipo sia. Tipi diversi di tumore richiedono trattamenti differenti, eppure possono apparire sorprendentemente simili nelle immagini di Risonanza Magnetica (MRI). Questo studio esplora un nuovo approccio di intelligenza artificiale in grado di distinguere molte tipologie di tumori cerebrali dalle MRI con altissima accuratezza, offrendo potenzialmente ai radiologi un supporto più rapido e coerente nelle decisioni che incidono sulla vita dei pazienti.

Figure 1. Come l’IA trasforma le scansioni MRI cerebrali in gruppi chiari di molteplici tipi di tumore.
Figure 1. Come l’IA trasforma le scansioni MRI cerebrali in gruppi chiari di molteplici tipi di tumore.

Insegnare ai computer a leggere le scansioni cerebrali

I ricercatori si concentrano sulla classificazione multi-classe, cioè distinguere molte categorie di tumore contemporaneamente invece di limitarsi a rilevare tumore o assenza di tumore. Usano un modello di deep learning costruito su ResNet101, una rete di riconoscimento d’immagini ampiamente usata che ha già appreso schemi visivi generali da grandi collezioni di immagini naturali. Il team adatta questa rete alle MRI cerebrali e la applica a un dataset pubblico che include 15 classi, dal tessuto cerebrale normale a tumori specifici come glioblastoma, meningioma e medulloblastoma. Affrontare così tante categorie rende il compito molto più vicino a quanto i radiologi incontrano nella pratica clinica reale.

Pulire e bilanciare dati del mondo reale

Le raccolte di immagini mediche spesso contengono insidie nascoste, come scansioni duplicate dello stesso paziente o grandi differenze nella frequenza di ciascun tipo di tumore. Per evitare risultati fuorvianti, gli autori per primi analizzano l’intero dataset, calcolano un’impronta digitale digitale per ogni immagine e rimuovono i duplicati esatti. Successivamente raggruppano le immagini per ID paziente e separano i pazienti, non le immagini, nei set di addestramento, validazione e test in modo che le scansioni della stessa persona non compaiano in più di un sottoinsieme. Questa suddivisione per paziente aiuta a garantire che l’accuratezza riportata rifletta la performance su individui realmente non visti prima, anziché viste ripetute dello stesso cervello. Il team utilizza inoltre una batteria di trasformazioni d’immagine e una tecnica chiamata MixUp per rendere i tipi di tumore rari meglio rappresentati durante l’addestramento e per aiutare il modello a gestire variazioni di orientamento, luminosità e rumore.

Figure 2. Come l’attenzione multi-scala flessibile permette all’IA di concentrarsi sulle regioni chiave nelle MRI cerebrali per separare i tipi di tumore.
Figure 2. Come l’attenzione multi-scala flessibile permette all’IA di concentrarsi sulle regioni chiave nelle MRI cerebrali per separare i tipi di tumore.

Guardare più da vicino con attenzione flessibile

Un’innovazione chiave dello studio è un modulo che gli autori chiamano modulo di attenzione deformabile multi-scala. In termini semplici, il modello esamina la MRI a diversi livelli di dettaglio, dalle strutture grossolane dell’intero cervello fino a texture più fini vicino al tumore. Invece di analizzare ogni posizione in modo rigido e a griglia, l’attenzione deformabile impara a spostare leggermente i propri “sguardi” per concentrarsi sulle regioni informative. Applica poi due forme complementari di attenzione: una che evidenzia i punti importanti nell’immagine e un’altra che rafforza i canali di feature più utili all’interno della rete. Questa combinazione permette al sistema di cogliere meglio le sottili differenze di forma e texture che distinguono un tipo di tumore dall’altro.

Mettere alla prova performance e affidabilità

Dopo molte epoche di addestramento, il modello raggiunge una accuratezza di validazione di circa il 97 percento e una accuratezza di test superiore al 99 percento su tutte le 15 classi. La maggior parte dei tipi di tumore viene classificata perfettamente nel set di test tenuto separato, con solo un ristretto numero di errori in categorie tumorali sia rare sia visivamente simili. I ricercatori confrontano i loro risultati con un metodo precedente che utilizza anch’esso attenzione deformabile e mostrano che il loro approccio eguaglia o supera tale metodo su quasi tutte le misure di valutazione, nonostante la complessa distribuzione delle classi. Mettono inoltre il sistema sotto stress aggiungendo rumore e riducendo la risoluzione delle immagini, trovando che l’accuratezza rimane elevata anche quando la qualità della scansione peggiora, cosa importante per le condizioni reali degli ospedali.

Vedere ciò che il modello vede

Per aiutare i clinici a fidarsi del sistema, gli autori usano strumenti di visualizzazione che rivelano dove la rete si concentra quando prende una decisione. Le mappe di calore prodotte da Grad-CAM evidenziano le aree nella MRI che hanno maggiormente influenzato la predizione, e le analisi basate su SHAP indicano quali feature apprese spingono il modello verso una diagnosi piuttosto che un’altra. Queste spiegazioni visive puntano consistentemente alle regioni tumorali e ai loro confini piuttosto che allo sfondo irrilevante, suggerendo che il ragionamento del modello si allinea con l’intuizione radiologica. Pur sottolineando la necessità di ulteriori test esterni, lo studio dimostra che una pipeline di deep learning progettata con cura può non solo classificare con alta affidabilità numerosi tipi di tumore cerebrale, ma anche offrire indizi interpretabili su come vengono prese tali decisioni.

Cosa potrebbe significare per i pazienti

Nella pratica clinica quotidiana, questo tipo di sistema non sostituirebbe i radiologi ma fungerebbe da secondo lettore, segnalando rapidamente i tipi di tumore più probabili e richiamando l’attenzione su regioni sospette nella scansione. Gestendo una vasta gamma di tumori e mantenendosi stabile con immagini rumorose o di qualità inferiore, il framework descritto in questo paper mostra come l’IA potrebbe supportare diagnosi più coerenti e tempestive. Con ulteriori validazioni tra ospedali e diversi scanner, tali strumenti potrebbero entrare a far parte dei flussi di lavoro di routine, aiutando gli specialisti a concentrarsi sulla pianificazione del trattamento mentre i computer gestiscono gran parte della classificazione ripetitiva delle immagini.

Citazione: Reddy, B.S., Jha, R.R., Dasore, A. et al. Multi-class classification of brain tumor using a ResNet101 backbone integrated with multi-scale deformable attention module and advanced data augmentations. Sci Rep 16, 15938 (2026). https://doi.org/10.1038/s41598-026-45675-y

Parole chiave: tumore cerebrale MRI, deep learning, IA per imaging medico, classificazione dei tumori, reti ad attenzione