Clear Sky Science · it
PETWB-REP: Un dataset FDG PET/CT whole-body multi-tumore con relativi referti radiologici
Perché questa nuova risorsa per l’imaging oncologico è importante
I medici oncologi si affidano sempre più a esami avanzati e a strumenti informatici per capire come i tumori si comportano in tutto il corpo. Ma i potenti sistemi di intelligenza artificiale richiedono raccolte molto ampie e accuratamente organizzate di esami reali di pazienti per apprendere, e tali raccolte sono sorprendentemente rare e difficili da condividere in sicurezza. Questo articolo presenta PETWB-REP, una nuova collezione pubblica di esami whole-body per il cancro e dei corrispondenti referti medici, pensata per accelerare lo sviluppo di strumenti diagnostici migliori e ricerche più precise a livello globale.

Una finestra sul corpo intero
Il progetto PETWB-REP si concentra su un tipo di esame chiamato FDG PET/CT, che combina due visualizzazioni del corpo contemporaneamente. La componente CT mostra l’anatomia dettagliata, come ossa e organi, mentre la PET evidenzia aree che consumano molto zucchero, spesso indice di attività tumorale. Fondendo queste immagini, i medici possono vedere non solo dove si trovano i tumori, ma anche quanto siano attivi. Il nuovo dataset raccoglie esami whole-body di 490 persone affette da diversi tipi di cancro, tra cui polmone, fegato, mammella, prostata, ovaio e altri, rendendolo molto più ampio rispetto a molte raccolte precedenti focalizzate su un unico tipo di tumore.
Dalla visita clinica ai dati pronti per la ricerca
Tutti gli esami sono stati raccolti in un grande centro di imaging a Shanghai tra il 2021 e il 2024 durante la pratica clinica di routine, sotto la supervisione di un comitato etico. I pazienti hanno osservato il digiuno prima degli esami, hanno ricevuto un’iniezione dosata di uno zucchero radioattivo e poi hanno riposato per permettere al tracciante di distribuirsi nel corpo. Ogni esame ha coperto il corpo dalla base del cranio al medio-tigh, seguendo un protocollo standardizzato in modo che le immagini potessero essere confrontate tra i pazienti. Oltre alle immagini stesse, il team ha registrato informazioni di base come età, sesso, tipo di tumore e dettagli sulle modalità di esecuzione degli esami, e ha archiviato il tutto in una struttura coerente pensata per la condivisione di immagini mediche.
Proteggere la privacy mantenendo i dettagli
Trasformare esami clinici in una risorsa pubblica sicura ha richiesto un processo accurato di rimozione delle informazioni personali preservando però i dettagli utili a scopo medico. I ricercatori hanno prima cancellato nomi, identificativi e altri dati riconoscibili dai file delle immagini, sostituendoli con codici di studio. Hanno quindi utilizzato uno strumento specializzato per rimuovere digitalmente i tratti facciali dalle immagini CT in modo che i pazienti non potessero essere riconosciuti, lasciando però intatta l’anatomia del collo e del corpo per le analisi. Due ricercatori hanno controllato manualmente le immagini e i testi per assicurarsi che non rimanesse nulla di identificabile. Il risultato è un set di immagini e referti che preserva i pattern tumorali e la struttura degli organi, ma non rivela più l’identità dei pazienti.
Colmare immagini e parole
Una caratteristica distintiva di PETWB-REP è che ogni esame è accompagnato da un referto radiologico completo redatto da medici esperti in medicina nucleare. Questi referti descrivono ciò che i medici hanno osservato nelle diverse regioni del corpo, indicano le dimensioni e il comportamento delle aree sospette e terminano con un’impressione generale. Per aprire il dataset a un pubblico globale, i referti originali in cinese sono stati tradotti in inglese tramite traduzione automatica e poi accuratamente corretti da uno specialista bilingue, pubblicando entrambe le lingue affiancate. Questo ricco abbinamento di immagini e narrazione rende il dataset ideale per addestrare sistemi che possano collegare i pattern visivi al modo in cui i medici li descrivono e interpretano.

Come i ricercatori possono usare questa risorsa
Il dataset finale è organizzato in scansioni “raw” e versioni elaborate più facili da gestire per i computer. Il team ha convertito i dati in un formato di ricerca ampiamente usato, ha regolato luminosità e contrasto delle immagini, allineato le visuali PET e CT e creato una tabella master che riassume ogni caso. Hanno anche eseguito controlli di qualità per garantire che ogni paziente abbia scansioni e referti corrispondenti e che le immagini siano prive di difetti rilevanti. Con queste basi, i ricercatori possono sviluppare e testare strumenti per individuare e delineare automaticamente i tumori, combinare informazioni da immagini e testo per predire esiti, o generare referti preliminari a partire dalle scansioni. Sebbene i dati provengano da un singolo centro e la composizione dei tumori rifletta la pratica locale, la dimensione, la varietà e la cura nella preparazione rendono PETWB-REP un prezioso nuovo punto di partenza sia per studi medici sia per ricerche in intelligenza artificiale.
Citazione: Xue, L., Feng, G., Zhang, W. et al. PETWB-REP: A Multi-Cancer Whole-Body FDG PET/CT Dataset with Corresponding Radiology Reports. Sci Data 13, 675 (2026). https://doi.org/10.1038/s41597-026-07058-w
Parole chiave: Imaging PET/CT, dataset multi-tumore, referti radiologici, IA medica, imaging multimodale