Clear Sky Science · nl
PETWB-REP: Een whole-body FDG PET/CT-dataset voor meerdere kankersoorten met bijbehorende radiologierapporten
Waarom deze nieuwe bron voor kankerscans ertoe doet
Oncologen vertrouwen steeds vaker op geavanceerde scans en computertools om te zien hoe tumoren zich door het lichaam gedragen. Maar krachtige systemen voor kunstmatige intelligentie hebben enorme, zorgvuldig georganiseerde verzamelingen echte patiëntscans nodig om van te leren, en die zijn verrassend schaars en lastig veilig te delen. Dit artikel introduceert PETWB-REP, een nieuwe publieke verzameling whole-body kankerscans en bijbehorende doktersrapporten die tot doel heeft de ontwikkeling van betere diagnosetools en preciezer onderzoek wereldwijd te versnellen.

Een venster naar het hele lichaam
Het PETWB-REP-project draait om een type scan dat FDG PET/CT heet en twee weergaven van het lichaam tegelijk combineert. Het CT-gedeelte toont gedetailleerde anatomie, zoals botten en organen, terwijl het PET-gedeelte gebieden oplicht die veel suiker gebruiken, vaak een aanwijzing voor actieve kanker. Door deze beelden te combineren kunnen artsen niet alleen zien waar tumoren zich bevinden, maar ook hoe actief ze zijn. De nieuwe dataset verzamelt whole-body scans van 490 mensen met veel verschillende kankersoorten, waaronder long-, lever-, borst-, prostaat-, eierstok- en andere vormen, waardoor hij veel breder is dan veel eerdere collecties die zich op één tumortype richtten.
Van polikliniekbezoek naar onderzoeksrijpe data
Alle scans werden verzameld in een groot beeldvormingscentrum in Sjanghai tussen 2021 en 2024 tijdens routinezorg, onder toezicht van een ethische commissie. Patiënten vastten vóór de scans, kregen een zorgvuldig gedoseerde injectie van een radioactieve suiker en rustten daarna om de tracer door het lichaam te laten verspreiden. Elke scan besloeg het lichaam van de schedelbasis tot de midden-dij, volgens een gestandaardiseerd protocol zodat beelden tussen patiënten vergeleken konden worden. Naast de beelden zelf noteerde het team basisgegevens zoals leeftijd, geslacht, kankertype en details over hoe de scans werden uitgevoerd, en bewaarde alles in een consistente structuur die ontworpen is voor het delen van medische beelden.
Privacy beschermen zonder details te verliezen
Het omzetten van klinische scans naar een veilige publieke bron vereiste een zorgvuldig proces om persoonlijke informatie te verwijderen terwijl medisch nuttige details behouden bleven. De onderzoekers wisten eerst namen, ID’s en andere identificerende gegevens uit de afbeeldingsbestanden en vervingen die door studiecoden. Daarna gebruikten ze een gespecialiseerd hulpmiddel om gelaatstrekken digitaal te verwijderen uit de CT-beelden zodat patiënten niet herkenbaar zijn, terwijl de hals- en lichaamsanatomie voor analyse intact bleef. Twee onderzoekers controleerden handmatig de scans en teksten om er zeker van te zijn dat er niets identificeerbaars overbleef. Het resultaat is een set beelden en rapporten die tumormodellen en orgaanstructuur behouden maar niet meer laten zien wie de patiënten zijn.
Brug slaan tussen beelden en woorden
Een onderscheidend kenmerk van PETWB-REP is dat elke scan gepaard gaat met een volledig radiologierapport geschreven door ervaren nucleair geneeskundigen. Deze rapporten beschrijven wat de artsen in verschillende lichaamsregio’s zagen, noteren de grootte en het gedrag van verdachte plekken en sluiten af met een algemene indruk. Om de dataset wereldwijd toegankelijk te maken, werden de oorspronkelijke Chinese rapporten vertaald naar het Engels met machinevertaling en daarna zorgvuldig gecorrigeerd door een tweetalige specialist, met beide talen naast elkaar vrijgegeven. Deze rijke koppeling van beelden en tekst maakt de dataset ideaal voor het trainen van computersystemen die patronen in beelden kunnen koppelen aan de manier waarop artsen ze beschrijven en interpreteren.

Hoe onderzoekers deze bron kunnen gebruiken
De uiteindelijke dataset is georganiseerd in "raw" scans en verwerkte versies die gemakkelijker door computers te verwerken zijn. Het team converteerde de data naar een veelgebruikt onderzoeksformaat, paste helderheid en contrast van beelden aan, lijnde de PET- en CT-weergaven uit en maakte een mastertabel die elk geval samenvat. Ze voerden ook kwaliteitscontroles uit om te garanderen dat elke patiënt bijpassende scans en rapporten heeft en dat de beelden vrij zijn van grote gebreken. Met deze basis kunnen onderzoekers tools bouwen en testen om automatisch tumoren te vinden en af te bakenen, beeld- en tekstinformatie te combineren om uitkomsten te voorspellen, of conceptrapporten uit scans te genereren. Hoewel de data uit één centrum komen en de mix van kankers de lokale praktijk weerspiegelt, maken de omvang, variatie en zorgvuldige voorbereiding van PETWB-REP het tot een waardevol nieuw vertrekpunt voor zowel medische als AI-studies.
Bronvermelding: Xue, L., Feng, G., Zhang, W. et al. PETWB-REP: A Multi-Cancer Whole-Body FDG PET/CT Dataset with Corresponding Radiology Reports. Sci Data 13, 675 (2026). https://doi.org/10.1038/s41597-026-07058-w
Trefwoorden: PET/CT-beeldvorming, multi-kanker dataset, radiologierapporten, medische AI, multimodale beeldvorming