Clear Sky Science · sv

PETWB-REP: Ett helkropps-FDG PET/CT-datasätt för flera cancerformer med tillhörande radiologiska rapporter

· Tillbaka till index

Varför denna nya resurs för canceravbildning är viktig

Cancerläkare förlitar sig i allt högre grad på avancerade skanningar och datorverktyg för att se hur tumörer beter sig i hela kroppen. Men kraftfulla artificiella intelligenssystem behöver mycket stora, noggrant organiserade samlingar av verkliga patientskanningar för att lära sig, och sådana är förvånansvärt sällsynta och svåra att dela på ett säkert sätt. Denna artikel presenterar PETWB-REP, en ny offentlig samling av helkroppsskanningar vid cancer och matchande läkarrapporter som syftar till att påskynda bättre diagnostiska verktyg och mer precis forskning globalt.

Figure 1
Figure 1.

En blick in i hela kroppen

PETWB-REP-projektet fokuserar på en skanningstyp kallad FDG PET/CT, som kombinerar två kroppsvyer samtidigt. CT-delen visar detaljerad anatomi, som ben och organ, medan PET-delen lyser upp områden som använder mycket socker, ofta ett tecken på aktiv cancer. Genom att sammanfoga dessa bilder kan läkare se inte bara var tumörer sitter, utan också hur aktiva de är. Det nya datasättet samlar helkroppsskanningar från 490 personer med många olika cancerformer, inklusive lung-, lever-, bröst-, prostata-, äggstockscancer och andra, vilket gör det mycket bredare än många tidigare samlingar som fokuserade på en enda tumörtyp.

Från klinikbesök till forskningsklart material

Alla skanningar samlades in vid ett stort avbildningscenter i Shanghai mellan 2021 och 2024 under rutinmässig vård, med övervakning av en etikkommitté. Patienterna fastade innan skanningen, fick en noggrant avvägd injektion av en radioaktiv sockerlösning och vilade sedan för att låta spårämnet spridas i kroppen. Varje skanning täckte kroppen från skallen bas till mitten av låret, enligt ett standardiserat protokoll så att bilder kunde jämföras mellan patienter. Förutom själva bilderna registrerade teamet grundläggande information som ålder, kön, cancernamn och detaljer om hur skanningarna utfördes, och lagrade allt i en konsekvent struktur avsedd för delning av medicinska bilder.

Skydda integriteten samtidigt som detaljer bevaras

Att omvandla kliniska skanningar till en säker offentlig resurs krävde en noggrann process för att avlägsna personuppgifter samtidigt som medicinskt användbar detalj behölls. Forskarna raderade först namn, ID:n och andra identifierare från bildfilerna och ersatte dem med studie-koder. De använde sedan ett specialiserat verktyg för att digitalt ta bort ansiktsdrag från CT-bilderna så att patienter inte kunde känna igenas, samtidigt som hals- och kroppsanatomin lämnades intakt för analys. Två forskare kontrollerade manuellt skanningarna och texterna för att säkerställa att inget identifierbart återstod. Resultatet är en uppsättning bilder och rapporter som bevarar tumörmönster och organstruktur men som inte längre avslöjar vilka patienterna är.

Att förena bilder och ord

En utmärkande egenskap hos PETWB-REP är att varje skanning levereras med en fullständig radiologisk rapport skriven av erfarna nuklearmedicinare. Dessa rapporter beskriver vad läkarna såg i olika kroppsregioner, noterar storlek och beteende hos misstänkta fynd och avslutar med en sammanfattande bedömning. För att göra datasättet tillgängligt för en global publik översattes de ursprungliga kinesiska rapporterna till engelska med maskinöversättning och korrigerades därefter noggrant av en tvåspråkig specialist, med båda språken publicerade sida vid sida. Detta rika par av bilder och text gör datasättet idealiskt för att träna datorsystem som kan länka mönster i bilder till hur läkare beskriver och tolkar dem.

Figure 2
Figure 2.

Hur forskare kan använda denna resurs

Det slutliga datasättet är organiserat i "råa" skanningar och bearbetade versioner som är lättare för datorer att hantera. Teamet konverterade data till ett ofta använt forskningsformat, justerade bildens ljusstyrka och kontrast, anpassade PET- och CT-vyer och skapade en huvudtabell som sammanfattar varje fall. De genomförde också kvalitetskontroller för att säkerställa att varje patient har matchande skanningar och rapporter och att bilderna är fria från större fel. Med denna grund kan forskare bygga och testa verktyg för att automatiskt hitta och avgränsa tumörer, kombinera bild- och textinformation för att förutsäga utfall eller generera utkast till rapporter från skanningar. Även om data kommer från ett enda center och cancerblandningen speglar lokal praxis, gör PETWB-REPs storlek, variation och noggranna förberedelse det till en värdefull ny utgångspunkt för både medicinska och artificiella intelligensstudier.

Citering: Xue, L., Feng, G., Zhang, W. et al. PETWB-REP: A Multi-Cancer Whole-Body FDG PET/CT Dataset with Corresponding Radiology Reports. Sci Data 13, 675 (2026). https://doi.org/10.1038/s41597-026-07058-w

Nyckelord: PET/CT-avbildning, datasätt för flera cancerformer, radiologiska rapporter, medicinsk AI, multimodal avbildning