Clear Sky Science · de

PETWB-REP: Ein Ganzkörper-FDG-PET/CT-Datensatz für mehrere Krebsarten mit zugehörigen Radiologieberichten

· Zurück zur Übersicht

Warum diese neue Ressource für Krebsbildgebung wichtig ist

Krebsärzte verlassen sich zunehmend auf fortgeschrittene Untersuchungen und computergestützte Werkzeuge, um zu verstehen, wie sich Tumoren im ganzen Körper verhalten. Leistungsfähige KI-Systeme benötigen jedoch große, sorgfältig organisierte Sammlungen von echten Patientendaten, um daraus zu lernen — und solche Datensätze sind überraschend selten und schwer sicher zu teilen. Dieser Artikel stellt PETWB-REP vor, eine neue öffentliche Sammlung von Ganzkörper-Krebs-Scans und passenden ärztlichen Berichten, die darauf abzielt, die Entwicklung besserer Diagnosetools und präzisere Forschung weltweit zu beschleunigen.

Figure 1
Figure 1.

Ein Blick in den ganzen Körper

Im Zentrum des PETWB-REP-Projekts steht eine Untersuchungsart namens FDG PET/CT, die zwei Perspektiven des Körpers kombiniert. Der CT-Anteil zeigt die detaillierte Anatomie, etwa Knochen und Organe, während der PET-Anteil Bereiche hervorhebt, die viel Zucker verbrauchen — oft ein Hinweis auf aktive Tumoren. Durch das Verschmelzen dieser Bilder können Ärzte nicht nur sehen, wo Tumoren liegen, sondern auch, wie aktiv sie sind. Der neue Datensatz sammelt Ganzkörper-Scans von 490 Personen mit verschiedenen Krebsarten, darunter Lungen-, Leber-, Brust-, Prostata-, Eierstockkrebs und andere, und ist damit deutlich breiter gefächert als viele frühere Sammlungen, die sich auf einen einzelnen Tumortyp konzentrierten.

Vom Klinikbesuch zu forschungsbereiten Daten

Alle Scans wurden zwischen 2021 und 2024 in einem großen Bildgebungszentrum in Shanghai im Rahmen der Routineversorgung und unter Aufsicht einer Ethikkommission erhoben. Die Patienten mussten vor der Untersuchung fasten, erhielten eine sorgfältig bemessene Injektion eines radioaktiven Zuckers und pausierten danach, damit sich der Tracer im Körper verteilen konnte. Jede Untersuchung reichte vom Schädelbasis bis zur Mitte der Oberschenkel und folgte einem standardisierten Protokoll, sodass die Bilder zwischen Patienten vergleichbar sind. Zusätzlich zu den Bildern zeichnete das Team Basisinformationen wie Alter, Geschlecht, Krebsart und Details zur Durchführung der Scans auf und speicherte alles in einer konsistenten Struktur, die für das Teilen medizinischer Bilder ausgelegt ist.

Privatsphäre schützen und gleichzeitig Details bewahren

Die Umwandlung klinischer Scans in eine sichere öffentliche Ressource erforderte einen sorgfältigen Prozess, bei dem persönliche Informationen entfernt, medizinisch nützliche Details jedoch erhalten blieben. Die Forschenden löschten zunächst Namen, IDs und andere Identifikatoren aus den Bilddateien und ersetzten sie durch Studiencodes. Anschließend nutzten sie ein spezialisiertes Tool, um Gesichtszüge in den CT-Bildern digital zu entfernen, sodass die Patienten nicht wiedererkannt werden konnten, während Hals- und Körperanatomie für Analysen erhalten blieben. Zwei Forschende kontrollierten manuell die Scans und Texte, um sicherzustellen, dass nichts Identifizierbares zurückblieb. Das Ergebnis ist ein Satz von Bildern und Berichten, die Tumormuster und Organstruktur bewahren, aber nicht mehr offenbaren, wer die Patienten sind.

Verknüpfung von Bildern und Text

Ein charakteristisches Merkmal von PETWB-REP ist, dass jeder Scan mit einem vollständigen radiologischen Bericht versehen ist, der von erfahrenen Nuklearmedizinern verfasst wurde. Diese Berichte beschreiben, was die Ärztinnen und Ärzte in verschiedenen Körperregionen sahen, notieren Größe und Verhalten verdächtiger Herde und schließen mit einer Gesamteinschätzung ab. Um den Datensatz einem globalen Publikum zugänglich zu machen, wurden die ursprünglichen chinesischen Berichte maschinell ins Englische übersetzt und anschließend von einer zweisprachigen Fachperson sorgfältig korrigiert; beide Sprachen wurden nebeneinander veröffentlicht. Diese reichhaltige Verknüpfung von Bildmaterial und narrative Beschreibung macht den Datensatz ideal zum Training von Computersystemen, die Muster in Bildern mit der Art und Weise verknüpfen können, wie Ärztinnen und Ärzte diese beschreiben und interpretieren.

Figure 2
Figure 2.

Wie Forschende diese Ressource nutzen können

Der fertige Datensatz ist in "rohe" Scans und verarbeitete Versionen gegliedert, die für Computer leichter zu handhaben sind. Das Team konvertierte die Daten in ein weit verbreitetes Forschungsformat, passte Helligkeit und Kontrast der Bilder an, richtete PET- und CT-Ansichten aufeinander aus und erstellte eine Haupttabelle, die jeden Fall zusammenfasst. Außerdem führten sie Qualitätskontrollen durch, um sicherzustellen, dass jeder Patient passende Scans und Berichte hat und die Bilder frei von größeren Mängeln sind. Auf dieser Grundlage können Forschende Werkzeuge entwickeln und testen, um Tumoren automatisch zu finden und zu umreißen, Bild- und Textinformationen zu kombinieren, um Ergebnisse vorherzusagen, oder Entwurfsberichte aus Scans zu generieren. Obwohl die Daten aus einem einzigen Zentrum stammen und die Zusammensetzung der Krebsarten lokale Praxis widerspiegelt, machen Größe, Vielfalt und sorgfältige Aufbereitung von PETWB-REP ihn zu einem wertvollen neuen Ausgangspunkt für medizinische wie auch KI-Forschungsprojekte.

Zitation: Xue, L., Feng, G., Zhang, W. et al. PETWB-REP: A Multi-Cancer Whole-Body FDG PET/CT Dataset with Corresponding Radiology Reports. Sci Data 13, 675 (2026). https://doi.org/10.1038/s41597-026-07058-w

Schlüsselwörter: PET/CT-Bildgebung, Multi-Krebs-Datensatz, Radiologieberichte, medizinische KI, multimodale Bildgebung