Clear Sky Science · de
Ein CT‑Datensatz mit RECIST‑Messungen und umfassenden Segmentierungsmasken für Tumore und Lymphknoten
Warum diese Krebsbildgebungsressource wichtig ist
Die Krebsversorgung stützt sich zunehmend auf medizinische Bilder, um zu entscheiden, ob Behandlungen wirken. Dennoch sind die sorgfältigen, schichtweisen Messungen, die Ärztinnen und Ärzte an CT‑Scans vornehmen, zeitraubend und können zwischen Expertinnen und Experten variieren. Dieser Artikel stellt eine neue, öffentlich verfügbare Sammlung von CT‑Scans von Krebspatientinnen und -patienten vor, bei der Tumore und Lymphknoten akribisch nach einem weit verbreiteten klinischen Regelwerk umrandet und vermessen wurden. Sie soll Forschenden helfen, Programme zu entwickeln und zu prüfen, die eines Tages einen Großteil dieser mühsamen Arbeit übernehmen und die Überwachung von Krebstherapien weltweit schneller und konsistenter machen könnten.
Wie Ärztinnen und Ärzte derzeit Tumore verfolgen
Um zu beurteilen, ob eine Krebstherapie hilft, folgen Radiologinnen und Radiologen oft dem Standard RECIST 1.1. In der Praxis bedeutet das, dass sie eine Handvoll „Target“‑Tumoren auf den CT‑Scans eines Patienten auswählen und den längsten sichtbaren Durchmesser jedes Tumors in Millimetern notieren. Im Zeitverlauf vergleichen sie die Summe dieser Durchmesser mit früheren Scans, um zu entscheiden, ob die Erkrankung geschrumpft, stabil geblieben oder gewachsen ist. Zwar hat dieser Ansatz in klinischen Studien für dringend benötigte Ordnung gesorgt, er hat aber auch Nachteile: Er hängt stark davon ab, welche Tumoren der Arzt auswählt, stützt sich auf eindimensionale Messungen statt auf reale 3‑D‑Größen und benötigt typischerweise mehr als 10 Minuten pro Patient und Untersuchung. Mit der weltweit zunehmenden Zahl an Krebserkrankungen setzt das Radiologieabteilungen erheblich unter Druck.

Woraus der neue CT‑Datensatz besteht
Die Autorinnen und Autoren stellten CT‑Scans von 22 erwachsenen Patientinnen und Patienten zusammen, die wegen verschiedener Krebsarten am Klinikums der Universidad de Chile behandelt wurden, darunter Lungen‑, Leber‑, Kolorektal‑, Brust‑, Ovarial‑, Magen‑, Gallenblasen‑, Blasen‑Krebs und Melanom. Aus 58 thorakalen und abdominellen Scan‑Serien aus den Jahren 2017 bis 2023 identifizierten sie jeden soliden Tumor oder vergrößerten Lymphknoten, der groß genug war, um gemessen zu werden. Insgesamt umrandeten sie manuell 1.246 einzelne Läsionen: 1.148 Metastasen (sich ausbreitende Tumore), 93 vergrößerte Lymphknoten und 5 Primärtumore. Für 82 dieser Läsionen lagen außerdem die offiziellen RECIST‑Messungen aus klinischen Berichten vor, sodass ein direkter Vergleich zwischen Routinepraxis und automatisierten Methoden möglich ist.
Wie Experten und KI zusammenarbeiteten
Solch detaillierte Umrandungen wären normalerweise unerschwinglich langsam, daher nutzte das Team eine „Human‑in‑the‑Loop“‑Strategie. Erfahrene Radiologinnen und Radiologen sowie Assistierende zeichneten grobe 3‑D‑Boxen um verdächtige Tumore, und ein leistungsfähiges Segmentierungsmodell namens MedSAM schlug erste Konturen vor. Assistierende korrigierten diese Konturen, und leitende Radiologinnen und Radiologen führten eine abschließende Prüfung durch. Nach jedem Batch von Scans wurde das KI‑Modell mit den verbesserten Umrandungen nachtrainiert und beim nächsten Durchgang wieder zur Unterstützung eingesetzt. Mit jedem Zyklus näherte sich seine Leistung dem, was menschliche Expertinnen und Experten akzeptieren würden, wodurch der Korrekturaufwand sank, während die Genauigkeit erhalten blieb.
Was die Daten über Tumore verraten
Weil jede Läsion in den Scans dreidimensional umrandet wurde, konnten die Autorinnen und Autoren ihre Größen und Dichten detailliert untersuchen. Die meisten Tumore befanden sich in Lunge und Leber. Lungentumore hatten tendenziell ein geringes Volumen, zeigten aber oft relativ lange Durchmesser, während Lymphknoten größere Volumina, aber etwas kürzere Hauptdurchmesser als Lebertumore aufwiesen. Das Team untersuchte zudem, wie hell oder dunkel diese Bereiche im CT erscheinen, eine Eigenschaft, die mit der Gewebedichte zusammenhängt. Lungentumore, die von Luft umgeben sind, zeigten sehr unterschiedliche Intensitätsmuster im Vergleich zu Lebertumoren und Lymphknoten, was darauf hindeutet, dass einfache numerische Merkmale aus CT‑Bildern helfen könnten, Läsionstypen zu unterscheiden. Wichtig ist auch, dass die Studie eine starke Beziehung zwischen dem längsten Durchmesser einer Läsion und ihrem tatsächlichen 3‑D‑Volumen bestätigte und damit die Idee stützt, dass durch Durchmesser‑basierte Regeln wie RECIST praktisch anwendbare Stellvertreter für vollständige Volumenmessungen sein können, wenn sie sorgfältig angewendet werden.

Den Datensatz mit Deep Learning testen
Um zu zeigen, wie der Datensatz genutzt werden kann, trainierten und verfeinerten die Forschenden zwei Arten von Deep‑Learning‑Systemen. Zunächst feinjustierten sie MedSAM, um Tumore automatisch aus einfachen Bounding‑Boxen zu segmentieren, und erzielten Überlappungswerte mit Expertenumrandungen, die in derselben Größenordnung lagen wie Berichte zu deutlich größeren internationalen Datensätzen. Zweitens passten sie ein weit verbreitetes Framework namens nnUNet an, ausgehend von Modellen, die auf globalen Herausforderungen zur Lungen‑ und Leberbildgebung trainiert waren, und feinjustierten diese dann mit den neuen chilenischen Daten. Nach dem Feintuning erreichten die Systeme eine gleichwertige oder bessere Leistung als zuvor, besonders bei Lungentumoren, obwohl die Patientenkohorte relativ klein war. Das zeigt, dass sorgfältig kuratierte lokale Daten die Zuverlässigkeit von KI‑Werkzeugen in einem bestimmten Krankenhausumfeld deutlich verbessern können.
Was das für die künftige Krebsversorgung bedeutet
Für Nicht‑Spezialistinnen und -Spezialisten ist die Kernbotschaft, dass dieser Datensatz ein Ermöglichungswerkzeug ist, kein diagnostisches Produkt. Indem die Autorinnen und Autoren CT‑Scans offen teilen, in denen jeder sichtbare Tumor und Lymphknoten umrandet und in vielen Fällen präzise vermessen wurde, bieten sie einen realistischen Trainingsboden für Algorithmen, die die Tumorüberwachung automatisieren sollen. Solche Werkzeuge könnten Radiologinnen und Radiologen helfen, weniger Zeit mit manuellen Messungen zu verbringen und mehr Zeit für komplexe Beurteilungen aufzuwenden, und zugleich die Variation zwischen Lesenden reduzieren. Da die Daten aus einem lateinamerikanischen Krankenhaus stammen und unter einer großzügigen Lizenz veröffentlicht wurden, tragen sie außerdem dazu bei, dass zukünftige medizinische KI an vielfältigeren Patientengruppen getestet wird, was die Chance erhöht, dass automatisierte Krebsüberwachung für Menschen weltweit zuverlässig funktioniert.
Zitation: Rojas-Pizarro, R., Vásquez-Venegas, C., Pereira, G. et al. A CT Dataset with RECIST Measurements and Comprehensive Segmentation Masks for Tumors and Lymph Nodes. Sci Data 13, 270 (2026). https://doi.org/10.1038/s41597-026-06597-6
Schlüsselwörter: Krebsbildgebung, CT‑Scans, Tumorsegmentierung, RECIST, medizinische KI‑Datensätze