Clear Sky Science · ru
Набор КТ-данных с измерениями по RECIST и подробными сегментационными масками для опухолей и лимфоузлов
Почему этот ресурс по визуализации рака важен
Уход за больными раком всё в большей степени опирается на медицинские изображения, чтобы оценить, помогают ли лечения. При этом тщательные посрезовые измерения, которые врачи выполняют на КТ, отнимают много времени и могут различаться у разных экспертов. В этой статье представлен новый открытый набор КТ-сканов пациентов с раком, где опухоли и лимфатические узлы скрупулёзно обведены и измерены в соответствии с широко используемыми клиническими правилами. Он предназначен помочь исследователям создавать и проверять компьютерные программы, которые однажды смогут взять на себя большую часть этой монотонной работы и сделать мониторинг лечения рака быстрее и более согласованным по всему миру.
Как врачи сейчас отслеживают опухоли
Чтобы судить, помогает ли лечение рака, рентгенологи часто следуют стандарту RECIST 1.1. На практике это означает, что выбирают несколько «контрольных» опухолей на КТ и измеряют наибольший видимый диаметр каждой в миллиметрах. Со временем суммарные значения этих диаметров сравнивают с предыдущими сканами, чтобы решить, уменьшилась ли болезнь, осталась стабильной или увеличилась. Хотя этот подход привнёс порядок в клинические испытания, у него есть и недостатки: многое зависит от того, какие опухоли выбрал врач, используются одномерные измерения вместо истинного 3D‑размера, и обычно процедура занимает более 10 минут на пациента при каждой оценке. По мере роста числа онкологических случаев во всём мире эти ограничения создают реальную нагрузку на службы лучевой диагностики.

Что содержит новый набор КТ-данных
Авторы собрали КТ-сканы 22 взрослых пациентов, лечившихся от различных видов рака в Клинической больнице Университета Чили, включая рак лёгкого, печени, колоректальный, молочной железы, яичников, желудка, жёлчного пузыря, мочевого пузыря и меланому. Из 58 томографических серий грудной и брюшной области, выполненных в период с 2017 по 2023 год, они выделили все солидные опухоли или увеличенные лимфоузлы, достаточные по размеру для измерения. В сумме вручную обведено 1 246 отдельных поражений: 1 148 метастазов (распространившихся опухолей), 93 увеличенных лимфоузла и 5 первичных опухолей. Для 82 из этих поражений в набор включены официальные RECIST-измерения из клинических گزارشов, что позволяет сопоставлять рутинную практику и автоматизированные методы.
Как эксперты и ИИ работали вместе
Создание таких подробных контуров обычно было бы чрезвычайно медленным, поэтому команда использовала стратегию «человек в петле». Опытные рентгенологи и ординаторы нарисовали грубые 3D‑коробки вокруг предполагаемых опухолей, а мощная модель сегментации MedSAM предложила начальные границы. Ординаторы затем скорректировали эти границы, а старшие рентгенологи выполнили итоговую проверку. После каждой партии сканов модель ИИ дообучалась на улучшенных контурах и использовалась для помощи при обработке следующей партии. С каждым циклом её работа становилась всё ближе к приемлемому для человеческих экспертов уровню, снижая объём необходимой ручной правки при сохранении точности.
Что данные показывают о опухолях
Поскольку каждое поражение на сканах было обведено в трёх измерениях, авторы смогли подробно изучить их объёмы и плотности. Большинство опухолей находились в лёгких и печени. Опухоли лёгких, как правило, имели небольшой объём, но часто демонстрировали относительно большие длины диаметров, тогда как лимфоузлы показывали большие объёмы, но несколько более короткие основные диаметры по сравнению с печёночными опухолями. Команда также изучила, насколько светлыми или тёмными выглядели эти области на КТ — свойство, связанное с плотностью ткани. Опухоли лёгких, окружённые воздухом, имели сильно отличающиеся паттерны интенсивности от опухолей печени и лимфоузлов, что указывает на то, что простые числовые признаки из КТ-изображений могут помочь различать типы поражений. Важно, что исследование подтвердило сильную связь между наибольшим диаметром поражения и его истинным 3D‑объёмом, поддерживая идею о том, что диаметро‑ориентированные правила вроде RECIST могут служить практичной заменой полному объёмному измерению при аккуратном применении.

Испытание набора данных с помощью глубокого обучения
Чтобы продемонстрировать прикладное значение набора, исследователи обучили и доработали два типа систем глубокого обучения. Сначала они донастроили MedSAM для автоматической сегментации опухолей по простым ограничивающим коробкам, достигнув показателей перекрытия с экспертными контурами, сопоставимых с результатами, полученными на гораздо больших международных наборах. Затем они адаптировали широко используемый фреймворк nnUNet, начиная с моделей, обученных на глобальных задачах по изображениям лёгких и печени, и дообучили их на этих новых чилийских данных. После дообучения системы сравнялись или превзошли исходную производительность, особенно на лёгочных опухолях, несмотря на относительно небольшой размер когорты пациентов. Это показывает, что тщательно отобранные локальные данные могут существенно повысить надёжность ИИ-инструментов в конкретной больничной среде.
Что это значит для будущей помощи при раке
Для неспециалистов ключевая мысль такова: этот набор данных — инструмент для разработки, а не самостоятельный диагностический продукт. Открыто предоставляя КТ-сканы, в которых каждая видимая опухоль и лимфоузел обведены и во многих случаях точно измерены, авторы создают реалистичную учебную площадку для алгоритмов, стремящихся автоматизировать отслеживание опухолей. Такие инструменты могут помочь рентгенологам тратить меньше времени на ручные измерения и больше — на сложные клинические решения, а также снизить разброс между разными читателями. Поскольку данные поступают из больницы Латинской Америки и выпущены под мягкой лицензией, они также способствуют тому, чтобы будущее медицинского ИИ тестировалось на более разнообразных пациентах, повышая шансы на то, что автоматизированный мониторинг рака будет надёжно работать для людей по всему миру.
Цитирование: Rojas-Pizarro, R., Vásquez-Venegas, C., Pereira, G. et al. A CT Dataset with RECIST Measurements and Comprehensive Segmentation Masks for Tumors and Lymph Nodes. Sci Data 13, 270 (2026). https://doi.org/10.1038/s41597-026-06597-6
Ключевые слова: изображения рака, КТ-сканы, сегментация опухолей, RECIST, наборы данных для медицинского ИИ