Clear Sky Science · ru

BreastDCEDL: стандартизованный набор данных грудной DCE-MRI, готовый для глубокого обучения, для 2070 пациентов

· Назад к списку

Почему это важно для ухода при раке молочной железы

Когда человеку ставят диагноз «рак молочной железы», врачам нужно быстро решить, какие методы лечения скорее всего будут наиболее эффективны. Мощные МРТ-сканирования показывают поведение опухоли, но превращать эти сканы в надёжные компьютерные инструменты для помощи в выборе терапии оказалось сложно. В этой статье представлен BreastDCEDL — большой, тщательно подготовленный набор МРТ-сканов молочной железы, созданный специально для того, чтобы помочь исследователям в разработке и тестировании систем искусственного интеллекта (ИИ), предсказывающих ответ опухолей на лечение.

Наблюдение за изменениями опухоли во времени

Врачи часто используют специальный тип МРТ — динамическую контрастную МРТ (DCE-MRI), чтобы увидеть опухоль в молочной железе. В таких исследованиях изображения получают до и после введения контрастного вещества, фиксируя, как кровь проходит через опухоль в течение нескольких минут. Злокачественная ткань обычно имеет проницаемые, неупорядоченные сосуды, поэтому она по‑другому «зажигается» и затем затухает по сравнению с нормальной тканью. Эти покадровые изображения могут показать, насколько агрессивна опухоль, и помочь предсказать, исчезнет ли она полностью после мощных препаратов, таких как химиотерапия.

Figure 1
Figure 1.

Превращая разрозненные сканы в единый ресурс

До сих пор прогресс ИИ в области МРТ молочной железы тормозился разрозненными данными: разные больницы хранят изображения в разных форматах, используют разные сканеры и по‑разному фиксируют клинические данные. Проект BreastDCEDL решил эту проблему, собрав предлечебные DCE‑МРТ‑сканы 2 070 пациентов из трёх крупных исследовательских групп, известных как I‑SPY1, I‑SPY2 и Duke. Команда преобразовала более 8,5 миллиона отдельных срезов изображений в чуть более одиннадцати тысяч 3D‑томов, используя стандартный формат, широко применяемый в исследованиях медицинской визуализации. Они также аккуратно упорядочили изображения по времени (до введения контраста, рано после и позже после) и по пространству, чтобы сканы каждого пациента корректно сошлись друг с другом.

Разметка опухолей и сопоставление клинических данных

Чтобы ИИ мог учиться, ему нужно знать, где находится опухоль и что произошло с пациентом. В BreastDCEDL для каждого пациента есть разметка опухоли и ключевая клиническая информация. Для групп I‑SPY сложные компьютерные описания контуров опухоли были декодированы в простые 3D‑маски, помечающие опухолевые области поксель за покселью. В группе Duke опытные радиологи нарисовали ограничивающие прямоугольники вокруг наибольшей опухоли в каждом случае. В дополнение к изображениям набор данных содержит возраст пациента, основные демографические сведения, размер опухоли, статус гормональных рецепторов (HR), статус HER2 и информацию о том, полностью ли опухоль исчезла после лечения — результат, называемый патологическим полным ответом (pCR). Этот исход, доступный для 1 452 пациентов, тесно связан с долгосрочной выживаемостью и является ключевой целью для прогнозных моделей.

Создание честных испытаний для ИИ‑инструментов

Чтобы облегчить сравнение новых методов ИИ, авторы предоставили фиксированные обучающую, валидационную и тестовую выборки с похожими уровнями pCR между ними. Это позволяет разным исследовательским группам проверять модели на точно тех же наборах пациентов, делая утверждения о производительности более надёжными. Набор данных также сохраняет естественное разнообразие, наблюдаемое в реальных больницах: сканы поступают из многих центров, с разных МРТ‑установок и при немного разных критериях определения HR и HER2 положительности. Вместо того чтобы сглаживать эти различия, BreastDCEDL чётко их фиксирует, чтобы исследователи могли самостоятельно решать, как с ними обращаться, и проверять, работают ли их модели в разных популяциях пациентов и при разных условиях сканирования.

Figure 2
Figure 2.

Что это открывает для будущих исследований

BreastDCEDL — это не просто набор изображений; это хорошо организованный инструментарий для множества типов исследований. Исследователи могут обучать ИИ‑системы находить опухоли, измерять объём опухоли, предсказывать pCR до начала лечения и изучать, как паттерны на изображениях соотносятся с биологией опухоли. Пациенты без данных об исходе всё равно полезны, предоставляя дополнительные примеры для методов без учителя и полунеподконтрольного обучения. Поскольку все файлы следуют простой системе именования и общему формату, учёные могут быстро загружать и анализировать их с использованием стандартного программного обеспечения, экономя дни ручной подготовки и снижая риск ошибок.

Ясный путь к персонализированному лечению

Проще говоря, эта работа превращает небрежно собранный набор МРТ‑сканов из разных больниц в чистую, совместно используемую основу для ИИ‑исследований. Стандартизируя способ хранения изображений и клинической информации и последовательно отмечая опухоли и исходы, BreastDCEDL даёт исследователям инструменты, необходимые для создания и честной оценки компьютерных систем, которые однажды могут помочь врачам выбирать правильное лечение для каждого пациента. Это само по себе не лечит рак, но снимает важный барьер на пути к более точной, основанной на данных помощи при раке молочной железы.

Цитирование: Fridman, N., Solway, B., Fridman, T. et al. BreastDCEDL: A standardized deep learning-ready breast DCE-MRI dataset of 2,070 patients. Sci Data 13, 264 (2026). https://doi.org/10.1038/s41597-026-06589-6

Ключевые слова: МРТ молочной железы, визуализация рака, медицинский ИИ, ответ на лечение, медицинские наборы данных