Clear Sky Science · ru
Улучшение диагностики острого лимфобластного лейкоза с помощью VGG19 с модулем внимания CBAM
Почему важна быстрая проверка на рак крови
Острый лимфобластный лейкоз (ОЛЛ) — агрессивный рак крови, который может стать опасным для жизни в течение нескольких недель, если его не выявить и не лечить своевременно. Сегодня врачи часто диагностируют ОЛЛ, исследуя клетки костного мозга и крови под микроскопом — тщательная, трудоёмкая процедура, сильно зависящая от экспертной оценки. В этом исследовании рассматривается, как адаптированная форма искусственного интеллекта (ИИ) может помочь врачам быстрее и последовательнее выявлять ОЛЛ и его подтипы по микроскопическим изображениям, что потенциально ускорит начало лечения при сохранении контроля специалистов.

Более внимательный взгляд на детский рак крови
ОЛЛ возникает, когда незрелые белые клетки — лимфобласты — начинают бесконтрольно делиться в костном мозге и попадать в кровоток. Эти аномальные клетки вытесняют здоровые клетки крови и могут поражать нервную систему. ОЛЛ — наиболее частая форма рака у детей, но она также встречается у взрослых. Под микроскопом специалисты разделяют ОЛЛ на три основных подтипа — L1, L2 и L3 — по размеру и форме клеток, структуре их генетического материала и виду окружающей жидкости. Различие этих подтипов и отделение их от здорового костного мозга важно для выбора лечения, но даже экспертам бывает трудно, когда внешний вид клеток очень похож.
Обучение компьютеров видеть то, что видят эксперты
Исследователи поставили задачу создать систему ИИ, которая могла бы распределять изображения костного мозга по четырём группам: три подтипа ОЛЛ и нормальные (нелейкемические) образцы. Они собрали 328 изображений высокого увеличения из клинической лаборатории в Пакистане, охватывающих пациентов в возрасте от 10 до 45 лет, и применили методы аугментации данных — такие как повороты, отражения и незначительные изменения яркости или контрастности — чтобы получить 1 585 разнообразных обучающих примеров при сохранении ключевых структур клеток. Набор данных был разделён на обучающую, валидационную и тестовую выборки и дополнительно проанализирован статистическими инструментами, которые показали сложное перекрытие классов, подтверждая, что задача непроста даже для современных алгоритмов.
Как новая модель ИИ обращает внимание
В основе исследования лежит модифицированная версия известной сети для распознавания изображений VGG19. Поверх неё авторы добавили «сверточный блок внимания» (CBAM) после каждого крупного шага подвыборки (pooling). Проще говоря, модель сначала извлекает множество многослойных признаков из изображений, а затем с помощью механизма внимания решает, какие признаки и какие области на изображении заслуживают большего веса. Одна часть механизма внимания подчёркивает наиболее информативные каналы — такие как контуры ядер или внутренняя текстура — в то время как другая выделяет самые важные локализации внутри клетки. Последовательное применение этих внимания на разных уровнях сети позволяет системе отслеживать тонкие визуальные признаки, которые помогают, например, отличать близкие по внешности подтипы лейкоза.
Насколько хорошо работает система
Модель VGG19 с CBAM сравнивали с несколькими популярными архитектурами глубокого обучения, включая DenseNet, Inception, MobileNet и оригинальную VGG19. По стандартным метрикам новая модель достигла общей точности 98,73%, что примерно на 5,7 процентного пункта выше по сравнению с VGG19 без модуля внимания и лучше, чем у всех конкурирующих моделей на тех же данных. Детальные результаты показали высокие значения precision и recall по всем четырём классам, включая редкий подтип L3, а кривые ROC были близки к идеальным. Команда также провела k‑кратную кросс‑валидацию — обучение и тестирование на нескольких разбиениях данных — чтобы убедиться в устойчивости результатов, а также выполнила «абляционные» эксперименты, показавшие, что использование и каналного, и пространственного внимания на нескольких стадиях было ключевым для полученного улучшения.

Что это может означать для пациентов и врачей
Несмотря на обнадеживающие цифры, авторы подчёркивают, что эта система ещё не готова заменить специалистов или использоваться автономно в клинике. Исследование опирается на относительно небольшой набор данных из одного центра, и отсутствует независимый многоцентровый тест, подтверждающий равную эффективность модели в разных условиях или популяциях. Тем не менее работа показывает, что тщательно спроектированные механизмы внимания помогают ИИ концентрироваться на тех же тонких визуальных деталях, которыми пользуются патологии при чтении слайдов костного мозга. В будущем подобные системы, верифицированные на гораздо больших и более разнообразных наборах данных, могут служить инструментами поддержки принятия решений — быстро отмечая подозрительные случаи, предлагая вероятные подтипы ОЛЛ и показывая тепловые карты областей, повлиявших на прогноз — чтобы врачи могли ставить диагнозы быстрее и с большей уверенностью.
Цитирование: Rahman, S.I.U., Abbas, N., Ali, S. et al. Improving acute lymphoblastic leukemia diagnosis through CBAM-enhanced VGG19 deep learning. Sci Rep 16, 11027 (2026). https://doi.org/10.1038/s41598-026-40184-4
Ключевые слова: острый лимфобластный лейкоз, ИИ в медицинской визуализации, диагностика глубокого обучения, механизмы внимания, микроскопия костного мозга