Clear Sky Science · ru
Автоматическая сегментация и классификация для выявления рака шейки матки на основе глубокого обучения с улучшенным U-Net и ансамблевыми методами
Почему тесты Папаниколау всё ещё нуждаются в цифровой помощи
Рак шейки матки — одно из немногих злокачественных заболеваний, которое в значительной степени предотвратимо при раннем обнаружении, тем не менее многие женщины умирают, потому что опасные изменения клеток пропускаются или обнаруживаются слишком поздно. Знакомый тест Пап уже спасает жизни, но просмотр тысяч изображений клеток невооружённым глазом — медленная и утомительная работа, и даже эксперты могут расходиться во мнениях. В этой статье исследуется, как современные методы искусственного интеллекта могут выступать в роли неутомимого помощника, автоматически находя и сортируя клетки шейки матки на изображениях мазков Пап, чтобы помогать врачам быстрее и надёжнее замечать ранние признаки заболевания.
Обучение компьютеров распознавать проблемные клетки
Исследователи поставили цель создать вычислительную систему, способную выполнять две ключевые задачи: во‑первых, выделять каждую клетку шейки матки на фоне изображения мазка Пап, и во‑вторых, определять, выглядит ли клетка нормально или демонстрирует признаки, связанные с раком. Для этого они использовали глубокое обучение — форму ИИ, которая самостоятельно выявляет закономерности по большому числу примеров изображений, а не по заранее прописанным правилам. Система ориентирована на всю клетку целиком — и на тёмный центр (ядро), и на окружающую массу (цитоплазму), поскольку изменения размера, формы и текстуры по всей клетке могут указывать на болезнь.
Более умный способ очерчивания клеток
В основе системы лежит улучшенная версия популярной модели для медицинских изображений U-Net, особенно хорошая в проведении точных контуров объектов на снимках. Авторы модифицировали U-Net так, чтобы он мог одновременно учитывать детали изображения на нескольких масштабах и оставаться устойчивым при обучении на маленьких батчах — распространённом ограничении в медицине. Эта усовершенствованная сеть обучается рисовать простую маску поверх каждого изображения: белым отмечаются области, где присутствует клетка, чёрным — фон. Изолируя только области клеток, последующие этапы обработки могут концентрироваться на самом важном, не отвлекаясь на пятна, мусор или пустое пространство.

Создание дополнительных обучающих примеров из ничего
Главная проблема в медицине — дефицит качественно размеченных изображений, получение которых дорого и трудозатратно. Чтобы решить её, команда использовала генеративную модель под названием RES_DCGAN, которая обучается создавать реалистичные синтетические изображения мазков Пап на основе реальных. Эти дополнительные «сделанные, но правдоподобные» изображения включаются в процесс обучения как до этапа сегментации клеток, так и после — на этапе классификации. Видя значительно больше вариаций клеток, включая редкие и тонкие паттерны, ИИ становится более стойким и менее склонным к переобучению на ограниченном наборе пациентов или условиях съёмки.
От контуров к ранним предупреждениям
После сегментации клеток в работу вступает вторая группа моделей глубокого обучения, которая классифицирует каждую клетку как нормальную или относящуюся к различным атипичным категориям. Авторы использовали мощную модель распознавания изображений ResNet50V2 и объединили её с несколькими другими известными сетями в «ансамбль», где несколько моделей совместно голосуют за итоговое решение. Они протестировали шесть различных схем обработки на трёх наборах данных из Польши (Померания), Дании (Херлев) и Греции (SIPaKMeD), охватывающих как простые задачи нормал/аномалия, так и более детальные многоклассовые проблемы. Во всех тестах предварительная сегментация клеток последовательно улучшала точность классификации, а добавление синтетических изображений в целом немного повышало результаты, особенно на этапе очерчивания клеток.

Насколько хорошо выступал цифровой помощник?
Система показала очень высокие оценки. Для задачи очерчивания клеток точность достигала примерно 99,5% на одном наборе данных и около 98% на другом, что заметно превосходит стандартный U-Net. Для определения типа клетки ансамбль моделей правильно классифицировал примерно 95–96% клеток в более сложных задачах и до 99% в простых бинарных решениях о риске рака. Эти результаты сопоставимы или лучше многих предыдущих исследований, одновременно демонстрируя, что единый унифицированный конвейер может работать для различных лабораторий и источников данных. Прирост был менее заметен на одном особенно разнородном наборе, что подчёркивает, что реальное разнообразие данных по‑прежнему остаётся вызовом.
Что это значит для пациентов и врачей
Проще говоря, эта работа показывает, что ИИ‑ассистент может научиться тщательно обводить клетки шейки матки и классифицировать их по группам риска с впечатляющей последовательностью. Он не заменяет патологоанатома, но может предварительно скринировать слайды, выделять подозрительные клетки и снижать вероятность того, что ранние признаки будут упущены в загруженных клиниках или в регионах с нехваткой специалистов. При дальнейшем тестировании на больших и более сложных выборках и с экспертно верифицированными масками такие системы могли бы помочь обеспечить надёжный скрининг рака шейки матки для большего числа женщин во всём мире, выявляя опасные изменения раньше и повышая шансы на успешное лечение.
Цитирование: Wubineh, B.Z., Rusiecki, A. & Halawa, K. Deep learning-based automatic segmentation and classification for cervical cancer detection using an improved U-Net and ensemble methods. Sci Rep 16, 5184 (2026). https://doi.org/10.1038/s41598-026-35299-7
Ключевые слова: скрининг рака шейки матки, изображения мазков Папаниколау, глубокое обучение, сегментация медицинских изображений, компьютерная поддержка диагностики