Clear Sky Science · ru
Двухэтапный подход предпроцессинга и классификации для точного обнаружения COVID-19 на рентгеновских снимках
Почему важно умнее читать рентген
Во время пандемии COVID-19 врачи в основном полагались на лабораторные тесты для подтверждения инфекции. Но лабораторное оборудование может быть в дефиците, а результаты занимать время — особенно в регионах с ограниченными ресурсами. Рентген грудной клетки, напротив, доступен и позволяет быстро получить изображение, однако даже опытным рентгенологам иногда трудно заметить тонкие изменения лёгочной ткани, вызванные COVID-19. В этой работе рассматривается способ научить компьютеры надёжнее «читать» рентгеновские снимки: сначала очистить изображения, а затем применить современные методы искусственного интеллекта, с целью помочь клиницистам принимать решения быстрее и точнее.
Видеть важные детали в шумных изображениях
Рентген грудной клетки содержит смешение информации: кости, мягкие ткани, тени и артефакты оборудования накладываются друг на друга. Стандартные системы глубокого обучения обычно учатся непосредственно на таких сырых изображениях, и тогда сети приходится самостоятельно разбираться, какие части кадра важны. Это затруднительно при вариативности по яркости, контрасту и качеству. Авторы решают проблему, добавляя специальный этап предпроцессинга перед подачей снимков в нейронную сеть. Они используют компьютерный метод Maximally Stable Extremal Regions (MSER), который сканирует изображение на разных уровнях яркости и выделяет области, остающиеся стабильными при изменении порога. Эти стабильные фрагменты часто соответствуют значимым структурам — например, областям патологической ткани лёгкого — при этом игнорируя более случайный беспорядок.

Пусть виртуальная «ста́я волков» настроит параметры
MSER мощен, но капризен: его эффективность сильно зависит от нескольких числовых параметров, которые контролируют максимальный размер региона, допустимую вариацию яркости и плавность краёв. Ручное перебирание всех комбинаций для тысяч снимков было бы утомительным и медленным. Чтобы решить эту задачу, исследователи применяют натуралистичный метод оптимизации Grey Wolf Optimizer. В этом алгоритме виртуальная «ста́я» «волков» исследует разные комбинации параметров и постепенно смещается к тем, которые дают наиболее чистые и информативные области на изображениях. Качество каждой настройки оценивается с помощью меры, которая поощряет участки, одновременно внутренне однородные и чётко отделённые от окружения. За несколько десятков итераций на изображение стая сходится к набору параметров, который делает подозрительные участки лёгких хорошо различимыми.
Обучение нейросетей на очищенных изображениях
После такой доработки рентгеновские снимки передаются в глубокую сверточную нейронную сеть — тот же класс моделей, который широко применяется для распознавания лиц и автономного вождения. Авторы протестировали свою двухэтапную схему с тремя семействами сетей: простой собственной архитектурой, DenseNet (более мощная и сложная архитектура) и MobileNet (лёгкая модель для мобильных устройств). Для каждой из них они сравнили результаты на двух публичных наборах рентгеновских снимков: сначала на сырых изображениях, затем на изображениях, обработанных связкой MSER–Grey Wolf. Во всех случаях предобработка повышала точность, уменьшала количество ложных срабатываний и ускоряла обучение. В одном эксперименте точность возросла примерно с 90% до почти 99%, а время обучения сократилось примерно на две трети.

Насколько этот подход устойчив в реальных условиях?
Чтобы проверить, не запомнила ли модель случайные особенности одного набора данных, авторы провели более строгий тест: они обучали модели на одной коллекции снимков, а затем оценивали на другой, ранее не видимой. Производительность, как и следовало ожидать, снизилась, но системы с новой предобработкой держались значительно лучше, чем модели, обученные только на сырых изображениях. В работе также проведён абляционный анализ, показавший, что использование MSER без автоматической подстройки даёт мало эффекта, а сравнение с более обычным методом повышения контраста также сводило выигрыши на нет. Это указывает на то, что ключевой компонент — не просто «улучшение» изображения, а направление алгоритма на выделение стабильных, релевантных заболеванию областей принципиальным, данным-ориентированным способом.
Что это значит для пациентов и врачей
Данная работа не заменяет ПЦР-тесты и экспертизу рентгенологов, и авторы отмечают ограничения: данные получены из ограниченного набора больниц, и метод не тестировали на всех современных архитектурах сетей или на других заболеваниях лёгких. Тем не менее результаты показывают, что продуманный предпроцессинг может значительно повысить точность и эффективность существующих ИИ-систем. Помогая нейросетям фокусироваться на наиболее информативных участках каждого рентгеновского снимка, двухэтапный подход предлагает практичный путь к надёжным инструментам автоматизированной поддержки диагностики COVID-19 и, возможно, других респираторных состояний — особенно в условиях, где быстрые решения и ограниченные вычислительные ресурсы являются повседневной реальностью.
Цитирование: González, A., Gutiérrez, V.G., Cuevas, E. et al. A two-stage preprocessing and classification approach for accurate COVID-19 detection in X-ray images. Sci Rep 16, 13514 (2026). https://doi.org/10.1038/s41598-026-41861-0
Ключевые слова: Диагностика COVID-19 по рентгену, предобработка медицинских изображений, глубокое обучение в радиологии, компьютерная поддержка обнаружения, ИИ для грудной визуализации