Clear Sky Science · ru

Многоуровневая сегментация изображения на основе нового механизма, улучшенного алгоритма оптимизации коати

2026-02-24 · Назад к списку

Более четкие изображения благодаря умной цифровой «нарезке»

Каждое цифровое изображение, от спутниковых снимков до медицинских сканов, по сути представляет собой сетку чисел. Для анализа таких изображений компьютерам часто требуется разделить их на содержательные области — например, отделить опухоль от здоровой ткани или дорогу от фона. В этой статье представлен новый подход, который делает такое разбиение одновременно и точнее, и быстрее, даже для очень сложных изображений, обучая виртуальный «рой» решателей задач сотрудничать более разумно.

Почему разрезать изображение на части так сложно

Прежде чем компьютер сможет понять изображение, его нужно разделить на области, которые относятся к одному объекту — процесс, называемый сегментацией. Один из самых простых и широко используемых подходов — пороговая обработка: выбрать одно или несколько пороговых значений на шкале яркости и отнести каждый пиксель к той или иной области в зависимости от того, в каком интервале находится его значение. С одним порогом это просто. Но в современных задачах часто требуется множество порогов одновременно, чтобы разделить несколько типов тканей на скане или различные типы земель на спутниковом снимке. Математический поиск наилучшей комбинации порогов растёт экспоненциально с их числом и быстро превращается в задачу, которую нельзя решить простым перебором.

Пусть виртуальные животные охотятся за лучшими решениями

Чтобы справляться с такими сложными поисками, учёные всё чаще обращаются к метаэвристическим алгоритмам: цифровым роям, которые бродят по пространству решений, подтягивая кандидатные ответы в перспективные направления. Работа здесь развивается на основе недавно предложенного метода, вдохновлённого коати — социальными млекопитающими, охотящимися группами. В оригинальном алгоритме оптимизации коати некоторые виртуальные особи взбираются к добыче, в то время как другие выжидают и накрывают добычу, имитируя глобальный поиск и локальную донастройку. Эта стратегия хорошо работает во многих случаях, но всё ещё может застревать в посредственных решениях, особенно когда число порогов велико или когда изображения и критерии качества разнообразны.

Обучая рой исследовать и фокусироваться

Авторы разработали улучшенную версию под названием ENCOA, которая модернизирует рой коати на нескольких уровнях. Во‑первых, они совершенствуют способ инициализации кандидатных решений, используя аккуратно настроенный хаотический шаблон и приём с зеркальным отражением по типу линзы, чтобы более равномерно распределить стартовые точки по пространству поиска. Затем они заимствуют идеи из другого морского вдохновлённого алгоритма для создания адаптивного механизма поиска (ASSM). Этот механизм постепенно меняет поведение роя: от широкого сканирования на ранних этапах к более осторожной доработке позже, что помогает избегать попадания в локальные тупики. Наконец, они вводят иерархический «вертикально‑горизонтальный» поиск: элитные решения корректируются по одному измерению за раз для точной подгонки, в то время как остальная часть роя перекрёстно комбинирует части решений, чтобы поддерживать высокое разнообразие.

Проверка метода на тестах, инженерных задачах и реальных изображениях

Чтобы убедиться, что эти доработки действительно имеют значение, команда сначала протестировала ENCOA на стандартном наборе трудных математических тестовых функций. По большинству этих задач новая методика сходится быстрее и достигает более точных решений, чем исходный алгоритм коати и ещё 11 известных методов, основанных на рое. Затем они применили ENCOA к четырём классическим инженерным задачам проектирования, например оптимизации веса зубчатого редуктора, где алгоритм вновь нашёл более лёгкие или дешёвые конструкции по сравнению с конкурентами при тех же ограничениях. Наконец, они перешли к основной цели: сегментации шести градаций серого и четырёх цветных эталонных изображений, включая природные сцены и изображения медицинского типа. С использованием двух различных критериев качества — одного, основанного на различимости областей, и другого, на сохранении информации — ENCOA последовательно выдаёт сегментации с более высокими показателями по стандартным мерам сходства изображений, особенно при большом числе порогов (до 32).

Более чёткие границы для реальных изображений

Говоря простыми словами, это исследование показывает, как более продуманный цифровой рой может разрезать изображения на более чистые и содержательные фрагменты, не замедляясь по мере усложнения задач. Тщательно балансируя между широким исследованием и целевой доработкой, ENCOA находит настройки порогов, которые сохраняют детали и уменьшают шум в широком наборе изображений и задач. Авторы отмечают, что эти преимущества могут быть полезны в требовательных областях, таких как медицинская визуализация, где более чёткие автоматические сегментации помогают клиницистам лучше видеть тонкие структуры и поддерживать более надёжную диагностику.

Цитирование: Liu, J., Yang, S., Liu, W. et al. Multilevel threshold image segmentation based on a novel mechanism enhanced coati optimization algorithm. Sci Rep 16, 10338 (2026). https://doi.org/10.1038/s41598-026-40921-9

Ключевые слова: сегментация изображений, алгоритмы оптимизации, ройный интеллект, медицинская визуализация, цифровой анализ изображений