Clear Sky Science · ru

Оптимизированный алгоритм K-средних для сегментации изображений на основе улучшённого алгоритма жуков навозников

· Назад к списку

Чётче изображения благодаря более умным алгоритмам

Каждый день телефоны, медицинские сканеры и беспилотные автомобили полагаются на компьютеры, которые отделяют важные объекты на изображении от фона. Этот процесс, называемый сегментацией изображений, влияет на всё — от обнаружения опухолей в снимках до распознавания пешеходов в потоке транспорта. Представленное здесь исследование предлагает новый способ сделать это разделение более точным и надёжным, сочетая две идеи: классический метод кластеризации и стратегию поиска, вдохновлённую жуком-навозником.

Figure 1
Figure 1.

Почему разбивать изображение сложно

На первый взгляд разрезать изображение на области с похожей яркостью, цветом или текстурой просто. Популярный инструмент, известный как K-средних, делает это, группируя пиксели в кластеры. Но у K-средних есть уязвимость: результат сильно зависит от начальной точки. Дать ему неудачную начальную догадку — и он может застрять в посредственном решении, упуская мелкие детали или размывая границы. Это особенно проблематично для изображений с шумом, сложным освещением или тонкими текстурами, например медицинских снимков или уличных сцен с отражениями и тенями.

Уроки из жизни жука

Чтобы улучшить ситуацию, авторы опираются на относительно новый метод «роевого интеллекта», вдохновлённый поведением жуков-навозников. В природе эти насекомые катят, прячут, крадут и ищут шарики навоза, корректируя свои траектории при изменении условий. Оригинальный алгоритм оптимизации жуков навозников имитирует это поведение, чтобы искать хорошие решения в математическом пространстве. Однако, как и многие алгоритмы поиска, он может рано застревать или медленно сходиться на сложных задачах. Исследователи предлагают улучшенный алгоритм оптимизации жуков-навозников (IDBO), который уточняет способы, которыми виртуальные жуки исследуют пространство и сосредотачиваются на перспективных областях.

Три улучшения для более эффективного поиска

Новый метод вводит три ключевых улучшения. Во-первых, применяется метод выборки Латинского гиперкуба, чтобы равномерно распределить начальные позиции жуков по пространству поиска, избегая скоплений и пропущенных зон. Во-вторых, гибридная стратегия движения позволяет жукам плавно переключаться между широким исследованием и целенаправленным уточнением по мере продвижения поиска, используя изменяющееся правило принятия решений и простую «конкуренцию», когда одни жуки корректируют траектории, опираясь на других. В-третьих, специальные локальные корректировки, основанные на математических функциях с короткими и редкими длинными прыжками, помогают жукам тонко настраивать лучшие позиции и при этом выходить из локальных ловушек. В совокупности эти шаги нацелены на то, чтобы находить лучшие решения быстрее и стабильнее, чем исходный алгоритм.

Figure 2
Figure 2.

Испытания на эталонных задачах и реальных изображениях

Чтобы проверить эффективность IDBO, авторы сначала тестируют его на наборе стандартных математических задач, используемых для сравнения методов оптимизации. По многим функциям и размерностям IDBO обычно достигает лучших решений быстрее и с меньшей вариативностью между запусками, чем конкурирующие алгоритмы, включая ранние версии алгоритма жуков и другие популярные роевые методы. Затем они интегрируют IDBO в пайплайн K-средних, используя его для выбора лучших начальных центров кластеров при сегментации изображений. На классических тестовых изображениях — таких как лебедь на воде, оператор камеры, зерна риса и цветок — K-средних с поддержкой IDBO даёт более четкие границы, меньше пересвеченных или выстираных областей и более правдоподобную текстуру. Численные показатели искажений и качества сигнала подтверждают эти визуальные улучшения.

Что это значит для повседневных изображений

Проще говоря, исследование показывает, что направление K-средних более продуманным, «жучьим» поиском сильно снижает вероятность того, что алгоритм остановится на неудачном разбиении изображения. Вместо этого он чаще находит сегментации, сохраняющие края и структуру, даже при сложном освещении и текстурах. Хотя метод по-прежнему требует вычислительных ресурсов и может потребовать дополнительной настройки для очень больших или задач в реальном времени, он указывает на будущее, где интеллигентные стратегии поиска незаметно улучшают то, как машины видят мир за кулисами.

Цитирование: Li, N., Luo, Y., Feng, Z. et al. Optimized K-means algorithm for image segmentation based on improved dung beetle algorithm. Sci Rep 16, 11187 (2026). https://doi.org/10.1038/s41598-026-38438-2

Ключевые слова: сегментация изображений, кластеризация, роевой интеллект, алгоритмы оптимизации, компьютерное зрение