Clear Sky Science · zh
基于新型机制增强的貘优化算法的多阈值图像分割
通过更智能的数字切分得到更清晰的图像
每一幅数字图像——从卫星照片到医学扫描——本质上都是一个数字网格。为了分析这些图像,计算机常常需要将它们切分为有意义的区域——例如将肿瘤与健康组织、或道路与背景区分开来。本文提出了一种新的方法,通过教会一群虚拟“群体”更智能地协作,使这种切分既更清晰又更快速,即便面对极其复杂的图像也能如此。

为何将图像切分成片段如此困难
在计算机真正理解图像之前,必须把图像分成属于同一类的区域——这一过程称为分割。最简单且被广泛使用的方法之一是阈值化:在图像亮度刻度上选择一个或多个临界值,根据像素值落在哪个区间把像素分配到不同区域。只有一个阈值时很容易,但现代任务常常需要同时使用多个阈值来将扫描中的多种组织或卫星影像中的多类地物分离开来。随着阈值数量增加,寻找最佳阈值组合的数学搜索空间呈爆炸式增长,很快变成难以用直接计算解决的问题。
让虚拟动物群去寻找更好的解
为应对这些棘手的搜索问题,科学家越来越多地求助于元启发式算法:在解空间中游走的数字群体,推动候选解朝有希望的方向演化。本文的工作基于一种受貘(注:文中指社会性哺乳动物)群体狩猎行为启发的最新方法。在原始的貘优化算法中,部分虚拟个体向猎物爬行,而另一些则埋伏突袭,模拟全局探索与局部微调的协同。这一策略在许多情况下表现良好,但在阈值数量较多或图像与质量度量多样时,仍可能陷入平庸解。
教会群体既探索又聚焦
作者设计了一个增强版本,称为 ENCOA,在多个层面升级了貘群体。首先,他们改进了候选解的初始化,使用精心调校的混沌序列和类透镜的镜像技巧,使起始点更均匀地分布在搜索空间中。接着,他们借鉴另一种海洋启发算法的思想,引入了自适应搜索机制(ASSM)。该机制使群体行为随着迭代逐步从早期的广泛漫游转向后期的谨慎细化,帮助避免陷入局部停滞。最后,他们提出了分层的“纵向-横向”搜索:对精英解逐维度进行精确调整,同时让其余群体通过交叉混合解的片段来保持多样性。
在测试、工程案例与真实图像上验证方法
为验证这些改进是否有效,研究团队首先在一套标准且具有挑战性的数学测试函数上运行 ENCOA。在这些测试中,该方法在收敛速度和解的精度上大多优于原始貘算法及另外 11 种知名的群体式方法。随后,他们将 ENCOA 应用于四个经典工程设计问题,例如优化齿轮箱重量,在相同约束下该算法再次比竞争方法找到更轻或成本更低的设计。最后,他们针对主要目标进行了实验:对六幅灰度和四幅彩色基准图像(包括自然场景和类似医学的图像)进行分割。采用两种不同的质量准则——一种基于区域分明程度,另一种基于信息保留量——ENCOA 在标准图像相似性指标上持续给出更高得分,尤其是在需要许多阈值(最多可达 32 个)时表现尤为突出。

为真实世界图像带来更清晰的边界
通俗地说,这项研究展示了如何通过更合理设计的数字群体,在问题复杂度增加时仍能将图像切分得更干净、更有意义,而不会陷入运算瓶颈。通过在大胆探索与有针对性的细化之间取得谨慎平衡,ENCOA 能找到既保留细节又降低噪声的阈值设置,适用于广泛的图像与目标。作者认为,这些改进可望推广到诸如医学成像等高要求领域,在那里更清晰的自动分割有助于临床医生更清楚地观察微小结构并支持更可靠的诊断。
引用: Liu, J., Yang, S., Liu, W. et al. Multilevel threshold image segmentation based on a novel mechanism enhanced coati optimization algorithm. Sci Rep 16, 10338 (2026). https://doi.org/10.1038/s41598-026-40921-9
关键词: 图像分割, 优化算法, 群体智能, 医学成像, 数字图像分析