Clear Sky Science · zh
基于多策略鱼鹰优化算法的航拍图像分割与多阈值化
从天空看得更清楚
来自飞机、无人机和卫星的航拍照片在日常决策中默默发挥作用:哪里可以建新房、野火蔓延得有多快、哪些农田需要灌溉。但要把一堆像素变成有用的地图,计算机必须先“理解”图像内容。本文介绍了一种新的方法,通过模拟鱼鹰捕食方式的算法,使航拍图像分割更快、更准确,从而将图像划分为有意义的区域。

为什么要对图像进行划分
在航拍图像能用于城市规划或灾害响应之前,需要先将其分解成若干部分:水体、建筑、道路、森林等。这个步骤称为分割,类似于在景观上绘制精确的“着色本”,使每类区域成为独立的部分。一种常用策略是“阈值化”,通过亮度或颜色的分界值将像素分为两类。对于复杂场景,计算机会同时使用多个分界值——多阈值化——把图像切成几层。要把这件事做好并不容易,因为计算机必须在大量可能的分界值组合中搜索,找到能够最好地分离真实世界特征的那些。
计算机中的自然启发“猎手”
为了解决这个搜索问题,作者基于一种较新的优化方法——鱼鹰捕食模型进行了扩展。在基本的鱼鹰优化算法中,每个“鱼鹰”代表一个试探解——一组阈值——在数学上的解空间中飞行。在探索阶段,这些数字鱼鹰广泛游走,由有潜力的“猎物”(其他优秀解)指导。在利用阶段,它们在已发现的最佳位置附近进行较小的精细移动,尝试加以改进。这种自然的平衡有助于算法避免陷入局部劣解,但原始算法有时仍会过早收敛,错失更优解。
为捕猎添加新策略
作者提出了改进版本 MOOA,为虚拟鱼鹰加入额外策略。其一是“双重吸引器”机制:每只鱼鹰不仅被群体找到的全局最优解吸引,还被自身的个体最优解引导。这种双重拉动有助于在大胆探索新区域与稳步改进已知良好位置之间取得平衡。第二个新增项是动态随机搜索,这是一种局部精调手段,能让鱼鹰在当前最佳阈值周围偶尔进行小幅而智能的扰动。两者结合使群体在初期广泛探索,随后聚焦于最有前景的阈值集合。
在真实航拍场景上的测试
为了检验这些策略是否有效,研究人员将 MOOA 应用于来自公开数据集的十六幅真实航拍图像,展示了海岸线、城市、农田和森林的固定分辨率影像。对每幅图像,他们在两种常用规则下寻找阈值——偏好强对比的 Otsu 方法和通过最大化像素分布信息量的 Kapur 方法。他们将 MOOA 与若干其他自然启发式优化器以及原始鱼鹰算法在不同分割数目下进行比较。使用衡量细节保留程度和分割图像与原图相似度的常用质量指标,MOOA 一致产生更清晰、更忠实的分割结果。同时,它在计算时间上保持竞争力,甚至优于一些替代方法。

对日常应用的意义
简而言之,这种基于鱼鹰的新方法在复杂航拍场景中更擅长决定“在哪里画线”。通过更可靠地选择亮度和颜色的合适分界值,它能生成保留重要结构(如海岸线、田块、建筑物)且不引入噪点或丢失细微特征的分割图像。这使得后续任务——如船只计数、洪水范围追踪或土地利用制图——更加可靠。作者也指出,识别微小目标和进一步加速代码仍是未解决的挑战,但他们的结果表明,经细致调优的自然启发搜索策略对于许多类型的航拍图像分析,是比一些大型深度学习系统更高效且可行的替代方案。
引用: Abd Elaziz, M., Al-Betar, M.A., Ewees, A.A. et al. Aerial image segmentation using multilevel thresholding based on multi strategy Osprey optimization algorithm. Sci Rep 16, 9095 (2026). https://doi.org/10.1038/s41598-025-07217-w
关键词: 航拍图像分割, 多阈值化, 元启发式优化, 遥感, 图像分析