Clear Sky Science · zh
一种用于全局优化问题的多策略框架以增强哈里斯鹰优化算法
通过数据实现更聪明的捕猎
现代医院为每位患者收集大量信息——从血液检测和影像到传感器读数和问卷。在这些测量数据中隐藏着可帮助医生更早发现疾病并选择更优治疗方案的模式。但当测量项远多于患者数量时,传统的计算模型容易被噪声误导而不是捕捉真实信号。本文提出了一种新方法,帮助算法在庞大的医学数据集中筛选出一小组可靠的线索,同时仍能准确预测疾病。
信息过多为何会有害
如今的医学数据集每人可能包含数十甚至数千个测量值,而患者数量相对较少。这种不平衡会使模型产生“过拟合”,在既有数据上表现优秀但在新患者上失败。一个有力的解决办法是特征选择:不是把每个化验值和影像测量全都输入模型,而是先由算法搜索一组更紧凑的、高信息量的特征。依赖少量关键生物标志物的诊断工具不仅更易训练、运行更快,而且对临床医生更透明,他们可以理解决策的理由。
从猎鹰捕猎中获得灵感
为选出理想的特征子集,作者基于一种自然启发的技术——哈里斯鹰优化。在这一比喻中,每个可能的特征子集是鹰的“栖枝”,对最佳子集的搜索模拟了在可能性景观上协同捕猎的过程。标准哈里斯鹰优化擅长广泛巡航然后收拢到有前景的区域,但仍可能在具有欺骗性的山顶上盘旋停滞——看起来局部优秀但并非真正最优的解。这种停滞在医学中代价尤为高,因为每个试验解都需要通过训练和测试分类器来评估,这是一个耗时的步骤。

为群体增加的三项新策略
论文提出了一个改进框架,称为MHHO,为虚拟鹰群引入了三项新策略。首先,领导者引导的栖息步骤促使探索中的鹰更多关注当前的最优解,而不是盲目追随随机同伴,帮助搜索更快到达有前景的区域。其次,自适应欺骗因子监测进展停滞的迹象;一旦发生,就暂时增大鹰群随机跃动的幅度,使其跳出局部陷阱,恢复改进后再收窄这些跃动以进行微调。第三,分层攻击策略改变了最终突袭的方式:不是每只鹰都直接向同一点俯冲,而是各自参考一只略优的“导师”鹰,从多个角度接近目标,避免整个群体过早聚集得过于集中。
在数学难题与真实患者数据上的测试
为验证这些新行为是否有效,作者进行了两项主要测试。在第一项中,MHHO 与原始方法共同攻克了23个广泛用于考验优化算法的标准数学基准问题。MHHO 在大多数问题上取得了更好的结果,收敛更快、精度更高,但计算时间略有增加。在第二项测试中,团队将MHHO作为特征选择器应用于15个公开的医学数据集,包括乳腺癌、心脏病、甲状腺疾病、帕金森病和糖尿病性视网膜病变等。每次试验中,都使用支持向量机分类器来评估给定特征子集在区分健康与患病(或多类诊断)方面的效果。

更少检测、更清晰结论
在这些医学案例研究中,MHHO 通常发现非常小的特征集合——经常只有一到两个测量值——其分类准确率与或优于原始方法。它还产生了更稳定的解:多次运行往往选择相似的子集并达到相近的准确率,这在医生和监管机构要求可重复性时尤为重要。统计检验证实三项新增策略各自对性能有显著贡献,且合并后在准确性与稀疏性之间提供了良好的平衡。从实际角度看,这意味着未来的诊断工具可以基于一组精简且高度信息化的检测,降低成本和复杂性,同时保持可信度。
对患者与临床实践的意义
对非专业读者而言,核心信息是:更好的“搜索策略”能让机器学习系统在医学中变得既更聪明又更简洁。通过协调那些能探索、逃离陷阱并智能微调瞄准的虚拟鹰群,所提框架帮助计算机聚焦最重要的少数测量项。尽管该方法在医学以外还需更多验证并增加了一定的计算开销,但它展示了精心设计的优化如何推动我们朝向更准确、稳定且更易被临床医生理解和采纳的诊断模型前进。
引用: Al-Adwan, S., Abdullah, S., Alweshah, M. et al. A multi-strategy framework for enhancing Harris hawks optimization for global optimization problems. Sci Rep 16, 10614 (2026). https://doi.org/10.1038/s41598-026-45741-5
关键词: 特征选择, 医疗诊断, 元启发式优化, 哈里斯鹰算法, 高维数据