Clear Sky Science · zh

一种蝠鲼-贝叶斯优化方法用于经超参数调优的卷积神经网络在肺癌分类中的应用

2026-03-07 · 返回目录

这对病人和医生为何重要

肺癌是致死率最高的癌症之一，早期在CT影像上被发现可以挽救生命。然而，让计算机准确解读这些影像并不简单，因为即便是强大的人工智能系统，如果调参不当也会失误。本研究提出了一种更智能的方式来微调一个紧凑的图像分析网络，使其能够更准确、更高效地识别肺癌，未来可能帮助放射科医生更快、更可靠地做出判断。

一种更聪明的教机器的方法

现代基于图像的诊断常依赖深度学习，计算机网络直接从医学影像中学习模式。这些系统已经展示出能区分健康肺部与癌性结节的能力，有时可与传统方法一较高下。然而，它们的成功在很大程度上取决于一些隐藏的设置，比如模型学习速率、用于扫描图像的滤波器数量，以及为避免过拟合而施加的正则化程度。传统上，研究者通过反复试验或暴力搜索来调整这些设置，这既慢又昂贵，且可能仍会错过更优组合。作者认为，对于肺癌影像，我们需要既更智能又更实用的调参策略。

结合两种搜索策略

团队提出了一个两步搜索流程，将模型调优视为探索未知地形。首先，一种称为贝叶斯优化的概率方法会依据已有的模型结果，建议下一步最有前景的设置，而不是盲目检查每一种可能。它使用性能的数学代理来引导在学习率、卷积滤波器数量、全连接单元数和丢弃率等参数空间中的探索。一旦全局步骤缩小到一个良好区域，第二种受蝠鲼觅食行为启发的方法就接手了。这种基于群体的过程通过链式运动、盘旋模式和突发的“翻滚”跳跃来轻微扰动候选设置，以进行局部精炼并逃离性能地形中的小陷阱。

为扫描设计的精简网络

为了利用该调参策略，作者设计了一个针对肺部CT影像的轻量级卷积网络。与那些拥有数百万参数的庞大模型不同，他们的设计借鉴了紧凑型移动视觉架构的思路。网络使用深度可分离卷积和逐点卷积层以减少计算量同时保留重要的视觉细节，然后融合不同深度的特征并将其送入最终的分类层以区分多个肺部类别。仔细的图像预处理进一步帮助模型：去噪、增强对比、强调边缘，并通过数据增强平衡数据集，使得罕见或细微的病例不会被忽视。

该方法的效果如何

研究者在若干公共肺癌CT数据集上测试了他们经调优的网络，包括一个临床上更现实的集合，其中恶性病例比正常病例更常见。与广泛使用的架构如 MobileNet、ResNet、DenseNet 以及基于变换器的模型相比，他们的紧凑网络以远少的参数与更低的计算时间，达到了相似或更高的准确率。通过结合贝叶斯和蝠鲼调优流程，该模型在一个基准测试上达到了约98%的测试准确率，并在良性、恶性和正常类别上保持了较高的精确率与召回率。交叉验证和统计检验表明，这种混合搜索策略比粒子群、遗传算法等其他优化方案产生了更稳定且显著更优的结果。

这在实践中可能意味着什么

对非专业读者来说，核心信息是：调节人工智能模型的学习方式，与模型本身的设计同样重要。通过将全局概率搜索与局部的自然启发式精化步骤配对，本研究展示了一个相对小型的网络可以在使用适度计算资源的情况下，学会准确解读肺部CT影像。尽管还需要更多与替代调参方法的比较和大规模临床试验，但这项工作指向了有望整合进日常医院设备的人工智能工具，作为放射科医生的快速第二意见，并有可能帮助更早、更可靠地发现肺癌。

引用: Samal, S., Sunder, S., Gadekellu, T. et al. A manta ray-bayesian optimization approach for hyperparameter-tuned convolutional neural networks in lung cancer classification. Sci Rep 16, 14794 (2026). https://doi.org/10.1038/s41598-026-42506-y

关键词: 肺癌, CT扫描, 深度学习, 超参数调优, 医学影像