Clear Sky Science · zh
用于宫颈癌和淋巴瘤多分类诊断的深度卷积神经网络的元启发式优化
更智能的早期癌症检测工具
对许多人来说,癌症确诊仍然来得太晚,治疗更困难且生存率下降。医生已经使用显微镜和计算机检查组织样本,但教会机器分辨外观相似的癌症出乎意料地困难。本研究探讨如何通过让受自然启发的搜索策略自动微调一种强大的图像分析网络,使人工智能在识别两种严重疾病——宫颈癌和淋巴瘤方面更加可靠。

为何癌症图像会让计算机困惑
在显微镜下,不同癌症的细胞可能彼此相似,而同一类癌细胞在形状、颜色和纹理上又可以差别很大。这种视觉上的混乱使得人类和机器都难以给出一致的诊断。深度学习系统,尤其是流行的图像网络 VGG-16,能够学会捕捉有用的视觉模式。然而,它们的性能在很大程度上取决于许多隐藏设置,例如学习率、批量大小以及模型正则化强度。这些设置称为超参数,通常由人工选择或保持默认值,这会限制准确性,尤其是在目标是同时区分多种癌症类型时。
借力大数据而不必依赖大规模数据
医学影像数据集通常很小,因为高质量的带标签样本难以且昂贵地收集。为了解决这一问题,研究人员依赖迁移学习。他们从在大型通用图像集合上训练好的 VGG-16 网络出发,重用其早期层作为细胞图像的特征提取器,然后添加为新任务量身定制的层。研究团队使用了两套公开数据集:一套包含五类细胞的宫颈癌数据集和一套包含三种亚型的淋巴瘤数据集。每个原始数据集的图像都不到一千张,因此作者通过仔细的数据扩增(如小角度旋转、平移、缩放、亮度变化和翻转)将它们扩展为数万张多样的训练样本。

让虚拟“动物”来调节旋钮
研究并非靠凭感觉猜测超参数,而是使用六种受动物行为和进化启发的元启发式算法来搜索最佳设置。在这些方法中,每个候选解都像是在探索可能性景观的生物。鲸鱼优化算法模仿座头鲸围绕猎物的螺旋行为,灰狼优化器模拟狼群包围和追踪目标,粒子群优化将解视为群鸟,遗传算法通过重组和变异来模拟基因变化,蚁群优化遵循虚拟信息素轨迹,而一种改进的 PSO 变体用于避免过早陷入局部最优。每个候选定义了一个完整的 VGG-16 训练配方;网络被短时间训练,其验证准确率被测量,元启发式通过若干轮迭代调整种群以偏好更好的配方。
从调参配方到对网络的精细打磨
该框架分为两个阶段。首先,使用预训练的 VGG-16 作为冻结的特征提取器,同时算法搜索强的超参数组合。其次,一旦找到最佳组合,就解冻 VGG-16 的顶层并在这些优化设置下对癌症数据进行微调,使网络能够将其内部滤波器调整到特定的组织模式。尽管搜索预算很小——仅五个个体和三次迭代——以及训练轮数适中,这一双阶段策略仍产生了显著提升。例如,在淋巴瘤数据集上,未经优化的基线 VGG-16 约为 83% 的准确率,而优化后的模型攀升至九十多%。宫颈癌也出现了类似的飞跃,调优系统即便仅训练五个周期也超过了 99% 的准确率。
哪种策略最有效及其重要性
在两种癌症类型和多次重复实验中,鲸鱼优化算法表现突出。与预训练的 VGG-16 配合时,它在测试集上达到了准确率、精确率、召回率和特异性方面的满分,并在仅几次迭代内可靠收敛。其他算法如蚁群优化和粒子群优化在启用深层微调后也显示出实力,同样接近或超过 99% 的准确率。统计检验确认,基于鲸鱼的调优相较于其他方法获得的提升并非偶然。尽管如此,这类几近完美的结果仍需在更广泛、多样化的数据上进行验证,研究表明,精心选择的搜索策略可以比默认设置从现有网络中释放出更多性能。
这对未来癌症护理的意义
对非专业人士来说,主要结论是:该研究提供了一种更聪明的方法来调整现有深度学习系统,使其能够在有限训练数据和合理计算资源下,非常可靠地分离多种外观相似的癌症。这类系统不是要取代医生,而是可以作为一致的助手,标记可疑切片并帮助减少漏诊或误诊。作者指出,在临床部署之前,还需要更大、更具多样性的数据集、更轻量的网络设计以及解释模型所见内容的工具。尽管如此,这项工作表明,让虚拟的鲸鱼、狼群和群体来调节我们的癌症检测网络,可以使自动化诊断更敏锐、更快捷且更值得信赖。
引用: Abdelhay, E.H., Elgamily, K.M. & Badr, W.O.EF. Metaheuristic optimization of deep CNNs for multi-class diagnosis of cervical cancer and lymphoma. Sci Rep 16, 15110 (2026). https://doi.org/10.1038/s41598-026-51619-3
关键词: 宫颈癌影像, 淋巴瘤分类, 深度学习诊断, 超参数优化, 元启发式算法