Clear Sky Science · zh
基于深度学习的自动分割与分类用于宫颈癌检测:改进的 U-Net 与集成方法
为何巴氏涂片检测仍需数字化帮手
宫颈癌是少数在早期发现时高度可预防的癌症之一,但仍有许多女性因为危险细胞变化被漏诊或发现过晚而死亡。熟悉的巴氏涂片检测已经挽救了生命,但人工目视阅读成千上万张细胞图像既缓慢又容易疲劳,即使是专家有时也会产生分歧。本文探讨了现代人工智能如何作为不知疲倦的助理,自动在巴氏涂片图像中定位并分类宫颈细胞,帮助医生更快速且更可靠地发现早期预警信号。
教会计算机识别异常细胞
研究者旨在构建一个能完成两项关键任务的计算机系统:首先,从巴氏涂片图像背景中识别并分离出每个宫颈细胞;其次,判定细胞是正常还是呈现与癌症相关的异常迹象。为此他们采用了深度学习——一种从大量示例图像中直接学习模式而非依赖手工规则的人工智能方法。该系统关注整个细胞——既包括暗色的细胞核也包括周围的细胞质——因为细胞在大小、形状和纹理上的整体变化可能提示疾病存在。
更智能的细胞轮廓描绘方法
系统的核心是改进版的流行医学成像模型 U-Net,它在为图像中对象绘制精确轮廓方面表现突出。作者对 U-Net 进行了修改,使其能同时在多个尺度上观察图像细节,并在使用小批量数据训练时保持稳定——这是医学影像工作中常见的限制。此升级网络学会为每张图像生成简单的掩码:细胞区域为白色,背景为黑色。通过仅隔离细胞区域,后续流程可以专注于最重要的部分,而不受染色斑点、碎屑或空白区域的干扰。

从无到有生成更多训练样本
医学领域面临的主要挑战是高质量、有标签的图像稀缺且获取成本高。为应对这一问题,团队使用了一种名为 RES_DCGAN 的生成模型,该模型学习基于真实图像生成逼真的合成巴氏涂片图像。这些额外“虚构但可信”的图像被混入训练过程中,既用于细胞分割前的阶段,也用于后续的分类阶段。通过看到更多细胞的变体——包括罕见且细微的模式——AI 变得更健壮,更不容易对少量患者或特定成像条件过拟合。
从轮廓到早期预警
在细胞分割完成后,第二组深度学习模型接手,对每个细胞进行分类,判断其为正常或属于不同的异常类别。作者使用了一种强大的图像识别模型 ResNet50V2,并将其与其他几种知名网络组合成“集成”系统,由多个模型共同表决最终结果。他们在来自波兰(Pomeranian)、丹麦(Herlev)和希腊(SIPaKMeD)的三个数据集上测试了六种不同的处理流程,涵盖简单的正常与异常二分类以及更细化的多类问题。跨这些测试,先进行细胞分割始终能稳定提高分类准确率,加入合成图像通常也会进一步提升性能,尤其是在细胞轮廓描绘方面效果显著。

这位数字助理表现如何?
系统取得了很高的评分。在细胞轮廓描绘方面,一套数据集上的准确率达到约99.5%,另一套约为98%,明显优于标准 U-Net。在细胞类型判定上,模型集成在更复杂的任务中对约95–96%的细胞作出了正确标注,而在更简单的有/无癌风险判定中准确率可达99%。这些结果与或优于许多早期研究,同时表明单一统一的流程可以适用于不同实验室和数据源。在一个变异性特别大的数据集上增益较小,这也凸显了现实世界数据多样性带来的挑战。
对患者与医生的意义
用通俗的话说,这项工作表明 AI 助手可以学会精确描绘宫颈细胞并将其归入风险组,且一致性显著。它并不取代病理学家,但可以对切片进行预筛选、标出可疑细胞,并降低在繁忙门诊或专家稀缺地区遗漏早期征象的风险。经过对更大、更多样本以及专家验证掩码的进一步测试,类似系统有望将可靠的宫颈癌筛查推广给更多女性,尽早发现危险变化,从而提高成功治疗的机会。
引用: Wubineh, B.Z., Rusiecki, A. & Halawa, K. Deep learning-based automatic segmentation and classification for cervical cancer detection using an improved U-Net and ensemble methods. Sci Rep 16, 5184 (2026). https://doi.org/10.1038/s41598-026-35299-7
关键词: 宫颈癌筛查, 巴氏涂片图像, 深度学习, 医学图像分割, 计算机辅助诊断