Clear Sky Science · zh

通过 CBAM 增强的 VGG19 深度学习改善急性淋巴细胞白血病诊断

· 返回目录

为何更快速的血液癌症检测至关重要

急性淋巴细胞白血病(ALL)是一种侵袭性的血液癌症,如果不及时发现和治疗,可能在数周内威胁生命。当前,医生通常通过在显微镜下观察骨髓和血细胞来诊断 ALL——这是一项细致、耗时的工作,高度依赖专家判断。本研究探讨了一种定制化的人工智能(AI)如何帮助医生从显微镜图像中更快速、更一致地识别 ALL 及其亚型,可能在保持专家控制的同时加快诊疗流程。

Figure 1
Figure 1.

聚焦儿童血液癌症的病理特征

ALL 是由于未成熟的白细胞(称为淋巴母细胞)在骨髓中失控生长并进入血液所致。这些异常细胞挤占正常血细胞,并可能扩散到神经系统。ALL 是儿童最常见的癌症,但也可发生于成人。在显微镜下,专家根据细胞大小与形状、遗传物质的纹理以及细胞周围液体的外观,将 ALL 分为三种主要亚型——L1、L2 和 L3。区分这些亚型并将其与健康骨髓分开对于选择治疗方案很重要,但当细胞外观非常相似时,即便是专家也可能难以判断。

教计算机看懂专家看到的细节

研究人员旨在构建一个 AI 系统,将骨髓图像分为四类:三种 ALL 亚型和正常(非白血病)样本。他们从巴基斯坦的一家临床实验室收集了 328 张高倍率图像,涵盖 10 至 45 岁的患者,然后使用数据增强技术(如旋转、翻转以及亮度或对比度的细微调整)生成了 1,585 个多样化的训练示例,同时保留了关键细胞结构。数据集被划分为训练集、验证集和测试集,并通过统计工具进一步分析,显示各类别在特征空间中以复杂方式重叠,强调即便对高级算法来说这一任务也并非易事。

新型 AI 模型如何“聚焦”重要信息

研究核心是对一种知名图像识别网络 VGG19 的改进版本。在每个主要池化步骤之后,作者添加了“卷积块注意力模块”(CBAM)。简单来说,模型先从图像中学习多层特征,然后使用注意力机制决定哪些特征和图像区域应获得更高权重。注意力机制的一部分强调最具信息量的通道——例如核边缘或内部纹理等模式,另一部分则突出细胞中最重要的位置。通过在网络的多个深度堆叠这些注意力步骤,系统能够跟踪细微的视觉线索,帮助区分彼此相近的白血病亚型。

系统性能如何

在测试中,CBAM 增强的 VGG19 模型与多种流行的深度学习架构进行了比较,包括 DenseNet、Inception、MobileNet 以及原始的 VGG19。使用标准的性能度量,新模型实现了 98.73% 的总体准确率,比没有注意力的 VGG19 高出约 5.7 个百分点,并优于在相同数据上测试的所有竞争模型。详细结果显示四类均具有较高的精确率和召回率,包括罕见的 L3 亚型,受试者工作特征曲线接近理想。团队还进行了 k 折交叉验证——在多次数据划分上训练和测试以检验稳定性,并通过消融实验表明在多个阶段同时使用通道和空间注意力是提高性能的关键。

Figure 2
Figure 2.

这对患者和医生意味着什么

尽管结果令人鼓舞,作者强调该系统尚不适合替代人工专家或单独在临床上使用。本研究依赖相对较小的单中心数据集,且没有独立的多院验证来证明模型在不同环境或人群中同样有效。尽管如此,研究表明精心设计的注意力机制能帮助 AI 专注于病理学家在阅读骨髓切片时使用的细微视觉细节。未来,经过更大规模和更多样化数据验证的类似系统,可能作为决策支持工具——快速标注可疑病例、建议可能的 ALL 亚型,并展示影响预测的热图区域——从而帮助医生更快、更自信地作出诊断。

引用: Rahman, S.I.U., Abbas, N., Ali, S. et al. Improving acute lymphoblastic leukemia diagnosis through CBAM-enhanced VGG19 deep learning. Sci Rep 16, 11027 (2026). https://doi.org/10.1038/s41598-026-40184-4

关键词: 急性淋巴细胞白血病, 医学影像人工智能, 深度学习诊断, 注意力机制, 骨髓显微镜