Clear Sky Science · zh

一种用于增强基于CT扫描图像的非小细胞肺癌分类的轻量级卷积神经网络

· 返回目录

更快的肺部扫描为何重要

肺癌是致死率最高的癌症之一,部分原因在于常常被发现得较晚。医生越来越依赖高分辨率的CT扫描和肺组织的显微图像来发现早期病变,但读取这些影像需要耗费时间和专业技能,而这些资源在小型医院尤为匮乏。本研究提出了一种紧凑的人工智能模型,称为MiniConvNet,旨在帮助医生在计算资源有限的情况下快速且准确地区分几种主要的非小细胞肺癌亚型与健康肺组织。

Figure 1
Figure 1.

早期发现肺癌的困难

大多数肺癌死亡与非小细胞肺癌有关,该总称包括腺癌、鳞状细胞癌和大细胞癌等亚型。这些亚型在生物学行为、对治疗的反应上各不相同,但在影像上可能非常相似。如今,放射科医生和病理学家通过检查CT扫描和组织切片来判断病情,但这项工作劳动强度大,在专家稀缺的地区尤其困难。尽管现代深度学习系统可以提供帮助,许多高性能模型体积庞大、推理缓慢且需要强大的图形处理器,使其难以在日常诊所中部署。

构建更小、更聪明的影像判读器

作者着手设计一种在保留深度学习优势的同时减少体量的神经网络。MiniConvNet是一种轻量级的卷积神经网络,非常适合图像分析。它使用一系列小的图像滤波器、简单的数学运算和池化层,逐步将视觉信息浓缩为紧凑表示,随后通过全连接层做出最终判断。MiniConvNet大约有五十万个可训练参数,文件大小仅约6兆字节,远小于常见的VGG、ResNet和Inception等模型,这些模型通常包含数千万参数并需要更多内存和计算资源。

对模型进行测试

为了评估这一紧凑设计的效果,研究者在两类不同的肺部影像上训练并评估了MiniConvNet。第一类是包含三种癌症亚型和健康肺的900张CT扫描图像集合;第二类是更大的、包含约15000张高分辨率肺组织显微图像的数据集,涵盖类似的类别。对于两个数据集,图像都被统一调整到标准尺寸,并采用数据增强——例如翻转、旋转和缩放等简单变换——以帮助模型应对实际应用中可能遇到的变异。为了公平比较,MiniConvNet与一组常用对照模型使用了相同的训练设置,如学习率、批量大小和优化器。

Figure 2
Figure 2.

新模型的表现如何

在CT扫描测试集中,MiniConvNet取得了约96%的准确率,明显优于已有模型:表现最好的大型网络Inception V3约为82%,而VGG16、VGG19、ResNet‑50、EfficientNet、MobileNet和ConvNeXt等则落后。MiniConvNet在精确率、召回率和F1分数等指标上也在各个类别中表现良好,表明它不仅能可靠识别癌症,还能在三种主要亚型与健康肺之间进行区分。在组织图像数据集中,该模型同样位列前茅,测试准确率接近97%,且在各类别间性能均衡。通过五折交叉验证——在不同的数据划分上重复训练和测试——确认了这些结果具有稳定性,而非偶然偏差。

速度与在临床的实用性

除准确性外,研究还强调了速度和资源使用。MiniConvNet的训练速度快于许多重量级模型,在普通硬件上每张图像的预测只需几毫秒,同时能有效处理CT和组织图像。这些特性对床旁工具尤为重要,因为那里的计算能力可能较弱,医生需要快速反馈。研究者还表明,引入一种名为dropout的正则化技术有助于维持模型性能并降低过拟合风险——过拟合是当训练数据相对较少时深度学习常见的问题。

对患者和医生的意义

通俗来说,这项工作表明,小型高效的AI程序可以以媲美甚至超过更大系统的准确率标注并分类肺癌。MiniConvNet体积小,能够在成本较低的机器上运行,是当前缺乏先进计算基础设施的医院和诊所的有希望候选工具。不过,在将此类工具用于常规临床之前,仍需更大且更多样化的患者数据集以及真实世界的试验来验证其可靠性。总体而言,该研究指向了一个前景:快速、便携的AI助手在帮助专家更早发现肺癌并更精确地制定治疗方案方面的潜力。

引用: Baqir, M.A., Qayyum, S., Ashfaq, N. et al. A lightweight CNN for enhanced non-small cell lung cancer classification using CT scan image. Sci Rep 16, 12985 (2026). https://doi.org/10.1038/s41598-026-41401-w

关键词: 肺癌, CT扫描, 深度学习, 卷积神经网络, 医学影像