Clear Sky Science · zh
用于多类肝病分类的基于Transformer增强的深度集成方法,基于CT图像
更智能的肝脏影像为何重要
肝病正悄然成为全球健康危机,但在医学影像中早期发现肝病常常很困难,即便对专家也是如此。本文探讨了现代人工智能如何帮助医生更准确地解读常规CT扫描,在不需额外检测的情况下将患者归类为三种常见且严重的肝脏问题——脂肪肝、肝硬化和肝癌。通过结合两种强大的AI理念:卷积神经网络和Transformer注意力机制,作者构建了一个接近为放射科医师提供高度可靠第二意见的系统。
三种常见肝病,一个重大挑战
肝脏位于人体代谢的核心,负责代谢、解毒和重要蛋白质的生成。当肝脏因长期脂肪沉积、瘢痕化或肿瘤受损时,其影响会波及几乎所有器官系统。脂肪肝现在大约影响全球三分之一的人口,肝硬化和肝癌每年造成数百万人的死亡。然而在CT影像上,这些疾病常常融入灰度背景:早期脂肪变性可能不明显,肝硬化的瘢痕可能呈弥漫性而非局灶性,肿瘤也可能隐藏在正常组织之间。传统的实验室检测有帮助,但并不针对某一种疾病。临床上越来越依赖影像来决定谁需要密切随访或治疗,但影像解读会随经验和工作负荷而差异显著。
教计算机在医学影像中‘看见’
过去十年,深度学习改变了计算机读取图像的方式。卷积神经网络(CNN)擅长发现边缘、纹理和形状等模式,已经提升了多种肝脏疾病的检测效果。然而,传统CNN多集中于局部区域,对于分布广泛或细微的变化可能力有不逮。Transformer最初为语言任务设计,带来了新的能力:注意力机制。它们可以学习图像中远距离区域之间的关系,识别全局模式而不仅仅是局部补丁。该研究的作者旨在将两者的优势融合在一个实用的肝脏CT系统中——来自CNN的局部细节与来自Transformer的全局语境相结合。

构建混合神经网络团队
研究者汇集了来自若干公开数据集的CT影像,覆盖681名患者和超过一百万张单独的切片,涵盖脂肪肝、肝硬化和肝细胞癌(一种常见的肝癌类型)。在标准化图像尺寸并增强对比度后,他们通过谨慎的数据增强来平衡不均的类别分布:对图像进行小幅平移、旋转和缩放,以模拟真实世界的变异。三种知名的预训练CNN——ResNet50V2、DenseNet121和MobileNetV2——首先被改造并微调,以独立地对三类疾病进行分类。每种网络有不同的架构“性格”:ResNet深且强大,DenseNet高效复用特征,MobileNet轻量且速度快,适合资源受限的环境。
加入注意力并融合意见
接着,团队在每个CNN上添加了Transformer模块。他们没有停留在一堆局部特征上,而是将CNN的输出重塑为一系列token,并将其送入多头自注意力层。这些层学习图像中哪些区域应“关注”其他区域,从而捕获诸如弥漫性瘢痕或斑片状脂肪沉积等远程模式。每个混合的CNN–Transformer模型基于患者的所有CT切片(而非单张图像)输出三类疾病的概率。最后,作者创建了一个混合集成:他们对三种模型的特征表示进行对齐与拼接,并通过一个额外的Transformer来学习如何最好地组合这些不同视角,然后给出最终决策。

系统表现如何?
性能提升显著。单独调优后的CNN准确率约在69%到82%之间,已属可观但存在明显盲点——尤其是脂肪肝和肝硬化,这两者在影像上常相似。为每个骨干网络加入Transformer后,准确率提高到87%–93%,并大幅改善了三类疾病间的平衡。当三种增强Transformer网络被融合进集成时,整体准确率上升到97%,精确度、召回率以及对类别不平衡更鲁棒的相关性指标几乎达到完美。在患者层面上,集成在测试数据中未漏诊任何肝硬化或肝癌病例,并且对脂肪肝的误报也非常少。统计检验确认这些提升并非偶然,而是相对于最佳单一模型的显著改进。
这对患者意味着什么
对非专业读者而言,关键信息是这种混合AI系统可以将常规CT扫描变成一个更敏锐的工具,同时识别三种主要肝病。通过结合不同的神经网络并赋予它们“注意力”机制,模型学会同时注意细粒度的细节与整器官的模式,这些对诊断至关重要。尽管该方法在计算上比简单网络更重,且仍需在更多医院和扫描仪上进行验证,但它指向了可与放射科医师协同工作的实用工具:提示细微病变、减少漏诊、支持更早的治疗决策。简言之,这预示着一种未来,智能软件能帮助确保严重肝病不会在影像中被忽视。
引用: Bhardwaj, S., Aggarwal, S., Kumar, N. et al. Transformer-enhanced deep ensemble for multi-class liver disease classification using computed tomography images. Sci Rep 16, 12690 (2026). https://doi.org/10.1038/s41598-026-43256-7
关键词: 肝病影像, 深度学习诊断, CT扫描分析, Transformer集成, 计算机辅助放射学