Clear Sky Science · zh
熵正则化双流注意力融合用于多病种肺部分类
更智能的肺部影像为何重要
像肺炎和 COVID-19 这样的肺部疾病在胸片上可能表现得非常相似,即便对有经验的医生也是如此。细微的雾状斑块、散在的小点以及整体浑浊的影像特征常常在不同疾病之间重叠,而且影像质量在不同医院之间也会有差异。本研究提出了一种新的人工智能(AI)方法,旨在更可靠地解读这些图像,准确区分不同的肺部问题,并在图像噪声较大或来自不熟悉的扫描设备时保持稳定的表现。

同时关注细小斑点与整体格局
现有的大多数肺部影像 AI 系统依赖于两类策略之一。第一类是卷积网络,擅长发现细节,例如可能提示早期感染或结节的微小亮点或暗点。另一类基于较新的“注意力”思想,更善于评估肺区的整体模式,这对弥漫性病变如晚期肺炎或 COVID-19 很重要。单独使用任一风格的系统都会有所欠缺:注重细节的系统可能忽视远程关联的模式,而注重宏观的系统又可能忽略细微的纹理特征。
一种可按患者自适应的双通路模型
作者提出了一种名为自适应双流注意力融合(ADSAF)的双通路 AI 框架。同一张胸片被并行送入两条路径:一条聚焦细节,放大小纹理和边缘,另一条关注上下文,捕捉疾病在整个肺区的分布模式。ADSAF 并非简单地平均两条路径的输出,而是为每张图像学习应赋予各路径的权重。对于以局部、细小改变为主的扫描,它更依赖细节路径;对于表现为弥漫性浑浊的扫描,则更多地倚重全局模式路径。
让模型自信地做出选择
该工作的一大创新在于如何融合这两条信息流。许多早期的“混合”系统以固定或仅略微灵活的方式混合来自不同路径的特征,可能导致优柔寡断的组合,从而模糊重要线索。ADSAF 在训练中引入了一条特殊规则,惩罚这种不确定的融合,推动系统在给定图像上更明确地选择应占主导的路径。从数学上说,它对不确定的权重组合施加惩罚,促使模型偏向更清晰的决策。此外,一个额外的注意力模块类似聚光灯,增强最可能与病变相关的区域,同时抑制诸如肋骨或心影等背景结构。这不仅提高了准确性,也使模型关注点在视觉上更易解释。

在真实世界挑战下的表现
为了验证该方法,研究者在广泛使用的胸片数据集(用于肺炎和 COVID-19)上训练并评估了 ADSAF。他们将其与多种强对手进行了比较,包括深度卷积网络、基于 Transformer 的模型以及若干系统组合而成的集成方法。ADSAF 的表现与这些方法不相上下或更优,分类准确率超过 98%。在研究团队故意加入噪声以模拟差的成像条件时,其他模型的准确率下降幅度远大于 ADSAF。该系统在一个数据集上训练、在另一个数据集上测试时也表现更稳健,模拟了从一家医院的设备与患者群体迁移到另一家的情况。基于热图的可视化解释显示,ADSAF 集中于放射科医生也会关注的肺区,表明其决策基于有意义的影像线索。
这对未来肺部医疗意味着什么
简言之,这项研究表明:能够灵活决定何时依赖细节、何时依赖全局模式的 AI 模型,能比现有方法更准确、更可靠地从胸片中对肺部疾病进行分类。通过为每位患者强调最具信息量的视角并过滤分散注意力的背景特征,ADSAF 为临床人员提供了更稳定的“第二双眼”。尽管仍需临床试验和实时测试,该框架指向了可能帮助更早发现严重肺部问题、减少相似疾病间误分以及在不同医院与成像条件下保持一致表现的决策支持工具。
引用: Thakare, V., Aote, S.S., Gangrade, J. et al. Entropy-regularized dual-stream attention fusion for multi-disease lung classification. Sci Rep 16, 14141 (2026). https://doi.org/10.1038/s41598-026-44441-4
关键词: 肺部影像, 医学人工智能, 胸片分析, 肺炎检测, COVID-19 诊断