Clear Sky Science · zh

使用双重注意力的增强型Swin Transformer用于从X光图像对膝骨关节炎严重程度分级

· 返回目录

为什么膝痛很重要

膝盖疼痛不仅仅是令人烦恼;它是全球致残的主要原因之一,尤其在人群老龄化时更为常见。医生在判断患者的膝骨关节炎是轻度且可管理,还是严重到需要考虑手术时,严重依赖X光影像。但阅片既耗时,又可能漏掉早期损伤,不同专家之间也常存在分歧。本研究提出了一种新的人工智能(AI)系统,旨在快速且高度准确地解读膝部X光,帮助临床医生更早发现关节损伤并更一致地指导治疗。

一种更智能的膝部X光解读方法

骨关节炎会逐步磨损膝盖缓冲的光滑软骨,导致疼痛、僵硬和活动受限。在X光片上,医生会寻找一些线索,例如骨间隙变窄和称为骨赘的小骨增生。这些变化通常用一个五级评分来概括,即Kellgren–Lawrence(KL)分级,从0(健康)到4(严重)。基于卷积神经网络(CNN)的传统计算程序在自动化分级方面已有所帮助,但它们往往难以捕捉整张图像中的细微模式,并且通常需要大量计算资源和长时间训练。论文作者的目标是设计出既更准确,又更轻便、更快速的系统,从而能够在繁忙的临床环境中实际应用,包括资源有限的机构。

Figure 1
Figure 1.

该AI系统如何工作

研究人员构建了一个名为Swin‑O‑NETS的混合模型,结合了两种理念:一种先进的图像阅读器Swin Transformer和一种快速轻量的分类器Fast Extreme Learning Network。首先,从大型公共数据库——骨关节炎倡议(Osteoarthritis Initiative)中获取的X光图像经过清理和增强以去噪并改善对比度。随后将图像切分成小补丁并输入一个U形网络,对膝部区域进行分割和分析。在该网络内部,经过修改的Swin Transformer在多个尺度上查看图像,从关节表面的细节到整个膝部的更广泛结构模式。

关注正确的细节

一个关键创新是使用多头通道自注意力机制,这一机制帮助AI决定哪些图像特征最重要。模型不是将X光的所有部分一视同仁,而是学习聚焦于携带关节间隙变窄、骨缘清晰度和早期骨赘等信息的通道,同时弱化较少信息量的背景区域。多个注意力“头”并行地观察数据并合并其发现,从而丰富对膝部的整体描述。这些提炼后的特征被输入到Fast Extreme Learning Network,后者完成将X光划分为五个KL等级之一的最终步骤。由于该分类器可以通过一步数学计算得到其内部权重,而无需经过多次缓慢的训练循环,整个系统尽管结构复杂但仍保持高效。

Figure 2
Figure 2.

将系统付诸测试

为了评估Swin‑O‑NETS的性能,作者在2,047张带标签的膝部X光片上进行了训练和测试,仔细平衡了不同的严重程度等级,并使用旋转、缩放等数据增强手段以防止过拟合。他们将模型与流行的深度学习架构进行了比较,包括标准CNN、VGG‑19、ResNet、DenseNet,以及若干集成和增强注意力的变体。在所有五个KL等级(从健康到重度损伤)上,Swin‑O‑NETS始终给出最高的评分。其总体准确率约为99.5%,且精确率、召回率和F1分数同样很高,ROC曲线下面积为0.9838,表明其在区分不同严重程度方面能力优异。同时,它所需的计算量和训练时间也少于许多基于Transformer的竞争模型。

这对患者可能意味着什么

简而言之,这项工作表明,一个精心设计的AI系统可以几乎完美地在X光上对膝骨关节炎进行分级,同时仍保持可运行性。通过快速且一致地发现人眼可能忽略的早期关节变化,Swin‑O‑NETS可以支持更早的生活方式或药物干预、推迟关节置换的需要,并有助于在医院间标准化护理。作者指出,要在现实世界中部署该系统仍需在更大规模、多中心的数据集上进行更多测试,并开发更轻量的实时可用版本。不过,他们的结果表明,像这样的智能影像阅读器有望很快成为放射科医师的常规辅助工具,悄然改善数百万膝痛脆弱患者的预后。

引用: Sudha, K., Rajiv Kannan, A. Enhanced swin transformer with dual attention for knee osteoarthritis severity grading from X-ray images. Sci Rep 16, 10617 (2026). https://doi.org/10.1038/s41598-026-44174-4

关键词: 膝关节骨关节炎, X光成像, 深度学习, Transformer网络, 医学图像分类