Clear Sky Science · zh
用于 X 光图像中准确检测 COVID-19 的两阶段预处理与分类方法
为何更智能的 X 光判读很重要
在 COVID-19 大流行期间,医生主要依赖实验室检测来确认感染者。但实验室设备可能短缺,检测结果也可能需要较长时间——尤其在资源有限的地区。相比之下,胸部 X 光检查快捷且普及,但即便是经验丰富的放射科医师也可能难以察觉 COVID-19 导致的那些常常很微妙的肺部变化。本文探讨了一种先清理图像再应用现代人工智能的方法,以期教计算机更可靠地读片,帮助临床医生更快、更准确地做出决策。
在噪声图像中看清重要细节
一张胸部 X 光包含混杂的信息:骨骼、软组织、阴影和机器伪影叠加在一起。标准的深度学习系统试图直接从这些原始图像中学习,这意味着网络必须自行判断每张图像中哪些部分重要。当图像在亮度、对比度和质量上存在差异时,这一任务就非常困难。作者通过在 X 光进入神经网络之前加入专门的预处理步骤来应对这一点。他们使用一种称为最大稳定极值区域(Maximally Stable Extremal Regions,MSER)的计算机视觉技术,该方法在多个亮度阈值下扫描图像,挑出在阈值变化时仍然稳定存在的区域。这些稳定的片段往往对应有意义的结构——例如异常肺组织区域——同时忽略更多随机的杂波。

让虚拟狼群来调优参数
MSER 很强大但也挑剔:它的表现高度依赖若干数值设置,这些设置控制一个区域的最大尺寸、亮度可变范围以及边缘应有的平滑程度。对数千张 X 光手动测试所有组合将既繁琐又耗时。为了解决这个问题,研究者采用了一种受自然启发的优化方法——灰狼优化器(Grey Wolf Optimizer)。在该算法中,一个虚拟的“狼群”探索不同的参数组合,逐步趋向于那些在图像中产生最清晰、最具信息性的区域的设置。每组参数的质量通过一个评分度量来评估,该度量奖励内部一致且与周围明显分离的区域。经过每张图像几十次迭代后,狼群收敛到一组能使可疑肺部区域清晰突出的参数。
用更干净的图像来训练神经网络
一旦以这种方式细化了 X 光图像,它们就被送入深度卷积神经网络——这类模型同样广泛用于人脸识别与自动驾驶。作者使用三类不同的网络家族来测试他们的两阶段流水线:一个非常简单的自定义网络、DenseNet(一种更强、更复杂的架构)以及 MobileNet(一种为移动设备设计的轻量模型)。对于每种网络,他们在两个公开的胸部 X 光数据集上分别比较了使用原始图像和使用 MSER–灰狼组合预处理图像的性能。总体来看,预处理后的图像带来了更高的准确率、更少的误报以及更快的训练速度。在一个案例中,准确率从约 90% 跳升到接近 99%,而训练时间大约缩短了三分之二。

该方法在现实世界中有多稳健?
为了检验该方法是否仅仅记住了单一数据集的特殊性,作者做了更苛刻的测试:他们在一组 X 光上训练模型,然后在另一组从未见过的 X 光上进行评估。表现自然有所下降,但采用新预处理步骤的系统比仅用原始图像训练的系统表现得稳得多。研究还包含消融分析,结果显示单独使用未自动调优的 MSER 并未带来显著改进,并且与一种更常规的对比度增强方法比较时,优势在许多情况下消失。这表明关键成分不是单纯“增强”图像,而是以有原则、数据驱动的方式引导算法去隔离稳定且与疾病相关的区域。
这对患者和医生意味着什么
这项工作并不能取代 PCR 检测或资深放射科医师,作者也指出了局限性:数据来自有限的几家医院,他们未在每种现代网络架构或其他肺部疾病上测试该方法。尽管如此,结果表明经过深思熟虑的预处理可以显著提升现有 AI 系统的准确性与效率。通过帮助神经网络聚焦每张胸片中最具信息性的部分,这一两阶段方法为在需要快速决策且计算资源有限的环境中,构建可靠的自动化诊断支持工具提供了切实可行的路径,既可用于 COVID-19,也可能扩展到其他呼吸系统疾病。
引用: González, A., Gutiérrez, V.G., Cuevas, E. et al. A two-stage preprocessing and classification approach for accurate COVID-19 detection in X-ray images. Sci Rep 16, 13514 (2026). https://doi.org/10.1038/s41598-026-41861-0
关键词: COVID-19 X 光诊断, 医学图像预处理, 放射学中的深度学习, 计算机辅助检测, 胸部影像人工智能