Clear Sky Science · zh

一种基于CLAHE预处理的优化EfficientNetB0框架用于精确的多类胸片分类

2026-03-28 · 返回目录

来自胸片的更智能帮助

胸部X光是全球最常见的医学检查之一，但要正确解读它们——尤其是在多种肺或心脏问题同时出现时——并不容易。本研究介绍了一种新的计算机系统，通过精心调优的人工智能（AI）模型和增强图像细节的处理步骤，帮助医生更准确地在单张胸片中识别多种疾病。

为什么胸部影像难以解读

在胸片上，许多器官和组织层叠重叠：肋骨、肺、心脏和血管都汇聚在同一张平面图像中。有经验的放射科医生学会了解开这种视觉难题，但即便如此，当多种病情同时出现——例如肺周围积液、感染和心脏扩大——他们也可能遇到困难。早期的辅助诊断工具常常简化这一现实，假定每张图像只呈现单一问题或无问题。这使得它们在临床环境中用途受限，因为患者往往同时存在多种疾病。

构建更清晰的肺部视图

研究人员从美国国立卫生研究院的一个大型公开数据集入手，包含超过10万张已去标识的胸片。他们聚焦于五种在实际护理中重要的发现：正常、肺炎、气胸（肺萎陷）、胸腔积液和心脏增大（心脏扩大）。在让AI学习图像之前，研究团队对每张胸片进行了标准化的清理流程。图像保留灰度，使用称为CLAHE的方法轻度增强对比以揭示肺内微弱模式，调整亮度以保持一致性，并将所有图像统一调整为相同尺寸。团队还通过有针对性地重复某些样本并裁剪其他样本来平衡罕见与常见发现，防止模型忽视不常见但重要的疾病。

训练尊重现实复杂性的AI

系统的核心是EfficientNetB0网络，一种以在较小、计算快速的模型上实现优秀性能而著称的现代深度学习结构。作者针对胸片的混合现实对该网络进行了定制：系统不再给出单一的是/否答案，而是为五种发现中的每一种输出独立概率，从而允许在一张图像上标记多种问题。他们加入了类似注意力的组件，帮助模型强调最具信息量的图案，并采用了一种特殊的训练规则，重点学习那些最难以辨认、容易被忽略的病例。训练分两阶段进行——先只调整末端层，然后微调整个网络——并使用严格的交叉验证以确保结果稳定，而非由数据划分的偶然性造成。

系统的表现如何

为检验设计是否真正带来改进，团队在相同条件下将优化后的EfficientNetB0与两种流行的替代模型DenseNet121和MobileNetV2进行了比较。三者在总体准确率上相近，但在医学中最关键的方面，优化后的EfficientNetB0更具优势：它在区分病变与健康和避免漏诊方面表现更好。在五种发现中，它在区分有病与无病的平均评分较高，对肺炎和心脏增大尤为强劲。即便是在更棘手的气胸和积液病例中——这些情况的X光征象可能微弱且与其他问题重叠——该模型仍保持了稳健的检测能力，同时在重复测试中表现出一致性。

这对患者与临床医生意味着什么

该研究表明，关注整个工作流——从如何清理和平衡胸片到如何训练AI——可以产生更好地反映医院影像复杂现实的工具。该系统的目标不是取代放射科医生，而是作为第二道视力，标注单张胸片上可能的多种问题并提示那些应由人进一步审查的病例。凭借在大型公开数据集上的强劲结果以及可适配于其他数据集的设计，这一方法使计算辅助诊断更接近日常应用，在更快、更可靠地解读胸片方面，有望帮助患者获得及时且恰当的治疗。

引用: Hegazy, N.Y., Sawah, M.S. An optimized EfficientNetB0 framework with CLAHE-based preprocessing for accurate multi-class chest X-ray classification. Sci Rep 16, 10811 (2026). https://doi.org/10.1038/s41598-026-42492-1

关键词: 胸片人工智能, 肺部疾病检测, 深度学习放射学, 医学图像预处理, 多标签分类