Clear Sky Science · zh
一个带有结构化、逐项和分级放射学报告的全面床边胸片数据集
为何更智能的胸片很重要
当某人在重症监护病房病情危重时,一张简单的胸片就能显示他们的肺是否积液、心脏是否增大,或气道是否塌陷。医生常常每天重复这些床边拍片以追踪病情变化。然而,在病人不能正确坐立时,读片很困难,即便是专家也不总是以相同方式描述所见内容。本文介绍了 TAIX-Ray——一个大规模、经过仔细标注的床边胸片集合,旨在教会计算机更可靠地识别和分级肺部与心脏问题,从而有望加速诊断并支持超负荷工作的医务人员。

现有数据集的不足之处
过去十年,大型公开胸片集合推动了医学影像领域人工智能的快速发展。然而,这些数据库大多通过将放射学报告输入自然语言处理软件来推断哪些疾病存在。该捷径带来了两个主要问题。首先,真实的临床报告充斥着模糊或谨慎措辞——这些短语在不同语境下可以有不同解读。其次,放射科医生在表达不确定性方面差异很大;超过一半的胸部影像报告包含至少一条此类谨慎表述。把这些混乱的语言转换为简单的“疾病存在”或“疾病缺失”标签会向数据中引入噪音,并可能误导学习算法,从而限制即便是最先进模型的表现。
一种新型的胸片集合
TAIX-Ray 通过从结构化报告而非自由文本入手来应对这些弱点。作者收集了来自一家大型医院、跨 14 年间 47,724 名重症患者的 215,381 张床边胸片。在常规护理过程中,134 名受训放射科医师为每张胸片填写了标准化电子表单。他们不是随意书写描述,而是逐项选择关键发现的评分:心脏大小、肺部液体过多的征象、双侧胸腔积液、双侧肺内朦胧浸润以及双侧肺组织塌陷。每项发现按有序量表分级,从“无”到“可疑”、“轻度”、“中度”和“重度”(心脏大小采用类似的四级刻度)。这种方法不仅记录是否存在病变,还记录其严重程度和所在位置。
图像与标签的准备方式
为保护患者隐私,所有识别性信息都从图像和报告中剥离,并为每位患者、医师和胸片分配了随机代码。医院软件将原始报告表单转换为纯文本后,通过定制脚本提取仅有的预定义评分词,忽略任何额外注释。图像本身从原始医学格式转换为标准灰度图片文件,同时保留承载细微诊断线索的全亮度范围。每张图片还被调整为一致的最大尺寸以便处理,同时保留原始全分辨率版本。缺少必要数据或存在歧义的研究——例如多张图像但无法确定哪张被评分——被谨慎排除以维持数据质量。

构建与测试示例 AI 模型
为展示 TAIX-Ray 的使用价值,团队训练了一个基于“视觉变压器”(vision transformer)的现代图像分析系统,这是一种最初为通用图像任务开发的深度学习架构。他们从一个已经在大量非医学图片上自学出有用视觉特征的模型开始,添加了用于预测每项胸部发现存在性与严重程度的层。进行了两项主要实验。第一项中,模型仅判断胸片是否正常或存在任何异常。第二项中,模型预测每项发现的完整分级。为了避免数据重叠,按患者级别划分训练、验证和测试集,模型在所有任务上都取得了高准确率并与原始放射科医师评分表现出较好一致性,胸腔积液和心脏大小变化的表现尤为突出。
这对患者和医生意味着什么
通过将大量真实世界的床边胸片与一致、细致分级的专家标签配对,TAIX-Ray 为构建能做出超越“有异常”的 AI 工具奠定了基础。在该资源上训练的模型可以学习估计常见肺部与心脏问题的严重程度及其随时间的变化——这些信息对重症监护中的治疗决策至关重要。由于数据、代码与示例模型均公开可得,其他研究者可以重复使用它们、公平比较方法并将其扩展到新的问题。虽然此类系统不会取代放射科医师,但它们可以作为第二双眼睛——突出细微变化、优先处理危急病例,并为医院中一些最危重的患者带来更一致的评估。
引用: Truhn, D., Geiger, D., Siepmann, R. et al. A comprehensive bedside chest radiography dataset with structured, itemized and graded radiologic reports. Sci Data 13, 632 (2026). https://doi.org/10.1038/s41597-026-07271-7
关键词: 胸部X光人工智能, 重症监护成像, 放射学数据集, 肺部和心脏发现, 医学影像分级