Clear Sky Science · zh
BRISC:用于脑肿瘤分割与分类的带注释数据集
为什么脑部扫描数据与每个人息息相关
脑肿瘤是人们可能收到的最令人恐惧的诊断之一,临床医生越来越依赖计算机程序来帮助在 MRI 扫描中识别并描绘这些危险的病灶。但就像学生从缺页的教科书学习一样,许多现有的人工智能(AI)系统因数据不完整或不一致而受限。本文介绍了 BRISC——一个新整理的脑部 MRI 图像集合,旨在为医学 AI 提供高质量示例,从而更好地检测和描绘脑肿瘤,这项工作最终可能支持更快、更可靠的诊断。 
一座新的脑影像库
BRISC 数据集收集了 6,000 张聚焦于一种特定扫描类型的脑部 MRI 图像——增强对比的 T1 加权图像,这类图像特别有助于突出肿瘤边界。每张图像被分入四类之一:三种常见肿瘤类型(胶质瘤、脑膜瘤和垂体瘤)以及一个非肿瘤组,后者包括健康大脑和其他非癌性情况。这些图像来源于若干早期的公开集合,但 BRISC 补充了那些旧数据集中普遍缺乏的内容:由医学专家创建并核对的精确肿瘤区域轮廓和一致的标签。
平衡视角与肿瘤类型
许多现有集合的一个主要问题是数据不平衡:某些肿瘤类型或扫描角度占主导地位,导致 AI 模型仅在最常见的模式上表现良好。BRISC 通过在诊断类别和观察视角上设计更均衡的分布来应对这一问题。图像覆盖三种标准 MRI 视角——轴位(自上而下)、冠状位(前到后)和矢状位(侧向)——每种视角的样本数相近。四个诊断类别在训练和测试划分中也保持相对平衡。这种精心设计有助于未来算法从多个角度和更广泛的情形中学习识别肿瘤,更真实地反映临床医生在门诊中实际看到的情况。
仔细清理与专家标注
将原始扫描转化为可信赖的研究资源需要大量清理工作。团队从一个流行的在线脑肿瘤集合中开始,原始图像超过 7,000 张,剔除了质量差或损坏的扫描、近重复图像以及序列过短而无法可靠解读的扫描。为保持一致性,仅保留了增强对比的 T1 扫描。随后由临床医师和一位放射科医生审查图像,纠正错误标签并剔除可疑病例。使用专门的标注工具,他们在肿瘤区域绘制了详细的掩模,并反复完善直至达到较高的一致性;在一个测试子集上,初始标注与专家最终确认的轮廓吻合度很高。 
这些数据为 AI 模型带来什么可能性
为了展示 BRISC 的用途,作者在两项任务上训练了多种流行的 AI 模型。第一项任务要求模型将每张图像分类为四个诊断类别之一。现代图像识别系统,尤其是 EfficientNet 系列,取得了很高的准确率——大多数扫描被正确标注,特别是在区分无肿瘤图像方面表现尤为出色。第二项任务要求模型在 MRI 切片上逐像素地填色肿瘤区域。在这项任务中,更先进的分割网络,包括擅长建模上下文的基于变换器的架构,取得了最佳得分,能够在三种主要肿瘤类型中准确描绘肿瘤轮廓。
这项工作如何推动领域进步
简言之,BRISC 是一个组织良好、公开的“训练场”,供计算机学习解读脑部 MRI。它提供了数千张经过仔细清理的扫描、在肿瘤类型和观察角度上的现实多样性,以及由专家绘制的肿瘤轮廓,这些都能教会算法疾病确切出现的位置。虽然该数据集用于研究目的——并非面向患者的独立诊断工具——但它为构建和比较新型 AI 系统提供了坚实基础。随着研究人员利用 BRISC 和类似资源不断改进模型,临床医生终有一天可能会拥有更可靠的数字助手,帮助他们更早检测脑肿瘤并以更充分的信心制定治疗方案。
引用: Fateh, A., Rezvani, Y., Moayedi, S. et al. BRISC: Annotated Dataset for Brain Tumor Segmentation and Classification. Sci Data 13, 361 (2026). https://doi.org/10.1038/s41597-026-06753-y
关键词: 脑肿瘤 MRI, 医学影像 AI, 肿瘤分割, 数据集整理, 放射学 深度学习