Clear Sky Science · zh

基于动态蛇形卷积与多特征注意力的Yolov8n用于MRI脑颅肿瘤分割

· 返回目录

对患者和医生的重要性

脑肿瘤的威胁不仅来自其生长速度,还因为它们位于人体最脆弱的器官。术前或放疗前,医生必须在MRI影像上准确知道肿瘤的起止位置。目前,这种勾画常由人工完成,既耗时又易疲劳且不尽完美。本文提出了一种新的人工智能方法,旨在自动、快速并以更清晰的边缘细节勾画脑肿瘤,可能为神经外科医生提供更明确的手术或治疗导航图。

在噪声图像中更清晰地识别肿瘤

磁共振成像(MRI)是发现脑肿瘤和规划手术的主要工具。然而脑肿瘤形态各异——有些呈圆形且界限清晰,另一些则呈丝状、斑片状或与正常组织交织。其边界常常模糊,尤其在早期阶段,即便是专家也难以在每个切片上勾画出精确轮廓。传统的计算方法要么依赖人工设计的数学规则,要么依赖在反复压缩与重构过程中会模糊细节的标准深度学习模型。这两类方法在最需要精确的位置——肿瘤边缘——都显得力不从心。

为医学调优的更快探测器

作者在一类被称为YOLO的人工智能模型基础上改进,该模型最初用于照片和视频中的实时目标检测。YOLO速度快、效率高——这些特性在需要快速决策的繁忙医院中非常重要。但基础YOLO模型是为日常场景设计的,并不适应细微的医学差异。为将YOLOv8n(模型的紧凑版本)用于脑MRI扫描,研究者重构了其内部模块,使其对细微结构和不规则形状给予特殊关注,而不仅仅识别大范围的对象。

Figure 1
Figure 1.

沿肿瘤边缘延展的蛇形“镜头”

第一个主要创新称为动态蛇形卷积。标准的AI“镜头”在刚性的方形网格上查看图像补丁,这对汽车和路牌有效,但对在脑组织中呈弯曲管状延伸的肿瘤则不适用。动态蛇形卷积允许“镜头”沿灵活的蛇形路径滑动,以适应局部结构。模型扫描MRI切片时,其采样点被柔性引导去追随连续曲线而非固定方框,从而在跟踪复杂轮廓时更自然、不会迷失位置。

融合多视角并聚焦关键区域

为了进一步提高准确性,模型并不依赖单次蛇形扫描。它对同一区域进行多次此类扫描,然后将得到的特征图融合为更丰富的结合表征——作者称之为多特征融合。在此基础上,他们加入了双注意力机制。一部分在通道维度上工作,决定哪些特征类型(例如纹理或亮度模式)应被赋予更高权重;另一部分在空间维度上工作,突出图像中最具信息量的位置。组合起来,这些注意力层像一位放射科医生:既知道哪些线索通常预示肿瘤,又能放大可疑区域,而非对每个像素一视同仁。

Figure 2
Figure 2.

新方法的效果如何?

团队在一个包含1300幅脑部MRI影像的公开数据集上训练并测试了他们改进的模型,称为DMA‑YOLOv8n,并检验了其向另一个知名脑肿瘤数据集(BraTS2021)的迁移性能。他们使用标准指标评估自动轮廓与专家绘制轮廓的重合程度。与原始YOLOv8n及若干其他领先系统(包括医院和研究中常用的U‑Net变体)相比,DMA‑YOLOv8n在准确性与效率之间取得了最佳平衡。它获得了更高的精确率和召回率,表明其漏检的肿瘤像素更少、误把健康像素标为肿瘤的情况也更少,同时保持了适合实际使用的较低计算成本。

对未来临床护理的意义

对外行来说,关键结论是该AI方法能够比许多现有工具更清晰、更可靠地在脑部扫描上勾画肿瘤边界,同时不延缓护理流程。通过追随肿瘤生长的自然弯曲路径并学习聚焦最有意义的细节,DMA‑YOLOv8n生成的轮廓与专家意见高度一致。如果将此类系统整合到临床工作流中,可能帮助医生更有信心地规划手术和放疗,缩短从诊断到治疗的时间,并有望改善脑肿瘤患者的治疗结局。

引用: Hang, Y., Zhang, Q., Li, L. et al. Yolov8n based on dynamic serpentine convolution and multi-feature attention for MRI brain cranial tumor segmentation. Sci Rep 16, 12008 (2026). https://doi.org/10.1038/s41598-026-42502-2

关键词: 脑肿瘤MRI, 医学图像分割, 深度学习, YOLOv8, 临床决策支持