Clear Sky Science · zh

MSF-VMDNet:一种基于多频双编码器网络的皮肤癌整张切片多类分割

· 返回目录

为什么绘制皮肤癌分布很重要

在诊断皮肤癌时,医生常常查看染色组织切片的超高分辨率显微图像。这些图像不仅显示肿瘤,还展示了多种紧密交织在一起的正常皮肤结构。人工逐一勾画各区域的精确边界既费时又容易因专家不同而产生差异。本研究提出了一种新的计算方法,旨在自动且高精度地分离这些错综复杂的组织,既能节省时间,也能提高诊断一致性。

从简单斑点到纠结的组织

皮肤癌是全球最常见的癌症之一,部分原因是紫外线暴露增加。现代诊断通常从皮肤镜检查(放大皮肤照片)开始,并常常继续做活检:取一小块皮肤,染色并在显微镜下观察。在这些整张切片图像中,肿瘤穿行于表皮、深层结缔组织、毛囊、汗腺和脂肪等层次。许多区域在颜色和纹理上相近,边界可能模糊,即便对专家来说要清晰地将肿瘤与健康组织区分也很困难。

一种读懂复杂图像的新方法

早期大多数计算工具把这个问题当作用两种颜色填图:“病变”和“非病变”。这在较简单的表面照片上或许可行,但在必须同时划分多种组织类型的切片上就力不从心。作者关注的是一个具有挑战性的非黑色素瘤皮肤癌数据集,每张图像需要被划分为最多十种不同的组织类别。他们的目标是构建一个既能理解组织整体布局,又能捕捉边界处细微细节的系统——这是传统神经网络常常难以权衡的两项能力。

Figure 1
Figure 1.

两套“脑”协同更好

为了解决这一问题,团队设计了MSF‑VMDNet,这是一种双编码器网络,可以把它看作两套互补的“脑”并行检查同一张切片。一个分支基于广受欢迎的医学成像模型U‑Net,擅长捕捉局部细节。作者在其上增强了一个频谱模块,将图像转换为若干频率成分——有的描述缓慢、平滑的变化,有的捕捉清晰的边缘和纹理——然后将它们重新组合以强化类别边界。与此同时,第二个分支基于一种较新的方法Vision Mamba,以更流线的方式扫描切片,高效建模远距离的关系,使得相距较远但相关的区域可以相互提供信息。

同时“听见”多种频率

频率信息在该架构中起到核心作用。通过在普通图像空间与基于频率的视角之间转换,网络能够对广泛形状与微小结构区别对待。低频成分帮助理解肿瘤及周围皮层的整体布局,而高频成分则锐化一种组织类型终止与另一种开始之间的边缘。精心设计的模块将这些视角合并回空间图,额外的解码模块(称为SCConv)在抑制冗余信号的同时增强真正有信息量的模式。结果是每个组织区域的映射更清晰、置信度更高。

Figure 2
Figure 2.

实际效果如何?

研究者在非黑色素瘤皮肤癌数据集上测试了MSF‑VMDNet,并将其与一系列领先的分割模型进行了比较,包括经典的U‑Net、基于Transformer的方法以及其他Vision Mamba混合模型。他们的系统在肿瘤轮廓更清晰、在肿瘤、毛囊和炎性组织交错的棘手区域犯错更少。在常用的重叠度量上,它优于所有竞争方法,与专家手工标注的掩码达到约95%的吻合率。为了检验方法是否能超越单一实验室和单一癌种的适用性,团队还在三类额外数据集上进行了评估:皮损的皮肤镜照片、不同类型细胞核的显微图像以及腹部器官的CT扫描。在所有测试中,该方法均保持高度准确,并在统计上优于多个强基线。

这对患者和医生意味着什么

简而言之,MSF‑VMDNet是一个用于医学图像的自动制图工具,能够以不同寻常的精度将肿瘤从复杂的正常组织环境中分离出来。尽管它不能取代病理学家的判断,但可以提供快速且详尽的起点,减少手工工作量并帮助确保微小肿瘤区域不会被忽视。由于同一方法在多种不同医学图像上均表现良好,它有望成为多种诊断任务的通用工具。随着进一步开发并整合临床信息,此类系统可支持更可靠的皮肤癌分级并最终促进更有依据的治疗决策。

引用: Zhang, J., Pu, Q., Tian, J. et al. MSF-VMDNet for multi class segmentation of skin cancer whole slide images using a multi frequency dual encoder network. Sci Rep 16, 11722 (2026). https://doi.org/10.1038/s41598-026-40044-1

关键词: 皮肤癌成像, 医学图像分割, 病理学中的深度学习, 组织病理分析, 人工智能诊断