Clear Sky Science · zh

DermaScanAI:一种可解释的混合深度学习框架,利用双重注意力与元数据融合实现皮肤病变自动分类

· 返回目录

为何更智能的痣筛查很重要

皮肤癌是最常见的癌症之一,及早发现可以挽救生命。然而,许多人在可疑痣检查前会拖延数月甚至数年,即便是有经验的医生在处理棘手病例时也常感困难。本研究介绍了 DermaScanAI,一种旨在帮助医生将无害斑点与危险斑点区分开的计算机系统,它通过查看高分辨率皮肤图像和简单的患者信息来工作,并清晰地展示其“关注”了哪些区域以得出结论。

教计算机“读”皮肤图像

皮肤科医生通常使用称为皮肤镜的手持设备获取痣和其他斑点的特写图像。这些图像揭示了可以提示癌变的细微颜色与纹理模式,但也包含许多干扰项,如毛发、不均匀光照和摄像差异。DermaScanAI 首先对图像进行清理:数字化去除毛发、均衡亮度与颜色,并将病变区域放大到标准尺寸。系统随后通过翻转、旋转和轻度变换颜色来扩增数据,使计算机能看到每个病变的多种现实变化,从而更好地应对真实世界的多样性。

Figure 1. 通过分析详细的特写图像,帮助医生对不同皮肤痣进行分类的人工智能助手。
Figure 1. 通过分析详细的特写图像,帮助医生对不同皮肤痣进行分类的人工智能助手。

兼顾细节与整体视角

以往许多用于皮肤癌的计算工具只关注局部微小模式或仅关注整体形态,这会在部分相似但整体不同的病变上造成混淆。DermaScanAI 通过结合两类模式识别来避免这一问题。首先,现代卷积网络(一种图像处理引擎)在多个尺度上提取细节特征,如边缘、色点与纹理,从微小片段到较大区域。其上叠加的注意力模块则帮助系统“放大”最有信息量的颜色通道与图像区域,同时抑制无关的背景区域。

加入全局语境与患者线索

在聚焦最重要的图像区域后,DermaScanAI 将精炼后的特征传送到轻量级的 Transformer 模块。该模块擅长连接图像中相距较远的部分,因此它能将痣的中心与边界及周围皮肤关联起来。与此同时,系统引入了诸如年龄、性别和病变部位等简单的患者信息。这些线索反映了真实临床实践:年轻人腿部的深色斑点与老年人背部的类似斑点所代表的风险可能不同。通过在做出判断前将图像特征与这些基本信息融合,模型模拟了皮肤科医生考虑语境的方式。

Figure 2. 逐步流程:AI如何清理图像、聚焦关键区域、结合患者信息并输出病变类型。
Figure 2. 逐步流程:AI如何清理图像、聚焦关键区域、结合患者信息并输出病变类型。

让医生能检查的决策过程

将人工智能用于临床的一个主要障碍是许多系统像“黑盒子”。为了解决这一问题,DermaScanAI 包含了可解释性模块。利用称为 Grad-CAM++ 的技术,它生成热图以突出哪些病变部位对决策影响最大;另一种方法 SHAP 估计包括患者元数据在内的各个信息项在多大程度上推动了结果朝向某一种诊断。当这些热图叠加在原始图像并与专家描绘的病变轮廓比较时,它们表现出高度重合,表明系统关注的是具有医学意义的区域而非随机噪声。

系统的性能如何

研究人员在 HAM10000 数据集上测试了 DermaScanAI,该公开大型数据集包含一万多张皮肤镜图像,覆盖七类皮肤病变,包括黑色素瘤、常见痣及若干良性状况。经过训练与多次数据划分的严格交叉验证后,模型达到了约 94.8% 的整体准确率、约 92% 的宏平均 F1 分数,以及 0.962 的 ROC 曲线下面积,显示出在区分病变类型方面的强大能力。当仅用数据的部分子集训练时,模型仍能保持较好的准确性;与仅基于卷积网络或 Transformer 的领先系统相比,它在使用更少计算资源的同时也能取得有竞争力的表现。

这对未来皮肤筛查的意义

简而言之,这项工作表明,经过精心设计的计算模型可以高可靠性地对不同类型的皮肤病变进行分类,利用简单的患者信息来细化判断,并向医生展示其在皮肤上“观察”的具体位置。DermaScanAI 尚非独立诊断工具:在支持实际临床决策之前,它仍需在更多医院、相机和患者群体中进行测试。但它为未来既准确又透明的皮肤癌辅助工具提供了清晰蓝图,可能帮助医生更早发现危险病变,同时增强患者与临床人员对决策过程的信心。

引用: Murali, P., Mazumder, D.H. DermaScanAI an explainable hybrid deep learning framework for automated skin lesion classification using dual attention and metadata fusion. Sci Rep 16, 15130 (2026). https://doi.org/10.1038/s41598-026-46011-0

关键词: 皮肤癌, 皮肤镜, 深度学习, 医学影像人工智能, 可解释的人工智能