Clear Sky Science · zh
DermNet:用于缓解皮肤科诊断偏差的整合 CNN-ViT 架构,采用先进的无监督病灶分割
为何浅色皮肤诊断公平性重要
皮肤疾病几乎每个人一生中都会遇到,从痤疮和湿疹到更严重的病症不等。然而,对于褐色和深色皮肤的人来说,这些问题在临床上以及由人工智能(AI)工具检测时更难被发现并更易被误诊。本文介绍了 DermNet——一种新的 AI 系统,旨在通过教计算机专注于实际的病变区域而非周围皮肤的颜色,从而在不同肤色之间更公平地识别皮肤疾病。

一刀切的皮肤 AI 有何问题
大多数现有的皮肤诊断 AI 系统的训练照片严重偏向浅色皮肤。当这些系统用于深色皮肤的人群时,其准确性会下降约 8–12%。在现实中,这种差距可能意味着早期警示被错过和治疗延迟。收集平衡的医学照片数据集也很困难:图像散落在各个医院,某些国家几乎没有数字记录,而且由皮肤科医生进行专家标注既耗时又昂贵。因此,AI 往往会学会捷径,例如将某些疾病主要与苍白皮肤关联,而非真正理解病灶的外观。
教计算机只看病灶
作者从源头处理这种偏差:图像本身。他们不是将整张手臂、脸或腿的照片输入 AI,而是首先自动裁切出实际的病变区域——病灶——无论周围皮肤是什么颜色。为此,他们将一个功能强大的开源工具 Segment Anything(可在无需专门训练的情况下勾勒对象)与经典的图像处理技巧结合,强调颜色和亮度差异。通过巧妙切换颜色空间并应用自动阈值处理,他们生成了将病灶与正常皮肤分离的黑白“掩码”。值得注意的是,这一无监督流程在浅色和深色皮肤上与专家级病灶轮廓的重叠率约为 90%,且无需依赖人工绘制的训练掩码。

更精简、更智能的皮肤病网络
在病灶被分离后,DermNet 接管分类任务。该分类器融合了两种流行的 AI 思想:擅长捕捉边缘和纹理的卷积神经网络(CNN),以及擅长捕捉图像中长程模式的视觉变换器(ViT)。DermNet 首先只使用两层轻量级 CNN 从裁剪出的病灶中提取细节,然后将这些特征传入变换器,学习病灶不同部分之间的相互关系。由于系统不再需要解析整张身体照片,它可以保持小巧——约 250 万个参数,低于 10 兆字节——但性能仍优于许多更大、被广泛使用的图像模型。
幕后构建更公平的数据集
为了训练和测试 DermNet,团队将两个由皮肤科医生注释的集合合并,构成他们称为 SkinCon 的数据集。在对每种疾病至少要求 20 张图像后,他们获得了 3,643 张图像,涵盖 122 种病症,大致三分之一来自浅色、褐色和深色皮肤各自的样本。通过简单的变换(如旋转和亮度变化)进一步扩展此集合,以减少过拟合并提高鲁棒性。使用这一多样且精心策划的数据集,他们发现以完整、未分割图像训练会导致学习不稳定且验证准确率约为 50–56%。当改用仅包含病灶的输入时,性能大幅提升:DermNet 达到约 81% 的验证准确率,并且在三种肤色组间更为一致。
从实验室流程到手机助手
为展示实际应用潜力,研究人员构建了一个原型移动应用。用户拍摄或上传一张可疑皮肤区域的照片;系统自动分割病灶、通过 DermNet 进行识别,并在 20 秒内返回三个最可能的诊断及其概率——最终判断仍交由皮肤科医生。虽然这不能替代医生,但此类工具可用于标记早期疾病,特别是在皮肤科医生稀缺的地区,并帮助将有限的专家资源优先分配给最紧急的病例。
这对普通患者意味着什么
对非专业读者的主要结论是,AI 不必以简单的“色盲”方式工作;相反,可以引导其关注正确的对象:病灶本身。通过消除背景皮肤色调的影响并聚焦于病变区域,该研究展示了构建既精简又准确的模型以更平等地处理浅色、褐色和深色皮肤图像是可行的。DermNet 是朝着为所有人可靠工作的皮肤病应用和诊断系统迈出的早期一步,而不仅仅是对已有多数医学照片所匹配人群有效的系统。
引用: Imran, M.H., Shahid, M., Aazam, M. et al. DermNet: integrative CNN-ViT architecture for bias mitigation in dermatological diagnostics using advanced unsupervised lesion segmentation. Sci Rep 16, 5291 (2026). https://doi.org/10.1038/s41598-026-35697-x
关键词: 皮肤病诊断, 医疗人工智能偏差, 病灶分割, 皮肤科影像, 视觉变换器