Clear Sky Science · zh
通过SCTFD框架在高方差不平衡皮肤镜图像上实现准确的皮损分类
更智能的皮肤检查为何重要
皮肤癌是最常见的癌症之一,但若能及早发现,治愈率也很高。皮肤科医生越来越依赖用手持放大镜(皮肤镜)拍摄的痣和斑点特写照片来判断哪些可能危险。然而,即便对专家来说,解读这些图像也很困难;可能帮助他们的计算机系统常因某些癌种罕见且病变在不同患者间外观差异大而失灵。本研究提出了一种新的人工智能框架,称为SCTFD,旨在在正是这些困难情形下使基于计算机的皮损分类更准确、更可靠。

罕见且复杂的皮损带来的挑战
真实世界的皮肤图像集合远非平衡。常见且大多无害的痣在训练数据中出现成千上万次,而像黑色素瘤或罕见肿瘤之类的严重癌症仅出现几百次或更少。与此同时,同一种疾病的病变在大小、颜色和形状上可以有很大差异。标准的人工智能系统倾向于对常见模式过拟合,而忽视罕见模式,这在医学领域十分危险:漏诊一个无害的痣比漏诊一例黑色素瘤要好。传统策略比如简单复制稀有图像、将它们混合,或使用复杂的生成模型,在真实感、稳定性或计算成本上都有局限。SCTFD 专为处理这种不平衡和变异性而构建,同时保持足够的效率以便实用部署。
制造更好的训练样本
SCTFD 的第一个构件是名为 CN-SMOTE 的数据生成器。与其仅在像素间插值或训练容易脆弱的生成对抗网络,CN-SMOTE 使用编码器—解码器对:一个网络将皮肤镜图像压缩为紧凑的内部编码,另一个再将其重建回图像。一旦学得了这个紧致空间,该方法在稀有类别病变中寻找近邻并在它们的编码之间插值,然后将混合编码解码回新的图像。一个特殊的训练惩罚项使相同类型病变的内部编码彼此靠近,从而保证合成图像在现实性和疾病特征上保持忠实。结果是得到一个更大、更平衡的皮肤镜图像集合,其中稀有但重要的病变类型得到更好代表。
兼顾细节与整体视野
第二个组件 MARD-Net 致力于将每张图像转化为丰富的鉴别特征。卷积层像可调节的放大镜,捕捉边界和纹理等精细模式。在此之上,注意力模块教会网络集中在病变实际所在的小区域,弱化可能干扰模型的周围健康皮肤。最后,基于 Transformer 的阶段跨越整张图像以捕捉病变不同远端部分之间的关系,例如不同颜色和结构的排列方式。为避免 Transforme rs 通常带来的高计算开销,作者引入了滑动窗口策略,使模型在只对选定区域做集中注意力计算的同时,仍能获得病变的广阔视野,从而更快且更省内存。

引导模型公平对待每个类别
SCTFD 的第三个支柱是新的训练目标 FDLoss,用以在学习过程中指导 AI 如何调整自身。FDLoss 并非对每张图像一视同仁,而是强调困难和稀有的样本,防止模型仅靠在大量且容易的样本上表现良好而“偷懒”。它融合了两种流行评分规则的思想:一种奖励敏感性与精确度之间的良好平衡,另一种则对网络已能正确分类的简单样本给予较低权重。在此基础上,FDLoss 增加了一项鼓励同一疾病的图像在模型内部空间中形成紧密簇,同时将不同疾病推得更远的项。这一组合直接对抗了类别不平衡和每类内部通常会干扰分类器的大变异。
新方法的性能如何
作者在两个广泛使用的国际皮肤影像基准集 ISIC 2018 与 ISIC 2019 上测试了 SCTFD,这两个数据集分别包含数万张真实临床皮肤镜图像,覆盖七类与八类病变,并严重偏向常见痣。与几种最先进方法相比,SCTFD 达到了更高的准确率以及在捕捉真阳性与避免误报之间更好的平衡。它将 ISIC 2018 的总体准确率提升到约 93%,ISIC 2019 提升到约 91%,并将 F1 分数——衡量漏诊与误分之间平衡的指标——提升至超过所有竞品。可视化结果显示,其注意力模块确实集中在病变区域,且不同疾病的特征在训练后变得更清晰分离。
这对患者与医生意味着什么
对患者而言,SCTFD 的前景是当皮肤出现可疑斑点时提供更可靠的第二意见。通过合成罕见癌症的真实样本、集中于每张图像中最具信息量的部分并使用迫使疾病类型清晰分离的损失函数,该框架降低了自动系统因病变罕见或非典型而忽视危险病变的风险。尽管它不能取代皮肤科医生的判断,但这种方法可能降低临床与远程医疗平台上实现早期准确诊断的门槛,从而更早、更稳定地发现危及生命的皮肤癌。
引用: Li, X., Ouyang, J., Chen, Y. et al. Accurate skin lesion classification on imbalanced dermoscopic images with high variance via the SCTFD framework. Sci Rep 16, 12302 (2026). https://doi.org/10.1038/s41598-026-37846-8
关键词: 皮肤癌检测, 皮肤镜人工智能, 医学图像分类, 不平衡数据集, 皮肤科中的深度学习