Clear Sky Science · zh

建立基于人工智能工作流的皮肤病理学百科 DermpathNet

2026-02-06 · 返回目录

为什么需要新的皮肤图像库

皮肤癌及其他皮肤肿物通常通过在显微镜下检查薄片组织来诊断，这一领域称为皮肤病理学。然而，用于培训医生和评估人工智能（AI）工具的图像往往被付费墙或隐私规则所限制。本文介绍了 DermpathNet——一个免费、经过严格审核的数千张皮肤活检图像集合，借助 AI 协助构建。其目的是让全球的临床医生和研究人员更容易、更可靠地学习、校对诊断并开发新的计算工具。

受限教学切片的问题

大多数医学学员从玻片或由单一医院控制的数字文件中学习。这些材料可能包含病人标识信息，或以不允许共享的方式授权。现有的在线资源要么需要付费订阅，要么只提供少量示例病例，或可能没有经过专家一致的审核。因此，学生和临床医生缺乏一个广泛、可信、开放的显微皮肤图像集合，既能展示常见也能涵盖罕见肿瘤。没有这样的资源，就难以进行病例比对、教学标准化或公平评估计算机视觉系统的真实表现。

从海量文章中寻找高质量图像

作者转向了 PubMed Central 的开放获取集合，这是一个可合法重用全文生物医学文章的海量图书馆。他们从一个结构化词表开始，包含 12 类良性和恶性皮肤肿瘤及近 200 个具体诊断，由专家意见和标准化医学词汇构建。利用该词表，他们在 PubMed Central 中检索标题或摘要中提到这些疾病的文章，下载全文并提取所有图形和图注。第一次筛查获得了来自超过 43,000 篇文章的 20 万多幅图像——数量远多于所需，而且大多数并非真正的皮肤显微图像。

AI 与关键词如何协同工作

为将有用图像从无关图像中分离，团队创建了一个混合过滤系统。一方面是一个在独立医学图像集合上训练的深度学习模型，用来判断某张图片是否看起来像病理切片；另一方面扫描图注以寻找诸如放大倍数或染色术语等通常伴随显微镜图像的提示性短语。对于非常常见的诊断，仅保留同时通过两项检测的图像以提高纯度；对于罕见诊断，则接受通过任一检测的图像以避免遗漏稀少示例。将该混合方法与 651 张人工标注图像的人类“金标准”比较时，其表现强劲，F 分数超过 90%，优于单独使用 AI 或关键词的方法。

DermpathNet 的内容与用途

处理后，该工作流生成了 7,772 张图片，覆盖 166 种不同的皮肤肿瘤诊断。每张图像均由委员会认证的皮肤病理学家审核，并且每张图像都链接到描述来源文章、疾病类型和标准化医学编码的丰富元数据。数据集按疾病类别、具体诊断或原始发表文献进行组织，同时追踪许可信息。除了用于教学外，作者还用 DermpathNet 来检验现代视觉—语言模型的极限：GPT‑4v。在对这些具有挑战性的图像进行判断（真假题、开放式问题和多项选择题格式）时，该模型表现不佳，经常无法识别正确诊断，即使提供了简短的选项列表也如此。

对医生与机器的意义

对非专科人员而言，DermpathNet 可被视为一个高质量、开放共享的皮肤显微肿瘤图谱，构建时采用了智能筛选系统，使人类专家能将精力集中在最终审核而非人工翻阅上。它降低了跨机构培训和比对的门槛，并揭示了该视觉任务的难度：即使是最先进的 AI 系统在这些图像上也举步维艰。作者得出结论：虽然 AI 能协助组建此类资源，但当今的通用模型尚不足以替代皮肤病理学专家的判断。相反，DermpathNet 为教学和构建下一代专用医学 AI 工具提供了坚实基础，帮助真正辅助皮肤疾病诊断。

引用: Xu, Z., Lin, M., Zhou, Y. et al. Establishing dermatopathology encyclopedia DermpathNet with Artificial Intelligence-Based Workflow. Sci Data 13, 368 (2026). https://doi.org/10.1038/s41597-026-06715-4

关键词: 皮肤病理学, 医学图像数据集, 人工智能, 皮肤癌, 数字病理学