Clear Sky Science · zh

基于智能手机的注释口腔图像综合数据集以增强口腔疾病诊断

· 返回目录

为什么你的手机可能有助于发现口腔癌

我们大多数人随身携带着功能强大的相机,但很少用它来查找口腔内疾病的早期迹象。口腔癌及其预警病变常常在疾病进展较晚时才被发现,尤其是在缺乏专科医生的社区。本研究描述了 SMART‑OM,这是一个经过精心挑选的口腔内部照片集合,所有照片均由普通智能手机拍摄,并由牙科专家仔细标注。其目标是为研究人员提供构建人工智能工具所需的原始素材,使这些工具能够在危险变化致命之前及早标出可疑区域。

Figure 1
Figure 1.

口腔中的全球性问题

唇和口腔癌每年在全球造成近二十万人死亡,新发病例数达数十万,负担在低收入和中等收入国家尤其沉重。烟草、酒精和槟榔咀嚼是主要风险因素,男性和老年人受影响更大。早期诊断能显著提高存活率,但在许多地区难以接触到专科医生,常规口腔检查更多依赖于牙医的眼力和经验。因此,细微的斑点或粗糙区域可能被忽略,或不同临床医生对所见存在分歧。一种低成本、广泛可用的记录和复查口腔内情况的方法可能带来实质性改变。

将智能手机变成筛查工具

SMART‑OM 项目旨在在真实社区环境中仅使用两款常见智能手机(一部 Android 和一部 iPhone)采集高质量的口腔图像。印度南部的社区卫生工作者和牙医走访家庭和牙科义诊,招募愿意接受检查的成年人。每位参与者拍摄八个标准视角,覆盖舌面、颊部、唇部以及上下牙弓。拍摄时尽量使用自然光,将相机置于仅几厘米处,并用镜子或木棒等简单工具轻轻撑开脸颊和嘴唇。模糊或光线不足的照片会重复拍摄,所有数据采集遵循严格的伦理规范,面部保持在画面之外,个人信息完全匿名化。

从原始图片到丰富的标注数据

研究团队共收集了来自 331 名受试者的 2,469 张图像。每张图片被归入四类之一:完全健康的组织;与常态不同但无害的变异;可能恶变的病变(有发展为癌症风险);以及确诊的口腔癌。资深牙外科医生不仅给出简单标签,还使用开源标注工具在图像上描绘详细轮廓。有些版本仅标注主要兴趣区域,另一些则标出可见的所有结构,针对病变的版本会精确描绘可疑斑块和肿物。除了图像外,数据集中还包含电子表格,列出每个绘制区域的含义,以及描述每位受试者年龄、性别、吸烟或嚼食槟榔等习惯和临床发现的单独表格。这种影像与背景信息的结合旨在支持仅基于图像或多模态的人工智能系统。

Figure 2
Figure 2.

将人工智能模型付诸考验

为展示 SMART‑OM 的实用性,研究者们训练了若干常用的深度学习模型(这些模型最初用于通用图像识别)来完成两项任务:区分正常与异常图像,以及在四个诊断组之间进行分类。他们将数据集分为训练集和测试集,并对 ResNet、VGG、EfficientNet 及 Vision Transformer 等模型进行微调。尽管数据集以健康图像为主,真正的癌症和高风险病例相对较少,但表现最好的模型——一种相对紧凑的 ResNet 变体——在整体测试图像中正确分类率接近九成。该模型在识别健康口腔方面尤为可靠,对异常情况的识别也较为良好但稳定性不足,反映了类别不平衡和视觉差异微妙的现实问题。

这对日常护理意味着什么

对非专科人员来说,核心信息是 SMART‑OM 为将日常智能手机转变为早期口腔癌筛查辅助工具奠定了基础。通过公开提供这一大型、精心注释且完全匿名化的数据集,作者为全球研究人员提供了一个共享资源,用于训练和比较能够标出可疑区域、将影像线索与生活方式风险数据结合并帮助判断谁需要进一步由牙医或病理学家检查的 AI 工具。尽管当前样本中真正的癌症病例仍相对较少,但数据集忠实反映了社区中看到的情况,并会随着时间扩展。随着样本增多,SMART‑OM 有望支持更准确、可及且经济的口腔异常检测,通过更早诊断可能挽救生命。

引用: Madan Kumar, P.D., Ranganathan, K., Lavanya, C. et al. A Smartphone-based Comprehensive Dataset of Annotated Oral Cavity Images for Enhanced Oral Disease Diagnosis. Sci Data 13, 676 (2026). https://doi.org/10.1038/s41597-026-06954-5

关键词: 口腔癌, 智能手机成像, 医疗人工智能, 口腔病变, 筛查数据集