Clear Sky Science · zh
在大规模食管癌筛查中,预训练大型视觉-语言模型用于食管白斑初步诊断的应用
为何这些喉部斑点重要
在常规的胃肠和咽喉检查中,医生常会在食管内看到小的白色斑块。大多数无害,但有些可能是可治愈的早期癌症——若能及时发现,治愈率很高。在繁忙的筛查项目中,将这些外观相似的斑点区分开来困难重重,即使对专家也是如此。本研究探索一种先进的人工智能(AI)系统能否帮助医生快速将危险斑块与良性斑块区分开来,并用通俗语言描述其所见。

常见的白斑但风险差异很大
食管内的白斑出人意料地常见:在这项大型筛查中,超过五分之一的患者出现了白斑。然而这些斑块可能由截然不同的病因引起。一些是早期食管癌,表现为轻微隆起、表面粗糙且无法擦除的白色区域;另一些由真菌感染引起,形成柔软的白色覆膜,可能剥落后露出原始组织;还有一些是称为乳头状瘤的微小良性赘生物,或被称为糖原性棘皮病的扁平颗粒状斑块,这两者通常无害,可做简易随访。由于治疗选择从紧急活检到观察随访不等,首次视觉判断的准确性至关重要。
将内镜图像转化为智能指引
研究人员在一种强大的视觉-语言模型BLIP之上构建了计算机辅助诊断系统,该模型最初在大量图像与文本集上训练。他们向系统输入了来自2000多名患者的13,922张内镜图像,涵盖白斑的四种主要病因,并使用了常规白光视图与一种称为窄谱成像的特殊对比模式。与只给出疾病标签的早期工具不同,该系统同时完成两项任务:预测图像中属于哪四种情况之一,并生成一段简短的文字描述,说明它“看到”的斑块位置与外观等信息。
在有限医学数据上教会 AI 更多
与日常照片档案相比,医学图像集规模较小,这会限制AI的表现。为应对这一问题,团队在BLIP模型中加入了特殊的“正激励噪声”模块。简单来说,这些模块基于数据为每张图像及模型的内部特征图创造温和的变体,促使系统学习更稳健的模式,同时避免被随机变化淹没。随后对模型进行了微调,使其对图像的理解与经验丰富的内镜医师提供的专家诊断和文字描述更紧密地对齐。

超越对手模型与人类专家
在测试中,这套新系统在所有四类疾病的关键性能指标上均优于若干领先的仅图像AI模型,且在两种内镜模式下表现一致。它在生成诊断关键词的任务上也胜过一款名为LLaVA‑Med的专用医学视觉-语言模型。在与四位内镜医师(两位资深、两位初级)进行的直接“阅片竞赛”中,AI在图像分类的总体准确率上更高。最显著的是,它在发现早期食管癌方面优于所有医生,尤其在召回率上表现突出,即在保持良好精确度的同时漏诊更少的癌症病例。
这对未来体检可能意味着什么
研究表明,经过精心适配的视觉-语言AI有望成为大规模筛查项目中的有价值助手。此类系统可以实时标记可疑白斑,减少早期癌症的漏检,并通过在病变看起来安全良性时给出支持性判断,避免许多患者接受不必要的活检。该工作仍需在内镜视频、更罕见类型的白斑以及多家医院中进一步验证,但它指向了这样一个未来:AI不仅能在医学影像中发现异常,还能用有助于更快、更一致临床决策的语言解释其判断。
引用: Li, Y., Li, X., Zhang, D. et al. The application of pre-trained large visual-language models for preliminary diagnosis of esophageal whitish plaques in large-scale esophageal cancer screening. npj Precis. Onc. 10, 94 (2026). https://doi.org/10.1038/s41698-026-01301-8
关键词: 食管癌筛查, 内镜人工智能, 视觉-语言模型, 计算机辅助诊断, 食管白色斑块