Clear Sky Science · zh

组织检测对前列腺数字病理诊断人工智能算法的影响

· 返回目录

为何癌症AI的第一步至关重要

随着医院越来越多地使用人工智能辅助读取前列腺活检,往往有一个低调但关键的步骤被忽视:在数字切片上找到组织的位置。如果这第一步失败、遗漏了重要组织片段,即便是最聪明的癌症检测AI也可能被误导。本研究探讨了这一基础步骤对整体性能到底有多大影响,以及现代人工智能在最初发现组织方面是否能比旧有的基于规则方法更安全可靠。

从玻片到数字图像

在数字病理学中,前列腺组织薄片被扫描成高分辨率图像。在任何癌症分级算法开始工作之前,系统必须将组织与空白背景区分开。传统做法是基于颜色和亮度的简单规则,例如设定阈值来决定哪些像素可能是组织。更新的系统则训练人工智能模型识别组织的形状和模式,类似于它们在更复杂任务中的应用。问题在于,这种对“流水线管道”升级是否能在真实世界的癌症分级中带来改进,还是主要减少那些罕见但严重的失败情况。

Figure 1. 前列腺活检切片从扫描、经过组织检测到基于人工智能的癌症分级结果的流程。
Figure 1. 前列腺活检切片从扫描、经过组织检测到基于人工智能的癌症分级结果的流程。

构建并测试两种检测方法

研究人员聚焦于前列腺癌分级,活检被赋予Gleason评分和ISUP分级以指导治疗决策。他们将长期使用的基于规则的组织检测器与基于UNet++图像分割网络构建的新型AI模型进行比较。为训练和评估组织检测器,研究者使用了来自多家医院和多种扫描仪类型的超过33,000张扫描切片,将自动生成的组织轮廓与少量由专家费时检查并修订的标注结合起来。对于下游的癌症分级,他们应用了一种在超过55,000张切片上训练的先进AI,并在13个临床站点、使用13种不同扫描仪进行测试,模拟真实临床实践中的多样性和不确定性。

各方法识别组织的能力如何

单纯从像素级准确性来看,两种方法在平均表现上都很不错。基于AI的检测器总体上捕获了略多的真实组织,而经典方法在避免背景误识方面稍占优势。关键差异出现在少数外观异常的极端切片上。在这些困难病例中,基于规则的方法有时会完全漏掉大块组织,而AI检测器通常能保留更多组织。在超过27,000张评估切片中,完全未检出任何组织的崩溃性失败数量从经典方法的118例降至AI检测器的24例,这表明AI在减少灾难性遗漏方面可能具有安全优势。

更好的组织检测是否改善了癌症分级?

研究团队进一步询问,这些组织图差异是否实际改变了下游AI给出的最终癌症分级。为公平起见,他们仅分析了两种组织检测方法都至少检测到部分组织的切片,并比较AI预测分级与病理学家赋分的一致性。在这大批切片上,无论系统使用基于规则还是基于AI的组织检测,整体分级性能都非常相近,且在所有临床队列中置信区间重叠。换言之,对于典型切片而言,即便使用较旧、较简单的检测器,这一步骤并未明显限制强大现代分级模型的准确性。

Figure 2. 活检切片上更完整的组织检测与遗漏组织时相比,如何改变人工智能对癌症分级的估计。
Figure 2. 活检切片上更完整的组织检测与遗漏组织时相比,如何改变人工智能对癌症分级的估计。

何时第一步会改变结果

尽管平均结果相似,组织检测器的选择确实在少量但重要的病例中改变了预测的癌症分级。在带有整张切片参考分级的恶性切片中,有3.5%因所用的组织检测器不同而产生不同的ISUP分级预测。在这些不同案例中,大致有同等数量是AI检测器在经典方法失败时得出正确分级,反之亦然。可视化示例说明了原因:若某检测器遗漏了包含肿瘤的大块组织,或将碎屑误识为组织,分级AI可能被推向更低或更高的风险类别。这些“边缘情况”突显了哪些图像补丁进入分级模型这一细微差别如何改变最终决策。

这对未来的癌症AI意味着什么

目前,该研究表明在高质量、多中心的前列腺活检数据集中,所用的具体组织检测方法并不会强烈改变先进AI分级的平均准确性。然而,AI组织检测明显降低了完全失败的发生率,并且在一小部分恶性病例中会影响结果——这些情况下遗漏组织可能最具危害性。作者建议应将组织检测视为诊断AI系统的一个完整且可审计的组成部分,为病理学家提供清晰的可视化,并在下游AI变得更精确时继续研究稳健且高效的模型。

引用: Boman, S.E., Mulliqi, N., Blilie, A. et al. The impact of tissue detection on diagnostic artificial intelligence algorithms in prostate digital pathology. Sci Rep 16, 14968 (2026). https://doi.org/10.1038/s41598-026-52148-9

关键词: 数字病理学, 前列腺癌, 组织检测, Gleason分级, 诊断人工智能