Clear Sky Science · zh

组织病理学中的染色归一化:使用多中心数据集的方法基准测试

· 返回目录

为医生和计算机提供更清晰的组织图像

病理学家在显微镜下观察组织样本时,依赖于细微的粉色和紫色色调来判断细胞是否健康或癌变。如今,不同医院实验室之间这些颜色变化很大,这不仅增加了人工诊断的难度,也会让基于这些图像训练的人工智能工具出错。本研究的目标是量化这种颜色问题的严重程度,并测试哪些计算方法在不丢失重要细节的情况下,能最好地使切片图像看起来更一致。

Figure 1
Figure 1.

实验室间颜色差异的原因

研究集中在病理学中最常用的一对染料——苏木精和伊红,其分别将细胞核染成蓝紫色、周围组织染成粉红色。实验室在固定、处理和染色组织的细微差别,以及扫描仪采集图像的方式,都会显著改变这些颜色。为了在受控条件下研究这一效应,作者从同一供体石蜡块切取了三种微小组织样本——皮肤、肾脏和结肠,并将相同的未染色切片寄往11个国家的66个实验室。每个实验室使用其常规染色流程,然后对制成的切片进行数字化。由于生物材料几乎相同,任何外观差异主要反映了各实验室的染色和成像方式。

构建用于颜色校正的独特测试平台

所得图像集合显示出显著的变化:来自同一组织块的切片颜色可从淡色到几乎发黑,或从冷色调漂移到非常暖的色调。团队首先通过测量每张切片的平均红色和蓝色水平来量化这些差异。然后他们为每种组织类型选择了一张色彩平衡良好的切片作为参考,并对其他所有图像应用了八种不同的染色归一化方法。四种方法是较老的、基于数学的方案,调整全局颜色统计或分离并重新缩放染色成分。另四种基于现代“生成式”人工智能,使用神经网络学习如何将图像从一种颜色风格转换为另一种。

Figure 2
Figure 2.

在颜色和结构方面哪些方法效果最好

为评判性能,作者提出了两个主要问题:校正后的图像在多大程度上匹配参考颜色,以及它们在多大程度上保留了精细组织结构?他们使用了若干数值评分来比较颜色分布、一个借用自计算机视觉的高级图像相似性度量,以及一个对模糊或失真敏感的结构指标。在皮肤、肾脏和结肠样本中,一种称为直方图匹配的简单方法——基本上将每张切片的颜色分布重塑为仿效参考分布——在保持结构大体完整的同时,始终产生最接近参考的颜色匹配。另一传统方法Reinhard归一化的表现通常也接近。第三种方法Vahadane在保留结构方面表现突出,但往往会将所有色调偏向粉色并抑制蓝色的核染色。

人类专家和人工智能工具眼中的图像

有经验的病理学家审阅了归一化后的结肠切片,以评估这些方法对真实世界可解释性的影响。他们检查重要层次和细胞类型是否仍然易于区分、过度或不足染色的原片是否得到改善,以及是否出现任何奇怪的数字伪影。没有一种方法能解决所有问题,但直方图匹配通常能产生均匀、接近参考的颜色且无明显伪影,尤其在严重过染的样本中效果明显。一些基于AI的方法,特别是某些版本的CycleGAN和Pix2pix,生成的结果观感真实,但偶尔会在血细胞和背景区域引入细微的伪结构或色彩故障。团队还展示了归一化如何改变一个先进的细胞检测算法计数细胞核的方式,以及大型“基础”模型如何表征切片,强调颜色校正会强烈影响后续AI行为。

对未来数字诊断的意义

总体而言,该研究表明实验室之间的颜色差异足以影响人类读片者和自动系统,使图像更统一成为实现可靠、可共享数字病理的关键一步。令人意外的是,在这个组织内容非常相似的严格控制数据集中,像直方图匹配这样的简单全局方法常常优于更复杂的深度学习技术——后者比每个实验室一张参考切片需要更多的训练数据。作者公开发布了他们的66中心数据集,以便他人对新方法进行基准测试并更好地设计反映真实世界变化的训练数据。对患者而言,这一领域的进展可能意味着AI系统能更好地在不同医院间迁移,无论活检在哪处理,都能提供更一致的诊断。

引用: Khan, U., Härkönen, J., Friman, M. et al. Staining normalization in histopathology: Method benchmarking using multicenter dataset. Sci Rep 16, 11097 (2026). https://doi.org/10.1038/s41598-026-40943-3

关键词: 数字病理, 染色归一化, 组织学成像, 医疗人工智能, 颜色差异