Clear Sky Science · zh
正常乳腺组织(NBT)分类器:推进正常乳腺组织学的分区分类
在“正常”乳腺组织中寻找早期线索
乳腺癌筛查通常聚焦于肿瘤或可疑肿块,但重要的预警信号可能在肿瘤形成之前就已潜伏。本研究提出了一个简单但影响深远的问题:能否用人工智能(AI)学会真正健康的乳腺组织长什么样,从而让最微小的早期变化更清晰地显现?通过教计算机识别正常乳腺组织的主要构成部分,研究者希望创建一个更稳健的参考图谱,以便发现通向癌症的最初征兆。

为什么正常乳腺组织很重要
大量乳腺癌研究侧重于病变组织,但癌症是发生在显微镜下看似正常的组织中的。在乳腺中,产乳结构及其周围的支持组织位于纤维区与脂肪区的混合体内。这些区域的细微变化,尤其是围绕小叶(产乳的小囊)及其邻近的间质(支持性结缔组织)处的改变,可能预示着癌症风险增加。这对于携带遗传性BRCA1或BRCA2突变的女性或接受风险减少手术的女性尤为相关。要读取这些微弱信号,科学家需要精确、定量的方法来描述不同女性和不同医疗中心中“正常”的样貌。
构建多样化的健康切片库
研究团队收集了来自英国、荷兰、瑞士的五家机构和一个公共组织库的70张高分辨率正常乳腺组织数字图像。这些样本来自年龄在16至74岁、背景各异的女性,包括健康志愿者、接受乳房缩小手术的女性、携带遗传高风险基因改变者以及对侧乳腺有癌症的女性。专家病理学家在每张切片上仔细标注了三种关键成分:上皮(管道和小叶的细胞层)、间质(纤维和结缔组织)和脂肪细胞(脂肪细胞)。这种劳动密集的注释生成了一个丰富多样的参考集,反映了真实世界中组织处理、染色和扫描的差异。
教计算机识别组织类型
利用该注释库,研究者训练了深度学习模型——称为NBT-分类器,使其通过查看从大切片中提取的小图像块来识别三种组织类型。他们测试了不同的图像块尺寸和技术设置,例如如何标准化染色颜色以及选择哪种神经网络结构,最终找到了最佳组合。在来自其他中心的完全独立的正常切片集合上评估时,模型能够以接近完美的准确率区分上皮、间质和脂肪。可视化“热图”显示,AI关注的部位与生物学上有意义的结构一致,例如细胞丰富区、胶原纤维和脂肪细胞边界,类似人类病理学家解读组织的方式。
是什么让正常组织看起来正常
为了了解仅基于健康组织训练是否有优势,作者将他们的模型与一个在正常、癌前和癌变样本混合上训练的现有工具进行了比较。两者都能识别广义的组织类型,但新的NBT-分类器更擅长捕捉真正正常乳腺上皮的细致结构。当在包含早期病变和肿瘤的图像块上进行挑战时,单纯以正常样本训练的模型更可靠地区分健康外观区域与异常区域。这表明它学到的是更锋利的正常定义,可能有助于突出伴随早期疾病出现的细微偏离。

从整张切片到目标区域
由于这些模型在图像块级别工作,它们可以应用于整张数字切片,自动为每个微小区域标注为上皮、间质或脂肪。研究者构建了一个端到端流程,首先检测切片上组织所在位置,然后运行NBT-分类器以创建详尽的组织区室图谱。基于这些图谱,系统可以定位单个小叶及其直接周围区域,生成用于进一步测量的掩膜,并将选定区域输入更高级的分析工具。这使得研究特定微环境(例如小叶外侧的间质)更容易——这些区域可能出现早期与癌症相关的变化——并在未来将结构特征与空间基因或蛋白质图谱等其他数据类型结合。
这对未来乳腺癌预防意味着什么
简而言之,本研究表明可以训练AI以极高的精度识别健康乳腺组织的构成要素,且其结果便于病理学家解读。通过将庞大复杂的数字切片转化为上皮、纤维和脂肪区域的结构化图谱,NBT-分类器为跨越众多女性和医院的“正常”提供了可靠的基线。这一更清晰的正常图景可能使检测癌症发展早期微弱痕迹变得更容易,从而支持未来用于识别高风险女性并在可见肿瘤出现之前指导预防策略的工具。
引用: Chen, S., Parreno-Centeno, M., Booker, G. et al. Normal breast tissue (NBT)-classifiers: advancing compartment classification in normal breast histology. npj Breast Cancer 12, 41 (2026). https://doi.org/10.1038/s41523-026-00896-2
关键词: 正常乳腺组织, 计算病理学, 深度学习, 早期癌症检测, 数字组织学