Clear Sky Science · zh

用于透射电子显微镜图像中铂纳米簇原子数分类的可解释深度学习

2026-02-27 · 返回目录

微小金属簇为何重要

铂是清洁能源技术中的骨干金属，从燃料电池到电解槽都有广泛应用，但它稀少且昂贵。在最微小的尺度下，向铂簇中添加或移去一个原子就可能显著改变其驱动化学反应的能力。为了充分利用每一个原子，科学家需要一种可靠的方法，能够直接从显微镜图像中数清每个纳米级簇中有多少原子。本文展示了一种经过精心设计的人工智能如何从电子显微镜图片中学会这一计数，并解释其关注的依据，为更智能、更高效的催化剂设计铺平道路。

用电子显微镜看原子

现代扫描透射电子显微镜（STEM）可以成像到单个原子，揭示金属纳米簇如何位于支撑表面。理论上，这应允许研究者直接读出每个簇中的原子数。实际上，这项工作要困难得多。图像中簇的亮度和形状不仅取决于其大小，还受其取向、电子束如何穿过以及仪器噪声和微妙对比变化的影响。传统分析方法依赖测量每个颗粒的表观直径并假设更大意味着更多原子。但对于含有几十到约七十个原子的铂簇，尺寸分布重叠严重，因此不同原子数的簇在仅凭直径判断时可能几乎相同，使该方法不可靠。

构建可信的图像库

为了解决这一问题，作者首先构建了一个异常干净且可信的数据集。他们使用专门的离子束系统制备了原子数可精确选择的铂簇束：19、30、41、55 或 70 个原子。这些“尺寸选定”的簇随后以极低能量轻柔地沉积到电子显微镜网格上，使其粘附而不发生破碎或重排。如此细致的制样产生了高保真度的STEM图像，其中每个簇的原子数在成像前已知。这样一个消除了许多常见歧义的数据集，为训练一个能够学习与原子数相关的微妙视觉线索（而不仅仅是粗略尺寸）的深度学习系统提供了理想的训练场。

教神经网络计数原子

团队设计了一个紧凑的卷积神经网络，这是一类在图像模式识别方面表现出色的深度学习模型。每个铂簇被裁切成一个小图像补丁并输入网络，网络学习将其归类到五个已知的原子数之一。对比了两种模型版本：一种使用原始STEM图像作为单通道输入，另一种增加了第二通道，该通道对相同图像施加局部对比度归一化滤波，强调边缘和局部变化。尽管簇的直径有重叠，两种模型在区分五种原子数方面都远胜于仅凭尺寸判断，且双通道版本在估计总体类别比例时取得了接近0.94的决定系数，意味着其预测几乎与独立的物理测量（各尺寸簇的沉积数量）相匹配。

让机器的推理可见

除了原始准确率外，作者还希望了解模型实际关注的内容。他们使用一种可视化方法，高亮出对每个决策贡献最大的图像区域，生成簇上的热图。这些热图表明，网络根据簇的大小在中心区和边缘区的关注方式存在差异，且原始通道与对比度归一化通道互为补充。对于较小的簇，原始图像主要通过亮中心指导决策，而滤波通道则将注意力扩展到外部轮廓。对于最大的簇，这一平衡发生了翻转。他们还将模型内部对每个颗粒的数字描述投影到二维中，显示出与不同原子数对应的、颜色编码的独立“岛状”簇。经过在不同显微镜条件下新图像上的短暂微调后，这些岛变得更清晰、分离度更高，反映出分类性能的恢复。

适应变化的成像条件

真实实验很少在完全稳定的条件下进行：背景纹理、噪声和对焦都可能在不同会话间漂移。作者展示了这些变化会使在一种条件下训练的模型产生混淆，导致其偏向错误的类别。为了解决这一问题而无需全面重训，他们引入了一步轻量级的适配。使用一小部分直径位于明显分离区间的簇——这些簇的可能原子数可以高度确定——来对模型在每组新图像上进行温和更新。该微调可在几秒内完成，将模型内部特征簇拉回对齐并恢复准确预测，即便在混合样品上（同一网格上存在多种簇尺寸）也能奏效。

对未来催化剂的意义

对非专业读者而言，关键结论是作者将原子分辨率的原始图像转化为一种可靠且可解释的工具，能够在单个铂簇中数清原子，即使在简单尺寸测量失灵时也可行。通过将精确的样品制备与可解释的深度学习相结合，他们展示了机器可以自动提取并可视化那些影响催化性能的结构细节。这一能力可以直接嵌入显微镜中，为实验提供实时反馈，并指导以更节约、更有效的方式使用珍贵铂金的催化剂设计。相同策略应可推广到其他金属和合金，帮助材料科学家以更数据驱动、更节约资源的方式将纳米结构与功能联系起来。

引用: Tsukamoto, K., Hirata, N., Tona, M. et al. Interpretable deep learning for atomicity classification of platinum nanoclusters in STEM images. npj Comput Mater 12, 143 (2026). https://doi.org/10.1038/s41524-026-02014-z

关键词: 铂纳米簇, 电子显微镜, 深度学习, 催化剂设计, 材料信息学