Clear Sky Science · zh

基于本体的电子实验记录中纳米计算断层扫描测量的描述

· 返回目录

为何记录实验细节至关重要

在大型 X 射线设施进行的现代实验能够以惊人的精度成像材料的内部结构,精确到十亿分之一米。但这些测量只有在科学家能准确回忆其执行方式时才有用:使用了哪些设置、测试了哪块样品、以及在何种条件下进行。本文介绍了一种捕捉这些相关信息——即元数据——的新方法,使得复杂的纳米尺度 X 射线实验不仅被记录下来,而且在数年后仍能被人类和机器可靠地查找、理解和重复利用。

大型 X 射线设备与更庞大的数据量

基于同步加速器辐射的纳米计算断层成像(SRnCT)是一种三维 X 射线成像技术,可揭示材料和生物样品的精细内部结构。这些测量会产生大量原始图像,但同样重要的是围绕这些图像的背景信息:光束线如何配置、使用了哪种探测器、样品周围的温度和液体流动情况,以及是谁执行了这些工作。在同步加速器的光束线上,随着不同来访团队带着不同需求到来,这些设置每隔几天就会改变。如果没有谨慎且一致的文档记录,比较实验、重复实验或将数据用于计算模型与机器学习几乎变得不可能。

Figure 1
Figure 1.

从简单表单到智能结构化记录

作者通过从科学家已熟悉的事物入手来应对这一挑战:一个关于应记录何种内容的结构化清单。他们与光束线人员合作,设计了一个用于纳米断层扫描的详尽元数据“树”。它将每次测量划分为直观的模块,例如关于整个实验的信息、参与人员、样品、测量条件、仪器布局和所得数据。这一结构类似于精心组织的电子表格或纸质实验记录,但又足够精确,使计算机能够以一致的方式解释每个字段。

教会笔记本术语的含义

为了超越简单表单,团队将该清单与一个形式化的“本体”关联——一个共享的词典,告诉计算机每个术语的含义以及不同信息项之间的关系。他们基于材料科学现有的社区词汇来构建,使其工作能与其他数据库无缝对接。利用语义电子实验记录系统 Herbie,他们将本体转化为科学家在浏览器中看到的网页表单。Herbie 自动强制执行哪些字段为必填、数字与单位如何输入,以及诸如光束线设置或样品环境等条目如何在多次扫描间复用。在后台,每次点击和数值都被存储为知识图谱中的一个节点,这种类似网络的结构非常适合表示丰富且相互关联的信息。

对系统的现场检验

研究人员在一次要求严格的原位实验中评估了该方法,该实验对镁丝(拟用于可生物降解植入物)在类似体内血清的液体中缓慢腐蚀的过程进行了成像。随实验进展,科学家使用 Herbie 记录了光时段标识、样品细节、精确的温度、流速与 X 射线光学信息,以及原始与处理后数据的存放位置。由于光束线布局等常见元素在扫描间变化不大,它们只需输入一次并复用,从而将每次扫描的文档时间缩短到仅几分钟。生成的知识图谱使团队能够提出有针对性的问题——例如“每次扫描的能量、流速和系统温度是多少?”——并使用标准查询工具即时获得答案,无需人工翻查笔记。

Figure 2
Figure 2.

让未来的实验更易共享与再利用

通过将精心设计的元数据结构、共享的科学词典和智能电子实验记录结合起来,这项工作展示了复杂纳米尺度 X 射线实验的信息如何做到真正的 FAIR:可查找、可访问、可互操作且可重用。该方法确保每个数据集与其实验条件、相关人员和仪器之间建立明确无歧义的关联,并且这些信息可以与其他实验记录或数据目录交换,或在需要时转换为标准 XML 文件。就实际而言,这意味着未来的研究者将更容易重复实验、跨光束线比较结果,并将高质量、描述完善的数据输入到模拟与机器学习模型中——把今天详尽记录的光时段转化为明天的新发现。

引用: Kirchner, F., Wieland, D., Irvine, S. et al. An ontology-based description of nano computed tomography measurements in electronic laboratory notebooks. Sci Data 13, 432 (2026). https://doi.org/10.1038/s41597-026-07052-2

关键词: 电子实验记录, 纳米 X 射线断层扫描, 科学元数据, 知识图谱, FAIR 数据