Clear Sky Science · ru
Онтологическое описание измерений нанокомпьютерной томографии в электронных лабораторных журналах
Почему важно отслеживать эксперименты
Современные эксперименты на крупных рентгеновских установках позволяют визуализировать внутреннюю структуру материалов с поразительной детализацией — до миллиардных долей метра. Но эти измерения остаются полезными только если учёные точно фиксируют, как они были проведены: какие настройки использовались, какой образец исследовали и в каких условиях. В статье описывается новый способ захвата этой сопроводительной информации — метаданных — чтобы сложные наномасштабные рентгеновские эксперименты не просто записывались, но и могли надёжно находиться, пониматься и повторно использоваться годами позже как людьми, так и машинами.
Большие рентгеновские приборы и ещё большие объёмы данных
Нанокомпьютерная томография на основе синхротронного излучения (SRnCT) — это вид трёхмерного рентгеновского сканирования, который раскрывает тонкую внутреннюю структуру материалов и биологических образцов. Эти измерения генерируют огромные объёмы исходных изображений, но не менее важна и сопроводительная история: как была настроена линия луча, какой детектор использовался, температура и поток жидкостей вокруг образца и кто выполнял работу. На синхротронных линиях конфигурация часто меняется каждые несколько дней, по мере приезда новых команд с разными требованиями. Без тщательной и согласованной документации становится практически невозможно сравнивать эксперименты, повторять их или использовать данные в компьютерных моделях и методах машинного обучения.

От простых форм к умным, структурированным записям
Авторы решают эту задачу, начав с того, что учёным уже понятно: структурированного контрольного списка того, что следует записать. Они работали с персоналом линий луча над созданием подробного метаданных «дерева» для сканирований нано-томографии. Оно делит каждое измерение на интуитивно понятные блоки, такие как информация об эксперименте в целом, задействованные люди, образец, условия измерения, устройство и полученные данные. Эта структура схожа с тем, что можно хранить в аккуратно организованной таблице или бумажном журнале, но при этом достаточно точна, чтобы компьютер мог однозначно интерпретировать каждое поле.
Обучение журнала значению слов
Чтобы перейти от простых форм к более продвинутому уровню, команда связала этот контрольный список с формальной «онтологией» — общей словарной базой, которая говорит компьютеру, что означает каждый термин и как разные элементы информации взаимосвязаны. Они опирались на существующие общественные словари из материаловедения, чтобы их работа органично интегрировалась с другими базами данных. С помощью семантического электронного лабораторного журнала Herbie они превратили онтологию в веб-формы, которые учёные видят в браузере. Herbie автоматически контролирует обязательные поля, формат ввода чисел и единиц измерения, а также повторное использование записей, таких как настройки линии луча или условия вокруг образца, в разных сканированиях. За кулисами каждый клик и значение сохраняются как узел в графе знаний — сетеподобной структуре данных, идеальной для богатой взаимосвязанной информации.
Испытание системы на практике
Исследователи оценили этот подход во время сложного in situ эксперимента, в котором магниевые проволоки, предназначенные для использования в биоразлагаемых имплантатах, сканировали по мере их медленной коррозии в жидкости, имитирующей серум организма. В процессе эксперимента учёные использовали Herbie для записи идентификаторов времени эксперимента, данных об образцах, точной информации о температуре, скорости потока и рентгеновской оптике, а также о местоположении исходных и обработанных данных. Поскольку общие элементы, такие как компоновка линии луча, мало менялись между сканированиями, их вводили один раз и переиспользовали, что сокращало время документации на одно сканирование до нескольких минут. Полученный граф знаний позволил команде задавать целевые вопросы — например, «какими были энергия, скорость потока и температура системы для каждого сканирования?» — и немедленно получать ответы с помощью стандартных инструментов запросов, без ручного просмотра заметок.

Упрощение обмена и повторного использования будущих экспериментов
Комбинируя продуманную структуру метаданных, общий научный словарь и интеллектуальный электронный лабораторный журнал, эта работа демонстрирует, как информация о сложных наномасштабных рентгеновских экспериментах может действительно соответствовать принципам FAIR: быть находимой, доступной, совместимой и повторно используемой. Подход гарантирует однозначную привязку каждого набора данных к условиям эксперимента, людям и приборам, а также возможность обмена этой информацией с другими журналами или каталогами данных, либо преобразования в стандартные XML-файлы при необходимости. На практике это означает, что будущие исследователи смогут легче повторять эксперименты, сравнивать результаты между линиями луча и использовать качественные, хорошо описанные данные в симуляциях и моделях машинного обучения — превращая тщательно задокументированное время эксперимента сегодня в новые открытия завтра.
Цитирование: Kirchner, F., Wieland, D., Irvine, S. et al. An ontology-based description of nano computed tomography measurements in electronic laboratory notebooks. Sci Data 13, 432 (2026). https://doi.org/10.1038/s41597-026-07052-2
Ключевые слова: электронные лабораторные журналы, нано рентгеновская томография, научные метаданные, графы знаний, данные FAIR