Clear Sky Science · pt

Uma descrição baseada em ontologia das medições de nano tomografia computadorizada em cadernos de laboratório eletrônicos

· Voltar ao índice

Por que registrar experimentos é importante

Experimentos modernos em grandes instalações de raios X podem capturar a estrutura interna dos materiais com detalhes impressionantes, até a escala de bilionésimos de metro. Mas essas medições só permanecem úteis se os cientistas conseguirem lembrar com precisão como foram feitas: quais configurações foram usadas, qual amostra foi testada e em que condições. Este artigo descreve uma nova maneira de capturar essa informação de contexto — os metadados — para que experimentos complexos de raios X em nanoescala não apenas sejam registrados, mas também possam ser encontrados, compreendidos e reutilizados com confiança anos depois, por pessoas e por máquinas.

Grandes máquinas de raios X e dados ainda maiores

A nano tomografia computadorizada baseada em radiação síncrotron (SRnCT) é um tipo de imagem tridimensional por raios X que revela a fina estrutura interna de materiais e amostras biológicas. Essas medições geram volumes enormes de imagens brutas, mas igualmente importante é a história ao redor delas: como a linha de feixe foi configurada, qual detector foi usado, a temperatura e o fluxo de líquidos em torno da amostra e quem realizou o trabalho. Em linhas de feixe de síncrotron, essa configuração muda a cada poucos dias conforme chegam novas equipes visitantes com necessidades diferentes. Sem documentação cuidadosa e consistente, torna‑se quase impossível comparar experimentos, repeti‑los ou usar os dados em modelos computacionais e aprendizado de máquina.

Figure 1
Figure 1.

De formulários simples a registros inteligentes e estruturados

Os autores enfrentam esse desafio começando por algo que os cientistas já compreendem: uma lista estruturada do que deve ser anotado. Trabalharam com a equipe da linha de feixe para projetar uma "árvore" de metadados detalhada para varreduras de nano tomografia. Ela divide cada medição em blocos intuitivos, como informações sobre o experimento como um todo, as pessoas envolvidas, a amostra, as condições de medição, a configuração do instrumento e os dados resultantes. Essa estrutura é semelhante ao que poderia ser mantido em uma planilha bem organizada ou em um caderno de papel, mas é precisa o suficiente para que um computador interprete cada campo de forma consistente.

Ensinando ao caderno o que as palavras significam

Para ir além de formulários simples, a equipe vinculou essa lista a uma "ontologia" formal — um dicionário compartilhado que diz a um computador o que cada termo significa e como as diferentes peças de informação se relacionam. Eles se basearam em vocabulários comunitários já existentes na ciência dos materiais para que seu trabalho se conectasse de forma fluida a outros bancos de dados. Usando o caderno eletrônico semântico Herbie, transformaram a ontologia em formulários web que os cientistas veem no navegador. O Herbie aplica automaticamente quais campos são obrigatórios, como números e unidades devem ser inseridos e como entradas, como configurações da linha de feixe ou ambientes da amostra, são reutilizadas em várias varreduras. Nos bastidores, cada clique e valor é armazenado como um nó em um grafo de conhecimento, uma estrutura de dados em rede ideal para informação rica e interconectada.

Colocando o sistema à prova

Os pesquisadores avaliaram essa abordagem durante um experimento in situ exigente em que fios de magnésio, destinados ao uso como implantes biodegradáveis, foram imageados enquanto corroíam lentamente em um fluido semelhante ao soro corporal. Conforme o experimento avançava, os cientistas usaram o Herbie para registrar identificadores de tempo de feixe, detalhes da amostra, informações precisas sobre temperatura, taxa de fluxo e óptica de raios X, e onde os dados brutos e processados foram armazenados. Como elementos comuns, como a configuração da linha de feixe, mudavam pouco entre as varreduras, eles precisaram ser inseridos apenas uma vez e depois reutilizados, reduzindo o tempo de documentação por varredura para apenas alguns minutos. O grafo de conhecimento resultante permitiu à equipe fazer perguntas direcionadas — por exemplo, “quais foram a energia, a taxa de fluxo e a temperatura do sistema para cada varredura?” — e obter respostas imediatas usando ferramentas de consulta padrão, sem buscar manualmente nas anotações.

Figure 2
Figure 2.

Tornando futuros experimentos mais fáceis de compartilhar e reutilizar

Ao combinar uma estrutura de metadados cuidadosamente projetada, um dicionário científico compartilhado e um caderno de laboratório eletrônico inteligente, este trabalho mostra como a informação sobre experimentos complexos de raios X em nanoescala pode se tornar verdadeiramente FAIR: encontrável, acessível, interoperável e reutilizável. A abordagem garante que cada conjunto de dados esteja inequivocamente ligado às suas condições experimentais, pessoas e instrumentos, e que essas informações possam ser trocadas com outros cadernos de laboratório ou catálogos de dados, ou convertidas em arquivos XML padrão, se necessário. Em termos práticos, isso significa que pesquisadores futuros terão mais facilidade para repetir experimentos, comparar resultados entre linhas de feixe e alimentar modelos de simulação e aprendizado de máquina com dados de alta qualidade e bem descritos — transformando o tempo de feixe cuidadosamente registrado de hoje nas novas descobertas de amanhã.

Citação: Kirchner, F., Wieland, D., Irvine, S. et al. An ontology-based description of nano computed tomography measurements in electronic laboratory notebooks. Sci Data 13, 432 (2026). https://doi.org/10.1038/s41597-026-07052-2

Palavras-chave: cadernos de laboratório eletrônicos, nano tomografia por raios X, metadados científicos, grafos de conhecimento, dados FAIR