Clear Sky Science · fr

Une description basée sur une ontologie des mesures de nano-tomographie par ordinateur dans les cahiers de laboratoire électroniques

2026-03-19 · Retour à l’index

Pourquoi il est important de suivre les expériences

Les expériences modernes réalisées dans de grands instruments à rayons X peuvent imager la structure interne des matériaux avec un niveau de détail saisissant, jusque dans l’ordre du milliardième de mètre. Mais ces mesures ne restent utiles que si les scientifiques peuvent se souvenir avec précision de la manière dont elles ont été réalisées : quels réglages ont été utilisés, quel échantillon a été testé et dans quelles conditions. Cet article décrit une nouvelle façon de capturer ces informations contextuelles — les métadonnées — afin que les expériences X à l’échelle nano ne soient pas seulement consignées, mais puissent être retrouvées, comprises et réutilisées de manière fiable, des années plus tard, par des humains comme par des machines.

De gros instruments à rayons X et des données encore plus volumineuses

La nano tomographie par ordinateur basée sur la radiation synchrotron (SRnCT) est un type d’imagerie X tridimensionnelle qui révèle la fine structure interne des matériaux et des échantillons biologiques. Ces mesures produisent d’énormes volumes d’images brutes, mais l’histoire qui les entoure est tout aussi importante : comment la ligne de lumière était configurée, quel détecteur a été utilisé, la température et le débit des liquides autour de l’échantillon, et qui a réalisé l’expérience. Sur les lignes de lumière des synchrotrons, cette configuration change tous les quelques jours lorsque de nouvelles équipes visiteuses arrivent avec des besoins différents. Sans documentation rigoureuse et cohérente, il devient presque impossible de comparer des expériences, de les reproduire ou d’utiliser les données dans des modèles informatiques et l’apprentissage automatique.

Des formulaires simples à des enregistrements intelligents et structurés

Les auteurs abordent ce défi en partant de quelque chose que les scientifiques connaissent déjà : une checklist structurée de ce qui doit être noté. Ils ont travaillé avec le personnel des lignes de lumière pour concevoir un « arbre » de métadonnées détaillé pour les scans de nano-tomographie. Il divise chaque mesure en blocs intuitifs, tels que les informations sur l’expérience dans son ensemble, les personnes impliquées, l’échantillon, les conditions de mesure, l’agencement de l’instrument et les données résultantes. Cette structure est semblable à ce que l’on pourrait conserver dans un tableur soigneusement organisé ou un cahier papier, mais elle est suffisamment précise pour qu’un ordinateur puisse interpréter chaque champ de manière cohérente.

Apprendre au cahier ce que signifient les mots

Pour aller au-delà des formulaires simples, l’équipe a relié cette checklist à une « ontologie » formelle — un dictionnaire partagé qui indique à un ordinateur ce que signifie chaque terme et comment les différentes informations sont reliées entre elles. Ils se sont appuyés sur des vocabulaires communautaires existants en sciences des matériaux afin que leur travail s’intègre facilement à d’autres bases de données. En utilisant le cahier de laboratoire électronique sémantique Herbie, ils ont transformé l’ontologie en formulaires Web que les scientifiques consultent dans leur navigateur. Herbie applique automatiquement quels champs sont obligatoires, comment les nombres et unités doivent être saisis, et comment des entrées telles que les réglages de la ligne de lumière ou les environnements d’échantillon sont réutilisées pour plusieurs scans. En coulisses, chaque clic et chaque valeur sont stockés comme un nœud dans un graphe de connaissances, une structure de données en réseau idéale pour des informations riches et interconnectées.

Mettre le système à l’épreuve

Les chercheurs ont évalué cette approche lors d’une expérience in situ exigeante au cours de laquelle des fils de magnésium, destinés à être utilisés comme implants biodégradables, ont été imagés pendant qu’ils corrodèrent lentement dans un fluide similaire au sérum corporel. Au fil de l’expérience, les scientifiques ont utilisé Herbie pour enregistrer les identifiants de temps de faisceau, les détails des échantillons, des informations précises sur la température, le débit et l’optique des rayons X, ainsi que l’emplacement des données brutes et traitées. Parce que des éléments communs comme l’agencement de la ligne de lumière changeaient peu entre les scans, ils n’avaient à être saisis qu’une fois puis réutilisés, réduisant le temps de documentation par scan à quelques minutes seulement. Le graphe de connaissances résultant a permis à l’équipe de poser des questions ciblées — par exemple, « quelles étaient l’énergie, le débit et la température du système pour chaque scan ? » — et d’obtenir des réponses immédiates avec des outils de requête standard, sans rechercher manuellement dans les notes.

Faciliter le partage et la réutilisation des expériences futures

En combinant une structure de métadonnées soigneusement conçue, un dictionnaire scientifique partagé et un cahier de laboratoire électronique intelligent, ce travail montre comment l’information sur des expériences X à l’échelle nano peut devenir véritablement FAIR : trouvable, accessible, interopérable et réutilisable. L’approche garantit que chaque jeu de données est lié sans ambiguïté à ses conditions expérimentales, aux personnes et aux instruments, et que ces informations peuvent être échangées avec d’autres cahiers de laboratoire ou catalogues de données, ou converties en fichiers XML standard si nécessaire. Concrètement, cela signifie que les chercheurs futurs pourront mieux répéter les expériences, comparer les résultats entre lignes de lumière et alimenter des simulations et des modèles d’apprentissage automatique avec des données de haute qualité et bien décrites — transformant le temps de faisceau soigneusement consigné d’aujourd’hui en nouvelles découvertes de demain.

Citation: Kirchner, F., Wieland, D., Irvine, S. et al. An ontology-based description of nano computed tomography measurements in electronic laboratory notebooks. Sci Data 13, 432 (2026). https://doi.org/10.1038/s41597-026-07052-2

Mots-clés: cahiers de laboratoire électroniques, nano tomographie X, métadonnées scientifiques, graphes de connaissances, données FAIR