Clear Sky Science · fr

Apprentissage contrastif amélioré par KAN : l’accélérateur d’identification des structures cristallines à partir des motifs de DRX

· Retour à l’index

Pourquoi une cartographie cristalline plus rapide est importante

Les nouveaux matériaux pour les batteries, l’électronique et les énergies propres sont souvent découverts un cristal à la fois. L’agencement atomique interne de chaque cristal détermine son comportement, et les scientifiques lisent généralement cet agencement à partir des motifs de diffraction des poudres par rayons X (DRX) : des courbes en pic produites lorsque les rayons X diffusent sur un échantillon. Aujourd’hui, transformer ces motifs en une structure concrète est un travail lent, exigeant l’expertise humaine. Cet article présente un système d’apprentissage automatique capable d’apparier rapidement un motif de DRX aux structures cristallines probables, rendant ce travail de détection plus rapide, plus fiable et plus facile à intégrer aux laboratoires automatisés.

Des motifs en pics aux plans atomiques

Dans la pratique conventionnelle, un spécialiste DRX inspecte les pics d’un motif, utilise des formules physiques pour déduire les espacements atomiques possibles, puis compare itérativement des structures candidates aux données. Ce processus peine lorsque les pics se chevauchent ou lorsqu’il existe de nombreuses possibilités similaires, et il ne s’adapte pas bien aux expériences à haut débit modernes pouvant produire des milliers de motifs par jour. Les outils d’apprentissage automatique antérieurs ont majoritairement traité la DRX comme un problème d’étiquetage — prédire une classe de symétrie ou un groupe d’espace à partir d’un motif — plutôt que d’identifier directement la structure elle‑même. La nouvelle approche, appelée XRD‑Crystal Contrastive Pretraining (XCCP), reformule la tâche en recherche par similarité : donné un motif, trouver le cristal le plus compatible dans une grande base de données.

Figure 1
Figure 1.

Une vision à deux regards des motifs de rayons X

XCCP apprend à « voir » les données DRX de façon informée physiquement. Au lieu d’alimenter le motif entier dans un unique réseau neuronal, la méthode le divise en deux plages angulaires. Une branche se concentre sur les petits angles, qui rendent compte de caractéristiques à grande distance comme les empilements de couches et les superréseaux. L’autre se focalise sur les grands angles, où les pics sont denses et fortement contrôlés par la symétrie cristalline. Chaque branche est traitée par un réseau profond puis combinée par un module de projection spécial basé sur les réseaux de Kolmogorov–Arnold (KAN). Ce module excelle à focaliser l’attention sur des régions étroites du motif — précisément là où les pics de diffraction nets portent le plus d’information structurale.

Laisser les motifs et les structures se rencontrer au milieu

Côté cristal, XCCP utilise un réseau basé sur des graphes qui représente les atomes comme des nœuds et leurs liaisons comme des connexions. Pendant l’entraînement, le système voit de nombreuses paires appariées : un motif DRX et sa structure cristalline connue. Il apprend un espace numérique partagé où chaque motif se situe proche de sa structure correspondante et éloigné des mauvaises correspondances. Lorsqu’un nouveau motif arrive, le modèle l’encode dans cet espace, le compare aux représentations de toutes les structures de la base de données et renvoie une liste classée. Sans aucune information sur les éléments chimiques présents, la structure correcte arrive en première position près de la moitié du temps et apparaît parmi les cinq premières dans la grande majorité des cas. Lorsque l’utilisateur fournit également la composition chimique — information couramment disponible dans les expériences réelles — le meilleur résultat (top‑1) est correct presque 90 % du temps.

Figure 2
Figure 2.

Voir ce que la machine voit

Les auteurs examinent si leur système s’appuie sur une vraie physique ou sur des accidents des données. En masquant des parties du motif et en utilisant des outils d’attribution, ils montrent que la tête KAN fonde principalement ses décisions sur des pics de diffraction forts et bien définis plutôt que sur des variations de fond larges ou du bruit. La branche ajoutée des faibles angles améliore systématiquement les performances, en particulier pour les cristaux de faible symétrie et les motifs où les caractéristiques aux grands angles sont ambiguës. Le modèle se montre également robuste aux imperfections expérimentales courantes telles que l’élargissement des pics et de petits décalages le long de l’axe d’angle, et il se transfère de manière raisonnable aux jeux de données expérimentaux réels. Fait important, les scores de similarité qu’il produit servent aussi de mesures de confiance, chutant nettement lorsque la véritable structure est absente de la base de données — une propriété essentielle pour une utilisation sûre en conditions réelles.

Vers une découverte de matériaux plus intelligente et autonome

Pour un non‑spécialiste, le message principal est que XCCP transforme l’analyse DRX d’un artisanat en une recherche rapide, guidée par les données. En alignant motifs de diffraction et cristaux candidats dans un espace partagé, et en utilisant une conception de réseau informée par la physique, le système peut proposer rapidement une courte liste de plans atomiques réalistes avec une confiance interprétable. Il ne remplace pas le jugement d’un expert ni les raffinements détaillés, mais il accélère grandement la première et la plus difficile étape : déterminer quelles structures sont même plausibles. Cela le rend particulièrement adapté aux laboratoires à haut débit et autonomes, où des robots peuvent synthétiser de nouveaux composés, mesurer leurs motifs DRX et laisser XCCP suggérer des structures probables en temps réel, accélérant le chemin des données brutes vers de nouveaux matériaux.

Citation: Xu, C., Su, T., Xiong, J. et al. KAN-enhanced contrastive learning: the accelerator of crystal structure identification from XRD patterns. npj Comput Mater 12, 144 (2026). https://doi.org/10.1038/s41524-026-02015-y

Mots-clés: diffraction des poudres par rayons X, identification de la structure cristalline, apprentissage contrastif, informatique des matériaux, réseaux de Kolmogorov–Arnold