Clear Sky Science · tr
Bileşim tabanlı malzeme özellik tahminini çapraz modal bilgi aktarımıyla geliştirmek
Malzeme davranışını tahmin etmenin önemi
Yeni piller, güneş hücreleri veya daha dayanıklı alaşımlar tasarlamak genellikle hangi elementlerin karıştırılacağını listeleyen basit bir tarifle başlar. Bu tarifi bilinen mukavemet, iletkenlik veya kararlılığa sahip gerçek bir malzemeye dönüştürmek genellikle maliyetli kuantum hesaplamaları veya deneyler gerektirir. Bu çalışma, başta metin okumak için geliştirilmiş gelişmiş dil tabanlı yapay zekâ modellerinin birçok türde malzeme verisinden öğrenebileceğini ve ardından sadece bir kimyasal formülden önemli özellikleri doğrudan tahmin ederek olası bileşiklerin geniş uzaylarını keşfetmek için gereken zaman ve maliyeti azaltabileceğini gösteriyor.

Tariflerden tahminlere
Malzeme bilimi alanındaki geleneksel makine öğrenmesi araçları iki gruba ayrılıyor. Bir aile, atomların üç boyutta nasıl düzenlendiğini tanımlayan ayrıntılı kristal yapıları gerektirir ve özellikleri yüksek doğrulukla tahmin edebilir ancak yüksek hesaplama maliyetiyle. Diğer grup ise yalnızca her elementten kaç atom bulunduğu gibi genel kimyasal formüle bakar; bu daha ucuzdur ama genellikle daha az doğrudur. Yazarların hedefi bu uçurumı kapatmak: yalnızca formülü gören ancak yapı bilgisine dayanan yöntemler kadar iyi performans gösteren modeller istiyorlar; böylece hiç üretilmemiş veya yapısal olarak modellenmemiş bileşenlerin hızlı taraması mümkün olur.
Yapay zekâyı malzemelerin dilini konuşacak şekilde eğitmek
Ekip, bir formülü cümledeki kelimeler gibi token dizisi olarak ele alan kimyasal dil modelleri üzerine inşa ediyor. Önce bu modeller formüllerin eksik parçalarını doldurmayı öğreniyor; bu eğitim görevi, hangi elementlerin hangi oranlarda birleştiğine dair düzenlilikleri yakalamalarına yardımcı oluyor. Yazarlar bu öğrenmeyi termodinamik olarak kararlı malzemelere doğru daha fazla ağırlık verecek şekilde de yönlendiriyor, böylece model gerçekçi bileşimlere daha fazla dikkat ediyor. Ardından kritik bir dokunuş getiriyorlar: modelleri yalnızca geleneksel dil modellerinin yaptığı gibi metinden öğrenmek yerine, kristal yapılar, elektronik davranış ve yük dağılımları dahil olmak üzere birden çok kaynaktan zaten öğrenmiş olan ayrı bir multimodal temel model ile hizalıyorlar. Fiilen, dil modeli sadece formüllerle çalışmaya devam ederken zengin yapısal bilgiyi miras alıyor.

Bilgi paylaşımı için iki yol
Araştırmacılar örtük ve açık olmak üzere tamamlayıcı iki strateji araştırıyorlar; bunlara çapraz modal bilgi aktarımı diyorlar. Örtük versiyonda, formüle dayalı dil modeli multimodal temel model tarafından üretilen iç temsillerle eşleştirmek üzere eğitiliyor, böylece yapılar ve elektronik desenlerin bileşime nasıl bağlandığını sessizce özümsüyor. Açık versiyonda ise büyük bir üretken model önce her formül için olası kristal yapılar öneriyor ve ardından atom ağlarını işlemek konusunda iyi olan grafik sinir ağları bu yapılardan özellikleri tahmin ediyor. Bu iki aşamalı yol, tahmin yapmadan önce eksik kristal bilgisini yeniden kurmayı amaçlıyor.
Yöntemler ne kadar iyi çalışıyor
Modeller, güneş hücreleriyle ilgili bant aralıklarından kayma modülü gibi mekanik özelliklere kadar onlarca hedef niceliği kapsayan iki büyük kıyaslama setinde test ediliyor. Bu görevlerin çoğunda, özellikle kuantum mekanik hesaplamalara dayanan veri kümelerinde, örtük aktarım modelleri önceki dil modellerine göre daha küçük tahmin hataları veriyor ve sık sık güçlü yapı tabanlı rakiplerle yarışıyor. Açık aktarım boru hattı da önceki formül tabanlı dil modellerine göre iyileşme gösteriyor ancak kristal yapıların üretilmesi ihtiyacı nedeniyle yavaş kalıyor. Bu yapıların üretilmesi, özellikle bileşim birden çok farklı element içerdiğinde, doğrudan dil modeli tahminine göre maddeler başına onlarca kat daha uzun sürebiliyor.
Siyah kutuya bakmak
Dil modelinin ne öğrendiğini anlamak için yazarlar, girdinin farklı parçalarının tek başına veya kombinasyon halinde tahmin edilen özelliği nasıl etkilediğini ölçen oyun teorik bir analiz uyguluyor. Şekil değişimine karşı bir malzemenin direncini ilişkilendiren kayma modülüne baktıklarında, belirli elementlerin ve element gruplamalarının değeri kuvvetle yükselttiğini veya düşürdüğünü; bunun borürler ve karbürler gibi bilinen sert bileşiklerle uyumlu olduğunu görüyorlar. Formüldeki bazı üç token'lı desenler bile tanıdık kristal prototipleriyle ilişkilendirilebiliyor; bu, modelin yalnızca bileşimden yapısal motifleri örtük olarak öğrendiğini gösteriyor.
Gelecekte malzeme keşfi için anlamı
Genel olarak çalışma, farklı türde malzeme verileri arasında bilgi paylaşımının sadece kimyasal formül mevcut olduğunda bile özellik tahminini önemli ölçüde iyileştirebileceğini gösteriyor. Multimodal temel model tarafından yönlendirilen dil modelinin kullanıldığı örtük yaklaşım doğruluk ve hız açısından en iyi karışımı sunuyor ve yeni bileşiklerin geniş sanal taramaları için cazip kılıyor. Kristal yapıları yeniden kuran açık yol da, yapı üreteçleri geliştikçe, başka bir umut verici açı sunuyor. Birlikte bu yöntemler, tek bir kristal büyütülmeden çok önce geniş kimyasal uzayları hızla ayıklayıp en umut verici adayları öne çıkarabilecek yapay zekâ araçlarına işaret ediyor.
Atıf: Rubtsov, I., Dudakov, I., Kuratov, Y. et al. Enhancing composition-based materials property prediction by cross-modal knowledge transfer. Sci Rep 16, 16434 (2026). https://doi.org/10.1038/s41598-026-53182-3
Anahtar kelimeler: malzeme informatiği, kimyasal dil modelleri, özellik tahmini, multimodal öğrenme, kristal yapıları