Clear Sky Science · ar
تعزيز التنبؤ بخصائص المواد المبنية على التركيب عبر نقل المعرفة بين الوضعيات
لماذا يهم التنبؤ بسلوك المادة
تصميم بطاريات جديدة أو خلايا شمسية أو سبائك أقوى غالباً ما يبدأ من وصف بسيط يحدد العناصر التي يجب خلطها. تحويل تلك الوصفة إلى مادة حقيقية ذات صلابة أو موصلية أو استقرار معروف عادة ما يتطلب حسابات كمية مكلفة أو تجارب. تُظهر هذه الدراسة كيف يمكن لنماذج الذكاء الاصطناعي المتقدمة المعتمدة على اللغة، والتي بُنيت أصلاً لقراءة النصوص، أن تتعلم من أنواع متعددة من بيانات المواد ثم تتنبأ بخصائص مهمة مباشرة من الصيغة الكيميائية، مما يقلص التكلفة والوقت اللازمين لاستكشاف فضاءات هائلة من المركبات الممكنة.

من الوصفات إلى التنبؤات
تقسم أدوات التعلم الآلي التقليدية في علوم المواد إلى معسكرين. العائلة الأولى تحتاج هياكل بلورية مفصّلة تصف كيفية ترتيب الذرات في ثلاثة أبعاد، ويمكنها حينها التنبؤ بالخصائص بدقة لكن بتكلفة حسابية عالية. العائلة الأخرى تنظر فقط إلى الصيغة الكيميائية العامة، مثل عدد ذرات كل عنصر، وهو أمر أرخص لكنه عادة أقل دقة. يهدف المؤلفون إلى سد هذه الفجوة: يريدون نماذج ترى الصيغة فقط ومع ذلك تعمل تقريباً بمستوى أداء طرق واعية بالهيكل، مما يتيح فحصاً سريعاً للمركبات التي لم تُصنَع بعد أو حتى لم تُنمذج هيكلياً.
تعليم الذكاء الاصطناعي لغة المواد
يبني الفريق على نماذج اللغة الكيميائية، التي تتعامل مع الصيغة كسلسلة من الرموز، تماماً مثل الكلمات في جملة. أولاً، تتعلم هذه النماذج ملء أجزاء مفقودة من الصيغ، وهي مهمة تدريبية تساعدها على التقاط التكرارات في كيفية اتحاد العناصر وبأي نسب. يميل المؤلفون بهذا التعلم أيضاً نحو المواد المستقرة ترموديناميكياً، بحيث يعطي النموذج اهتماماً أكبر للتراكيب الواقعية. ثم يقدمون لمسة حاسمة: بدلاً من التعلم من النص وحده كما في نماذج اللغة التقليدية، يتم محاذاة نماذجهم مع نموذج أساس منفصل سبق وأن تعلم من مصادر متعددة، بما في ذلك الهياكل البلورية والسلوك الإلكتروني وتوزيعات الشحنة. وبفعالية، يرث نموذج اللغة معرفة هيكلية غنية بينما يظل يعمل فقط مع الصيغ.

طريقتان لمشاركة المعرفة
يستكشف الباحثون استراتيجيتين تكميليتين، يسمّيانها نقل المعرفة العابر للوضع الضمني والصريح. في النسخة الضمنية، يُدرَّب نموذج اللغة المعتمد على الصيغة لمطابقة التمثيلات الداخلية التي ينتجها نموذج الأساس متعدد الوضعيات، فيمتص بهدوء كيف ترتبط الأنماط الهيكلية والإلكترونية بالتركيب. في النسخة الصريحة، يقترح أولاً نموذج توليدي كبير هياكل بلورية محتملة لكل صيغة، ثم تتنبأ الشبكات العصبية الرسومية، الجيدة في التعامل مع شبكات الذرات، بالخصائص استناداً إلى تلك الهياكل. تحاول هذه المسار ذو الخطوتين إعادة بناء المعلومات البلورية المفقودة قبل إجراء التنبؤ.
مدى فعالية الطرق
اختُبرت النماذج على مجموعتين مرجعيتين كبيرتين تغطيان عشرات الكميات المستهدفة، من فجوات النطاق ذات الصلة بالخلايا الشمسية إلى خصائص ميكانيكية مثل معامل القص. عبر معظم هذه المهام، لا سيما لمجموعات البيانات المبنية على حسابات ميكانيكا كمية، تُظهر نماذج النقل الضمني أخطاء تنبؤ أصغر من نماذج اللغة السابقة وغالباً ما تُنافِس منافسي الطرق المعتمدة على الهيكل القوية. يحسّن خط أنابيب النقل الصريح أيضاً أداء نماذج اللغة المبنية على التركيب مقارنة بالسابق، لكنه يُبطَأ بسبب الحاجة إلى توليد هياكل بلورية. يمكن أن يستغرق إنتاج هذه الهياكل وقتاً أطول بعشرات المرات لكل مادة مقارنة بتنبؤ نموذج اللغة المباشر، خصوصاً عندما تتضمن التركيبات العديد من العناصر المختلفة.
إلقاء نظرة داخل الصندوق الأسود
لفهم ما تعلّمه نموذج اللغة، يطبق المؤلفون تحليل نظرية الألعاب الذي يقيس كيف تؤثر أجزاء الإدخال المختلفة، منفردة أو مجتمعة، على الخاصية المتوقعة. بالنظر إلى معامل القص، المرتبط بمدى مقاومة المادة لتغيير الشكل، يجدون أن عناصر وتجميعات عناصر معينة ترفع أو تخفض القيمة بقوة، بما يتوافق مع مركبات صلبة معروفة مثل البوريدات والكاربيدات. بعض أنماط ثلاثة رموز في الصيغة يمكن حتى ربطها بنماذج بلورية مألوفة، مما يوحي بأن النموذج قد أمسك ضمنياً بدلالات هيكلية من التركيب وحده.
ماذا يعني هذا لاكتشاف المواد مستقبلاً
بشكل عام، تُظهر الدراسة أن مشاركة المعرفة بين أنواع مختلفة من بيانات المواد يمكن أن تحسّن بشكل ملحوظ تنبؤ الخصائص عندما تتوفر فقط الصيغة الكيميائية. تقدم الطريقة الضمنية، حيث يَسترشد نموذج اللغة بنموذج أساس متعدد الوضعيات، أفضل مزيج من الدقة والسرعة، مما يجعلها جذابة للفحوص الافتراضية الواسعة للمركبات الجديدة. المسار الصريح الذي يعيد بناء الهياكل البلورية يقدم زاوية واعدة أخرى، لا سيما مع تحسن مولدات الهياكل. معاً، تشير هذه الأساليب إلى أدوات ذكاء اصطناعي قادرة على فرز فضاءات كيميائية واسعة بسرعة وإبراز أكثر المرشحين وعداً قبل أن تُنمو بلورة واحدة.
الاستشهاد: Rubtsov, I., Dudakov, I., Kuratov, Y. et al. Enhancing composition-based materials property prediction by cross-modal knowledge transfer. Sci Rep 16, 16434 (2026). https://doi.org/10.1038/s41598-026-53182-3
الكلمات المفتاحية: معلومات المواد, نماذج لغة كيميائية, تنبؤ الخصائص, التعلم متعدد الوضعيات, الهياكل البلورية