Clear Sky Science · ar

تطوير وتقييم نموذج فعال للتنبؤ بالذوبانية للأدوية في المذيبات العضوية باستخدام التعلم الآلي المبني على eXtreme Gradient Boosting

· العودة إلى الفهرس

لماذا تذويب الأدوية مهم حقًا

عندما يدخل قرص جسمك، يجب أن يذوب أولاً قبل أن يبدأ في العمل. مدى سهولة ذوبان المكوّن النشط في سائل يؤثر على كيفية تصنيع الدواء، ومدى استقراره، ومدى فعاليته. قياس هذه «الذوبانية» في سوائل ودرجات حرارة متعددة أمر بطيء ومكلف. تدرس هذه الورقة كيف يمكن لأداة بيانات حديثة، وهي التعلم الآلي، أن تساعد العلماء على تقدير مدى ذوبان المركبات الشبيهة بالأدوية في المذيبات العضوية الشائعة بسرعة، باستخدام قدر قليل من المعلومات السهلة الحصول.

اختيار السائل المناسب لصنع البلورات

في تصنيع الأدوية، غالبًا ما يقوم المنتجون بنمو بلورات المكوّن النشط من سائل عضوي. لا يتحكم السائل فقط في كمية الصلب المسترد؛ بل يشكل أيضًا حجم وشكل البلورات، مما قد يؤثر بدوره على سلوك الدواء. تقليديًا، يقوم الكيميائيون إما بإجراء تجارب كثيرة أو استخدام معادلات حرارية معقدة للتنبؤ بالذوبانية. يمكن أن تكون هذه الطرق التقليدية دقيقة لكنها غالبًا ما تتطلب العديد من المعاملات المضبوطة أو بيانات جزيئية مفصّلة غير المتاحة في مرحلة التطوير المبكرة. بدلًا من ذلك، تسأل هذه الدراسة ما إذا كان نموذج تعلم آلي مصمم بعناية يمكنه التقاط الاتجاهات الأساسية للذوبانية مع الاعتماد على مدخلات بسيطة وذات معنى فيزيائي.

Figure 1. كيف يربط نموذج تعلم آلي مدمج الخصائص الأساسية للمادة الدوائية والمذيب بالذوبانية عبر العديد من السوائل العضوية.
Figure 1. كيف يربط نموذج تعلم آلي مدمج الخصائص الأساسية للمادة الدوائية والمذيب بالذوبانية عبر العديد من السوائل العضوية.

نموذج مبني على البيانات مع بُعد فيزيائي

بنى الفريق نموذجًا لتنبؤ الذوبانية مستخدمين طريقة تعلم آلي شائعة تُدعى eXtreme Gradient Boosting، أو XGBoost. جمعوا بيانات ذوبانية منشورة لأربعة مركبات شبيهة بالأدوية في تسعة مذيبات عضوية شائعة عبر نطاق واسع من درجات الحرارة، مما نتج عنه 224 نقطة بيانات. بدلًا من إدخال واصفات عشوائية للخوارزمية، اختاروا عشرة خواص يفهمها الكيميائيون بالفعل: خصائص الصلب (مثل درجة انصهاره، وحرارة الانصهار، والسعة الحرارية، ومعامل ذوبانية معروف)، وخواص السائل الأساسية (القطبية عبر ثابت العزل ودرجة غليان السائل) بالإضافة إلى درجة الحرارة نفسها وترميزات بسيطة لأسماء الصلب والمذيب. ولعكس حقيقة أن معظم المواد الصلبة تذوب أفضل عند التسخين، ضمنوا قاعدة تجبر تنبؤات النموذج على الارتفاع مع زيادة الحرارة، مما يضمن سلوكًا معقولًا فيزيائيًا.

مدى مطابقة النموذج للقياسات الواقعية

بعد ضبط النموذج باستخدام التحقق المتقاطع، اختبر المؤلفون مدى قرب التنبؤات من القيم المقاسة. قيّموا الأداء بمقارنة لوغاريتم الذوبانية المقاسة والمتوقعة، وهو مقياس مناسب لأن الذوبانيات امتدت عبر عدة مراتب من الحجم. بالنسبة للمركبات الأربعة المستخدمة في التدريب والاختبار، استنسخ النموذج البيانات بأخطاء متوسطة صغيرة جدًا وارتباط عالٍ، مما يشير إلى أنه يمكنه وصف الذوبانية المعتمدة على درجة الحرارة عبر بيئات سائلة متعددة بشكل موثوق. والأهم أن النموذج بقي دقيقًا حتى لمركب شديد الانحلال السيئ، ريسبيريدون، الذي من الصعب عادة وصف سلوكه بمعادلات أبسط.

Figure 2. عرض خطوة بخطوة للمدخلات، نموذج التعلم الآلي، ومنحنيات المطابقة للذوبانية المقاسة والمتوقعة مع ارتفاع درجة الحرارة.
Figure 2. عرض خطوة بخطوة للمدخلات، نموذج التعلم الآلي، ومنحنيات المطابقة للذوبانية المقاسة والمتوقعة مع ارتفاع درجة الحرارة.

التنبؤ بمركب جديد تمامًا

السؤال الحاسم كان ما إذا كان النموذج يستطيع التعامل مع مكوّن نشط لم يره من قبل. لاختبار ذلك، خصص الباحثون جميع البيانات لمركب خامس، بوتامبين، واستخدموا تلك الخمسين قياسًا فقط بعد اكتمال التدريب. كانت أخطاء النموذج أكبر في مهمة التنبؤ الحقيقية هذه مقارنة بالبيانات التي رآها سابقًا، لكنها بقيت ضمن نطاق قابل للمقارنة مع عدم اليقين التجريبي النموذجي، خصوصًا لعدة مذيبات مختبرة. عند مقارنته بطريقتين حراريتين شبه-تنبؤيتين مستخدمتين على نطاق واسع، Flory Huggins وNRTL-SAC المعتمد على الحرارة، أنتج نموذج XGBoost أخطاء أصغر بشكل ثابت، وأداءً جيدًا بشكل خاص في الأنظمة الأكثر تحديًا.

ماذا يعني هذا لمستقبل تطوير الأدوية

لغير المتخصصين، الخلاصة أن نموذج تعلم آلي صغير نسبيًا ومستنير فيزيائيًا يمكنه تقدير مدى ذوبان المركبات الشبيهة بالأدوية في المذيبات العضوية الشائعة عبر نطاق من درجات الحرارة بشكل موثوق. يقوم بذلك باستخدام مجموعة محدودة من الخصائص القابلة للقياس، دون الحاجة إلى ضبط معلمات كثيف كما في النهج التقليدية. بينما يشير المؤلفون إلى أن تحسين الواصفات المختارة وتوسيع مجموعة البيانات سيحسّن الأداء، تظهر الدراسة أن مثل هذه النماذج يمكنها بالفعل دعم اختيار المذيبات وتصميم العمليات، مما يساعد الكيميائيين على تضييق الخيارات الواعدة قبل إجراء العمل المختبري التفصيلي.

الاستشهاد: Valavi, M., Assareh, M., Khoshsima, A. et al. Development and evaluation of an effective solubility prediction model for pharmaceuticals in organic solvents using machine learning based on eXtreme Gradient Boosting. Sci Rep 16, 16592 (2026). https://doi.org/10.1038/s41598-026-53038-w

الكلمات المفتاحية: ذوبانية الدواء, مذيبات عضوية, التعلم الآلي, XGBoost, التبلور