Clear Sky Science · ar
مجموعة بيانات قيم الذوبانية للمركبات العضوية في مخاليط مذيب ثنائية عند درجات حرارة مختلفة
لماذا هذا مهم للكيمياء اليومية
تعتمد العديد من المنتجات التي نعتمد عليها، من الأدوية إلى البلاستيك والدهانات، على مدى ذوبان مادة معينة في سائل. في البيئات الصناعية الحقيقية، نادراً ما يعمل العلماء بمذيب نقي واحد؛ فهم غالباً ما يخلطون سائلين لضبط مقدار المذاب الذي يذوب. قياس ذلك لكل مركب وزوج مذيب جديد بطيء وشاق. تقدم هذه الورقة MixtureSolDB، مجموعة بيانات واسعة ومدققة بعناية من البيانات التجريبية التي تلتقط كيفية ذوبان أكثر من ثمانمائة مركب عضوي في مئات من مخاليط مذيب ثنائية عبر نطاق واسع من درجات الحرارة. تهدف هذه الموارد إلى تسريع البحث في تطوير الأدوية، وتصميم المواد والتصنيع الأخضر.

خريطة كبيرة لكيفية الذوبان
جمع المؤلفون 175,166 قياساً فردياً للذوبانية لـ 810 مركبات عضوية في 750 مزيج مذيب ثنائي مختلف، شاملين 3,001 توليفة مميزة من المذاب والمذيبات المختلطة بين 252 و383 كلفن. يسجل كل نقطة بيانات مقدار ما يمكن أن يذوب من مركب في زوج معين من المذيبات عند نسبة خلط ودرجة حرارة معينة. تتضمن العديد من هذه الأنظمة الماء الممزوج بسائل عضوي مثل كحول أو أسيتون أو أسيتونيتريل، مما يعكس شيوع استخدام مثل هذه المخاليط في المختبرات والصناعة. من خلال الاستفادة من 1,115 ورقة محكَّمة، يُوسِّع المؤلفون بشكل كبير مجموعات البيانات العامة السابقة، مما يمنح الباحثين صورة أوسع وأكثر تنوعاً لسلوك الذوبانية.
كيف جُمعت البيانات ونُقّحت
لتجميع هذه المجموعة، بحث الفريق أولاً في الدوريات العلمية عن مقالات تحتوي ألقابها أو ملخصاتها عبارات مثل «الذوبانية + ثنائي» أو «الذوبانية + خليط». بدءاً من 5,775 سجل، أزالوا التكرارات والأوراق التي لا تحتوي بيانات قابلة للاستخدام، ثم استخرجوا يدوياً القيم العددية من 1,115 مقالة مناسبة. ركزوا على المركبات العضوية والأملاح العضوية والمحاليل المعرفة، تحت ضغط عادي وبدون إضافات، وتأكدوا من أن الأشكال الصلبة كانت الأشكال الأكثر استقراراً عند وجود تعدد أشكال بلورية. تُرجمت البنى الجزيئية للمذاب والمذيبات إلى صيغة نصية معيارية تُسمى SMILES، وتم توحيد تسميات المذيبات لتجنب الالتباس بين المرادفات.
جعل الأرقام قابلة للمقارنة عبر الأنظمة
يمكن الإبلاغ عن بيانات الذوبانية الخام بطرق عدة، مثل الكسرة المولية أو الغرامات لكل كمية من المذيب، ويمكن إعطاء نسبة كل مذيب في الخليط بالكتلة أو بالمول. لجعل البيانات متسقة وجاهزة للنمذجة، حوّل المؤلفون جميع القياسات إلى عدة أشكال معيارية، بما في ذلك قيمة قائمة على الكتلة معبّرة بالغرام من المذاب لكل 100 غرام من المذيب ولغاريتمها العشري، وهو خيار شائع في دراسات الذوبانية المعتمدة على البيانات. استخدموا أوزاناً جزيئية محسوبة بواسطة برامج كيمياء مفتوحة المصدر لإجراء هذه التحويلات، بما في ذلك للحالات الخاصة مثل المذيبات القائمة على بولي إيثيلين غليكول. كما يسجل الجدول النهائي بيانات وصفية مفصّلة: درجة الحرارة، تركيب زوج المذيبات، معرفات من قواعد بيانات عامة، وما إذا كان المركب معتمداً كدواء من قِبل إدارة الغذاء والدواء الأمريكية.

التحقق من الموثوقية واستكشاف مجموعة البيانات
على الرغم من أن الأوراق المصدرية كانت محكَّمة بالفعل، يمكن أن يؤدي النسخ اليدوي لعدد كبير من القيم إلى إدخال أخطاء. لتقليل هذا الخطر، استخرج كيميائيان مدرّبان البيانات بشكل مستقل وقارن شخص ثالث نتائجهما ودمجها. ثم أجرى الفريق سلسلة من الفحوص الآلية، باحثين عن قيم مستحيلة مثل ذوبانيات أكبر من كسرة مولية واحدة أو نسب مذيبات لا تجمع بشكل صحيح، ومقارنة درجات الحرارة مع نقاط الغليان المعروفة. كما تحققوا من المراجع الأدبية باستخدام معرفات الكائن الرقمي وحلّوا التناقضات حيث أشارت نفس التسمية إلى هياكل مختلفة أو العكس. المجموعة الناتجة، إلى جانب جدول أصغر لنقاط غليان المذيبات، متاحة للعامة كملفات مفصولة بفواصل ويمكن تصفحها عبر أداة تفاعلية على الإنترنت تتيح للمستخدمين البحث باسم المركب أو بالهيكل والتركيز على الأدوية المعتمدة.
ماذا يعني هذا للأدوات المستقبلية
بالنسبة للكيميائيين وعلماء البيانات، تقدم MixtureSolDB مورداً معيارياً لبناء واختبار نماذج تتنبأ بمقدار ذوبان مركب في مذيبات مختلطة دون إجراء تجارب جديدة في كل مرة. يساعد العدد الكبير من نقاط البيانات وتنوّع المركبات وأزواج المذيبات طرق التعلم الآلي على استنباط أنماط أكثر عمومية بدلاً من الإفراط في التكيّف مع مجموعة ضيقة من الحالات. بينما يوصي المؤلفون بمقياس لوغاريتمي واحد كهدف مناسب لمقارنة الأنظمة المختلفة، يقدمون أيضاً قيماً عملية قائمة على الكتلة للتخطيط الواقعي في المختبر. في النهاية، ينبغي أن تساعد هذه المجموعة الباحثين على تصميم تفاعلات وعمليات تبلور وصيغ أفضل عبر تزويدهم بطرق أسرع وأكثر استنارة لاختيار مخاليط المذيبات.
الاستشهاد: Malikov, D., Krasnov, L., Kiseleva, M. et al. Dataset of solubility values for organic compounds in binary mixtures of solvents at various temperatures. Sci Data 13, 727 (2026). https://doi.org/10.1038/s41597-026-07047-z
الكلمات المفتاحية: الذوبانية, مخاليط المذيبات الثنائية, مجموعة بيانات تعلم آلي, مركبات عضوية, كيمإنفورماتيكس