Clear Sky Science · tr

Çeşitli sıcaklıklarda çözücü çiftlerinin ikili karışımlarında organik bileşiklerin çözünürlük değerleri veri kümesi

· Dizine geri dön

Günlük kimya için neden önemli

Kullandığımız birçok ürün —ilaçlardan plastiklere ve boyalara kadar— bir maddenin bir sıvıda ne kadar iyi çözüldüğüne bağlıdır. Gerçek endüstriyel ortamda bilim insanları nadiren tek bir saf çözücüyle çalışır; katının ne kadar çözüneceğini hassas ayarlamak için genellikle iki sıvıyı karıştırırlar. Her yeni bileşik ve çözücü çifti için bunu ölçmek yavaş ve zahmetlidir. Bu makale, geniş sıcaklık aralıklarında yüzlerce farklı iki çözücü karışımında sekiz yüzün üzerinde organik bileşiğin nasıl çözüldüğünü yakalayan, dikkatle kontrol edilmiş geniş bir deneysel veri koleksiyonu olan MixtureSolDB’yi tanıtıyor. Böyle bir kaynak, ilaç geliştirme, malzeme tasarımı ve çevreci üretim araştırmalarını hızlandırmak için tasarlanmıştır.

Figure 1. Birçok molekülün birçok karışık çözücüde nasıl çözüldüğüne dair tek bir büyük haritaya beslenen veriler.
Figure 1. Birçok molekülün birçok karışık çözücüde nasıl çözüldüğüne dair tek bir büyük haritaya beslenen veriler.

Nelerin nasıl dağıldığını gösteren büyük bir harita

Yazarlar, 252 ile 383 kelvin arasındaki sıcaklıklarda çözücü çiftleriyle birlikte 3.001 farklı çözünen–karışık çözücü kombinasyonunu kapsayan, 750 farklı ikili çözücü karışımında 810 organik bileşik için 175.166 bireysel çözünürlük ölçümü topladılar. Her veri noktası, belirli bir karışım oranı ve sıcaklıkta bir bileşiğin bir çözücü çiftinde ne kadar çözünebildiğini kaydeder. Bu sistemlerin birçoğu, laboratuvarlarda ve sanayide sık kullanılan suyun bir alkol, aseton veya asetonitril gibi organik bir sıvıyla karışımını içerir. 1.115 hakemli makaleden yararlanarak, yazarlar önceki açık veri kümelerini büyük ölçüde genişleterek araştırmacılara çözünürlük davranışının çok daha geniş ve çeşitli bir resmini sunuyorlar.

Verilerin nasıl toplandığı ve temizlendiği

Bu veri kümesini oluşturmak için ekip önce bilimsel dergilerde başlıklarında veya özetlerinde “solubility + binary” veya “solubility + mixture” gibi ifadeler geçen makaleleri aradı. 5.775 kayıttan başlayarak, kopyalar ve kullanılabilir veri içermeyen makaleler çıkarıldı, ardından 1.115 uygun makaleden sayısal değerler elle çıkarıldı. Organik bileşikler, organik tuzlar ve tanımlı solvata odaklanıldı; normal basınç altında ve ilave katkı maddesi olmadan çalışıldı ve polimorflar söz konusu olduğunda katı formların en kararlı olanları olduğundan emin olundu. Çözünen ve çözücülerin moleküler yapıları SMILES adı verilen standart bir metin tabanlı formata dönüştürüldü ve eşanlamlılık karışıklığını önlemek için çözücü adlandırma kuralları birleştirildi.

Sistemler arasında sayıları karşılaştırılabilir kılmak

Ham çözünürlük verileri mol kesri veya çözücü miktarına göre gram gibi çeşitli biçimlerde raporlanabilir ve bir karışımdaki her bir çözücünün fraksiyonu kütleye veya mole göre verilebilir. Verileri tutarlı ve modellemeye hazır hale getirmek için yazarlar tüm ölçümleri birkaç standart biçime dönüştürdüler; bunların arasında 100 gram çözücü başına gram olarak ifade edilen kütle bazlı bir değer ve bunun onluk logaritması bulunuyor; bu, veri odaklı çözünürlük çalışmalarında yaygın bir tercihtir. Bu dönüşümleri gerçekleştirmek için açık kaynak kimya yazılımlarıyla hesaplanan moleküler ağırlıklar kullanıldı; polietilen glikol tabanlı çözücüler gibi özel durumlar da dahil edildi. Son tablo ayrıca sıcaklık, çözücü çiftinin bileşimi, kamu veritabanı tanımlayıcıları ve bir bileşiğin ABD Gıda ve İlaç Dairesi (FDA) tarafından onaylı bir ilaç olup olmadığı gibi ayrıntılı üstveriyi kaydeder.

Figure 2. İki çözücünün oranını molekül çevresinde değiştirerek, çözünürlüğünün adım adım nasıl arttığını veya azaldığını gösterme.
Figure 2. İki çözücünün oranını molekül çevresinde değiştirerek, çözünürlüğünün adım adım nasıl arttığını veya azaldığını gösterme.

Güvenilirliği kontrol etmek ve veri kümesini keşfetmek

Kaynak makaleler zaten hakemli olsa da, bu kadar çok sayıyı elle kopyalamak hatalara yol açabilir. Bu riski azaltmak için iki eğitimli kimyager verileri bağımsız olarak çıkardı ve üçüncü bir kişi sonuçları karşılaştırıp birleştirdi. Ekip daha sonra bir dizi otomatik kontrol çalıştırdı; mol kesrinden büyük olan çözünebilirlikler veya doğru toplamayan çözücü fraksiyonları gibi imkânsız değerleri aradı ve sıcaklıkları bilinen kaynama noktalarıyla karşılaştırdı. Ayrıca dijital nesne tanımlayıcıları kullanarak literatür atıflarını doğruladılar ve aynı adın farklı yapılara veya tersi durumlara işaret ettiği tutarsızlıkları çözdüler. Ortaya çıkan veri kümesi ile çözücü kaynama noktalarının daha küçük bir tablosu, basit virgülle ayrılmış dosyalar olarak halka açıktır ve kullanıcıların bileşik adına veya yapısına göre arama yapmasına ve onaylı ilaçlara odaklanmasına izin veren etkileşimli bir çevrimiçi araç aracılığıyla göz atılabilir.

Gelecekteki araçlar için ne anlama geliyor

Kimyagerler ve veri bilimciler için MixtureSolDB, karışık çözücülerde bir bileşiğin ne kadar çözüneceğini her defasında yeni deneyler yapmadan tahmin eden modelleri oluşturup test etmek için bir kıyas kaynağı sunar. Çok sayıda veri noktası ve geniş bileşik ile çözücü çifti çeşitliliği, makine öğrenimi yöntemlerinin dar bir vaka setine fazla uyum sağlamak yerine daha genel desenler öğrenmesine yardımcı olur. Yazarlar farklı sistemleri karşılaştırmak için en uygun hedef olarak bir logaritmik ölçüt önermelerine karşın, laboratuvarda gerçek dünya planlaması için daha pratik kütle bazlı değerleri de sağlarlar. Sonuç olarak bu veri kümesi, araştırmacıların çözücü karışımlarını seçme konusunda daha hızlı ve bilgiye dayalı yollar sunarak daha iyi reaksiyonlar, kristalleştirme süreçleri ve formulasyonlar tasarlamalarına yardımcı olmalıdır.

Atıf: Malikov, D., Krasnov, L., Kiseleva, M. et al. Dataset of solubility values for organic compounds in binary mixtures of solvents at various temperatures. Sci Data 13, 727 (2026). https://doi.org/10.1038/s41597-026-07047-z

Anahtar kelimeler: çözünürlük, ikili çözücü karışımları, makine öğrenimi veri kümesi, organik bileşikler, kimya bilişimi