Clear Sky Science · tr

Öğretim deneyiminden yararlanarak bir pKa tahmin modeli (pKaLearn) geliştirilmesi

· Dizine geri dön

Neden makineleri asitler hakkında eğitmek önemli

İlaçlardan pillere kadar günlük ürünler, moleküllerin proton verip verme veya kabul etme kolaylığına bağlıdır; bu özellik tanıdık pH ölçeği ve moleküler akrabası pKa ile yakalanır. pKa’yı laboratuvarda ölçmek zaman ve çaba gerektirir; gelişmiş bilgisayar yöntemleri bile yavaş veya güvenilmez olabilir. Bu çalışma basit ama büyük etkileri olan bir soruyu soruyor: Bilgisayarlara öğrencileri eğittiğimiz şekilde temel kimyayı öğretseydik ve onlardan pKa değerlerini daha hızlı ve daha doğru tahmin etmelerini isteseydik ne olurdu?

Sınıf kurallarından bilgisayar kurallarına

Kimya dersinde öğrenciler adım adım öğrenir. Önce atomlar ve elektronegatiflik gibi basit eğilimler gelir, sonra rezonans, halka gerilimi ve yakın grupların elektronları çekme veya itme etkisi gibi fikirler öğretilir. Ancak karmaşık bir molekülde hangi hidrojenin en asidik olacağı gibi zor tahminler daha sonra ele alınır. Yazarlar, çoğu makine öğrenmesi modelinin bu ilerlemeyi atladığını savunuyor. Bu modeller genellikle ham yapılar veya soyut parmak izleriyle beslenir ve desenleri tek başlarına keşfetmeleri beklenir; bu da altta yatan nedenleri anlamak yerine örnekleri ezberlemelerine neden olabilir. Burada ekip, insan öğretmenlerin kullandığı aynı temel fikirleri kasıtlı olarak kodladı ve bunları algoritmalarına girdi olarak verdi.

Figure 1. Bilgisayara, farklı moleküllerin ne kadar asidik olduğunu değerlendirebilmesi için temel kimya kavramlarını öğretmek.
Figure 1. Bilgisayara, farklı moleküllerin ne kadar asidik olduğunu değerlendirebilmesi için temel kimya kavramlarını öğretmek.

Bir kimyager gibi düşünen bir model inşa etmek

Araştırmacılar küçük organik moleküllerin pKa değerlerini tahmin etmeye odaklandı; bu, ilaç tasarımı ve kimyanın birçok alanı için temel bir özellik. Molekülü bağlarla birbirine bağlı atomlar kümesi olarak ele alan bir graf sinir ağı kullanarak pKaLearn adlı bir model inşa ettiler. Yalnızca genel yapısal kodlara güvenmek yerine ders kitabı ilkeleriyle doğrudan ilişkili özellikler eklediler: bir bağın ne kadar polar olduğu, yüklü bir grubun iyonlaşabilir bir siteden kaç bağ uzakta olduğu, bir bağın bir halkanın parçası olup olmadığı ve konjugasyon ile rezonansın yükü nasıl yayabileceği gibi. Ayrıca indüktif çekimin zincir boyunca ne kadar uzağa etkisini gösterdiğini ölçtüler ve her iyonlaşabilir sitenin çevresini yaklaşık yedi bağa kadar “hissetmesini” sağlayacak şekilde ağı tasarladılar.

Öğretmek, test etmek ve basit ezberlemeyi önlemek

Bu öğretim tarzının gerçekten bilgisayarın öğrenmesine yardımcı olup olmadığını kontrol etmek için yazarlar yaklaşık 13.000 pKa değerinden oluşan bir veri setini dikkatle topladı ve temizledi. Eğitim ve test moleküllerini çok benzer yapabilecek rastgele bölme yerine, test kümesinin yeni kimyasal aileler içerecek şekilde molekülleri kümelediler. Bu daha zorlu sınav, modelin genel kuralları öğrenip öğrenmediğini yoksa yalnızca örnekleri ezberleyip ezberlemediğini ortaya koyar. Bu koşullar altında pKaLearn tipik hatalarda 0.7 pKa biriminin altında sonuçlar elde ederek parmak izlerine dayalı geleneksel istatistiksel modellerden ve mevcut birkaç makine öğrenmesi ile kuantum kimyası tabanlı tahminciden daha iyi performans gösterdi. Yazarlar sadece element türlerine dayanmaya veya yaygın bir yazılım tanımına göre konjuge bağlara güvenmek gibi standart kestirmeleri denediklerinde performans düştü; bu da kimyasal olarak anlamlı, iyi tanımlanmış özelliklerin değerini vurguluyor.

Figure 2. Bir modelin, bir moleküldeki her asidik bölgeyi adım adım tarayarak asiditesini nasıl tahmin ettiğini izlemek.
Figure 2. Bir modelin, bir moleküldeki her asidik bölgeyi adım adım tarayarak asiditesini nasıl tahmin ettiğini izlemek.

Diğer akıllı tahmincilerle karşılaştırma

Ekip, pKaLearn’i ilaç şirketlerinden molekülleri ve geliştirme sırasında gerçek cevapların gizlendiği kör tahmin zorluklarını içeren yaygın benchmark setlerinde bilinen pKa araçlarıyla karşılaştırdı. Bu testlerde modelleri, ağır kuantum hesaplamalarını makine öğrenmesiyle birleştiren yöntemler ve diğer grafik tabanlı sinir ağlarıyla tutarlı şekilde eşleşti veya onları geride bıraktı. Önemli olarak, hataların ortaya çıktığı durumları da incelediler; genellikle hatalar eksik iyonlaşabilir sitelere, molekül içinde protonların yer değiştirebildiği zor tautomerlere veya kendisi belirsiz olan deneysel verilere dayanıyordu. Genel olarak, bileşiklerin yalnızca küçük bir kısmı büyük hatalar gösterdi ve performans birçok farklı fonksiyonel grup boyunca istikrarlı kaldı.

Kimyacılar ve ötesi için bunun anlamı

Çalışma, makinelere öğrenciler gibi öğretilmenin fayda sağlayabileceğini gösteriyor. Basit ama güçlü kimya ilkelerini doğrudan bir öğrenme algoritmasının içine gömerek yazarlar, hem doğru hem de kara kutu modellerden daha yorumlanabilir bir pKa tahmincisi yarattılar. Pratik kullanıcılar için bu, geniş bir molekül yelpazesinde asidite ve baziklik için daha hızlı ve daha güvenilir tahminler anlamına gelir; bu da ilaç tasarımı ve diğer moleküler keşif çabalarını yönlendirmeye yardımcı olur. Daha geniş anlamda, çalışma gelecek araçlar için bir yol öneriyor: Yapay zekadan temel bilimi sıfırdan yeniden keşfetmesini istemek yerine insan uzmanlığını yerleştirip modellerin bu bilgiyi rafine edip genişletmeye odaklanmasını sağlayabiliriz.

Atıf: Genzling, J., Luo, Z., Weiser, B. et al. Development of a pKa predictor (pKaLearn) by leveraging teaching experience to improve machine learning. Commun Chem 9, 181 (2026). https://doi.org/10.1038/s42004-026-01983-y

Anahtar kelimeler: pKa tahmini, makine öğrenmesi, graf sinir ağı, hesaplamalı kimya, ilaç tasarımı