Clear Sky Science · tr

Dil modeli rehberliğinde memeli metabolitlerinin öngörülmesi ve keşfi

· Dizine geri dön

Vücudumuzdaki Gizli Kimya

Her damla kan veya idrarda, ne yediğimizi, nasıl yaşadığımızı ve hasta olup olmadığımızı yansıtan binlerce küçük molekül bulunur. Buna rağmen bu moleküllerin çoğunun adı veya ne işe yaradıkları bilim insanları tarafından bilinmiyor. Bu makale, bu moleküllerin “dilini” okuyan ve insan ve hayvan kimyasının mevcut haritalarından eksik olanları tahmin eden yapay zeka sistemi DeepMet’i tanıtıyor. Deneyleri en umut verici adaylara yönlendirerek DeepMet, araştırmacıların bu kimyasal karanlık maddeyi ortaya çıkarmasına ve vücudumuzun nasıl çalıştığını daha iyi anlamasına yardımcı oluyor.

Figure 1
Figure 1.

Neden Bu Kadar Çok Molekül Bilinmiyor?

Modern cihazlar, bir doku örneğinde binlerce molekülü aynı anda tartıp kısmi parmak izi çıkarabiliyor. Ancak bu parmak izlerini kesin yapılara dönüştürmek zordur. Mevcut veritabanları bilinen birçok metaboliti listelese de gerçek örneklerde görülen sinyallerin çoğu bu kataloglarla eşleşmiyor. Bu boşluk, mevcut metabolizma haritalarının eksik olduğunu ve memelilerdeki birçok doğal molekülün daha önce tanımlanmamış olabileceğini gösteriyor. Yazarlar, bilinen metabolitlerden öğrenip sonra tıpkı dil modellerinin cümlede olası sözcükleri tahmin etmesi gibi en makul eksikleri tasavvur edebilecek bir araç geliştirmeye karar verdiler.

Makineye Metabolizmanın Dilbilgisini Öğretmek

Araştırma ekibi, her birini yapısını tanımlayan kısa bir dize olarak kodlayarak yaklaşık 2.000 iyi yerleşmiş insan metaboliti üzerinde DeepMet adlı bir sinir ağını eğitti. Genel kimyasal kuralları öğrenmesi için önce ilaç benzeri moleküllerle yapılan ilk eğitimden sonra DeepMet bu metabolit seti üzerinde ince ayar yapıldı. Yeni yapılar üretmesi istendiğinde model, gerçek metabolitlerle aynı kimyasal uzay bölgelerinde yer alan moleküller üretti ve açıkça bu kurallar öğretilmemesine rağmen birçok bilinen enzim reaksiyonu türünü yeniden oluşturdu. Başka bir deyişle, DeepMet şekerler ve amino asitler gibi temel yapı taşlarını biyolojik olarak gerçekçi küçük moleküllere bağlayan yazılı olmayan dilbilgisini içselleştirmiş gibi görünüyordu.

Hangi Yeni Moleküllerin Muhtemelen Var Olduğunu Tahmin Etmek

Araştırmacılar daha sonra DeepMet’ten bir milyar aday molekül örnekledi ve her benzersiz yapının ne sıklıkta göründüğünü saydı. Sık tekrarlanan yapılar, bilinen metabolitlere daha çok benzemeye, onlarla ortak kimyasal çekirdekleri paylaşmaya ve olası enzim dönüşümlerine uymaya yatkındı. Bu yüksek frekanslı adayların gerçek moleküllere karşılık gelip gelmediğini test etmek için ekip, DeepMet’in tahminlerini modelin eğitim verilerinin kapandığı tarihten sonra İnsan Metabolom Veritabanı’na eklenen metabolitlerle karşılaştırdı. DeepMet zaten bu daha sonraki keşiflerin çoğunu üretmişti ve birçoğunu en olası adayları arasında sıraladı. Veritabanında olmayan binlerce üst sıralı yapı arasından yazarlar 80 tane satın aldı veya sentezledi ve kütle spektrometrisi ile gerçek insan örneklerini kontrol etti. Mevcut literatürde yer almalarına rağmen gözden kaçmış olanlar da dahil olmak üzere daha önce tanınmamış birkaç metabolitin varlığını doğruladılar.

Figure 2
Figure 2.

Ham Sinyallerden Somut Yapılara

DeepMet, bir kütle spektrometresinde bilinmeyen bir zirve görüldüğünde de kullanışlıdır. Gizemli bir molekülün yalnızca kesin kütlesi verildiğinde model, aynı ağırlıkta olacak birçok yapıyı listeleyebilir ve bunları ne kadar metabolit-benzeri göründüklerine göre sıralayabilir. Test vakalarının yaklaşık üçte birinde doğru yapı en üstte çıktı; daha fazlasında ise doğru yapı yalnızca birkaç yüksek sıralı aday arasında yer aldı ve genellikle modelin favorisine biçimsel olarak çok benziyordu. Durumu daha da daraltmak için yazarlar, her adayın kütle spektrometresinde nasıl parçalanacağını tahmin eden ayrı bir yazılımla DeepMet’i birleştirdiler. Gerçek deneysel spektrlere bu öngörülen desenleri eşleştirmek tanımlama doğruluğunu yaklaşık iki kat artırdı. Bu birleşik yaklaşımla büyük halka açık veri kümelerinde arama yapmak, daha önce anonim olan birçok sinyal için olası yapılar ortaya koydu ve hastalıklar, diyetler ve mikrobiyom durumları arasında farklılık gösteren metabolitlere işaret etti.

Yaşamın Kimyasal Karanlık Maddesini Aydınlatmak

Veriden öğrenilmiş kimyasal sezgi ile kütle spektreleri karşısında güçlü örüntü eşleştirmeyi harmanlayarak DeepMet, yeni metabolitleri hedefe yönelik ve pratik bir biçimde keşfetmek için bir yol haritası sunuyor. Henüz her bilinmeyen molekülü ortaya çıkaramıyor—bazı yapılar gördüklerinden çok uzak ve belirli izomerler özel yöntemler olmadan ayırt edilemiyor. Ancak çalışma, dil modeli tarzı araçların sadece gerçekçi moleküller icat etmekle kalmayıp biyologların daha sonra hayvanlarda ve insanlarda doğrulayacakları gerçek bileşikleri de önceden tahmin edebileceğini gösteriyor. Bir okur için çıkarılacak sonuç, yapay zekânın artık kimyagerlerin vücudumuzdaki gizli kimyayı sistematik olarak açığa çıkarmasına yardımcı olabileceği; bunun yeni biyobelirteçleri ortaya çıkarma, diyet–mikrop–konak bağlantılarını izleme ve bugünün metabolik karanlık maddesini yarının iyi haritalanmış biyolojisine dönüştürme potansiyelini taşıdığıdır.

Atıf: Qiang, H., Wang, F., Lu, W. et al. Language model-guided anticipation and discovery of mammalian metabolites. Nature 651, 211–220 (2026). https://doi.org/10.1038/s41586-025-09969-x

Anahtar kelimeler: metabolomik, kimyasal dil modelleri, DeepMet, kütle spektrometrisi, metabolik karanlık madde