Clear Sky Science · tr

Protein-protein etkileşim modellemesi için eşleştirilmiş dizilim dil modeli

· Dizine geri dön

Protein ortaklıklarını incelemenin önemi

Her hücrenin içinde proteinler nadiren tek başına çalışır. Sinyal iletmek, yapılar oluşturmak ve enfeksiyonlarla savaşmak için çiftler veya daha büyük gruplar halinde bir araya gelirler. Hangi proteinlerin etkileştiğini, ne kadar sıkı bağlandıklarını ve tam olarak nerede temas ettiklerini bilmek, hücrelerin nasıl işlediğini ve hastalıkların nasıl ortaya çıktığını ortaya çıkarabilir. Ancak bu protein ortaklıklarının tamamını laboratuvarda ölçmek yavaş ve maliyetlidir. Bu çalışma, iki protein dizisini birlikte okuyarak kimlerin kiminle bağlandığını, ne kadar güçlü olduklarını ve hangi temas noktalarında bulunduklarını yalnızca amino asit dizileri girişini kullanarak tanımayı öğrenen yeni bir yapay zeka modeli tanıtıyor.

Aynı anda iki proteini okumanın yeni yolu

Mevcut çoğu protein dil modeli, her bir protein zincirini sanki yalnızmış gibi ele alır ve potansiyel etkileşimlerini göz ardı eder. Yazarlar bunun yerine iki diziyi yan yana her zaman birlikte inceleyen bir "Protein Çift Dil Modeli" (PPLM) geliştirdiler. Bu model, dil teknolojilerinde popülerleşmiş bir derin öğrenme türü olan dönüştürücü (transformer) mimarisini kullanır, fakat her proteindeki ve iki protein arasındaki desenleri ayrı ayrı izleyebilecek şekilde uyarlanmıştır. Eğitmek için ekip yapısal veritabanları ve etkileşim ağlarından 3,3 milyondan fazla protein çifti derleyerek modele doğal proteinlerin gerçek biyolojide nasıl eşleşme eğiliminde olduğuna dair geniş bir görüş sağladı.

Figure 1
Figure 1.

Dizilerde gizli kalan etkileşim sinyallerini görmek

PPLM’nin gerçekten protein ortaklıklarını anlayıp anlamadığını test etmek için yazarlar modele ikili dizilerde maskelenmiş amino asitleri tahmin ettirdiler ve onu önde gelen tek-dizi modeli ESM2 ile karşılaştırdılar. Farklı kaynaklardan binlerce protein çifti üzerinde PPLM, özellikle proteinlerin temas ettiği arayüzde bulunan kalıntılarda sürekli olarak daha emin ve daha doğru sonuç verdi. Modelin içsel "attention" (dikkat) desenlerini görselleştirerek, araştırmacılar PPLM’nin arayüz bölgelerine doğal olarak odaklandığını gösterdiler; oysa modele arayüzün nerede olduğu hiç açıkça söylenmemişti. Bilinen bir protein kompleksinin ayrıntılı bir vaka incelemesinde, modelin en güçlü şekilde dikkat verdiği kalıntı çiftleri üç boyutlu alanda deneysel olarak gözlemlenen temasların çoğuyla eşleşti.

Temel anlayıştan pratik tahminlere

Bu temelin üzerine ekip üç uygulamalı araç geliştirdi. PPLM-PPI iki proteinin etkileşme olasılığını tahmin eder. Beş farklı türde test edildiğinde, eğitimde görülenlerden önemli ölçüde farklı olan test proteinlerinde bile birkaç son teknoloji dizi tabanlı yöntemi geride bırakarak daha doğru ve daha kararlı etkileşim çağrıları sundu. PPLM-Affinity iki protein arasındaki bağlanma gücünü tahmin eder. Ölçülmüş bağlanma güçlerine sahip komplekslerin büyük bir kıyas setinde, aynı görev için ince ayar yapılmış bir ESM2 versiyonunu yalnızca yenmekle kalmadı, aynı zamanda ayrıntılı 3B yapılar kullanan özel bir yöntemi de geride bıraktı. Kazançlar, antikorların antijenlere bağlanması ve T hücre reseptörlerinin immün hedefleri tanıması gibi tıbbi açıdan önemli sistemlerde özellikle çarpıcıydı.

Proteinlerin nerede temas ettiğini tespit etmek

Üçüncü araç PPLM-Contact, iki protein arasındaki hangi kalıntı çiftlerinin gerçekten temas ettiğine odaklanır. Bu araç, PPLM’nin proteinler arası dikkat desenlerini çoklu dizi hizalamalarından elde edilen evrimsel bilgi ve tekil protein yapılarına ait mesafe haritalarıyla birleştirir. Birkaç zorlu test kümesi boyunca PPLM-Contact, temas haritalarını doğru biçimde geri kazandı ve yapısal girdilere güçlü biçimde dayanan bazı yöntemler de dahil olmak üzere mevcut yöntemlerden daha iyi arayüz kalıntılarını tanımladı. Geliştirilmiş bir versiyon olan PPLM-Contact2, modern 3B modelleme sistemlerinden tahmin edilen kompleks yapılarını da içine alarak bir adım ileri gider. Bu hibrit yaklaşım, yapıyı tahmin eden yöntemlerin kendilerinden bile daha iyi temas tahmini sağlayarak bağlanma yüzeylerine daha keskin görüşler ve bağlanma bölgelerinin daha güvenilir lokalizasyonunu sunar.

Figure 2
Figure 2.

Bu çalışmanın biyoloji ve tıp için anlamı

Bir arada ele alındığında, bu çalışma iki proteini ayrı ayrı değil çiftler halinde okumayı sağlayan modellerin hücresel yaşamın temelindeki ince etkileşim desenlerini yakalayabildiğini gösteriyor. PPLM ve türevleri, ucuz ve bol bulunan dizi bilgisiyle iki proteinin bir araya gelip gelmeyeceğini, ne kadar sıkı tuttuklarını ve hangi aminoasitlerin o tokalaşmayı oluşturduğunu söyleyebilir. Yaklaşım çok küçük veya zayıf arayüzlerde hâlâ zorluk yaşasa da ve mevcut eğitim verilerinin çeşitliliğine bağımlı olsa da, etkileşim ağlarını haritalama ve antikorlar, T hücre reseptörleri ve diğer biyolojik ilaçların tasarımını yönlendirme yolunda ölçeklenebilir bir yol sunuyor. Özetle, çalışma birlikte temsil edilen dil modellerinin ham dizi verisini proteinlerin birlikte nasıl çalıştığına dair zengin, etkileşim odaklı içgörülere dönüştürebileceğini gösteriyor.

Atıf: Liu, J., Chen, H. & Zhang, Y. A paired sequence language model for protein-protein interaction modeling. Nat Commun 17, 3733 (2026). https://doi.org/10.1038/s41467-026-70457-5

Anahtar kelimeler: protein–protein etkileşimleri, protein dil modelleri, bağlanma afinitesi, arayüz temas tahmini, hesaplamalı yapısal biyoloji