Clear Sky Science · tr
Lerne edilmiş temsillerden ve çoklu görev öğrenmesinden yararlanarak lizin metilasyon sitesi keşfi
Neden küçük protein işaretleri sağlık için önemli
Her hücrenin içinde proteinler sürekli olarak etkinliklerini açıp kapatabilen küçük kimyasal etiketlerle değiştirilir. Lizin metilasyonu adlı bu etiket, genlerimizin nasıl çalıştığını kontrol etmeye yardımcı olur ve giderek kanser ile diğer hastalıklarla ilişkilendirilmektedir. Ancak bu işaretlerin binlerce proteindeki tam konumlarını laboratuvarda bulmak yavaş ve pahalıdır. Bu çalışma, protein dizilerini tarayan ve hangi lizlerin metile olması muhtemel olduğunu tahmin eden güçlü bir bilgisayar modeli olan MethylSight 2.0’ı tanıtıyor; bu sayede bilim insanları yeni biyolojiyi ve potansiyel ilaç hedeflerini çok daha hızlı ortaya çıkarabilir.
Proteinlerdeki gizli anahtarlar
Proteinler amino asit zincirlerinden oluşur ve lizin, hücrelerin kimyasal etiket ekleyebileceği kilit pozisyonlardan biridir. Lizin üzerindeki metilasyonun, çekirdekte DNA’nın nasıl paketlendiğini kontrol ettiği ve hangi genlerin açılıp kapanacağını şekillendirdiği zaten bilinmektedir. Ancak pek çok lizin metilasyon olayı, hücrenin iskeletini oluşturan, motorlarını çalıştıran ve sinyal ileten histon olmayan proteinlerde gerçekleşir. Bu işaretleri yerleştiren birkaç enzim, kanserlerde aşırı aktif olduğundan çekici ilaç hedefleri haline gelmiştir. Zorluk şu ki, insan proteomunun tamamında metilasyonu deneysel olarak tespit etmek büyük miktarda zaman, para ve özel donanım gerektirir; bu nedenle araştırmacılar laboratuvar çalışmalarını en umut verici bölgelere odaklamak için tahmin araçlarına yönelirler.

Bilgisayarlara protein dilini öğretmek
Yazarlar, dizi ile yapı ve fonksiyon arasındaki desenleri öğrenen milyonlarca ila milyarlarca protein dizisi üzerinde eğitilmiş “protein dil modelleri”ndeki son gelişmelere dayanıyor. Bu modeller, bir proteindeki her amino asidi kimyasal çevresini ve 3B bağlamını yakalayan zengin sayısal tanımlamalara dönüştürür. Her lizin ve komşuları için bu öğrenilmiş temsilleri kullanarak ekip, daha basit çok katmanlı algılayıcılardan daha gelişmiş bir transformer mimarisine kadar çeşitli sinir ağı tasarımlarını test etti. Performansı şişirebilecek yinelikten kaçınırken yüksek güvenliğe sahip metile olmuş bölgeleri seçerek ve gerçekçi negatif örnekler oluşturarak eğitim verilerini kamu veri tabanlarından dikkatle düzenlediler.
Diğer kimyasal işaretlerden öğrenmek
Hücreler lizini izole olarak süslemez. Aynı pozisyon asetilasyon, ubikitinasyon veya sumoilasyon gibi diğer değişikliklerle işaretlenebilir; bu etiketler rekabet edebilir veya işbirliği yapabilir ve hangi modifikasyonun öne çıkacağını etkileyebilir. Araştırmacılar, bu diğer işaretlerle ilişkili desenlerin metilasyonu modelin daha iyi tanımasına yardımcı olabileceği sonucuna vardı. Sorunu çoklu görev ortamına dönüştürerek, dört lizin modifikasyonunu aynı anda tahmin eden ve iç parametrelerinin büyük kısmını paylaşan tek bir transformer tabanlı ağ eğittiler. Bu düzen, bir değişiklik türünden edinilen bilginin, bilinen örnekleri daha az olan metilasyon için de dahil olmak üzere diğer tahminleri güçlendirmesine olanak tanır.
Daha iyi tahminler ve gerçek dünyada doğrulama
MethylSight 2.0 adını taşıyan çoklu görevli transformer modeli, bağımsız bir test kümesinde önceki araçlardan açık ara daha iyi performans gösterdi ve anahtar bir doğruluk ölçüsünü eski yöntemlere kıyasla iki katından fazla artırdı. Gerçek hücrelerde metilasyonun ne kadar nadir olduğuna dair gerçekçi tahminleri kullanarak yazarlar, zorlu koşullar altında bile modelin faydalı bir keskinlik (precision) düzeyini koruduğunu öngörüyorlar. Ardından MethylSight 2.0’ı gözden geçirilmiş tüm insan proteomuna uyguladılar ve muhafazakar eşik değerleri kullanarak 60.000’in üzerinde olası metile lizin öngördüler. Bunlardan 100 aday siteyi hedefli kütle spektrometrisi deneyleri için seçip bu 100’den 68’inde metilasyon tespit ettiler; bu da modelin tahminlerinin laboratuvar gerçeğiyle iyi örtüştüğünü gösteriyor.

Genişleyen bir protein kontrol haritası
Öğrenilmiş protein temsillerini, gelişmiş bir sinir ağını ve çoklu görev eğitimini birleştirerek yazarlar, insan “lizin metilomu”nun yaklaşık 155.000 site içerebileceğini tahmin ediyor—önceden anlaşılandan çok daha fazla. Analizleri, öngörülen metilasyonun özellikle çeviri, RNA işlemesi ve sitoskeleton ile ilgili proteinlerde zenginleştiğini gösteriyor; bu, bu sistemlerin kimyasal işaretlerle sıkı şekilde ayarlandığına dair önceki izlenimlerle tutarlı. MethylSight 2.0 hem halka açık bir web sunucusu hem de indirilebilir yazılım olarak kullanılabildiği için araştırmacılar artık ilgilendikleri proteinleri tarayabilir, deneylere öncelik verebilir ve hastalıkla ilişkili metilasyon olaylarını daha verimli arayabilir. Pratik anlamda bu çalışma, proteinlere yapılan ince kimyasal düzenlemelerin sağlık ve hastalığı nasıl şekillendirdiğini keşfetmek için hem daha keskin bir harita hem de daha iyi bir pusula sunuyor.
Atıf: Charih, F., Boulter, M., Biggar, K.K. et al. Leveraging learned representations and multitask learning for lysine methylation site discovery. Sci Rep 16, 10212 (2026). https://doi.org/10.1038/s41598-026-39136-9
Anahtar kelimeler: lizin metilasyonu, post-translasyonel modifikasyon, protein dil modelleri, proteomikte derin öğrenme, kanser epigenetiği