Clear Sky Science · tr

Retentive Network, uzun diziler için verimli RNA dil modellemesini teşvik ediyor

· Dizine geri dön

Bilgisayarlara Yaşamın RNA Mesajlarını Okutmak

Vücudunuzdaki her hücre, genetik talimatları canlı maddelere dönüştürmeye yardımcı olan RNA molekülüyle doludur. Ancak günümüz biyologları, hiçbir insanın satır satır okuyamayacağı kadar büyük bir RNA veri akışıyla karşı karşıya. Bu makale, RNA dizilerini dil gibi “okuyan” ve son derece uzun genetik dizileri işleyebilen kompakt bir yapay zeka modeli olan RNAret’i tanıtıyor. Amaç, RNA’ların nasıl katlandığı, nasıl etkileşime girdiği ve işlevsel planları arkaplan gürültüsünden nasıl ayırdığına dair gizli desenleri ortaya çıkarmak — üstelik güncel araçlardan çok daha az hesaplama gücü kullanarak.

RNA’da Desenleri Görmenin Yeni Bir Yolu

RNAret, başlangıçta İnsan metni için büyük dil modellerinin motoru olan Transformer’ların halefi olarak önerilen yeni bir yapay zeka tasarımı olan Retentive Network üzerine kuruludur. Dizideki her pozisyonu her diğer pozisyonla karşılaştırmak yerine — uzun diziler için çok maliyetli hale gelen bir adım — Retentive yaklaşım modelin ilerledikçe önemli bilgileri “tutmasına” izin verir; maliyet dizinin uzunluğuyla doğru orantılı olarak artar. Yazarlar bu fikri, RNA boyunca her iki yönde bakan bir enkoderde uyarlayarak, standart bir araştırma GPU’sunda aynı anda binlerce RNA bazını işleyebilen yaklaşık 12 milyon parametreli hafif bir model yaratmışlar.

Figure 1
Figure 1.

Milyonlarca Etiketlenmemiş RNA Dizisinden Öğrenme

RNAret’e RNA’nın “gramerini” öğretmek için ekip, RNAcentral veritabanından tür ya da işlev etiketi vermeden yaklaşık 30 milyon kodlamayan RNA dizisi üzerinde eğitti. Dil modellemeden ödünç alınan bir strateji kullandılar: dizinin küçük parçalarını gizleyip modelden eksik kısımları tahmin etmesini istemek. 600.000’den fazla eğitim adımı boyunca RNAret, bu maskelenmiş segmentleri tahmin etmeyi istikrarlı şekilde öğrendi ve böylece bazların düzenlenişindeki düzenlilikleri yakaladığını gösterdi. Araştırmacılar daha sonra modelin ürettiği iç temsilere baktıklarında, benzer rol ve uzunluktaki RNA’ların, modele hangi dizinin hangi kategoriye ait olduğu hiç söylenmemiş olmasına rağmen, düşük boyutlu alanda doğal olarak kümelendiğini buldular.

Modeli Gerçek Biyolojik Sorular Üzerinde Çalıştırmak

Yazarlar sonra bu öğrenilmiş RNA desenlerinin pratik problemlerin çözümüne yardımcı olup olmayacağını test ettiler. Önce, RNAret kısa bir düzenleyici RNA olan microRNA’nın daha uzun bir RNA molekülü üzerindeki hedef bölgeye bağlanıp bağlanamayacağını değerlendirmek üzere ince ayarlandı. 27.000’den fazla microRNA–mRNA çiftinden oluşan standart bir kıstas setinde, dizinin beş harflik parçalarını okuyan RNAret sürümü, birkaç daha büyük RNA dil modelini ve uzmanlaşmış bir derin öğrenme aracını geride bırakarak yüksek doğruluk ve F1 puanlarına ulaştı. Araştırmacılar modelin iç “retention score”larını incelediklerinde, modelin deneylerle bağlanmayı yönlendirdiği bilinen ana bölüm olan microRNA “tohum” bölgesine ve hedef RNA’daki eşleşen bölüme doğal olarak odaklandığını gördüler; bu da modelin kararlarının sahte kestirmeler yerine gerçek biyolojiye dayandığını gösteriyor.

Figure 2
Figure 2.

Şekilleri Yeniden Oluşturma ve RNA Türlerini Sınıflandırma

Sırada ekip, RNAret’i tek zincirli RNA’ların ikincil yapılarının nasıl kendi üzerine katlandığını tahmin etmeye zorladı. Temizlenmiş kıyas veri setleri kullanıldığında, en basit RNAret sürümü (bir bazı bir kerede okuyan) baz eşleşmeleri için oluşturduğu bağlantı haritaları, özellikle orta uzunluktaki RNA’lar için popüler derin öğrenme ve termodinamik araçlara kıyasla sıklıkla deneysel olarak bilinen yapılara daha yakın sonuçlar verdi. Modelin çıktıları, hangi bazların eşleşebileceğine dair fiziksel kuralları zorlayan bir son işlem adımıyla birleştirildiğinde temiz, daha az gürültülü tahminler sağladı. Üçüncü bir testte RNAret, insan ve fare genomlarındaki protein kodlayan RNA’ları uzun kodlamayan RNA’lardan ayırt etmeyi öğrendi. Kesip parçalara ayırmadan tam uzunlukta transkriptleri işleyebilme yeteneği sayesinde kısmi ve uzun dizilerle iyi başa çıktı; klasik açık-okuma-kadrosu yöntemlerini ve çoğu rakip RNA dil modelini, özellikle büyük insan veri setinde geride bıraktı.

Hızlı, Verimli ve Büyümeye Hazır

Doğruluğun ötesinde, RNAret hız için tasarlandı. Retention tabanlı mimarisi sayesinde model, tek bir yüksek özellikli GPU’da ön eğitim sırasında saniyede yüz bin civarında RNA birimini işleyebiliyor ve yapı tahmini veya sınıflandırma için ince ayarlandığında bile verimliliğini koruyor. Birçok son biyolojik dil modelinden çok daha küçük olmasına rağmen, çeşitli görevlerde son teknoloji ya da yakın performans gösteriyor. Yazarlar bunu Retentive Network’lerin biyolojik dizi analizleri için pratik, yorumlanabilir motorlar olabileceğine dair bir kavram kanıtı olarak görüyor. Daha fazla ince ayar ve DNA ile proteine uzanan genişletmelerle RNAret ve ilgili modeller, ham dizi verisini moleküllerin nasıl etkileştiği, katlandığı ve yaşam talimatlarını nasıl yerine getirdiği konusunda içgörüye dönüştürmek için günlük araçlar haline gelebilir.

Atıf: Shen, Y., Cao, G., Hu, Y. et al. Retentive Network promotes efficient RNA language modeling of long sequences. Commun Biol 9, 575 (2026). https://doi.org/10.1038/s42003-026-09757-x

Anahtar kelimeler: RNA dil modeli, Retentive Network, RNA yapı tahmini, microRNA etkileşimleri, uzun kodlamayan RNA