Clear Sky Science · tr

Metagenomik madencilik ve makine öğrenimi ile Cas9 PAM çeşitliliğini ortaya çıkarmak

· Dizine geri dön

Gelecekteki gen düzenleme için bunun önemi

CRISPR modern gen düzenlemenin simgesi haline geldi, ancak sessiz bir kural hâlâ ne yapabileceğini sınırlıyor: DNA’daki her kesik kısa bir “izin belgesi” dizisinin yanında olmalı. PAM adı verilen bu kısa desenler, popüler Cas9 enziminin nerede çalışıp çalışamayacağını belirliyor. Bu çalışma, mikrobiyal DNA’nın büyük miktarlarını taramakla birlikte gelişmiş makine öğrenimini birleştirmenin bu izin belgelerinin muazzam gizli çeşitliliğini ortaya çıkarabileceğini gösteriyor. Bu yeni harita, insan genomunda daha pek çok bölgeyi hassas ve daha güvenli terapilere açabilir.

CRISPR kesiklerini yönlendiren gizli kurallar

Cas9 ve benzeri enzimler, bakteriler ve arkelerde bulunan doğal bağışıklık sisteminin bir parçasıdır. Kendi DNA’larını kesmekten kaçınmak için bu mikroorganizmalar, hedef sitin yanında çok kısa bir harf dizisi olan bir PAM araması için Cas proteinleri kullanır. Sadece o PAM mevcut olduğunda Cas9 DNA’yı açar ve kılavuz RNA’sının eşleşme kontrolü yapmasına izin verir; her şey uyarsa kesik tetiklenir. Tıpta sorun şu ki, standart Streptococcus pyogenes Cas9’u gibi yaygın laboratuvar araçları yalnızca dar PAM desenlerini tanır. Hastalık yapıcı bir mutasyonun yakınında uygun dizi yoksa, günümüz araçları doğruluktan ödün vermeden ona ulaşamaz.

Figure 1
Şekil 1.

Yeni seçenekler için mikrobiyal dünyayı madencilik yapmak

Yazarlar, farklı Cas9 proteinlerinin doğada hangi PAM’ları tanıdığını sistematik olarak haritalamayı amaçladılar. 3,8 milyondan fazla bakteri ve arkea genomunu ve mikropları enfekte eden veya aralarında hareket eden 7,4 milyondan fazla viral ve plazmid dizisini taradılar. CRISPR dizilerini tanımlayarak, bunları yakınlardaki Cas9 genleriyle ilişkilendirip saklanan “hafıza” spacer’larını invaziv virüs ve plazmidlerle eşleştirerek hangi kısa DNA desenlerinin gerçek hedeflerin kenarlarında eğilimli olduğunu görebildiler. Bunun sonucunda, her biri bir konsensüs PAM profili ile eşleştirilmiş 8003 Cas9 grubunu içeren ve evrimsel bir ağaç üzerinde düzenlenen, Cas9 enzimlerinin yakın akraba gruplarının benzer PAM tercihlerini paylaşma eğiliminde olduğunu vurgulayan kamuya açık CRISPR-PAMdb katalogunu oluşturdular; buna rağmen genel olarak çarpıcı bir çeşitlilik sergileniyor.

Veri tükendiğinde modele öğrenmesine izin verin

Bu devasa taramaya rağmen, buldukları Cas9 proteinlerinin çoğunda PAM’ı doğrudan okumak için yeterli eşleşen viral hedef yoktu. Boşlukları doldurmak için ekip CICERO adlı bir makine öğrenimi modeli geliştirdi. CICERO, amino asit dizilerinin genel desenlerini öğrenmiş güçlü bir protein “dil modeli” kullanır ve onu herhangi bir Cas9 proteini için PAM’daki on pozisyonda her bir DNA harfinin görünme olasılığını tahmin edecek şekilde ince ayarlar. Model CRISPR-PAMdb’den elde edilen PAM profilleriyle eğitildi ve sonra çapraz doğrulama ile ve PAM’ları deneysel olarak ölçülmüş 79 Cas9 enzimi üzerinde test edildi; tahmin ile gerçeklik arasında güçlü bir uyum sağladı.

Figure 2
Şekil 2.

Ne kadar güvenli olduğumuzu bilmek

CICERO’nun kilit özelliği sadece bir PAM tahmin etmemesi—aynı zamanda her tahminin ne kadar güvenilir olduğunu da tahmin etmesidir. PAM desenlerini tahmin etmeyi öğrendikten sonra, araştırmacılar aynı Cas9 dizisini alıp PAM tahmininin ne kadar doğru olacağını öngörmeyi öğrenen ikinci, hafif bir ağ eğittiler. Daha yüksek güven skorları gerçek dünya doğruluğuyla güçlü bir şekilde ilişkileniyordu. Bu güven filtresini kullanarak ekip, 50.000’den fazla ek Cas9 proteinine PAM açıklamaları genişletti ve bunların 17.000’den fazlası yüksek güven olarak sınıflandırıldı. Bu, hedefleme kuralları makul derecede iyi anlaşılan Cas9 varyantları menüsünü büyük ölçüde genişletiyor.

Genetik hastalıkların tedavisi için anlamı

Bu yeni kaynakların neden önemli olduğunu göstermek için yazarlar, prensipte baz düzenleyiciler kullanılarak düzeltilebilecek ClinVar veritabanındaki on binlerce hastalıkla ilişkili tek harfli mutasyonu incelediler—baz düzenleyiciler her iki ipliği kesmeden bir DNA harfini değiştirir. Standart Cas9 enziminin bu tür bölgelerin yalnızca yaklaşık yarısına ulaşabildiğini, bunun da katı PAM gereksinimlerinden kaynaklandığını buldular. CRISPR-PAMdb’deki Cas9 akrabalarına ve geniş ama hâlâ özgül bir dizi yakın diziyi tanıyan yüksek güvenli CICERO tahminlerine izin verdiklerinde, bu mutasyonların neredeyse tamamı teorik olarak hassasiyeti kaybetmeden erişilebilir hale geldi.

Hassas DNA cerrahisi için daha büyük bir alet kutusu

Basitçe söylemek gerekirse, bu çalışma iki şey inşa ediyor: binlerce doğal Cas9 proteininin tercih ettiği kısa DNA desenleriyle bağlanan devasa, halka açık bir harita ve dizilerinden daha fazla enzim için bu tercihleri tahmin edebilen bir yapay zeka kılavuzu. Birlikte, mikroplar dünyasını gelecekteki gen editörleri için zengin bir parça kütüphanesine çeviriyorlar. Araştırmacılar bu Cas9 varyantlarını laboratuvarda rafine edip test ettikçe, klinisyenler daha önce ulaşılamayan hastalık yapıcı mutasyonlara erişebilecek daha güvenli, daha çok yönlü araçlar kazanabilir ve gerçekten hassas genom cerrahisini gerçeğe bir adım daha yaklaştırabilirler.

Atıf: Fang, T., Bogensperger, L., Feer, L. et al. Uncovering Cas9 PAM diversity through metagenomic mining and machine learning. Nat Commun 17, 2510 (2026). https://doi.org/10.1038/s41467-026-69098-5

Anahtar kelimeler: CRISPR-Cas9, PAM çeşitliliği, metagenomik, makine öğrenimi, genom düzenleme