Clear Sky Science · tr
TATA bağlayıcı proteinin (TBP) çeşitli protein domain katlanma desenleriyle evrimsel ilişkisini destek vektör makineleri (SVM) kullanarak değerlendirme
Bir DNA “açma düğmesi” proteininin birçok başka proteinle nasıl bağlantı kurduğu
TATA‑box bağlayıcı protein ya da TBP, hücrelerimizin çalışkan bir elemanıdır: birçok promotörde DNA’yı kavrayarak genlerin açılmasına yardım eder. Bu çalışma, basit görünen ama sonuçları geniş olan bir soruyu sorar: çok farklı görevlere sahip başka proteinler TBP’nin temel şeklini gizlice paylaşıyor mu? 3B yapı karşılaştırması, dizi analizi ve modern makine öğrenmesi araçlarını birleştirerek yazarlar, TBP ile metabolizma, nörotransmitter kimyası ve hatta kanserle ilişkili yollarda görevli proteinler arasında gizli aile bağlarını izliyorlar.
Gen kontrolünün merkezindeki tek bir kilit protein
TBP, mayadan insana kadar organizmalarda gen ifadesinin kapısında oturur. TATA kutusu adı verilen kısa bir DNA dizisini tanır ve büyük transkripsiyon makinesinin RNA’ya genleri kopyalamasına yardımcı olmak için DNA’yı büker. Bu adım çok merkezi olduğundan, TBP’nin çekirdeğinin katlanışı — üç boyutlu düzeni — evrim boyunca büyük ölçüde korunmuştur. Yazarlar iyi çalışılmış bir TBP yapısı olan 1tba üzerinde yoğunlaşıp, amin asit dizileri ve günlük işlevleri ilk bakışta çok farklı görünse bile mimari taslağını paylaşabilecek diğer proteinleri aramak için bunu bir prob olarak kullanıyorlar.

Kalabalık bir protein evreninde yapısal kuzenleri bulmak
Modern veritabanları yüzbinlerce protein yapısı içerir; bu da yalnızca dizi yerine 3B şekle göre uzak akrabaları taramayı mümkün kılar. DALI ve TOP‑search adlı iki güçlü araç kullanarak ekip önce TBP’nin katlanışına benzeyen proteinleri çıkardı. Ardından bu adayları evrimsel bir domain kataloğuyla sınıflandırıp, yapısal olarak benzer ama işlevsel olarak çeşitli küçük bir örnek kümesine daralttılar. Bunlar metabolizmada önemli bir glutamin üreten enzim, birkaç tRNA işlemleme enziminde bulunan bir domain, yağ asidi kimyasında rol alan karakteristik “sıcak‑köfte (hot‑dog)” katlanışına sahip bir enzim ve beyin işlevi için kritik olan tetrahidrobiopterin yapan proteinleri içerir. Yapılarını TBP üzerine üst üste koymak, farklı görevlerine rağmen tanınabilir çekirdek motifleri paylaştıklarını gösterdi.
Makinalara gizli protein ailelerini tanımayı öğretmek
Vaka‑vaka incelemenin ötesine geçmek için yazarlar otomatik olarak TBP‑benzeri katlanışları işaretleyebilen makine öğrenmesi modelleri oluşturdu. TBP’ye veya ilgili her katlanışa ait olduğu bilinen büyük protein dizi setleriyle birlikte ilgisiz proteinlerden oluşan geniş bir “arka plan” seti topladılar. Her protein, her bir amino asidin ne sıklıkla göründüğü ve dizideki her olası amino asit çiftinin ne sıklıkta oluştuğu gibi basit sayısal özetlere dönüştürüldü. Bu profiller destek vektör makineleri (SVM) ve rastgele orman (random‑forest) modellerine beslendi; modeller bir katlanış tipini diğerlerinden ayırmayı öğrendi. Katı çapraz doğrulama kullanılarak modeller yüksek doğruluğa—çoğu zaman yüzde 95’in üzerinde—ulaştı; bu, sadece korunan bölgelerle ilgili dizilerin parçaları üzerinde eğitildiğinde bile geçerliydi.

Binlerce bilinmeyen yapı üzerinde modelleri test etmek
Bu eğitilmiş sınıflandırıcılarla donanmış ekip yapısal veritabanlarına geri döndü. DALI ve TOP‑search’ten alınan binlerce protein zincirini modellerinden geçirdi ve hangilerinin TBP‑benzeri ya da ilgili katlanışların istatistiksel işaretlerini taşıdığını inceledi. SVM ve rastgele orman yaklaşımları büyük ölçüde aynı fikirdeydi ve yapısal araçların da benzer olarak işaretlediği birçok adayı seçtiler. Bazı durumlarda, görünüşte alakasız aktivitelere sahip enzimler yine de güçlü biçimde TBP ile veya birbirleriyle kümelenmiş; bu da evrimin aynı temel çerçeveyi birçok farklı biyokimyasal rol için yeniden kullanabileceği fikrini pekiştiriyor.
Bu gizli bağlantılar neden önemli
Çalışma, TBP’nin glutamin sentetaz‑benzeri proteinler ve tRNA işlemleme enzimlerinin düzeltme (editing) domainleri dahil olmak üzere birkaç enzim ailesiyle derin yapısal akrabalık paylaştığı sonucuna varıyor. Diziler sürüklenmiş ve fonksiyonlar ayrışmış olsa bile, bu proteinler ortak mimari motifleri koruyor; bu da ortak bir atadan türemeyi düşündürüyor. Uzman olmayan bir okuyucu için ana mesaj şudur: doğa başarılı tasarımları yeniden kullanma eğilimindedir—bir katlanış, genleri açmaktan metabolizma ve beyin kimyasını ince ayarlamaya kadar çok farklı sorunları çözmek için tekrar tekrar uyarlanabilir. 3B yapı karşılaştırmasını makine öğrenmesiyle birleştirerek yazarlar, böyle ilişkileri ortaya çıkarmak için pratik bir araç seti sunuyor; bu, biyologların karakterize edilmemiş proteinlerin ne yapabileceğini tahmin etmelerine ve ilaç geliştiricileri için hastalıkla ilişkili yollarda evrim tarafından yönlendirilen yeni hedefleri işaret etmelerine yardımcı olur.
Atıf: Selvaraj, M.K., Kaur, J. Evaluating the evolutionary relationship of TATA binding protein (TBP) with various folding patterns of protein domains using support vector machine (SVM). Sci Rep 16, 7696 (2026). https://doi.org/10.1038/s41598-026-38883-z
Anahtar kelimeler: TATA-kutusu bağlayıcı protein, protein evrimi, makine öğrenmesi, protein yapısı, destek vektör makinesi