Clear Sky Science · tr

Gözetimsiz öğrenme, yüksek boyutlu insan proteomik verilerinde hastalıkla ilişkili yeni proteinleri ortaya çıkarıyor

· Dizine geri dön

Gözle Görülür Olanın İçine Saklanmış Kan İpuçları

Kanımız, hasta hissetmeden çok önce vücudumuzda olup bitenleri sessizce yansıtan proteinlerle doludur. Doktorlar halihazırda bu proteinlerin birkaçıyla testler yapıyor, ancak modern teknoloji artık binlercesini aynı anda ölçebiliyor. Bu çalışma büyük sonuçlar taşıyan basit bir soruyu soruyor: Bilgisayara bu devasa kan proteini haritalarını ne araması gerektiğini söylemeden serbestçe keşfetmesine izin verirsek, aklımıza bile gelmeyen hastalık bağlantılarını keşfedebilir mi?

Verilerin Kendi Kendine Konuşmasına İzin Vermek

Çoğu tıbbi algoritma “sağlıklı” veya “hipertansiyonu var” gibi net etiketlerle eğitilir. Bu yaklaşım güçlüdür ama özellikle kişi başına binlerce ölçüm olduğunda beklenmedik desenleri kaçırabilir. Burada araştırmacılar tersini yapıyor: hastaların hangi hastalığa sahip olduğunu bilmeden, kan proteini desenlerindeki benzerliklere göre insanları safça gruplandıran “gözetimsiz” öğrenmeyi kullanıyorlar. Ekip, UK Biobank adlı büyük bir kaynağı kullandı ve kanında 2.923 farklı protein için test yapılmış yaklaşık 53.000 katılımcıya odaklandı. Amaçları, bu sayı okyanusunda ortaya çıkan doğal grupların gerçek dünyadaki hastalıklarla örtüşüp örtüşmediğini görmek ve proteinler arasında yeni şüphelileri ortaya çıkarmaktı.

Figure 1
Figure 1.

Gizli Grupları Bulmanın İki Yolu

Böylesine zengin verilerle çalışmak pratik zorluklar getirir: ölçümler bazen eksiktir ve proteinlerin çokluğu sinyalleri gömebilir. Bunu aşmak için yazarlar DIRAM/COD adını verdikleri çift yollu bir çerçeve kurdular. Bir yol (DIRAM) eksik değerlerden kaçınmak için veriyi dilimlendirir, karmaşıklığı iki boyuta indirger ve ardından benzer insanların yoğun “adacıklarını” arar. Diğer yol (DIRCOD) önce eksik değerleri dikkatli tahminlerle doldurur, sonra grup tespiti için ağ biliminin ödünç aldığı bir topluluk bulma yöntemini kullanır. Her iki yol da tekrar tekrar rafine edilerek sonunda kan protein parmak izleri anlamlı şekilde farklı olan 55 ayrı katılımcı kümesi ortaya çıkarıldı.

Gerçek Hastalıkları Yansıtan Kümeler

Kümeler tanımlandıktan sonra ekip, yaş, cinsiyet ve en önemlisi tıbbi tanıların bu kümeler arasında nasıl dağıldığını kontrol etti. Bazı kümeler organ yetmezliği, nakiller ve kanser gibi ciddi durumlar için zenginleşmişti; bu da bu kümelerin protein imzalarının çok hasta bireylerin biyolojisini yakaladığını gösteriyordu. Yazarlar ardından çölyak hastalığı, hipertansiyon ve lösemi olmak üzere üç duruma odaklandı. Bu hastalıkların daha yaygın olduğu kümelerde hangi proteinlerin alışılmadık şekilde yüksek veya düşük olma eğiliminde olduğunu sordular. Sadece bu proteinleri ve basit eşik değerleri kullanarak hastalıkça zengin grupları “yeniden yaratarak”, bu protein desenlerinin hastalık olasılıklarını güçlü şekilde izlediğini gösterdiler—hatta çalışmadaki katılımcıları karıştırdıklarında bile.

Yeni Protein Şüphelileri ve Değişen İlişkiler

Bu yaklaşım tanıdık oyuncuları doğrulamanın ötesine geçti; yeni adayları da ön plana çıkardı. Hipertansiyon için UBE2L6, HNRNPUL1 ve BECN1 gibi proteinler öne çıktı; bunların hepsi daha önce damar veya kalp sorunlarıyla ilişkilendirilmişti. Çölyak hastalığında IGF2BP3 özellikle önemli olarak ortaya çıktı; bu, bağırsak bariyerinin korunmasına yardımcı olduğu yönündeki önceki ipuçlarıyla uyumlu ve NRXN3 ile CACNB1 gibi diğer umut verici proteinlerle birlikte anıldı. Lösemiyle ilişkili kümelerde LRCH4, WDR46, SERPINB1 ve NUB1 dahil olmak üzere birkaç proteinin davranışının değiştiği görüldü. Sadece düzeyleri farklı değil, birlikte yükselip alçalmaları da değişmişti; bu, kanser ve otoimmün hastalıklarda vücudun iç kontrol sistemlerinin yeniden kablolanmasına işaret ediyor olabilir.

Figure 2
Figure 2.

Kan Haritalarından Geleceğin Tıbbına

Birçok proteini aynı anda anlamlandırmak için araştırmacılar bunları genel desen değişikliklerini özetleyen tek bir “eksen”e de sıkıştırdılar. Bu eksen boyunca hipertansiyon veya çölyak hastalığına sahip olma ihtimalleri istikrarlı şekilde arttı ve bu eğilim çalışmadaki herkese genişletildiğinde bile devam etti. Uzman olmayan biri için çıkarım basit: algoritmalar binlerce kan proteinine göre insanları serbestçe sıralamasına izin verildiğinde, doğal sağlıkla ilgili grupları bulabilir, bilinen hastalık belirteçlerini doğrulayabilir ve yenilerini ortaya çıkarabiliriz. Biyobankalar yüzbinlerce insana ve daha fazla proteine ulaştıkça, bu tür gözetimsiz keşifler doktorların hastalığı daha erken tespit etmesine, neden bazı insanların hasta olurken bazılarının olmadığını anlamaya ve gelecekteki tedaviler için yeni hedefler göstermeye yardımcı olabilir.

Atıf: Bernard, E., Wang, Y., Chen, M. et al. Unsupervised learning reveals novel disease-associated proteins in high-dimensional human proteomic data. Sci Rep 16, 10185 (2026). https://doi.org/10.1038/s41598-026-41385-7

Anahtar kelimeler: kan proteinleri, gözetimsiz öğrenme, biyobelirteçler, kişiye özel tıp, hastalık riski