Clear Sky Science · tr
Diyabet araştırmaları için bimodal bir veri seti
Diyabetle yaşayanlar veya diyabetten endişe duyanlar için neden önemli
Diyabet dünya çapında yüz milyonlarca kişiyi etkiliyor, ancak araştırmacıların böbrek yetmezliği, körlük veya kalp hastalığı gibi ciddi komplikasyonları kimlerin geliştireceğini öngörmesi hâlâ zor. Büyük bir engel, diyabetin zaman içinde vücutla nasıl etkileştiğini gösteren geniş, ayrıntılı ve gerçek dünya verilerinin eksikliğidir. Bu makale, bilim insanlarının daha iyi tahmin araçları geliştirmesine ve diyabetin günlük klinik koşullarda nasıl seyrettiğine dair anlayışı derinleştirmesine yardımcı olabilecek, yaklaşık altı bin hastayı içeren zengin yeni bir veri setini tanıtıyor.
Sadece küçük araştırma örnekleri değil, gerçek hastalardan büyük bir havuz
Yazarlar, Şanghay’daki büyük bir diyabet merkezinde iki aylık bir dönemde tedavi gören 5.922 kişiden bilgi topladı. Yalnızca birkaç düzine veya birkaç yüz gönüllüyü izleyen önceki birçok çalışmanın aksine, bu veri seti doktorların gerçekte gördüğü hasta tipini yansıtıyor: 18–91 yaş arası yetişkinler, geniş bir vücut yapısı, kan şekeri düzeyi, hastalık süresi ve komplikasyon çeşitliliği. Gizliliği korumak için tüm kişisel tanımlayıcılar kaldırıldı ve değişken adları dünya çapındaki araştırmacıların veriyi kolayca anlaması ve yeniden kullanması için standartlaştırıldı.
Daha eksiksiz bir öykü anlatan iki tür veri
Bu kaynak “bimodal” olarak tanımlanıyor; yani sayısal ölçümler ile kişilerin tıbbi geçmişleri ve yaşam tarzları hakkında yapılandırılmış, metin-benzeri bilgileri birleştiriyor. Her hasta için toplamda 190 farklı özellik bulunuyor. Bunlar vücut kitle indeksi (BKİ) gibi beden ölçümlerini; çoklu kan şekeri okumalarını; karaciğer, böbrek ve kan testlerinin ayrıntılı panellerini; insülin üretim belirteçlerini içeriyor. Bu sayısal verilerin yanında sigara ve alkol alışkanlıkları, çalışma türü, diyabet belirtilerinin farkındalığı, aile öyküsü ve kalp hastalığı, inme, sinir hasarı, görme sorunları veya diyabetik ayak gibi komplikasyonların varlığına ilişkin kayıtlar bulunuyor. Birlikte bu katmanlar, diyabetin tüm vücutla ve günlük yaşamla nasıl etkileştiğine dair daha eksiksiz bir resim sunuyor.

Önceki diyabet veri setlerinin bıraktığı boşlukları doldurmak
Makale, bu yeni veri setini birkaç iyi bilinen kamu veri kaynağıyla karşılaştırarak bağlama oturtuyor. Mevcut bazı derlemeler gelişmiş diyabet teknolojisine sahip hastaları izleyip kan şekerini 24 saat takip ediyor, ancak genellikle komplikasyon bilgisi eksik oluyor. Diğerleri çok az sayıdaki kişiden moleküler ayrıntılar sunuyor, bu da gerçek kliniklere genelleme yapmayı zorlaştırıyor. Bazıları sürekli glikoz ölçümleri sağlasa da, birinin ne kadar süredir diyabeti olduğu veya böbrek hastalığı olup olmadığı gibi önemli arka plan faktörlerini atlıyor. Buna karşılık yeni veri seti kan şekeri kontrolü, karaciğer ve böbrek fonksiyonu, kan sayımları, yaşam tarzı ve komplikasyon öyküsü gibi birçok sistemi aynı anda bir araya getiriyor; bu nedenle gelecekteki riskleri tahmin etmeyi veya hastalığın farklı desenlerini sınıflandırmayı hedefleyen makine öğrenimi modelleri için özellikle uygun.
Sayılardan tıbbi açıdan mantıklı sonuçlar çıktığını kontrol etmek
Verinin güvenilir olduğunu göstermek için araştırmacılar klinisyenlerin beklediğine benzer bir dizi gerçeklik kontrolü yaptı. Vücut ağırlığının kan şekeriyle nasıl ilişkili olduğunu incelediler ve daha yüksek BKİ’nin genellikle açlık ve yemek sonrası glikoza eşlik ettiğini, çoğu değerin makul klinik aralıklarda olduğunu buldular. Kan şekeri ölçümlerinin hasta grubunda nasıl dağıldığına baktılar ve tip 2 diyabete tipik desenler gözlemlediler: birçok bireyin daha yüksek kilo kategorilerinde kümelenmesi ve iki saatlik postprandiyal glikozda yükselme eğilimi. Ayrıca aynı kişi içinde açlık ve yemek sonrası şeker okumalarının birbirini desteklediğini ve böbrek fonksiyon evrelerinin ortalama glikoz düzeyleriyle nasıl örtüştüğünü kontrol ettiler. Son olarak, kanda ölçülen insülin düzeylerinin beklenen şekilde insülin direnç endeksiyle güçlü ilişki gösterdiğini doğruladılar; bu, temel fizyolojiyle uyumlu bir sonuçtur.

Gelecek bakım ve araştırmalar için anlamı
Açıkça ifade etmek gerekirse, bu makale yeni bir ilaç veya diyet test etmiyor; bunun yerine diyabet bakımını daha akıllı hale getirecek araçları oluşturup değerlendirmek için gereken ham veriyi sunuyor. Veri seti büyük, ayrıntılı ve kamuya açık olduğu için araştırmacılar yüksek riskli hastaları daha erken tespit eden, hangi risk faktörleri kombinasyonlarının en önemli olduğunu anlayan veya farklı komplikasyon desenlerine sahip hasta alt gruplarını karşılaştıran algoritmalar eğitmek için bunu kullanabilirler. Akıllıca ve diğer kaynaklarla birlikte kullanıldığında, bu tür bir veri kaynağı diyabet bakımını tek tip yaklaşımdan daha kişiselleştirilmiş tahminlere ve nihayetinde hastalığın en korkulan sonuçlarının daha iyi önlenmesine doğru taşımaya yardımcı olabilir.
Atıf: Li, J., Zheng, H., Zhou, Y. et al. A bimodal dataset for diabetes research. Sci Data 13, 652 (2026). https://doi.org/10.1038/s41597-026-06923-y
Anahtar kelimeler: diyabet veri seti, klinik veri, makine öğrenimi, diyabetik komplikasyonlar, risk tahmini