Clear Sky Science · tr
Kanser verilerinin gözlemsel tıbbi sonuçlar ortak veri modeline dönüştürülmesi için veri uyum süreçleri
Neden kanser verilerini bir araya getirmek önemli
Kanser bakımı; hastaneler, kayıtlar, laboratuvarlar ve hatta hasta anketleri gibi kaynaklardan büyük miktarda bilgi üretir, ancak bu kayıtlar sıklıkla birbirleriyle kolayca "konuşamayan" farklı formatlarda saklanır. Bu makale, araştırmacıların bu dağınık kanser bilgisini daha güvenilir biçimde tedavi biçimleri, sağkalım ve nüfus sağlığı çalışmaları için kullanabilmek üzere tek, iyi düzenlenmiş bir formata dönüştürmek amacıyla nasıl açık, adım adım bir süreç tasarladıklarını açıklamaktadır.
Tek bir paylaşılan resim yerine birçok veri adası
Kanser verileri olağanüstü derecede ayrıntılıdır. Tümör türü, evre, genetik belirteçler, zaman içinde uygulanan tedaviler, yan etkiler ve sonuçlar gibi bilgileri tanımlar ve elektronik sağlık kayıtları, kanser kayıtları, sigorta talepleri, biyobankalar ve anketler gibi pek çok kaynaktan gelir. Her kaynak kendi yapı ve adlandırma kurallarını kullandığı için bunları birleştirmek zordur ve genellikle anlam kaybı ya da boşluklarla sonuçlanır. Gözlemsel Tıbbi Sonuçlar Ortak Veri Modeli (OMOP CDM), sağlık verileri için paylaşılan bir yapı sunar ve dünya çapında giderek daha fazla kullanılmaktadır. Ancak kanser verilerini bu modele nasıl aktarıp dönüştüreceğe dair mevcut kılavuzlar genel düzeyde kalmış; ekiplerin kendi yerel çözümlerini geliştirmesine yol açmıştır.

Önceki projeler ne gösteriyor
Yazarlar, OMOP formatına kanser verilerini dönüştürmeye çalışmış bilimsel makaleler ve uluslararası bir veri bilimi topluluğunun sunumlarından derlenen 20 projeyi incelediler. Çoğu proje ya belirli tedavilerin sonuçlarını incelemek gibi hasta düzeyinde araştırmalara ya da sağkalım eğilimleri ve hastalık izleme gibi nüfus düzeyi sorulara odaklanmıştı. Kanser kayıtları ve hastane kayıtları en yaygın veri kaynaklarıydı; genellikle Avrupa merkezlerinden geldi ve Amerika ile Asya’dan daha az örnek vardı. Birçok ekip, kaynak veriyi keşfetmek, eşlemeleri tasarlamak, kaliteyi kontrol etmek ve tedavi rejimlerini türetmek için OMOP topluluğundan gelen özel yazılım araçlarını kullandı, ancak işlerini organize etme biçimleri büyük ölçüde farklılık gösterdi.
Sürekli ortaya çıkan temel engeller
Bu projelerde üç tür sorun tekrar tekrar ortaya çıktı. Birincisi, başlangıç verileri dağınık veya eksikti: önemli ayrıntılar eksik, serbest metin olarak saklanmış veya birkaç sistem arasında dağılmıştı ve birden çok kaynağın birleştirilmesi yoğun temizlik ve kürasyon gerektiriyordu. İkincisi, yerel kodlar ve tanımları standart OMOP terimlerine eşlemek zordu; özellikle evreleme, belirteç sonuçları ve karmaşık ilaç kombinasyonları gibi ayrıntılı kanser bilgileri için standart sözlükler bazen yeterince ince taneli değildi ve serbest metin ya da genomik veriler ek araçlar ve uzman girişi gerektiriyordu. Üçüncüsü, bir eşleme kurulduktan sonra sabit kalmıyordu; ortak veri modeli, sözlükler ve araçlar hızla evrildiği için ekiplerin sistemlerini zaman içinde güncel tutma planları olması gerekiyordu.
Ekipler için beş adımlı yol haritası
İncelemedeki kalıpları ve kanser verisi uzmanlarından alınan geri bildirimleri kullanarak yazarlar onkolojiye uyarlanmış genel bir beş adımlı uyum sürecini özetlediler. Birinci adım olan Başlatma, disiplinlerarası bir ekip kurmayı, araştırma amacında anlaşmayı, yerel kuralları anlamayı ve OMOP ekosistemiyle tanışmayı kapsar. Gereksinim Analizi, kaynak veriyi daha derinlemesine inceleyerek hangi tür verilerin var olduğunu, nasıl yapılandırıldıklarını, ne kadar eksiksiz ve güvenilir olduklarını ve en büyük risklerin nerede bulunduğunu belirler. Tasarım Planlaması ise bu anlayışı verileri nasıl dönüştürecek ve eşleyecekleri, hangi araçları kullanacakları, tedavi dönemleri gibi bakım bölümlerini nasıl ele alacakları ve başarıyı nasıl değerlendirecekleri konusunda ayrıntılı bir plana çevirir.

Ham kayıtlardan kullanılabilir araştırma verisine
Dördüncü adım olan Teknik Uygulama planı hayata geçirir. Bu aşamada ekipler veriyi temizler ve kürate eder, ilgili parçaları çıkarır, bunları OMOP tablolarına dönüştürür ve sistematik bir şekilde kaliteyi kontrol eder. Her hastanın kanser yolculuğunun zaman çizelgelerini oluşturmak için tanılar, işlemler ve ilaç maruziyetleri gibi ilişkili olayları temsil eden OMOP tablolarının kullanılması özellikle önem kazanır. Beşinci adım olan Bakım ise işin asla tamamen bitmediğini kabul eder: sözlükler, yazılım araçları ve onkoloji bilgisi değişir; bu nedenle ekiplerin güncellemeleri planlamaları, yeni sorunları izlemleri ve eşlemelerini ile uygulama kurallarını düzenli olarak iyileştirmeleri gerekir. Tüm adımları destekleyen iki yatay ilke vardır: yinelemeli test ve iyileştirme döngüleri ile kararların dikkatli bir şekilde belgelenmesi, böylece çalışma şeffaf ve yeniden kullanılabilir olur.
Hastalar ve araştırmacılar için anlamı nedir
Halk için ana mesaj, mevcut kanser verilerinin daha iyi kullanılmasının yeni aygıtlardan ziyade bilgiyi düzenlemek için dikkatli, paylaşılmış yöntemlere dayanması gerektiğidir. Bu makale, herhangi bir hastane veya araştırma grubunun yerel kurallara ve teknolojilere saygı göstererek dağınık kanser kayıtlarını ortak bir formata dönüştürmek için uyarlayabileceği pratik bir yol haritası sunmaktadır. Verilerin merkezler ve ülkeler arasında birleştirilmesini kolaylaştırarak önerilen süreç, kanserlerin nasıl tedavi edildiğine ve hastaların gündelik uygulamadaki durumlarına dair daha güvenilir çalışmaların yapılmasını desteklemeyi, böylece klinisyenlerin ve politika yapıcıların kararlarını daha açık ve eksiksiz bir resme dayandırmalarına yardımcı olmayı amaçlamaktadır.
Atıf: Nada, I.P., Bonacina, S. Data harmonization processes of cancer data into the observational medical outcomes partnership common data model. Sci Rep 16, 15993 (2026). https://doi.org/10.1038/s41598-026-53570-9
Anahtar kelimeler: kanser verileri, OMOP ortak veri modeli, veri uyumluluğu, gerçek dünya kanıtı, sağlık bilişimi