Clear Sky Science · ar

عمليات توحيد بيانات السرطان إلى نموذج بيانات النتائج الطبية المرصودة المشترك (OMOP)

· العودة إلى الفهرس

لماذا يهم جمع بيانات السرطان معًا

تنتج رعاية السرطان كميات هائلة من المعلومات من المستشفيات والسجلات والمختبرات وحتى استبيانات المرضى، لكن هذه السجلات غالبًا ما تُخزن بصيغ مختلفة لا يمكنها "التواصل" بسهولة مع بعضها البعض. يشرح هذا المقال كيف صمّم الباحثون عملية واضحة وخطوة بخطوة لتحويل هذه المعلومات السرطانية المبعثرة إلى صيغة واحدة ومنظمة بشكل جيد بحيث يمكن استخدامها بشكل أكثر موثوقية في دراسات أنماط العلاج والبقاء وصحة السكان.

جزر بيانات متعددة بدلًا من صورة مشتركة

تتميّز بيانات السرطان بتفاصيل غير مألوفة. تصف نوع الورم ومرحلة المرض والمؤشرات الجينية والعلاجات عبر الزمن والآثار الجانبية والنتائج، وتأتي من مصادر عديدة مثل السجلات الصحية الإلكترونية وسجلات السرطان وبيانات المطالبات التأمينية والبنوك الحيوية والاستبيانات. ونظرًا لأن كل مصدر يستخدم هيكلًا وقواعد تسمية خاصة به، يصبح دمجها صعبًا وغالبًا ما يؤدي إلى فراغات أو فقدان معنى. يوفر نموذج بيانات النتائج الطبية المرصودة المشترك (OMOP CDM) هيكلًا مشتركًا للبيانات الصحية، ويُستخدم بشكل متزايد على مستوى العالم. ومع ذلك، كانت الإرشادات الموجودة حول كيفية نقل بيانات السرطان إلى هذا النموذج عامة، مما دفع الفرق لاختراع حلول محلية خاصة بها.

Figure 1. تحويل سجلات السرطان المبعثرة من مصادر متعددة إلى مجموعة بيانات بحثية مشتركة ومرتبة جيدًا.
Figure 1. تحويل سجلات السرطان المبعثرة من مصادر متعددة إلى مجموعة بيانات بحثية مشتركة ومرتبة جيدًا.

ما تكشفه المشاريع السابقة

راجع المؤلفون 20 مشروعًا، مأخوذة من مجلات علمية وعروض من مجتمع دولي لعلم البيانات، كانت قد حاولت بالفعل تحويل بيانات السرطان إلى صيغة OMOP. ركزت معظمها إما على أبحاث مستوى المريض، مثل دراسة نتائج علاجات محددة، أو على أسئلة مستوى السكان مثل اتجاهات البقاء ومراقبة الأمراض. كانت سجلات السرطان وسجلات المستشفيات أكثر مصادر البيانات شيوعًا، عادة من مراكز أوروبية، مع أمثلة أقل من الأمريكتين وآسيا. استخدمت العديد من الفرق أدوات برمجية متخصصة من مجتمع OMOP لاستكشاف بيانات المصدر وتصميم الخرائط وفحص الجودة واستخلاص نظم العلاج، لكن طرائق تنظيم عملهم اختلفت بشكل واسع.

العقبات الأساسية المتكررة

عبرت هذه المشاريع عن ثلاث مشكلات متكررة مرارًا وتكرارًا. أولًا، كانت البيانات الأولية فوضوية أو غير مكتملة: تفاصيل مهمة مفقودة أو مخزنة كنص حر أو موزعة عبر أنظمة متعددة، وكان دمج مصادر متعددة يتطلب تنظيفًا وتدقيقًا مكثفين. ثانيًا، كان ربط الرموز والوصف المحلي بالمصطلحات القياسية في OMOP صعبًا، خاصة للتفاصيل السرطانية الغنية مثل تحديد المرحلة ونتائج المؤشرات الحيوية وتركيبات الأدوية المعقدة؛ فالمفردات القياسية لم تكن أحيانًا ذات دقة كافية، وكانت النصوص الحرة أو البيانات الجينية تحتاج أدوات إضافية ومدخلات خبراء. ثالثًا، حتى بعد بناء الخرائط، لم تبقَ ثابتة؛ إذ يتطور نموذج البيانات المشترك والمفردات والأدوات بسرعة، لذا احتاجت الفرق إلى خطط للحفاظ على أنظمتها محدثة بمرور الوقت.

خارطة طريق من خمس خطوات للفرق

باستخدام أنماط مستخلصة من المراجعة وردود فعل خبراء بيانات السرطان، استخلص المؤلفون عملية توحيد عامة من خمس خطوات مصممة للأونكولوجيا. تغطي الخطوة الأولى، "الشروع"، تشكيل فريق متعدد التخصصات، الاتفاق على هدف البحث، فهم القواعد المحلية، والتعرف على منظومة OMOP. ثم تتعمق خطوة تحليل المتطلبات في بيانات المصدر: أنواع البيانات الموجودة، كيف هي مُهيكلة، مدى اكتمالها وموثوقيتها، وأين تكمن أكبر المخاطر. تحول خطوة تخطيط التصميم هذا الفهم إلى خطة مفصلة لكيفية تحويل الخرائط والبيانات، ما الأدوات المستخدمة، كيفية التعامل مع حلقات الرعاية مثل دورات العلاج، وكيفية تقييم النجاح.

Figure 2. تنظيف ومحاذاة تدريجيّة للسجلات السرطانية الأولية إلى حلقات مترابطة تتتبع رعاية كل مريض عبر الزمن.
Figure 2. تنظيف ومحاذاة تدريجيّة للسجلات السرطانية الأولية إلى حلقات مترابطة تتتبع رعاية كل مريض عبر الزمن.

من السجلات الخام إلى بيانات بحث قابلة للاستخدام

الخطوة الرابعة، "التنفيذ التقني"، تُنفّذ الخطة على أرض الواقع. هنا تنظف الفرق البيانات وتدققها، وتستخرج الأجزاء ذات الصلة، وتحولها إلى جداول OMOP، وتفحص الجودة بطريقة منهجية. يُعطى اهتمام خاص لبناء جداول زمنية لمسار كل مريض السرطاني باستخدام جداول OMOP التي تمثل حلقات الرعاية والأحداث المرتبطة بها مثل التشخيصات والإجراءات والتعرض للأدوية. تعترف الخطوة الخامسة، "الصيانة"، بأن العمل لا ينتهي أبدًا: تتغير المفردات وأدوات البرمجيات ومعرفة الأونكولوجيا، لذا يجب على الفرق جدولة تحديثات ومراقبة المشكلات الجديدة وتنقيح الخرائط والاتفاقيات. مبدآن مشمولان يدعمان كل الخطوات: دورات متكررة من الاختبار والتحسين، وتوثيق دقيق للقرارات بحيث يكون العمل شفافًا وقابلًا لإعادة الاستخدام.

ما الذي يعنيه ذلك للمرضى والباحثين

للقراء غير المتخصصين، الرسالة الأساسية أن الاستخدام الأفضل لبيانات السرطان القائمة يعتمد أقل على أجهزة جديدة وأكثر على مناهج مشتركة ومدروسة لتنظيم المعلومات. يقدم هذا المقال خارطة طريق عملية يمكن لأي مستشفى أو مجموعة بحثية تكييفها لجمع السجلات السرطانية المباثرة في صيغة مشتركة، مع احترام القواعد والتقنية المحلية. من خلال تسهيل جمع البيانات عبر مراكز وبلدان متعددة، تهدف العملية المقترحة إلى دعم دراسات أكثر موثوقية حول كيفية علاج السرطان وكيفية تعامل المرضى في الممارسة اليومية، مما يساعد الأطباء وصانعي السياسات على اتخاذ قرارات بناءً على صورة أوضح وأكثر اكتمالًا.

الاستشهاد: Nada, I.P., Bonacina, S. Data harmonization processes of cancer data into the observational medical outcomes partnership common data model. Sci Rep 16, 15993 (2026). https://doi.org/10.1038/s41598-026-53570-9

الكلمات المفتاحية: بيانات السرطان, نموذج بيانات OMOP المشترك, توحيد البيانات, الأدلة من العالم الحقيقي, معلوماتية صحية