Clear Sky Science · ar
يكشف التعلم غير المراقب بروتينات مرتبطة بالأمراض في بيانات البروتيوم البشري عالية الأبعاد
دلائل في الدم مخفية في العلن
يمتلئ دمنا ببروتينات تعكس بهدوء ما يحدث داخل أجسامنا قبل أن نشعر بالمرض بفترة طويلة. يستخدم الأطباء بالفعل مجموعة صغيرة من هذه البروتينات كاختبارات، لكن التكنولوجيا الحديثة قادرة الآن على قياس آلاف البروتينات دفعة واحدة. تطرح هذه الدراسة سؤالاً بسيطاً بآثار كبيرة: إذا تركنا الحاسوب يستكشف بحر خرائط بروتينات الدم الضخم دون إرشاد عما يبحث عنه، فهل يمكنه اكتشاف روابط جديدة بالأمراض لم نفكر حتى في اختبارها؟
ترك البيانات تتحدث عن نفسها
تُدرَّب معظم الخوارزميات الطبية على تسميات واضحة مثل «سليم» أو «يعاني من ارتفاع ضغط الدم». هذا النهج قوي لكنه قد يفوّت أنماطاً غير متوقعة، خصوصاً عند مواجهة آلاف القياسات لكل شخص. هنا، اختار الباحثون المسار المعاكس: استخدموا التعلم «غير المراقب» الذي يجمع الأشخاص بناءً على التشابه في أنماط بروتيناتهم في الدم فقط، دون معرفة من لديه أي مرض. عمل الفريق مع مورد ضخم، UK Biobank، مركزّين على ما يقرب من 53,000 مشارك أُعيد اختبار دمهم على 2,923 بروتيناً مختلفاً. كان الهدف معرفة ما إذا كانت التجمعات الطبيعية في هذا المحيط الرقمي ستتطابق مع أمراض العالم الحقيقي وتكشف عن بروتينات مشتبه بها جديدة.

مساران لاكتشاف التجمعات الخفية
العمل مع بيانات غنية كهذه يرافقه تحديات عملية: القياسات قد تكون مفقودة أحياناً، وعدد البروتينات الهائل قد يغمر الإشارات المفيدة. للتعامل مع ذلك بنى المؤلفون إطار عمل ثنائي المسار سمّوه DIRAM/COD. يقوم أحد المسارين (DIRAM) بتقطيع البيانات لتجنّب القيم المفقودة، ويقلل التعقيد إلى بُعدين ثم يبحث عن «جزر» كثيفة من أشخاص متشابهين. أما المسار الآخر (DIRCOD) فيملأ أولاً القيم المفقودة بتقديرات محكمة، ثم يستخدم طريقة للكشف عن المجتمعات مستعارة من علوم الشبكات لاكتشاف المجموعات. يتم تنقيح كلا المسارين تكرارياً، مما أدى في النهاية إلى 55 مجموعة مميزة من المشاركين الذين تختلف بصمات بروتيناتهم الدموية بطرق ذات مغزى.
تجمعات تعكس أمراضاً حقيقية
بمجرد تحديد التجمعات، تحقق الفريق من كيفية توزيع العمر والجنس والتشخيصات الطبية، وهو الأمر الحاسم، عبرها. كانت بعض التجمعات غنية بحالات خطيرة مثل فشل الأعضاء، وزرع الأعضاء والسرطان، ما يوحي أن توقيعات البروتين فيها التقطت بيولوجيا المرضى المتألمين جداً. ركز المؤلفون بعد ذلك على ثلاث حالات: الداء البطني (سيلياك)، وارتفاع ضغط الدم واللوكيميا. سألوا أي البروتينات تميل لأن تكون مرتفعة أو منخفضة بشكل غير عادي في التجمعات التي كانت هذه الأمراض أكثر شيوعاً فيها. من خلال «إعادة إنشاء» مجموعات غنية بالمرض باستخدام تلك البروتينات وحدها وعوامل عتبة بسيطة، أظهروا أن أنماط هذه البروتينات كانت تتتبّع احتمال المرض بقوة — حتى عند مزج مشاركين من مختلف أرجاء الدراسة.
مشتبه بهم بروتينيون جدد وعلاقات متغيرة
لم يقتصر هذا النهج على تأكيد العناصر المألوفة؛ بل أبرز مرشحين جدد. بالنسبة لارتفاع ضغط الدم، برزت بروتينات مثل UBE2L6 وHNRNPUL1 وBECN1، كلها ارتبطت سابقاً بمشكلات الأوعية الدموية أو القلب في دراسات أخرى. بالنسبة لمرض السيلياك، ظهر IGF2BP3 كمهم للغاية، متوافقاً مع تلميحات سابقة بأنه يساعد في الحفاظ على حاجز الأمعاء، إلى جانب بروتينات واعدة أخرى مثل NRXN3 وCACNB1. في التجمعات المرتبطة باللوكيميا، أظهرت عدة بروتينات، بينها LRCH4 وWDR46 وSERPINB1 وNUB1، سلوكاً متغيراً. لم تكن مستوياتها مختلفة فحسب، بل تغيّر أيضاً نمط ارتفاعها وانخفاضها معاً، مما يوحي بإعادة توصيل لأنظمة التحكم الداخلية في الجسم في حالات السرطان والأمراض المناعية الذاتية.

من خرائط الدم إلى طب المستقبل
لفهم العديد من البروتينات دفعة واحدة، ضغط الباحثون أيضاً هذه المعلومات إلى «محور» واحد يلخص تغيّرات النمط العامة. على طول هذا المحور، ارتفعت فرص الإصابة بارتفاع ضغط الدم أو الداء البطني تدريجياً، وبقي هذا الاتجاه حتى عندما وسّعوا التحليل ليشمل جميع المشاركين في الدراسة. للمختص غير المتخصص، الخلاصة بسيطة: بترك الخوارزميات تفرز الأشخاص استناداً إلى آلاف بروتينات الدم، يمكننا العثور على مجموعات صحية طبيعية، وتأكيد علامات الأمراض المعروفة، والكشف عن علامات جديدة. ومع توسع قواعد البيانات الحيوية لتشمل مئات الآلاف من الأشخاص وحتى المزيد من البروتينات، قد تساعد هذه الاستكشافات غير المراقبة الأطباء على اكتشاف المرض مبكراً، وفهم لماذا يمرض بعض الناس بينما لا يمرض آخرون، وتوجيه أهداف جديدة للعلاجات المستقبلية.
الاستشهاد: Bernard, E., Wang, Y., Chen, M. et al. Unsupervised learning reveals novel disease-associated proteins in high-dimensional human proteomic data. Sci Rep 16, 10185 (2026). https://doi.org/10.1038/s41598-026-41385-7
الكلمات المفتاحية: بروتينات الدم, التعلم غير المراقب, مؤشرات حيوية, الطب الدقيق, مخاطر المرض