Clear Sky Science · ar
التنبؤ بالتشابه الكيميائي عبر أوضاع التأين بين أطياف الكتلة المزدوجة في علم الاستقلاب
لماذا يهم ربط النقاط الكيميائية
كل رشفة قهوة أو نفس هواء أو دورة علاجية تترك وراءها آثارًا كيميائية ضئيلة في أجسامنا. يمكن للأجهزة الحديثة اكتشاف آلاف هذه الجزيئات دفعة واحدة، لكن تحويل تلك الإشارات إلى رؤى بيولوجية لا يزال أمرًا صعبًا بشكل مدهش. تقدم هذه الدراسة MS2DeepScore 2.0، أداة قائمة على تعلم الآلة تساعد العلماء على رؤية كيف ترتبط هذه الجزيئات ببعضها البعض، حتى عندما تُسجل الإشارات بطرق مختلفة جدًا. ومن خلال ذلك، تعد بتفسير أسرع وأكثر اكتمالًا للخليط الكيميائي المعقد في مجالات الطب والتغذية والبحوث البيئية.
طريقتان للنظر إلى نفس الجزيء
مطيافية الكتلة تقنية أساسية تزن الجزيئات وتفصلها لتكشف عن هويتها. في التجارب الروتينية، غالبًا ما يقيس العلماء العينة نفسها بوضعين: واحد يفضل الجزيئات مشحونة موجبًا وآخر يفضل المشحونة سالبًا. ينتج عن كل وضع «رمز شريطي» مميز من الشظايا. وحتى عندما تأتي القياسان من نفس الجزيء، قد تبدو الأنماط الناتجة مختلفة إلى حد يفشل معه أسلوب المقارنة التقليدي. ونتيجة لذلك، يحلل الباحثون عادة الوضعين بشكل منفصل، ويبنون خريطتين منفصلتين للعينة، معرضين أنفسهم لخطر فقدان علاقات كيميائية مهمة.

نظام تعلم يجسر الهوة
يتصدى MS2DeepScore 2.0 لهذا الانقسام بتعلم التشابه الكيميائي مباشرة من مكتبات كبيرة من الأطياف المعروفة. يعتمد النموذج على تصميم شبكة عصبية توأمية يحول كل نمط تفكك إلى بصمة مكونة من 500 رقم، تُدعى تضمينًا. أثناء التدريب، يرى النظام مئات الآلاف من الأمثلة من أوضاع الشحنة الموجبة والسالبة، مع مدى تشابه الجزيئات الأساسية فعليًا. يقوم بضبط نفسه بحيث تؤدي الأطياف الناشئة من جزيئات ذات صلة إلى تضمينات متقاربة، سواء قيست في نفس الوضع أو في أوضاع متعاكسة. يتخطى الإصدار الجديد سابقه من خلال إدخال معلومات إضافية، مثل كتلة الجزيء الأصلية ووضع التأين المستخدم، وعن طريق استخدام مخطط عينات موزون بعناية حتى لا تطغى العلاقات الكيميائية النادرة ولكن المفيدة بالعلاقات الشائعة غير المُفيدة.
من إشارات متفرقة إلى خرائط موحدة
بعد التدريب، يمكن لـ MS2DeepScore 2.0 تقدير مدى التشابه الكيميائي بين أي طيفين، بما في ذلك أزواج الوضع الموجب مقابل السالب. يبين المؤلفون أن هذه التنبؤات ترتبط جيدًا بمقاييس التشابه الهيكلي المعتمدة، ليس فقط داخل كل وضع بل عبر الأوضاع أيضًا. باستخدام بيانات حقيقية من بول الإنسان، وبلازما دم الإنسان، ونبات بري صالح للأكل، يبنون «شبكات جزيئية» حيث يمثل كل طيف عقدة وتؤدي درجة التشابه المتوقعة القوية إلى إنشاء رابط. على عكس الأساليب القديمة، تدمج هذه الشبكات بيانات الوضع الموجب والسالب بطبيعتها في خرائط متماسكة موحدة. تتضمن العناقيد التي راجعها خبراء، على سبيل المثال، مجموعات من جزيئات مرتبطة بالكافيين في البول مترابطة عبر أوضاع التأين وتتطابق مع مسارات أيضية معروفة.
رؤية المشهد الكيميائي بنظرة سريعة
تعتبر الشبكات الجزيئية قوية لكنها قد تتشابك إذا أُضيفت روابط ضعيفة كثيرة. لتجنب ذلك، يستخدم المؤلفون تضمينات MS2DeepScore مباشرة كإحداثيات في تخطيط ثنائي الأبعاد تم إنشاؤه بتقنية تسمى UMAP. يمثل كل نقطة في هذه الخريطة طيفًا واحدًا، والنقاط المجاورة تتوافق مع جزيئات يعتبرها النموذج متشابهة كيميائيًا. غالبًا ما تنتهي أطياف الوضع الموجب والسالب لنفس المركب، التي تبدو مختلفة بصريًا، جنبًا إلى جنب في فضاء التضمين هذا. كما يدرب الفريق نموذجًا إضافيًا يفحص كل تضمين ويقدّر مدى موثوقيته، مميِّزًا الأطياف الصاخبة أو غير المكتملة أو غير الشبيهة بأي شيء شوهد أثناء التدريب. يؤدي إزالة هذه النقاط المنخفضة الجودة إلى تحسين الدقة العامة وجعل التصورات أكثر موثوقية.

إيصال أدوات متقدمة إلى مختبرات الحياة اليومية
لضمان قابلية استخدام هذه التقنية من قبل من هم أبعد من خبراء البرمجة، دمج المؤلفون MS2DeepScore 2.0 في برامج مطيافية الكتلة الشائعة والمتاحة مجانًا. مع هذا التكامل، يمكن للباحثين اكتشاف الميزات، وبناء شبكات جزيئية تتجاهل حدود أوضاع التأين، واستكشاف الفضاء الكيميائي الناتج عبر لوحات تفاعلية. تمت مشاركة الشيفرة والنماذج المدربة ومجموعات البيانات التجريبية علنًا، ويمكن إعادة تدريب النظام أو تحسينه لفئات كيميائية متخصصة.
ما يعنيه هذا للاكتشافات المستقبلية
بالنسبة لغير المتخصصين، الرسالة الأساسية هي أن MS2DeepScore 2.0 يساعد في تحويل القياسات المجزأة والمعتمدة على الوضع إلى صورة واحدة أكثر قابلية للفهم للجزيئات الموجودة في العينة. من خلال ربط الإشارات التي كانت تعيش سابقًا في عوالم تحليلية منفصلة بشكل موثوق، يسمح الأسلوب للعلماء بالاستفادة من مكتبات مرجعية أكبر بكثير، ومقارنة العينات بشكل أكثر اكتمالًا، وتركيز انتباههم على مجموعات ذات معنى من المركبات المرتبطة. من المتوقع أن يسرع هذا الترابط عبر البيانات من تحديد المؤشرات الحيوية والمغذيات والمنتجات الطبيعية والملوثات، ويعزز في النهاية فهمنا لكيفية تشكيل الكيمياء للصحة والبيئة.
الاستشهاد: de Jonge, N.F., Chekmeneva, E., Schmid, R. et al. Cross ionization mode chemical similarity prediction between tandem mass spectra in metabolomics. Nat Commun 17, 2483 (2026). https://doi.org/10.1038/s41467-026-69083-y
الكلمات المفتاحية: علم الاستقلاب, مطيافية الكتلة, تعلم الآلة, شبكات جزيئية, التشابه الكيميائي