Clear Sky Science · ar

توجيه نماذج اللغة لاكتشاف وتوقع المستقلبات الثديية

· العودة إلى الفهرس

كيمياء خفية داخل أجسامنا

كل قطرة دم أو بول تحتوي على آلاف الجزيئات الصغيرة التي تعكس ما نأكله، وكيف نعيش، وما إذا كنا نمرض. ومع ذلك، لا يعرف العلماء أسماء معظم هذه الجزيئات أو وظائفها. يقدم هذا البحث DeepMet، نظامًا ذكاءً اصطناعيًا يقرأ «لغة» هذه الجزيئات ويتوقع أيها مفقود من خرائطنا الحالية للكيمياء البشرية والحيوانية. من خلال توجيه التجارب نحو المرشحين الأكثر وعدًا، يساعد DeepMet الباحثين على كشف هذه المادة الكيميائية المظلمة وفهم أفضل لآليات عمل أجسامنا.

Figure 1
الشكل 1.

لماذا تبقى الكثير من الجزيئات مجهولة

تمكّن الأدوات الحديثة من وزن وإعطاء بصمات جزئية لآلاف الجزيئات في عينة نسيجية دفعة واحدة. لكن تحويل هذه البصمات إلى هياكل دقيقة أمر صعب. تسجل قواعد البيانات الحالية العديد من المستقلبات المعروفة، ومع ذلك فإن معظم الإشارات المرصودة في العينات الحقيقية لا تطابق أي شيء في تلك الكتالوجات. تشير هذه الفجوة إلى أن خرائط الأيض الحالية غير كاملة وأن العديد من الجزيئات الطبيعية في الثدييات لم توصف من قبل. سعى المؤلفون إلى بناء أداة تتعلم من المستقلبات المعروفة ثم تتخيّل أكثر الجزيئات المفقودة احتمالًا، بطريقة شبيهة بكيفية توقع نماذج اللغة للكلمات المحتملة في جملة.

تعليم الآلة قواعد الأيض

درّب الفريق شبكة عصبية تسمى DeepMet على نحو 2000 مستقلب بشري مؤكد، مع ترميز كل واحد كسلسلة قصيرة تصف بنيته. بعد تدريب أولي على جزيئات شبيهة بالأدوية لتعلّم القواعد الكيميائية العامة، خضِّبت DeepMet على مجموعة المستقلبات هذه. عندما طُلِب منه إنتاج هياكل جديدة، أنتج النموذج جزيئات احتلت نفس مناطق الفضاء الكيميائي التي تشغلها المستقلبات الحقيقية وحتى أعاد إنتاج العديد من أنواع تفاعلات الإنزيمات المعروفة، على الرغم من أنه لم يُطلَع صراحةً على تلك القواعد. بعبارة أخرى، بدا أن DeepMet استوعب القواعد غير المكتوبة التي تربط اللبنات الأساسية مثل السكريات والأحماض الأمينية لتشكيل جزيئات صغيرة واقعية حيويًا.

التنبؤ بالجزيئات الجديدة التي من المحتمل أن توجد

بعد ذلك قام الباحثون بأخذ عيِّنة من مليار جزيء مرشح من DeepMet وحسبوا عدد مرات ظهور كل بنية فريدة. البنى المتكررة كثيرًا بدت أقرب إلى المستقلبات المعروفة، وشاركتها نوى كيميائية شائعة وتوافق مع تحولات إنزيمية محتملة. لاختبار ما إذا كانت هذه المرشحات عالية التكرار تمثل جزيئات حقيقية، قارن الفريق تنبؤات DeepMet مع المستقلبات التي أضيفت إلى قاعدة بيانات المستقلب البشري بعد انتهاء بيانات تدريب النموذج. كان DeepMet قد ولّد بالفعل معظم هذه الاكتشافات اللاحقة وصنّف العديد منها ضمن مرشحيه الأرجح. من بين آلاف البنى العليا المصنفة والمفقودة في قواعد البيانات، اشترى المؤلفون أو صنّعوا 80 وتركوها لفحوصات عينات بشرية حقيقية بواسطة مطياف الكتلة. وأكدوا وجود عدة مستقلبات غير معروفة سابقًا، وبعضها كان متجاهَلًا رغم ظهوره في الأدبيات القائمة.

Figure 2
الشكل 2.

من الإشارات الخام إلى هياكل ملموسة

يكون DeepMet مفيدًا أيضًا عند ظهور ذروة غير معروفة في مطياف الكتلة. بناءً على الكتلة الدقيقة لجزيء غامض فحسب، يمكن للنموذج أن يسرد العديد من الهياكل التي ستزن نفس الوزن ويرتبها بحسب مدى تشابهها مع المستقلبات. في ما يقرب من ثلث حالات الاختبار، جاء الهيكل الصحيح في الصدارة؛ وفي كثير من الحالات الأخرى ظهر ضمن عدد قليل فقط من المرشحين ذوي الترتيب العالي وكان عادةً متشابهًا جدًا في الشكل مع اختيار النموذج المفضل. لتضييق النتائج أكثر، جمع المؤلفون DeepMet مع برنامج منفصل يتنبأ بكيفية تفكك كل مرشح في مطياف الكتلة. مطابقة هذه الأنماط المتنبأ بها مع الطيف التجريبي الحقيقي ضاعفت تقريبًا دقة التعريف. إن البحث في مجموعات بيانات عامة كبيرة بهذا النهج المركب أفضى إلى هياكل افتراضية للعديد من الإشارات المجهولة سابقًا وأشار إلى مستقلبات تختلف عبر الأمراض، والنظم الغذائية، وحالات الميكروبيوم.

إضاءة المادة الكيميائية المظلمة للحياة

من خلال مزج الحدس الكيميائي المستفاد من البيانات مع مطابقة الأنماط القوية ضد أطياف الكتلة، يوفر DeepMet خارطة طريق لاكتشاف مستقلبات جديدة بطريقة مستهدفة وعملية. لا يستطيع بعد كشف كل جزيء مجهول — فبعض الهياكل بعيدة جدًا عن تلك التي رآها، وبعض المطابقات الإيزوميرية تبقى غير مميزة دون طرق متخصصة. لكن الدراسة تُظهر أن أدوات على غرار نماذج اللغة لا تكتفي باختلاق جزيئات واقعية، بل يمكنها أيضًا توقع مركبات حقيقية سيؤكدها العلماء لاحقًا في الحيوانات والبشر. للمستخدم العام، الخلاصة أن الذكاء الاصطناعي يمكنه الآن مساعدة الكيميائيين على كشف الكيمياء الخفية في أجسامنا بشكل منهجي، مما قد يكشف عن علامات حيوية جديدة، ويعقّب روابط النظام الغذائي–الميكروبات–المضيف، ويحوّل تدريجيًا المادة المظلمة الأيضية اليوم إلى بيولوجيا موثّقة غدًا.

الاستشهاد: Qiang, H., Wang, F., Lu, W. et al. Language model-guided anticipation and discovery of mammalian metabolites. Nature 651, 211–220 (2026). https://doi.org/10.1038/s41586-025-09969-x

الكلمات المفتاحية: التحليل الأيضي (الميتابولوميكس), نماذج اللغة الكيميائية, DeepMet, مطيافية الكتلة, المادة المظلمة الأيضية