Clear Sky Science · ar

الاستفادة من التمثيلات المكتسبة وتعلّم المهام المتعددة لاكتشاف مواقع ميثلة اللايسين

· العودة إلى الفهرس

لماذا تهم العلامات البروتينية الصغيرة للصحة

داخل كل خلية تُعدَّل البروتينات باستمرار بعلامات كيميائية صغيرة يمكن أن تشغّل أو تطفئ نشاطها. إحدى هذه العلامات، المسماة ميثلة اللايسين، تساعد في ضبط عمل جيناتنا وترتبط بشكل متزايد بالسرطان وأمراض أخرى. ومع ذلك، فإن تحديد المواقع الدقيقة لهذه العلامات على آلاف البروتينات في المختبر عملية بطيئة ومكلفة. تقدم هذه الدراسة MethylSight 2.0، نموذجًا حاسوبيًا قويًا يفحص تسلسلات البروتين ويتنبأ بأي بقايا لايسين من المرجح أن تكون ميثلة، مما يساعد العلماء على اكتشاف بيولوجيا جديدة وأهداف دوائية محتملة بشكل أسرع بكثير.

مفاتيح خفية على البروتينات

تتألف البروتينات من سلاسل من الأحماض الأمينية، ولايسين هو أحد المواقع الرئيسية التي يمكن للخلايا أن تضيف عندها علامات كيميائية. تُعرف ميثلة اللايسين بالفعل بقدرتها على التحكم في طريقة تعبئة الحمض النووي داخل النواة، مما يحدد أي الجينات تُشغّل أو تُطفأ. لكن العديد من أحداث ميثلة اللايسين تحدث على بروتينات غير هستونية تبني هيكل الخلية، وتشغّل محركاتها، وتنقل الإشارات. عدد من الإنزيمات التي تضع هذه العلامات مفرطة النشاط في أنواع من السرطان، مما يجعلها أهدافًا دوائية جذابة. التحدي هو أن الكشف التجريبي عن الميثلة عبر مجموع البروتينات البشرية يتطلب موارد هائلة من الوقت والمال والمعدات المتخصصة، لذا يلجأ الباحثون إلى أدوات التنبؤ للتركيز في المختبر على أكثر المواقع واعدة.

Figure 1
Figure 1.

تعليم الحواسيب لغة البروتينات

يبني المؤلفون على التقدمات الحديثة في «نماذج لغة البروتين»، وهي خوارزميات تُدرَّب على ملايين إلى مليارات من تسلسلات البروتين لتتعلم أنماطًا تربط التسلسل بالبنية والوظيفة. تحوّل هذه النماذج كل حمض أميني في البروتين إلى وصف عددي غني يلتقط بيئته الكيميائية والسياق ثلاثي الأبعاد. باستخدام هذه التمثيلات المكتسبة لكل لايسين وجواره، اختبر الفريق عدة تصاميم للشبكات العصبية، بما في ذلك مُدركات متعددة الطبقات الأبسط ومعمارية مترجم (Transformer) أكثر تقدمًا. قاموا بعناية بتصنيف بيانات التدريب من قواعد بيانات عامة، مختارين مواقع ميثلة عالية الثقة وبانين أمثلة سلبية واقعية، مع تجنُّب التكرار الذي قد يضخم الأداء.

التعلّم من علامات كيميائية أخرى

لا تُزيّن الخلايا اللايسين بمعزل عن بقية الوضع. يمكن أن يخضع نفس الموضع للأسيتيلاشن أو اليوبكويتينيشن أو السومويلاشن، وهذه العلامات قد تتنافس أو تتعاون، مما يؤثر في أي تعديل يسود. افترض الباحثون أن الأنماط المرتبطة بهذه العلامات الأخرى قد تساعد النموذج في التعرف على الميثلة بشكل أفضل. حوّلوا المشكلة إلى سياق تعلم مهام متعددة، مدرِّبين شبكة واحدة مبنية على المترجم للتنبؤ بأربعة تعديلات على اللايسين دفعة واحدة، مع مشاركة معظم معلماتها الداخلية. يتيح هذا الإعداد أن تعزز المعرفة المكتسبة من نوع تعديل واحد تنبؤات الأنواع الأخرى، خاصة الميثلة التي لها أمثلة معروفة أقل.

تنبؤات أفضل وتأكيد في العالم الحقيقي

تفوق نموذج المترجم متعدد المهام المسمى MethylSight 2.0 الأدوات السابقة بفارق كبير على مجموعة اختبار مستقلة، مضاعفًا مقياسًا رئيسيًا للدقة مقارنة بالأساليب القديمة. باستخدام تقديرات واقعية لمدى ندرة الميثلة في الخلايا الحقيقية، يرى المؤلفون أن النموذج يحافظ على دقة مفيدة حتى في ظروف صعبة. ثم طبقوا MethylSight 2.0 على كامل البروتيوم البشري المراجَع، وباستخدام حدود محافظة، تنبأوا بأكثر من 60,000 لايسين محتمل أن يكون ميثلًا. من بينها اختاروا 100 موقع مرشح لتجارب قياس طيف الكتلة الموجهة وكشفوا الميثلة في 68 منها، مما يشير إلى أن تنبؤات النموذج تتحول جيدًا إلى واقع المختبر.

Figure 2
Figure 2.

رسم خريطة متنامية للتحكم البروتيني

بجمع التمثيلات المكتسبة للبروتينات وشبكة عصبية متقدمة وتدريب متعدد المهام، يقدّر المؤلفون أن «الميثلوم» البشري للايسين قد يحتوي على نحو 155,000 موقعًا—أكثر بكثير مما كان يُقدَّر سابقًا. تُظهر تحليلاتهم أن الميثلة المتوقعة غنية بشكل خاص في البروتينات المشاركة في الترجمة، ومعالجة الرنا، والهياكل الخلوية، متسقة مع تلميحات سابقة بأن هذه الأنظمة مضبوطَة بعناية بواسطة العلامات الكيميائية. وبما أن MethylSight 2.0 متاح كخادم ويب عام وكبرنامج قابل للتحميل، يمكن للباحثين الآن فحص بروتيناتهم ذات الاهتمام، وإعطاء أولوية للتجارب، والبحث بكفاءة أكبر عن أحداث ميثلة ذات صلة بالأمراض. عمليًا، يوفر هذا العمل خريطة أكثر وضوحًا وبوصلة أفضل لاستكشاف كيف تشكّل التعديلات الكيميائية الدقيقة للبروتينات الصحة والمرض.

الاستشهاد: Charih, F., Boulter, M., Biggar, K.K. et al. Leveraging learned representations and multitask learning for lysine methylation site discovery. Sci Rep 16, 10212 (2026). https://doi.org/10.1038/s41598-026-39136-9

الكلمات المفتاحية: ميثلة اللايسين, تعديل ما بعد الترجمة, نماذج لغة البروتينات, التعلّم العميق في البروتيوميات, علم الوراثة السرطاني على مستوى الإيبيجينيتيك