Clear Sky Science · ar
JanusDDG: شبكة عصبية مستنيرة بالفيزياء لتنبؤ استقرار البروتينات من التسلسل عبر انتباه ثنائي الواجهة
لماذا يهم هذا البحث
البروتينات هي الآلات الدقيقة التي تحافظ على خلايانا حية، وحتى تغيير واحد في لبناتها البنائية يمكن أن يجعلها تعمل بشكل أفضل أو أسوأ أو تتعطل تمامًا. القدرة على التنبؤ بكيفية تأثير مثل هذه التغييرات على استقرار البروتين أمر حاسم لفهم الأمراض الوراثية ولتصميم أدوية وأنزيمات صناعية أفضل. تُقدم هذه الورقة JanusDDG، نموذج ذكاء اصطناعي جديد يتنبأ بكيفية تغيير الطفرات لاستقرار البروتين باستخدام تسلسل البروتين فقط، مع الالتزام أيضًا بالقواعد الفيزيائية الأساسية التي تحكم طي البروتينات.
مشكلة الآلات البروتينية الهشة
عندما يطوى البروتين إلى شكله ثلاثي الأبعاد، فإنه يوازن بين العديد من القوى، مثل خيمة تدعمها حبال متعددة. يمكن أن تشدد الطفرات بعض الحبال أو تضعف أخرى، ما يجعل البنية أكثر أو أقل استقرارًا. الاختبارات التجريبية لهذه التأثيرات بطيئة ومكلفة، لذلك يعتمد الباحثون كثيرًا على النماذج الحاسوبية لتقدير التغيرات في الاستقرار، والمعروفة باسم ΔΔG. أدوات القائمة غالبًا ما تعمل بصورة أفضل عندما تتوفر لها هياكل ثلاثية الأبعاد مفصّلة، وقد تنتهك بصمت قواعد الديناميكا الحرارية، مما يؤدي إلى توقعات تبدو دقيقة على الورق لكنها غير متسقة فيزيائيًا أو يصعب الوثوق بها عند تطبيقها على بروتينات جديدة.

طريقة جديدة لقراءة تسلسلات البروتين
يتصدى JanusDDG لهذا التحدي بالانطلاق من نماذج لغة البروتين، وهي فئة من الشبكات العصبية الكبيرة المدربة على ملايين تسلسلات البروتين، إلى حد ما كما تتعلم نماذج اللغة من النصوص. تحوّل هذه النماذج كل حمض أميني إلى تمثيل رقمي غني يلتقط أنماطًا من التطور والسلوك النموذجي للطي. يأخذ JanusDDG تسلسل البروتين الأصلي وتسلسل الطفرة ويقارن تمثيلاتهما المتعلمة، ويستخدم آلية انتباه متخصصة تركز على كيفية إحداث الطفرة لاضطراب في السياق المحيط. وبما أنه يحتاج إلى التسلسلات فقط، فيمكن تطبيق JanusDDG على بروتينات هياكلها ثلاثية الأبعاد غير معروفة أو صعبة التحديد.
بناء الفيزياء داخل الذكاء الاصطناعي
ابتكار رئيسي في JanusDDG هو أنه مصمم لاحترام المبادئ الفيزيائية الأساسية. ركز المؤلفون على خاصيتين لطاقة جيبس الحرة، الكمية التي تقوم عليها استقرارية البروتين. أولًا، التماثل المعكوس (اللاتماثل) يعني أنه إذا أدى الانتقال من متغير إلى آخر إلى تغيير في الاستقرار بمقدار معين، فالتغيير العكسي يجب أن يعكس ذلك المقدار. ثانيًا، العبورية تعني أن الأثر الإجمالي للانتقال من متغير أول إلى ثاني ثم إلى ثالث يجب أن يساوي القفزة المباشرة من الأول إلى الثالث. تفرض بنية JanusDDG اللاتماثل عن طريق تشغيل نسختين معكوسين من الشبكة على مدخلات متبادلة ودمج مخرجاتهما بحيث تكون توقعات الأمام والعكسية متعاكسة بالضبط. ويتم تشجيع العبورية أثناء التدريب بإضافة مصطلح خسارة خاص يدفع النموذج إلى تقديم توقعات متسقة عندما تُجزأ مسارات الطفرات إلى خطوات.

اختبار الأداء على أنواع عديدة من الطفرات
درّب الباحثون JanusDDG على مجموعة بيانات منقّحة تحتوي على آلاف الطفرات مع تغييرات استقرار مقاسة ثم اختبروه على عدة معايير مستقلة حيث كانت درجة التداخل في التسلسل مع بيانات التدريب منخفضة جدًا. يقلل هذا التصميم الحذر من خطر أن يكون النموذج مجرد حفظ لبروتينات مألوفة. عبر ثلاث مجموعات مستخدمة على نطاق واسع من الطفرات المفردة، ضاهى JanusDDG أو تفوّق على كلٍ من الأدوات المعتمدة على التسلسل الأخرى والعديد من الطرق التي تعتمد على الهياكل ثلاثية الأبعاد. كما تعامل مع طفرات متعددة متزامنة، وهو سيناريو أصعب حيث يمكن أن تكون التفاعلات بين التغييرات غير تراكمية. ومن اللافت أن دقته لم تنخفض للأزواج الطفرية القريبة مكانيًا، حيث كانت النماذج السابقة غالبًا ما تواجه صعوبة.
من الأرقام إلى تسميات استقرار مفيدة
في التطبيقات العملية، يريد الباحثون في كثير من الأحيان معرفة ليس فقط مقدار تغيير الاستقرار، بل ما إذا كانت الطفرة مستقرة بوضوح أو مفسدة للاستقرار. اختبر المؤلفون JanusDDG على مجموعة بيانات تركز على تمييز المتغيرات المستقرة عن المزعزعة للاستقرار. رغم أن النموذج حقق أداءً جيدًا، ظلّت هذه المهمة أكثر صعوبة من التنبؤ بالقيم العددية الخام، خاصة بالقرب من الحد الفاصل بين الفئتين حيث يكون الضجيج التجريبي والغموض البيولوجي في أعلى مستوياته. ومع ذلك، قارن JanusDDG بشكل إيجابي مع طرق رائدة أخرى، مما يشير إلى أن تصميمه الواعي بالفيزياء واستخدام تمثيلات تسلسلية غنية يساعدانه في التعامل مع هذا الشك أفضل من كثير من المنافسين.
ما يعنيه هذا لتصميم البروتين في المستقبل
بشكل عام، يوضح JanusDDG أنه من الممكن الجمع بين قوة الذكاء الاصطناعي الحديث المعتمد على التسلسل والقيود الصارمة للقانون الفيزيائي. من خلال التعامل مع البروتينات كتسلسلات يمكن قراءتها مثل اللغة، ومع الإصرار على أن تكون التنبؤات ملتزمة باللاتماثل والعبورية، ينتج النموذج تقديرات استقرار دقيقة ومتسقة ديناميكيًا. بالنسبة لغير المتخصصين، الخلاصة هي أننا نقترب من أدوات موثوقة خالية من الحاجة للبنية تكون قادرة على مسح عدد لا يحصى من الطفرات الممكنة، مميزة تلك المرجحة لتثبيت البروتين أو مميزة التغييرات الخطرة المرتبطة بالأمراض، وكل ذلك مع البقاء متجذرة في قوانين الفيزياء بدلًا من اختصارات إحصائية بحتة.
الاستشهاد: Barducci, G., Rossi, I., Codicé, F. et al. JanusDDG: a physics-informed neural network for sequence-based protein stability via two-fronts attention. Commun Biol 9, 494 (2026). https://doi.org/10.1038/s42003-026-09632-9
الكلمات المفتاحية: استقرار البروتين, الطفرات الجينية, تصميم البروتينات, تعلم الآلة, الديناميكا الحرارية