Clear Sky Science · ar

نموذج توليدي قابل للتفسير للتنبؤ بالببتيدات المضادة للميكروبات باستخدام شبكة عصبية تلافيفية زمنية ثنائية الاتجاه

· العودة إلى الفهرس

مكافحة العدوى والسرطان بببتيدات ذكية

لطالما كان حلم الطب أن تتوفر أدوية تقضي على الميكروبات والخلايا السرطانية من دون إلحاق ضرر بالأنسجة السليمة. الطبيعة توفر بالفعل مثل هذه الجزيئات: الببتيدات المضادة للميكروبات، وهي شظايا بروتينية صغيرة تُحدث ثقوباً في أغشية الميكروبات ويمكن أن تعدّل أيضاً الجهاز المناعي. لكن العثور على الببتيدات الأكثر وعداً ضمن العدد الهائل من تسلسلات الأحماض الأمينية الممكنة يشبه البحث عن إبر في كومة قش. تعرض هذه الدراسة إطاراً قوياً للذكاء الاصطناعي، GAC-BiTCNN-AMP، يتعلّم من مجموعات بيانات بيولوجية كبيرة للتنبؤ بأي الببتيدات من المرجح أن تكون عوامل مضادة للميكروبات ومرشحة محتملة للعلاج ضد السرطان.

Figure 1
Figure 1.

حراس الطبيعة الصغار

الببتيدات المضادة للميكروبات (AMPs) هي سلاسل قصيرة تتراوح بين 10 إلى 50 حمضاً أمينياً توجد في البشر والحيوانات والنباتات والميكروبات. تعمل كخط دفاع أول عن طريق الارتباط بأسطح الميكروبات، وتعطيل أغشيتها، وتشغيل آليات موت الخلايا. العديد من هذه الببتيدات يستقطب خلايا مناعية، يؤثر على الالتهاب، ويعيد تشكيل البيئة النسيجية المحلية. الخلايا السرطانية، ذات أغشية مشحونة وغير مرتبة بشكل غير معتاد، قد تكون عرضة بشكل خاص لمثل هذه الببتيدات. بعض الأمثلة المعروفة — مثل الميلتّين والديفنسينات — أظهرت قدرة على قتل الخلايا الورمية، وجعلها أكثر حساسية للعلاج الكيميائي أو الإشعاعي، وتحفيز استجابات مناعية ضد الأورام. هذه الدوران المزدوجان ضد العدوى والسرطان يجعلون الببتيدات المضادة للميكروبات مرشحة جذابة للأدوية الدقيقة من الجيل المقبل.

لماذا أدوات التنبؤ التقليدية تقصر

رغم وعدها، يظل تحديد ببتيدات AMPs جديدة حسابياً أمراً صعباً. اعتمدت النماذج الحاسوبية السابقة بشكل رئيسي على أنماط تسلسلية بسيطة وتقنيات تعلم آلي كلاسيكية. وغالباً ما تجاهلت معلومات أغنى حول كيفية تفاعل الأحماض الأمينية عبر مسافات طويلة داخل البروتين، وكيف تطورت هذه التسلسلات، وأي الخصائص الفيزيائية الدقيقة تجعل الببتيد فعّالاً ومنتقياً في نفس الوقت. استخدمت العديد من النماذج بيانات تدريب محدودة أو متكررة، وتخطّت اختيار الميزات المنهجي، وقدمت تفسيرية قليلة — فلم يستطع الباحثون بسهولة رؤية أي جوانب من المدخلات تقود التنبؤ. ونتيجة لذلك، كانت دقتها وقدرتها على التعميم إلى ببتيدات جديدة محدودة، وكافحت لالتقاط الأدوار البيولوجية المتنوعة التي قد تلعبها AMPs.

بناء صورة أغنى من التسلسلات

لتجاوز هذه الثغرات، جمع المؤلفون أولاً مجموعة بيانات كبيرة ومصفّاة بعناية من ست قواعد بيانات للببتيدات المضادة للميكروبات وUniProt. ميزوا الببتيدات النشطة عن غير النشطة باستخدام معايير تجريبية صارمة وخفضوا التكرار حتى لا تضخم التسلسلات المتقاربة الأداء. بعد ذلك، حوَّلوا كل تسلسل ببتيدي إلى عدة واجهات رقمية تكمل بعضها البعض. استُخدمت ثلاث نماذج لغة بروتين متقدمة — ProtTrans-T5 وUniRep وESM-2 — لتوليد تضمينات عالية البُعد تُشفّر السياق والاعتماديات بعيدة المدى والأنماط التطورية المكتسبة من ملايين البروتينات. وأضاف واصف مخصص يسمى PsePSSM-DCT معلومات حول كيفية تحوّر كل موضع في التسلسل عبر التطور وكيف تتغير تلك الأنماط بسلاسة على طول التسلسل. ثم قامت خطوة اختيار ميزات مبنية على XGBoost بتقطير هذه التمثيلات الغنية إلى المكونات الأكثر إفادة، مقلصة الضجيج مع الحفاظ على الإشارة.

Figure 2
Figure 2.

محرك ذكاء اصطناعي هجين لاكتشاف الببتيدات

قلب الإطار هو نموذج GAC-BiTCNN، وهو هندسة تعلم عميق هجينة مصممة خصيصاً لبيانات التسلسل. يجمع بين عدة أفكار: وحدة توليد تنافسي تولّد متجهات ميزات تركيبية واقعية لموازنة وإثراء مجموعة التدريب؛ طبقات تلافيفية تكتشف الدوافع المحلية؛ شبكة تلافيفية زمنية ثنائية الاتجاه تلتقط الأنماط التي تمتد في الاتجاهين الأمامي والخلفي على طول التسلسل؛ وشبكات كبسولة تجمع الميزات ذات الصلة في "كبسولات" متجهية صغيرة، محافظة على العلاقات الهرمية. يُعالَج كل نوع من الميزات — تضمينات نماذج اللغة والواصفات التطورية — في مسار خاص به ثم تُدمج لاحقاً. دُرِّب النموذج وملِم خصائصه باستخدام التحقق المتقاطع ثم اختُبر على مجموعة بيانات منفصلة تماماً وفصلية زمنياً من إدخالات ببتيد أحدث لتقليل تسرب المعلومات.

الأداء، والقابلية للتفسير، ومعناها

حقق GAC-BiTCNN-AMP أداءً بارزاً: دقة تصل إلى نحو 97% ودرجات منطقة تحت المنحنى شبه الكاملة في التحقق المتقاطع، وأكثر من 95% دقة على مجموعة الاختبار المستقلة، متفوقاً على مجموعة من المتنبئات القائمة للـAMPs وحتى على قواعد الأساس التي تستخدم المحولات المخصصة فقط. عندما جُمعت أنواع الميزات المختلفة، تحسّن الأداء أكثر، ما يُظهر أن كل منها يضيف معرفة مكمِّلة حول سلوك الببتيد. لاستكشاف ما تعلّمه النموذج، استخدم المؤلفون SHAP، تقنية شائعة في الذكاء القابل للتفسير، لقياس كيفية تأثير الميزات الكامنة المختلفة على التنبؤات. ورغم أن هذه الميزات تجريدية، أكّد التحليل أن النموذج يعتمد على مجموعة مدمجة من الأنماط التمييزية ذات المعنى البيولوجي بدلاً من الضجيج العشوائي. بعبارة بسيطة، يبدو أن النظام "ينظر" إلى أنواع الإشارات الصحيحة.

ماذا يعني هذا للأدوية المستقبلية

للغير متخصصين، الخلاصة أن هذا العمل يوفر مرشح فرز عالي الدقة ومبني على البيانات لانتقاء بين عدد هائل من تسلسلات الببتيدات لتحديد تلك الأرجح أن تعمل كعوامل مضادة للميكروبات أو مضادة للسرطان. بمزجه نمذجة توليدية، عدة نماذج لغة للبروتين، وتعلّم عميق قابل للتفسير، يقدم GAC-BiTCNN-AMP طريقة قابلة للتوسع لتحديد أولويات المرشحين للاختبار المخبري، مما قد يسرّع تطوير علاجات جديدة للعدوى والأورام المقاومة للعلاجات الحالية. قد لا تكتفي الامتدادات المستقبلية بالتنبؤ بالببتيدات الفعّالة فحسب، بل قد توجه أيضاً تصميم تسلسلات جديدة تماماً مصممة من حيث الفعالية والانتقائية والسلامة.

الاستشهاد: Ali, F., Khalid, M., Alsini, R. et al. A generative explainable model for antimicrobial peptide prediction using bidirectional temporal convolutional neural network. Sci Rep 16, 13801 (2026). https://doi.org/10.1038/s41598-026-43370-6

الكلمات المفتاحية: الببتيدات المضادة للميكروبات, نماذج لغة البروتين, التعلّم العميق, الطب الدقيق في الأورام, اكتشاف الأدوية