Clear Sky Science · ar

BiG-SCAPE 2.0 و BiG-SLiCE 2.0: تجميع متسلسل قابل للتوسع، دقيق وتفاعلي لعناقيد الجينات الأيضية

· العودة إلى الفهرس

كنوز كيميائية مخفية في حمض الميكروبات النووي

العديد من الأدوية ومواد حماية المحاصيل التي نعتمد عليها تأتي من جزيئات صغيرة تصنعها الميكروبات. تخبئ هذه الكائنات وصفات هذه الجزيئات في مقاطع من الحمض النووي تُدعى عناقيد جينية. ومع تسارع تقنيات تسلسل الحمض النووي، يغرق الباحثون في البيانات، ومع ذلك يظلون يعرفون جزءًا صغيرًا فقط مما تستطيع الميكروبات تصنيعه. يقدم هذا المقال BiG-SCAPE 2.0 و BiG-SLiCE 2.0، أداتين محدثتين تساعدان العلماء على غربلة أرشيفات جينومية هائلة لرسم خريطة، ومقارنة، وتنظيم هذه «المصانع الجزيئية» المخفية، مما يقرب اكتشاف الجيل التالي من المضادات الحيوية والمركبات الزراعية.

Figure 1
الشكل 1.

لماذا تهم عناقيد الجينات للصحة والزراعة

تستخدم الميكروبات جزيئات متخصصة صغيرة للتنافس، والتواصل، والتكيُّف مع بيئتها. غالبًا ما تكون المخططات الجينية لإنتاج أو تحطيم هذه الجزيئات مجمعة معًا في عناقيد جينية أيضية. وتشمل هذه عناقيد الجينات التخليقية التي تبني منتجات طبيعية معقدة، وعناقيد الجينات التحليلية التي تمكّن الميكروبات من الاستفادة من مركبات معينة أو إفرازات الجذور. لأن الجينات في الكتلة تعمل معًا، فإن العثور على مثل هذه المنطقة في جينوم يشبه اكتشاف «خط إنتاج» مستقل يمكن أن يعطي دلالة على بنية ووظيفة الجزيء. أدوات التنقيب في الجينومات تكشف بالفعل هذه المصانع في البكتيريا والفطريات، لكن التحدي الحقيقي هو مقارنة مئات الآلاف من العناقيد لمعرفة كيف ترتبط وما هو التنوع الكيميائي المحتمل بينها.

محركان لفرز المصانع الجزيئية

صُمما BiG-SCAPE و BiG-SLiCE في الأصل لتجميع عناقيد الجينات التي تشترك في ميزات جوهرية إلى «عائلات عناقيد جينية». يُتوقع أن تنتج كل عائلة نفس الجزيئات أو جزيئات قريبة الصلة. يبني BiG-SCAPE شبكات مفصلة للتشابه بين العناقيد، بينما يركّز BiG-SLiCE على السرعة، قادرًا على معالجة ملايين العناقيد بتحويلها إلى بصمات رقمية بسيطة ثم تجميع تلك البصمات. معًا، يشكلان أساسًا لنظام بيئي متنامٍ من خطوط أنابيب التنقيب في الجينومات، وقواعد بيانات، وعرض تفاعلي يساعد الباحثين على التنقل عبر الكيمياء الميكروبية على مقياس كوكبي.

ما الجديد في BiG-SCAPE 2.0

تقدم النسخة 2.0 من BiG-SCAPE سلسلة من التحسينات الموجهة لكل من علم الأحياء والحوسبة. أصبحت الآن تفهم مفهوم «المنطقة» الأكثر تطرُّفًا المستخدم في أداة antiSMASH المنتشرة على نطاق واسع، والتي تفصل العناقيد المتداخلة أو الهجينة إلى لبنات أصغر وأكثر دلالة تُسمى البروتوكلوسترات. تسمح أوضاع ومحاذاة واستراتيجيات جديدة لـ BiG-SCAPE 2.0 بالتركيز على الجينات الأساسية الهامة فعلاً داخل كل كتلة، ما يساعدها على التعامل بشكل أفضل مع الجينات المعاد ترتيبها وحدود العناقيد الضبابية. تحت الغطاء، أُعيدت كتابة قاعدة الشيفرة بالكامل للسرعة والاستدامة، باستخدام قاعدة بيانات SQLite مشتركة ومكتبة بايثون حديثة لعمليات البحث عن الملفات التعريفية. نتيجة لذلك، يمكن أن يعمل BiG-SCAPE 2.0 بسرعة تصل إلى ثماني مرات مقارنة بسابقه، مع استخدام حوالي نصف الذاكرة، وهو الآن يقدم عدة سير عمل جاهزة للتجميع والاستعلام وإزالة التكرار وقياس الأداء عبر واجهة ويب تفاعلية مُحسّنة.

Figure 2
الشكل 2.

كيف يواكب BiG-SLiCE 2.0 فيض البيانات

يركز BiG-SLiCE 2.0 على جعل التحليلات فائقة الحجم أكثر دقة دون فقدان سرعته المميزة. كانت الإصدارات السابقة تتعامل مع جميع أنواع عناقيد الجينات بنفس الطريقة، مما أعطى تفضيلًا غير مقصود لبعض العوائل على غيرها. بالتحول إلى مقياس مسافة شبيه بالجيب التمام (cosine) وتحديث مكتبة التواقيع البروتينية التخليقية إلى المعايير الأحدث، يجمع BiG-SLiCE 2.0 الآن أنواعًا مختلفة جدًا من العناقيد بشكل أكثر توازنًا. تجلب تحسينات الشيفرة والانتقال إلى نفس مكتبة البحث السريع عن الملفات التعريفية المستخدمة في BiG-SCAPE مكاسب سرعة إضافية، وخيارات جديدة لتصدير كل النتائج كجداول نصية بسيطة تجعل ربط BiG-SLiCE بخطوط أنابيب تحليل أخرى أسهل. اختبارات على تسع مجموعات بيانات من العائلات الجينية المُنقَّحة يدويًا تُظهر أن دقة BiG-SLiCE 2.0 باتت تقترب الآن من دقة BiG-SCAPE، لا سيما للعناقيد الأقصر والأكثر مراوغة.

كشف كون كيميائي شاسع غير مُستغل

استخدم المؤلفون الأداتين لفحص 260,630 منطقة تخليقية من قاعدة بيانات عامة للجينومات الميكروبية. أنتجا BiG-SCAPE 2.0 و BiG-SLiCE 2.0 تقديرات متشابهة بشكل لافت لعدد عائلات عناقيد الجينات المميزة الموجودة في مجموعة البيانات هذه، مؤكّدين أعمالًا سابقة تشير إلى أن نحو 3% فقط من الطاقات التخليقية المشفّرة في الجينومات البكتيرية قد تم توصيفها حتى الآن. بعبارة أخرى، تظل الغالبية العظمى من المواد الكيميائية المصنعة ميكروبيًا مجهولة. من خلال تمكين التجميع الدقيق وتصوير عناقيد الجينات عبر مئات الآلاف من الجينومات—وبالمستقبل ملايين—توفر BiG-SCAPE 2.0 و BiG-SLiCE 2.0 عدسات قوية لاستكشاف هذا الكون الكيميائي غير المرقوم، ممهِّدة الطريق لأدوية جديدة، وأدوات حماية محاصيل أكثر أمانًا، وفهم أعمق لكيفية تأثير الميكروبات على النظم البيئية وصحتنا.

الاستشهاد: Draisma, A., Loureiro, C., Louwen, N.L.L. et al. BiG-SCAPE 2.0 and BiG-SLiCE 2.0: scalable, accurate and interactive sequence clustering of metabolic gene clusters. Nat Commun 17, 2000 (2026). https://doi.org/10.1038/s41467-026-68733-5

الكلمات المفتاحية: عناقيد الجينات التخليقية, اكتشاف المنتجات الطبيعية, التنقيب في الجينومات, مستقلبات ميكروبية, التجميع الحاسوبي