Clear Sky Science · ar

EPInformer: تنبؤ قابل للتوسع ومتَكامل لتعبير الجينات من متتاليات المُحَفِّزات والمُعَزِّزات مع ملفات أَبِيْجِنُومِيّة متعددة الأنماط

· العودة إلى الفهرس

لماذا يهم التنبؤ بنشاط الجينات

كل خلية في جسمك تحمل تقريبًا نفس الحمض النووي، ومع ذلك تتصرف خلايا الدماغ وخلايا الدم وخلايا الكبد بشكل مختلف تمامًا. ما يميزها هو أي الجينات مُشغَّلة أو مُطفأة. القدرة على التنبؤ بهذا النشاط الجيني مباشرة من الحمض النووي والإشارات المرتبطة به ستمكن العلماء من فهم كيف تتطور الخلايا، وكيف تستجيب لبيئتها، ولماذا تختل أحيانًا في الأمراض. تقدم هذه الورقة أداة حاسوبية جديدة اسمها EPInformer تستخدم التقدّم الأخير في الذكاء الاصطناعي لتتنبأ بنشاط الجينات بدقة وكفاءة أكبر من الأساليب السابقة.

Figure 1
Figure 1.

كيف تتحكم مفاتيح الحمض النووي البعيدة في الجينات

الجينات لا تُضبَط فقط بواسطة القطعة القصيرة من الحمض النووي حيث يبدأ قراءتها (المُحَفِّز). بل تتأثر أيضًا بقطع بعيدة من الحمض النووي تُسمى المُعَزِّزات التي تعمل مثل مفاتيح بعيدة. هذه المفاتيح قد تكون على بعد عشرات أو حتى مئات الآلاف من قواعد الحمض النووي من الجين، وتلتف في الفراغ ثلاثي الأبعاد لتلامس المُحَفِّز. بالإضافة إلى تسلسل الحمض النووي الخام، تشير الوسوم الكيميائية وعلامات البروتين على الحمض النووي — والتي تُسمى مجتمعة الإشارات الأَبِيْجِينُومِيّة — إلى أي المفاتيح نشطة في نوع خلوي معين. عانت النماذج الحاسوبية التقليدية لتجميع كل هذه المعلومات، خاصة تأثير المفاتيح البعيدة جدًا، للتنبؤ بشدة تعبير الجين.

نموذج ذكاء اصطناعي مدمج يقرأ إشارات متعددة في آن واحد

يبنى EPInformer على بنية ذكاء اصطناعي حديثة تُعرف بالمحوّل (transformer)، مأخوذة من نماذج اللغة. بدلاً من قراءة الجمل، يقرأ مقاطع الحمض النووي حول الجين ومفاتيحه المرشحة. يحول النموذج أولاً كل متوالية مُحَفِّز ومُعَزِّز مجاور إلى «تضمين» رقمي يلتقط أنماطًا مهمة. ويمكنه أيضًا إرفاق قنوات إضافية تمثل الوسوم الكيميائية المحلية على الحمض النووي، وفتحات الكروماتين، وقياسات تكرار تلامس مناطق الحمض النووي بعضها البعض في ثلاثي الأبعاد. ثم يركّز آلية اهتمام خاصة على كيفية تفاعل كل مفتاح محتمل مع المُحَفِّز، مع تجاهل تفاعلات بين المُعَزِّزات نفسها عمدًا. تجمع خطوة التنبؤ النهائية هذا التمثيل المتعلم مع خصائص أساسية لحمض رسول الجين لإخراج مستوى النشاط المتوقع.

تنبؤات أفضل باستخدام موارد حوسبة أقل

لاختبار EPInformer، دربه المؤلفون وقيَّمُوه على مجموعات بيانات عامة كبيرة تُجسِّد وصولية الحمض النووي، والوسوم الكيميائية، والاتصالات ثلاثية الأبعاد، ونشاط الجينات في عدة خطوط خلوية بشرية. قارنوا نسخًا مختلفة من النموذج التي استخدمت التسلسل والمسافة فقط، وأضافت الإشارات الأَبِيْجِينُومِيّة، أو أدرجت خرائط الاتصالات ثلاثية الأبعاد أيضًا. عبر كل من تسلسل الحمض النووي الريبوزي القياسي وتجربة مُركَّزة على المُحَفِّز تُسمى CAGE، تفوّق EPInformer باستمرار على الطرق الرائدة، بما في ذلك النماذج الكبيرة المعتمدة على التسلسل فقط التي تفحص امتدادات طويلة جدًا من الحمض النووي. ومن اللافت أنه فعل ذلك بمقدار ضئيل من المعاملات — حوالي 0.4 مليون مقابل مئات الملايين — مما سمح بالتدريب على معالج رسومات واحد في حوالي ساعة. هذا يجعل نمذجة نشاط الجينات الدقيقة في متناول العديد من المختبرات دون الحاجة إلى عناقيد حوسبة ضخمة.

Figure 2
Figure 2.

العثور على المفاتيح الأساسية وكلمات التحكم الخاصة بها

بسبب آلية الاهتمام في EPInformer التي تُقيّم مدى تأثير كل مُعَزِّز مرشح على جينٍ ما، يمكنه أيضًا المساعدة في تحديد المفاتيح الأكثر أهمية في نوع خلوي معين. أظهر المؤلفون أن درجات الاهتمام هذه أعادت اكتشاف أزواج المُعَزِّز-الجين المؤكدة تجريبيًا بدقة أكبر من طريقة تقييم شائعة تعتمد فقط على النشاط والاتصال، لا سيما بالنسبة للمفاتيح البعيدة. استخدموا كذلك أدوات تفسير للتقريب إلى تسلسلات الحمض النووي للمُعَزِّزات الأعلى درجة ولتحديد أنماط قصيرة متكررة تتطابق مع مواقع ربط معروفة لعوامل النسخ — البروتينات التي تعمل مثل كلمات تحكم في الجينوم. في الخلايا المرتبطة بالدم، على سبيل المثال، أعاد EPInformer اكتشاف مواضيع (motifs) لتنظيميين رئيسيين لتطور خلايا الدم الحمراء، مما يوحي بأنه تعلَّم قواعد ذات معنى بيولوجي بدلاً من حفظ البيانات فحسب.

ما الذي يعنيه هذا لعلم الأحياء والطب المستقبليين

بعبارة بسيطة، يمنح EPInformer الباحثين عدسة أوضح وأكثر اقتصادية لكيفية تشغيل الجينات وإيقافها في أنواع خلايا مختلفة عن طريق الجمع بين تسلسل الحمض النووي، والوسوم الكيميائية، وطَيّ الجينوم ثلاثي الأبعاد. قدرته على إبراز أي المفاتيح البعيدة تهم لجين معين، وما كلمات التحكم التي تحتويها، يمكن أن تُوجِّه تجارب تختبر كيف تؤثر الطفرات أو التعديلات المستهدفة في نشاط الجينات. مع توسع النهج ليشمل مزيدًا من أنواع الخلايا والنسخ المختلفة للجينات، قد يساعد في تفسير كيف تسهم التغيرات غير المشفرة في الجينوم في الصفات المعقدة والأمراض، وإرشاد تصميم علاجات جينية أكثر دقة.

الاستشهاد: Lin, J., Li, Z., Zhao, Y. et al. EPInformer: scalable and integrative prediction of gene expression from promoter-enhancer sequences with multimodal epigenomic profiles. Nat Commun 17, 3975 (2026). https://doi.org/10.1038/s41467-026-70535-8

الكلمات المفتاحية: تنبؤ تعبير الجينات, تفاعلات المُعَزِّز-المُحَفِّز, أَبِيْجِينُومِيّات, التعلم العميق في الجينوميات, بنية الكروماتين