Clear Sky Science · ar

scLong: نموذج أساس بقدرات مليار معلمة لالتقاط سياق الجينات بعيد المدى في النسخ الخلوي أحادي الخلية

· العودة إلى الفهرس

تعليم الحواسيب قراءة اللغة الخفيّة للخلايا

كل خلية في جسدك تحمل مدينة صاخبة من الجينات التي تُشغَّل وتُطفأ بأنماط معقّدة. تُتيح تقنيات تسلسل الرنا أحادي الخلية الحديثة الاستماع إلى كل خلية على حدة، لكن النتيجة هي فيضان ساحق من الأرقام. يقدم هذا البحث نموذجًا ضخمًا للذكاء الاصطناعي يُدعى scLong مصممًا لفهم أنماط نشاط الجينات المعقّدة هذه، بما في ذلك الإشارات الخافتة التي تميل الطرق الأقدم إلى تجاهلها. هدفه مساعدة الباحثين على فهم كيف تستجيب الخلايا لتشغيل أو إيقاف جينات، أو لإضافة أدوية، أو لحدوث أمراض.

Figure 1
Figure 1.

لماذا خرائط الجينات على مستوى الخلية مهمة

غالبًا ما تخلط الدراسات التقليدية للجينات بين ملايين الخلايا، مما يمحو الخلايا النادرة أو الشاذة عبر التوسيط. غيّرت تقنيات الخلايا المفردة ذلك بقياس نشاط الجينات في كل خلية على حدة، كاشفة أنواع خلايا مخفية، وتواصلًا دقيقًا بين الخلايا، ودوائر تحكّم تفصيلية تقرر مصير الخلية. مع ذلك، تحليل هذا النوع من البيانات تحدٍ كبير: قد تُقاس مستويات النشاط لكل خلية لعشرات الآلاف من الجينات، وكثير منها يكاد يكون غير قابل للكشف. تُبسط نماذج الذكاء الاصطناعي الحالية المشكلة بالتركيز على الجينات الأكثر صخبًا فقط، مما يسرّع الحسابات ولكنه يفقد العديد من الإشارات الدقيقة التي قد تكون حاسمة في المرض أو التطور أو استجابة الأدوية.

نموذج جديد يستمع لكل جين

يتعامل scLong مع هذا التحدي عن طريق التوسع بدلًا من التقليص. إنه نموذج أساس بقدرات مليار معلمة مدرّب على ملفات نشاط الجينات لنحو 48 مليون خلية بشرية عبر أكثر من 50 نسيجًا. على عكس النهج السابقة التي تنتبه لعدة آلاف من الجينات النشطة جدًا، يأخذ scLong بعين الاعتبار نحو 28,000 جين دفعة واحدة، بما في ذلك تلك التي تُعبَّر نادرًا أو ضعيفًا. يجمع بين نوعين من المعلومات لكل جين: مدى نشاطه في خلية معينة وما هو معروف سابقًا عن وظيفته من تصنيف Gene Ontology، وهو فهرس كبير مُنقّح من الخبراء لأدوار وعلاقات الجينات. شبكة متخصّصة تعمل على رسم بياني لاتصالات الجينات تُجسِّد هذه المعرفة السابقة في تمثيلات مدمجة يمكن للنموذج استخدامها جنبًا إلى جنب مع قيم التعبير الخام.

كيف يوازن النموذج بين القوة والكفاءة

مراجعة كل جين بتفصيل مكثّف مكلفة حسابيًا، لذا يستخدم scLong تصميمًا ذكيًا ذي مسارين. داخل كل خلية، تُرتَّب الجينات بحسب شدة تعبيرها. تُعالَج الجينات الأكثر نشاطًا، التي غالبًا ما تحمل الإشارة البيولوجية الأساسية، عبر وحدة انتباه أكبر وأكثر قدرة. تُوجَّه الجينات الأهدأ، بما في ذلك القياسات المنخفضة أو الصفرية، عبر وحدة أصغر أخف وزنًا. بعد ذلك تُعاد جميع الجينات معًا وتُمرَّر عبر طبقة انتباه أخرى تسمح لكل جين بالتأثير على الآخرين. يمكّن هذا التصميم النموذج من الاحتفاظ بتمثيلات أرخص ولكن ذات مغزى للإشارات الخافتة بينما يخصّص سعة أكبر للأقوى منها. أثناء التمهيد المسبق، يخفي النظام مرارًا مجموعة فرعية من قيم نشاط الجينات ويتعلم إعادة بنائها من السياق المحيط، مما يجبره على اكتشاف الأنماط التي تربط الجينات ببعضها.

Figure 2
Figure 2.

تطبيق النموذج على مشاكل حقيقية

بمجرد التدريب، يمكن تكييف scLong لمجموعة واسعة من الأسئلة البيولوجية. يبيّن المؤلفون أنه يتنبأ بكيفية تغير نشاط الجينات عندما تُطْفأ أو تُعدَّل جينات معينة، بما في ذلك توليفات من جينين قد يتفاعلان معًا. كما يتنبأ بكيفية استجابة الخلايا عند تعرضها لمواد كيميائية مختلفة، وهو أمر مهم لاكتشاف الأدوية واختبارات السلامة. في دراسات السرطان، يساعد scLong في توقع كيفية استجابة خطوط خلايا الورم لأدوية مفردة ولأزواج من الأدوية التي قد تعمل بشكل أفضل معًا، متفوّقًا في كثير من الأحيان على النماذج المتخصصة وعلى نماذج أساس كبيرة أخرى. بخلاف التنبؤ، يستطيع scLong استنتاج شبكات العلاقات التنظيمية بين الجينات والمساعدة في تصحيح التشوّهات التقنية التي تظهر عندما تُجمع البيانات في مختبرات أو على أجهزة مختلفة.

ماذا يعني هذا لطب وبحوث المستقبل

بعبارة بسيطة، يمنح scLong العلماء خريطة عالية الدقة وواعية للسياق لنشاط الجينات داخل الخلايا المفردة، خريطة لا تتخلص من الجينات الهادئة أو النادرة الاستخدام. من خلال التعلم من ملايين الخلايا ودمج المعرفة البيولوجية الموجودة، يقدم تقديرات أكثر دقة حول كيفية استجابة الخلايا عند تعطّل جينات، أو عند إدخال أدوية جديدة، أو عند تطور العمليات المرضية. قد يسرّع هذا البحث عن علاجات جديدة، ويُوجّه اختيارات علاجية أكثر تخصيصًا، ويُشحذ فهمنا لكيفية تحكّم شبكات الجينات المعقّدة في الصحة والمرض. وبينما النموذج كبير ويحتاج موارد حسابية كبيرة، فإنّه يشير إلى مستقبل تكون فيه أنظمة الذكاء الاصطناعي العامة القوية رفقاء مرنين لاستكشاف الآليات الخفيّة في خلايانا.

الاستشهاد: Bai, D., Mo, S., Zhang, R. et al. scLong: a billion-parameter foundation model for capturing long-range gene context in single-cell transcriptomics. Nat Commun 17, 2380 (2026). https://doi.org/10.1038/s41467-026-69102-y

الكلمات المفتاحية: نسخ الخلايا المفردة, نماذج الأساس, تنظيم الجينات, تنبؤ استجابة الأدوية, تعبير الجينات