Clear Sky Science · ar
تعلّم تضمين متعدد النُّماط جزئياً مشترك لتمثيل كلي لحالة الخلية
لماذا تهم هذه الدراسة
كل خلية في أجسامنا عالم صغير، وأدوات العصر الحديث باتت قادرة على ملاحظة هذا العالم من زوايا متعددة في آن واحد — بقراءة الجينات، أو رسم خرائط لتعبئة الحمض النووي، أو تصوير البروتينات. ومع ذلك، فإن معظم الطرق الحاسوبية تمزج هذه المناظير بطريقة تجعل من الصعب معرفة أي قياس مسؤولة عن أي استنتاج. يقدم هذا البحث APOLLO، نهجاً جديداً لدمج بيانات الخلايا المتنوّعة يحافظ على تتبُّع ما هو مشترك بين القياسات وما هو خاص بكل واحدة، مقدمًا صورة أوضح وأكثر تكاملًا لسلوك الخلية.
رؤية الخلايا من عدسات متعددة
تقيس البيولوجيا الحديثة الآن بشكل روتيني عدة أنواع من المعلومات من نفس الخلية: أي الجينات مفعّلة، مدى إحكام تغليف الحمض النووي، أي البروتينات تغطي السطح، أو أين يوجد بروتين معين داخل الخلية. كل "أسلوب" أو نمط يلتقط جزءًا فقط من حالة الخلية الحقيقية. بعض الجوانب، مثل نوع الخلية العام، قد تظهر في جميع الأنماط، بينما تظهر جوانب أخرى — مثل تغليف الحمض النووي الدقيق أو موقع بروتين محدد — في نمط واحد فقط. الطرق الحسابية الحالية إما تحلل كل نمط بشكل منفصل أو تدمجها في تمثيل مختلط موحَّد. في كلا الحالتين، يجد العلماء صعوبة في تحديد أي الميزات ناتجة عن أي قياس والتنبؤ بما كان سيُظهره قياس مفقود.

خريطة جديدة للإشارات المشتركة والفريدة
يتعامل APOLLO مع هذه المشكلة من خلال تعلّم خريطة داخلية مُنظمة لكل خلية. بدلًا من مُلخص واحد غير مُميز، يقسّم المعلومات إلى ثلاثة أجزاء: مكوّن مشترك يعكس ما تشاركه القياسات المختلفة، ومكوّنان خاصان بكل نمط يلتقطان ما يميّز كل نوع من البيانات. داخليًا، يستخدم APOLLO عائلة من الشبكات العصبية تُسمى المشفّرات التلقائية (autoencoders). في خطوة تدريب أولى، يتعامل مع التمثيل الداخلي لكل خلية كمجموعة من المعاملات القابلة للضبط ويعدّلها مع شبكات فكّ التشفير بحيث يُعاد إنشاء كل نمط بدقة. في خطوة ثانية، يدرب شبكات تشفير يمكنها استنتاج نفس التمثيلات الداخلية من بيانات جديدة، مما يسمح للطريقة بالتعميم على خلايا غير مرئية وأداء توقعات عبر الأنماط.
اختبار الطريقة على بيانات مُحاكاة وحقيقية
يُقَيِّم المؤلفون أولاً أداء APOLLO على مجموعات بيانات مُحاكاة مصممة بعناية حيث تُعرف البنية الحقيقية الأساسية. عبر عدة سيناريوهات، بما في ذلك حالات تتشابك فيها العوامل المشتركة والخاصة إحصائيًا، يفصل APOLLO بينها بنجاح في المقصورات المقصودة. بعد ذلك يطبّقون الطريقة على بيانات مُزاوجة للتعبير الجيني والوصول إلى الكروماتين من جلد الفأر، وبيانات تُزاوج التعبير الجيني مع مستويات البروتين السطحي في الخلايا المناعية، وبيانات صور خلوية متعددة القياسات للغاية. في هذه المجموعات الحقيقية، يلتقط الفضاء المشترك الموضوعات البيولوجية الأساسية، مثل المنظّمات الرئيسية التي تحدد نوع الخلية، بينما تُبرز المساحات الخاصة بالأنماط طبقات إضافية مثل حالة دورة الخلية أو تأثيرات الدفعات (batch effects) التي تكون مميّزة لقياس واحد.
تنبؤ الصور المفقودة وكشف بنية الخلية
تطبيق واحد لافت يستخدم تصوير الخلايا المناعية من مرضى السرطان. هنا، لكل خلية صبغة للحمض النووي وصبغة واحدة أو عدة صبغات للبروتينات، لكن ليس كل البروتينات تقاس في كل خلية. يتعلّم APOLLO كيف ترتبط أنماط تنظيم الكروماتين بمواقع البروتينات ثم يمكنه التنبؤ بكيفية ظهور بروتين غير مُقاس في خلية معينة اعتمادًا فقط على صورتها للكروماتين. هذه الصور البروتينية المتوقعة واقعية بما يكفي بحيث أن مُصنّفًا منفصلاً، مدرّبًا للتمييز بين تشخيصات المرضى، يحقق أداءً قريبًا من أدائه على الصور الحقيقية. في مورد تصويري كبير آخر، أطلس البروتين البشري، يفصل APOLLO كيف ترتبط أشكال النواة وشبكة الأنابيب الدقيقة وشبكة الشبكة الإندوبلازمية الموضعية بمكان تواجد البروتينات داخل الخلية. لبعض البروتينات، تكون تغيّرات نسيج النواة أكثر إفادة؛ ولأخرى، تهيمن خصائص هيكل الخلية المحيط.

صورة أوضح لهوية الخلية
للغير متخصص، الرسالة الأساسية أن APOLLO يتيح للعلماء دمج قياسات متعددة لنفس الخلايا دون فقدان المسار الذي يشرح كل نتيجة. من خلال فصل المعلومات المشتركة عن المعلومات الخاصة بالأساليب صراحةً، يمكن للطريقة التنبؤ بالبيانات المفقودة — مثل صور البروتين غير المقاسة — وإبراز أي حجرة خلوية أو نوع بيانات مرتبطة فعليًا بظاهرة معينة، مثل حالة المرض أو إعادة توطين البروتين. تهيئ هذه القدرة على تكوين ملخّص مهيكل وقابل للتفسير لكل خلية أساسًا لتشخيصات أكثر دقّة وفهم آلي أعمق لكيفية تعاون طبقات البيولوجيا المختلفة.
الاستشهاد: Zhang, X., Shivashankar, G.V. & Uhler, C. Partially shared multi-modal embedding learns holistic representation of cell state. Nat Comput Sci 6, 285–300 (2026). https://doi.org/10.1038/s43588-025-00948-w
الكلمات المفتاحية: تعدد الوسائط على مستوى الخلية الواحدة, تعلّم التمثيل, حالة الخلية, توضع البروتين, تصوير الكروماتين