Clear Sky Science · ar

محول مسبق التدريب متساوق لتمثيل جزيئي ثلاثي الأبعاد موحَّد

· العودة إلى الفهرس

تعليم الحواسيب رؤية الجزيئات ثلاثية الأبعاد

يعتمد تصميم أدوية ومواد جديدة على فهم شكل الجزيئات وحركتها في ثلاثة أبعاد، وليس فقط كصيغ مسطحة على الورق. يقدم هذا البحث نموذج ذكاء اصطناعي قويًا جديدًا يمكنه التعلم من الأشكال ثلاثية الأبعاد لأنواع عديدة من الجزيئات في آن واحد — من المركبات الصغيرة الشبيهة بالأدوية إلى البروتينات الكبيرة ومجمعاتها — ثم استخدام تلك المعرفة للتنبُّؤ بشدة تفاعلاتها وبأيها قد يصبح دواءً مستقبليًا.

خريطة واحدة لعديد العوالم الجزيئية

أدوات الذكاء الاصطناعي الحالية في الكيمياء عادة ما تكون متخصصة: نموذج يتدرب على الجزيئات الصغيرة فقط، وآخر على البروتينات فقط، وثالث على مركباتها. هذا التجزئة تهدر البيانات وتُصعِّب نقل ما تعلَّم في مجال إلى آخر. بدلًا من ذلك، يبني المؤلفون نموذجًا أساسياً واحدًا يسمى «المحول المسبق التدريب المتساوق» (EPT)، يتعلم من مجموعة هائلة من التركيبات ثلاثية الأبعاد المأخوذة من قواعد بيانات عامة متعددة. من خلال معالجة كل هذه التركيبات ضمن إطار مشترك واحد، يستطيع النموذج التعرف على أنماط عامة في ترتيب وتفاعل الذرات، سواء كانت تنتمي إلى جزيء دوائي بسيط أو إلى عقدة معقدة من سلاسل البروتين.

Figure 1
الشكل 1.

تفكيك الجزيئات إلى قطع قابلة للإدارة

للتعامل مع التنوع والحجم الهائلين للأنظمة الجزيئية، يقدم الباحثون فكرة «الكتل» — قطع صغيرة ذات معنى من الذرات. بالنسبة للجزيئات الصغيرة، تجمع الكتلة ذرة ثقيلة مع الهيدروجينات المرتبطة بها؛ أما في البروتينات، فتصبح كل حمض أميني كتلة. أثناء التدريب، يرى النموذج كلًا من الذرات الدقيقة والبنية الكتلية الأعمق، مما يتيح له ربط التفاصيل الكيميائية المحلية بالأشكال ثلاثية الأبعاد الأوسع مثل العمود الفقري للبروتين أو جيوب الارتباط. كما تخلق هذه النظرة الكتلية لغة مشتركة تعمل عبر أنواع جزيئية مختلفة جدًا، مما يجعل من الممكن لنموذج واحد أن يفهمها جميعًا.

التعلم عن طريق تنظيف التركيبات المشوشة

بدلًا من إعطاء تسميات صريحة مثل «هذه الجزيء قابل للذوبان» أو «هذا يرتبط بقوة»، يتم تدريب EPT بطريقة التعلم الذاتي الموجَّه. يقوم المؤلفون عمدًا بتشويش كل كتلة جزيئية، بإزاحة وتدوير عشوائي لموقعها الحقيقي، ثم يطلبون من النموذج استنتاج القوى والالتواءات اللازمة لاستعادة البنية الأصلية. وبما أن التدريب يحترم قواعد هندسية أساسية — ينبغي أن تبدو الجزيئات نفسها إذا دارت أو تحركت في الفضاء ككل — يتعلم النموذج إحساسًا فيزيائيًا معقولًا بالشكل ثلاثي الأبعاد. تعلمه هذه اللعبة التنظيفية كيف تتماسك الذرات داخل الكتل وبينها، وكيف تؤثر التغيرات الهندسية الدقيقة على الاستقرار.

Figure 2
الشكل 2.

وضع النموذج قيد الاختبار

بعد التدريب المسبق على أكثر من خمسة ملايين تركيب، يتم ضبط EPT بشكل نهائي لعدة مهام علمية حقيقية. يتنبأ بمدى قوة ارتباط جزيء صغير بجيب بروتيني، وكيف يؤثر طفر واحد في واجهة بروتينية على الارتباط، وببعض الخواص الفيزيائية المهمة للجزيئات الصغيرة التي يهتم بها الكيميائيون. عبر مجموعات معايير متنوعة، يوازي النموذج الموحد أو يتفوق على أفضل الأدوات الحالية، بما في ذلك تلك المصمَّمة بعناية لمجال واحد فقط. ومن الجدير بالذكر أنه عندما يتدرب على نوع واحد من البيانات، مثل الجزيئات الصغيرة، لا يزال مفيدًا في مهام تبدو مختلفة، كارتباط البروتين، ما يكشف أنه قد التقط مبادئ كيميائية واسعة النطاق بدلًا من حيل ضيقة.

البحث عن علاجات جديدة لكوفيد-19

يوضح المؤلفون أيضًا القيمة العملية لـ EPT بتطبيقه على تحدٍ لإعادة توظيف الأدوية. يضبطون النموذج أولًا على مركبات البروتين-الرابط ثم يستخدمونه لترتيب ما يقرب من 2000 دواء مُصابَح سابقًا بحسب قدرتهم المتوقعة على الارتباط بالبروتياز الرئيسي لفيروس SARS‑CoV‑2، وهو إنزيم رئيسي يحتاجه الفيروس للتكاثر. ترتفع الأدوية المعروفة المضادة لكوفيد-19 نحو قمة الترتيب، ويسلط النموذج الضوء على مرشحين واعدين إضافيين. يتم فحص اثني عشر جزيئًا من الأعلى بمزيد من المحاكاة الحاسوبية، ويظهر اثنان — بما في ذلك واحد لم يُطوَّر أصلاً لكوفيد-19 — ارتباطًا متوقعًا قويًا للغاية ويتم التأكيد تجريبيًا على أنهما يثبطان البروتياز الفيروسي عند مستويات ميكرومولار.

خطوة نحو ذكاء اصطناعي جزيئي عام

بعبارات مبسطة، تُظهر هذه الدراسة أن نموذج ذكاء اصطناعي واحد مُدرك للهندسة يمكنه تعلم فهم ثلاثي الأبعاد مشترك لأنظمة جزيئية عديدة ثم استخدامه للإجابة عن مجموعة واسعة من الأسئلة العلمية. من خلال تنظيم الجزيئات إلى كتل وتدريب النموذج على «إصلاح» التركيبات المشوَّهة، يبتكر المؤلفون أداة لا تتنبأ بالأرقام بدقة أكبر فحسب، بل يمكنها أيضًا تسريع مهام مثل اكتشاف أدوية مضادة للفيروسات. يشير EPT إلى مستقبلٍ قد تساعد فيه أنظمة الذكاء الاصطناعي ذات الأغراض العامة الكيميائيين والبيولوجيين على استكشاف الفضاء الكيميائي بكفاءة أكبر، موجهة التجارب ومقصِّرة الطريق من البنية الذرية إلى العلاجات والمواد العملية.

الاستشهاد: Jiao, R., Kong, X., Zhang, L. et al. An equivariant pretrained transformer for unified 3D molecular representation learning. Nat Commun 17, 2606 (2026). https://doi.org/10.1038/s41467-026-69185-7

الكلمات المفتاحية: تمثيل جزيئي ثلاثي الأبعاد, محول متساوق, اكتشاف الأدوية, ارتباط البروتين-الرابط, التعلم الذاتي الموجَّه