Clear Sky Science · ar

DeepRetro يكتشف مسارات الاستعادية التركيبية عبر استدلال متكرر بنماذج اللغة الكبيرة

· العودة إلى الفهرس

لماذا الكيمياء الأذكى مهمة

تبدأ العديد من أهم الأدوية والمواد اليوم كمركبات معقدة يصعب صنعها. إن تخطيط كيفية بناء هذه الجزيئات في المختبر يشبه إلى حدّ ما تحديد أفضل طريقة لتفكيك ثم إعادة تجميع آلة معقدة باستخدام قطع غيار. خطوة التخطيط هذه، التي تُسمى تصميم التخليق، تشكل غالبًا عنق زجاجة رئيسياً في اكتشاف الأدوية والمواد المتقدمة. تقدم هذه الورقة DeepRetro، نظامًا مفتوح المصدر يستخدم نماذج اللغة الكبيرة — نفس فئة الذكاء الاصطناعي وراء روبوتات الدردشة الحديثة — مع برامج كيميائية تقليدية وخبرة بشرية لتصميم وصفات خطوة بخطوة واقعية لصنع جزيئات معقدة للغاية.

Figure 1
الشكل 1.

تفكيك الجزيئات الكبيرة إلى أجزاء يمكن إدارتها

عادة ما يخطط الكيميائيون للتخليق بالعمل رجوعًا من الجزيء الهدف، «مفكِّكين» ذهنيًا إياه إلى قطع أبسط يمكن شراؤها أو تحضيرها. تساعد الحواسيب في هذه المهمة منذ عقود، لكن الأدوات الحالية تكافح عندما تصبح الجزيئات معقدة للغاية أو غريبة أو مختلفة عن أي شيء في قواعد بيانات التفاعلات لديها. تتعامل DeepRetro مع هذا عبر الجمع بين عالمين: محركات سريعة قائمة على قواعد تطبق أنماط التفاعل المعروفة، و«دماغ» قائم على نموذج لغة يمكنه اقتراح طرق غير عادية لكنها منطقية كيميائيًا لتفكيك الجزيء. بدلًا من أن يُطلب من الذكاء الاصطناعي ابتكار وصفة كاملة دفعة واحدة، تطلب DeepRetro خطوة رجعية واحدة في كل مرة ثم تتحقق من كل اقتراح بعناية.

إبقاء الذكاء الاصطناعي أمينًا

تكمن مشكلة رئيسية مع نماذج اللغة الكبيرة في أنها قد «تتوهّم» — قد تقترح بثقة خطوات تنتهك مبادئ كيميائية أساسية. تحيط DeepRetro بالذكاء الاصطناعي بعدة طبقات من الفحص الآلي. يُختبر كل جزيء وسيط مقترح من حيث الصحة البسيطة (مثل عدد الروابط لكل ذرة)، ومن حيث الاستقرار المحتمل، ومن حيث التناسق الداخلي مع بقية التفاعل. تُرفض الاقتراحات التي تفشل في هذه الاختبارات. أما الاقتراحات التي تجتازها، فيستدعي النظام محرك بحث تقليدي أكثر ليرى ما إذا كانت الكيمياء المعروفة يمكنها ربط هذه اللبنات مرة أخرى بمواد بداية قابلة للشراء. يمكن للكيميائيين أيضًا التدخل في أي نقطة عبر واجهة رسومية: يمكنهم تعديل البنى، إعادة تشغيل جزء فقط من المسار، أو إضافة مجموعات واقية شائعة تجعل الكيمياء متعددة الخطوات عملية.

Figure 2
الشكل 2.

اختبار النظام

لفحص مدى جودة عمل DeepRetro، قيَّم المؤلفون النظام على مجموعات معيارية قياسية من التفاعلات مأخوذة من قواعد بيانات براءات الاختراع. بالنسبة لتنبؤات الخطوة الواحدة — تخمين المتفاعلات التي يمكن أن تشكل منتجًا مُعطى — طابق النظام أداء أدوات قوية قائمة أو تفوق عليها في عدة مقاييس، وخاصة في التعرف الصحيح على السلف الأساسي حتى عندما اختلفت المكونات الثانوية. بالنسبة لتخطيط متعدد الخطوات، حل DeepRetro تقريبًا جميع الأهداف في مجموعتين اختبار متطلبتين، بما في ذلك مجموعة من الجزيئات الشبيهة بالأدوية الصعبة بشكل خاص، متفوقًا على طرق سابقة رائدة. ومن المهم أن هذه الاختبارات جرت في وضع آلي كامل، دون تصحيحات بشرية، ما يُظهر أن الإطار متين حتى قبل تدخل الكيميائيين الخبراء.

حالات واقعية

قد تغفل المقاييس الحالة ما يهم الكيميائيين فعلاً: هل يبدو المسار المقترح شيئًا قد يجربه ممارس ماهر في المختبر؟ لذلك درس المؤلفون خمسة منتجات طبيعية شهيرة ومعقدة للغاية، بما في ذلك المضاد الحيوي إريثروميسين B وdiscodermolide، والقلويد ريزربين. في كل حالة، عملت DeepRetro جنبًا إلى جنب مع الكيميائيين البشريين في حلقة تكرارية. اقترح الذكاء الاصطناعي نقاط فصل وشظايا مسار؛ قام الكيميائيون بقص الأفكار المشكوك فيها، وتصحيح قضايا كيمياء فراغية دقيقة، وأحيانًا دفعوا النظام بوسيطة رئيسية. في حالتين، أنتجت DeepRetro خططًا تركيبية كاملة كانت استراتيجيتها العامة لا تطابق أي شيء وجده المؤلفون في الأدبيات، رغم أن التفاعلات الفردية كانت معروفة. يشير هذا إلى أن النظام يمكنه إعادة تركيب كيمياء مألوفة إلى مسارات عالمية جديدة حقًا.

الواعد والحدود وما هو قادم

تُظهر DeepRetro أن نماذج اللغة الكبيرة يمكن أن تكون أكثر من مولدات نصية ذكية؛ عندما تُشرف بإحكام وتُدمج مع أدوات راسخة، يمكنها المساعدة في التنقل في فضاء البحث الضخم لعمليات التخليق الكيميائي الممكنة. لا يزال للإطار حدود: نماذج اللغة العامة تقترح غالبًا وسائط وسطية غير مستقرة أو غير واقعية، والحلول الآلية الكاملة لأصعب الجزيئات تبقى بعيدة دون إشراف بشري. ومع ذلك، فإن أداء DeepRetro القوي في الاختبارات المعيارية، ونجاحه في دراسات حالة تحدّية، وإصداره مفتوح المصدر يجعله قالبًا عمليًا لاكتشاف علمي مساعد بالذكاء الاصطناعي في المستقبل. للمختصين غير المتخصصين، الخلاصة هي أن الذكاء الاصطناعي ينتقل من مجرد توقع خصائص جزيئية إلى المشاركة في تصميم وصفات مخبرية جديدة بالكامل، مع إمكانية تسريع ابتكار الأدوية والمواد في السنوات المقبلة.

الاستشهاد: Sathyanarayana, S.V., Hiremath, S.D., Rahil Kirankumar, S. et al. DeepRetro discovers retrosynthetic pathways through iterative large language model reasoning. Sci Rep 16, 8448 (2026). https://doi.org/10.1038/s41598-026-38821-z

الكلمات المفتاحية: الاستعادية التركيبية, نماذج اللغة الكبيرة, تخطيط التخليق العضوي, اكتشاف الأدوية, الكيمياء الحاسوبية