Clear Sky Science · ar

التعلّم العميق الجزيئي على حافة فضاء الكيمياء

· العودة إلى الفهرس

لماذا تهم توقعات الأدوية الأكثر ذكاءً

يعتمد اكتشاف الأدوية الحديث بشكل متزايد على الذكاء الاصطناعي لفرز مكتبات هائلة من المواد الكيميائية وتحديد المرشحين الواعدين. لكن هناك مشكلة: العديد من نماذج التعلّم الآلي تعمل بشكل جيد فقط على الجزيئات التي تشبه إلى حد كبير تلك التي رأتْها سابقاً. عندما يُطلب منها تقييم مركبات أكثر غرابة — وهي بالضبط المركبات التي قد تصبح أدوية من فئة جديدة — قد تصبح هذه النماذج واثقة بصورة مفرطة وخاطئة. تُقدّم هذه الدراسة طريقة جديدة لمعرفة متى يكون النموذج على أرض هشة، مما يساعد الباحثين على التقدم بأمان إلى مناطق غير مستكشفة في فضاء الكيمياء.

عندما ينتهي الخريطة

في مرحلة الاكتشاف المبكرة للأدوية، يبحث العلماء عن «نقاط إصابة»: جزيئات صغيرة تؤثر على هدف بيولوجي مثل بروتين مرتبط بمرض. وبما أن إجراء تجارب مخبرية على مليارات الجزيئات الممكنة أمر مستحيل، تُدرّب نماذج التعلّم الآلي على بضع مئات أو آلاف من المركبات المعروفة ثم تُستخدم للتنبؤ بالمركبات الجديدة التي تستحق التجربة. ومع ذلك، تميل هذه النماذج إلى التعطل عند مواجهة جزيئات لا تشبه بيانات التدريب — وهي مشكلة تُعرف بتحول التوزيع. التدابير الوقائية الحالية إما ترسم حدّاً صلباً حول المنطقة المعروفة، وتمنع المركبات الأكثر مغامرة، أو تُقدّر عدم التيقّن بطرق قد تضلّل عندما يرى النموذج شيئاً جديداً حقاً.

Figure 1
الشكل 1.

حساسية جديدة للغرابة

يقترح المؤلفون استراتيجية مختلفة مبنية على نوع من أنظمة التعلّم العميق تُسمى المُشفر التلقائي (autoencoder). نموذجهم «الجزيئي المشترك» يتعلّم مهمتين في آن واحد: توقع ما إذا كانت الجزيئة نشطة على هدف معين، وإعادة بناء الجزيئة من رمز داخلي مضغوط. إذا عانى النموذج لإعادة بناء جزيئة معينة بدقة، تُعتبر تلك الجزيئة «غير مألوفة». يحوّل الفريق خطأ إعادة البناء هذا إلى درجة رقمية تسمى الغرابة، تعكس مدى بُعد الجزيئة عن أنماط الكيمياء التي تعلّمها النموذج فعلياً. والأهم أن هذه الدرجة تستند إلى فهم النموذج الكيميائي نفسه بدل الاعتماد على مقاييس تشابه يدوية وبسيطة.

اختبار حافة فضاء الكيمياء

لاختبار مدى قدرة مقياس الغرابة على كشف أن النموذج تجاوز عمقه، جمع الباحثون 33 مجموعة بيانات تغطي أهدافاً بيولوجية وخواص مختلفة. استخدموا طرق التجميع لتقسيم كل مجموعة إلى أمثلة نموذجية وأخرى أكثر غرابة هيكلياً، مُحاكيين الفارق بين الجزيئات المدروسة جيداً وتلك الجديدة. عبر هذه المعايير المرجعية، كانت الجزيئات المصنفة على أنها خارجة عن التوزيع تُظهر باستمرار درجات غرابة أعلى. ولم يكن بالإمكان تفسير هذا التأثير عبر سمات بديهية مثل حجم الجزيئة أو تعقيدها. بدلاً من ذلك، راقبت الغرابة عن كثب مدى بُعد النواة البنيوية للجزيئة عن تلك الموجودة في مركبات التدريب، مما يؤكد أن النموذج كان يكتشف فعلاً مدى «انحراف» الجزيئة عن المخطط.

ما الذي قد تفوته الشكوك وحدها

قارن الفريق بعد ذلك الغرابة بعدة طرق شائعة لتقييم موثوقية التنبؤ، بما في ذلك عدم اليقين في النموذج ومقاييس مختلفة للتشابه الكيميائي. ارتبطت كل من الغرابة وعدم اليقين بأداء المصنف: عندما كان أي من المقياسين مرتفعاً، كانت التنبؤات أقل دقة. ومع ذلك، كان الإشاران مستقلين إلى حد كبير. التقطت الغرابة كل من البُعد البنيوي والأداء، بينما لم يعكس عدم اليقين وحده البنية جيداً، لا سيما عندما أتت الجزيئات من توزيع مختلف جداً. في عمليات فرز افتراضية ضخمة شملت أكثر من مليون مركب تجاري، فصلت الغرابة بوضوح المركبات الروتينية عن تلك الجديدة فعلاً، بينما أشار عدم اليقين إلى فارق طفيف بين المجموعتين.

Figure 2
الشكل 2.

من شاشة الكمبيوتر إلى المختبر الرطب

لإظهار الأثر العملي، أجرى الباحثون فرزاً توقعياً على نحو 180,000 جزيئة قابلة للشراء، باحثين عن مثبطات لإنزيمين مرتبطين بالأمراض، PIM1 وCDK1. درّبوا نموذجهم المشترك على مجموعات بيانات موجودة متواضعة ثم رتبوا المركبات الجديدة باستخدام ثلاثة عناصر معاً: النشاط المتوقع، عدم يقين النموذج والغرابة. بعد شراء واختبار 60 جزيئة فقط في تجارب بيوكيميائية، اكتشفوا سبعة ذات فاعلية ميكرومولارية منخفضة، كلها متميزة هيكلياً عن مركبات التدريب ومختلفة عن مثبطات الكيناز النموذجية. استراتيجيات التفضيل للغرابة المنخفضة — مع السماح ببعض عدم اليقين — أميلت لإنتاج أفضل النتائج، مما يوحي بأن الانتباه إلى الغرابة يمكن أن يوجّه الاستكشاف نحو كيمياء واعدة لكنها ليست غريبة تماماً.

ما الذي يعنيه هذا للأدوية المستقبلية

بعبارة بسيطة، تمنح درجة الغرابة نماذج التعلّم الآلي في الكيمياء إحساساً مدمجاً بمتى تكون تقوم باستقراءات أبعد من نطاق معرفتها. من خلال ربط هذا الإحساس بقدرة النموذج على إعادة بناء الجزيئات، يعكس النهج في آن واحد التشابه الكيميائي ومصداقية التنبؤ. تظهر الدراسة أن هذه المتريكة يمكن أن تكشف تحولات في التوزيع التي تفشل الطرق التقليدية في رصدها، وتحسّن ترتيب الأولويات في عمليات الفرز الافتراضية وتساعد على اكتشاف مواد كيميائية جديدة في تجارب فعلية. مع تزايد مغامرات الباحثين في شاسع فضاء الكيمياء الذي لم تُستكشف معظم مناطقه بعد، تقدّم الغرابة بوصلة مبدئية مبنية على مبادئ لاختيار التنبؤات الجريئة التي تستحق التصديق — واختبارها في المختبر.

الاستشهاد: van Tilborg, D., Rossen, L. & Grisoni, F. Molecular deep learning at the edge of chemical space. Nat Mach Intell 8, 575–587 (2026). https://doi.org/10.1038/s42256-026-01216-w

الكلمات المفتاحية: التعلّم الآلي للجزيئات, اكتشاف الأدوية, فضاء الكيمياء, خارج التوزيع, الفرز الافتراضي