Clear Sky Science · ar

طريقة جديدة عامة مركزة على المجال لتصنيف البروتينات

· العودة إلى الفهرس

لماذا يهم فرز البروتينات للصحة

داخل كل خلية، تعمل آلاف الآلات البروتينية الصغيرة للحفاظ على سير الحياة بسلاسة. من بين الأهم توجد كينازات البروتين، إنزيمات تشغّل أو توقف بروتينات أخرى وهي أهداف رئيسية للعديد من الأدوية الحديثة، لا سيما علاجات السرطان. ومع ذلك لا يزال العلماء يواجهون صعوبة في تصنيف كل الكينازات إلى عائلات تعكس آليات عملها بدقة. تعرض هذه المقالة طريقة جديدة لتصنيف الكينازات—وبالمبدأ العديد من البروتينات الأخرى—من خلال التركيز على المنطقة الأساسية المشتركة التي تقوم بالمهمة، وعلى الخصائص الفيزيائية والكيميائية الأساسية لبناتها. هذا يعد بخرائط أدق لعائلات البروتينات وبشواهد أفضل في نهاية المطاف لتصميم الأدوية.

Figure 1
الشكل 1.

من أشجار العائلة إلى بصمة أكثر تفصيلاً

تقليديًا، جُمعت الكينازات في فئات عن طريق مقارنة تسلسلات جيناتها أو بروتيناتها وبناء "أشجار عائلية" تطورية. كانت هذه المقاربة ناجحة للغاية، كاشفة عن نحو 500 كيناز بشري تقع ضمن عدة مجموعات رئيسية مثل AGC وCAMK وCMGC وSTE وTK وTKL وغيرها. ومع ذلك فإن العديد من الكينازات المكتشفة حديثًا لا تتناسب بوضوح مع هذه المجموعات: تبدو تسلسلاتها مختلفة رغم أنه قد تتشابه سلوكياتها داخل الخلايا. كما أن المقارنات القياسية تولي اهتمامًا ضئيلًا لخصائص كل حمض أميني الأساسية—الحجم أو الشحنة أو السمة المحبة للماء التي تحدد كيف يطوى البروتين ويعمل. يجادل المؤلفون بأنه لفهم عائلات الكينازات حقًا، نحتاج إلى النظر إلى ما يتجاوز مطابقة التتابع الأبجدية وفحص هذه البصمات الفيزيكو-كيميائية.

التكبير على النواة الفعّالة للكينازات

للقيام بذلك، استخدم الباحثون محاذاة عالية الجودة لـ497 نطاقًا من نطاقات الكيناز البشري، وهي النوى المدمجة التي تؤدي فعليًا التفاعل الكيميائي لإضافة مجموعات الفوسفات. لكل موضع في خريطة النطاق المشتركة هذه، استبدلوا حرف الحمض الأميني بما يصل إلى 30 واصفًا رقميًا يلتقط خصائص مثل الشحنة والهيدروفوبية والقطبية والحجم، بالإضافة إلى علامة إضافية للفجوات. النتيجة هي صورة رقمية مفصّلة لكل نطاق كيناز، حيث ينبغي أن يترجم السلوك المماثل في الفراغ ثلاثي الأبعاد إلى أنماط متشابهة في هذه الأرقام. ثم قللوا من تعقيد هذه الصور باستخدام تحليل المكونات الرئيسية، وهي تقنية قياسية تُكثف قياسات عديدة إلى عدد قليل من الاتجاهات الرئيسة التي تلتقط أكبر الفروقات.

ترك البيانات لتتجمع بنفسها

دون إخبار الحاسوب بأي كيناز ينتمي إلى أي فئة معروفة، طبّق الفريق طريقة تجميع غير خاضعة للرقابة تُسمى k-means على البيانات الرقمية المُقلّصة. استكشفوا أعدادًا متعددة محتملة من المجموعات واستخدموا مقاييس إحصائية لتحديد التجميعات الأكثر معنى، ثم جمعوا عدة حلول من هذا النوع في مجموعة نهائية مكوّنة من 24 مجموعة، لكل منها درجة ثقة تعكس مدى ثباتها عبر التشغيلات. ومن اللافت أن نحو 90% من الكينازات انتهت في مجموعات تطابقت مع تسميات فئاتها الأصلية، مما يشير إلى أن البورتريه الفيزيكو-كيميائي للنطاق يستعيد بطبيعته—وفي بعض الأحيان يوضّح—التصنيفات القائمة. احتوت بعض المجموعات على مزيج من فئة رئيسية وكينازات مصنفة سابقًا كـ"أخرى"، ما يوحي بأن هذه الشواذ قد تنتمي فعلاً إلى عائلة معروفة.

اكتشاف نقاط ساخنة هيكلية مهمة

بعيدًا عن التجميع، تكشف الطريقة عن أي أجزاء من نطاق الكيناز هي التي تقود هذه الاختلافات فعلاً. من خلال دمج المكونات الرئيسية مع خصائص البقايا ثم إجراء اختبارات عشوائية عن طريق الخلط، حدّد المؤلفون مواضع محددة تُميّز أنماط خصائصها بين فئة وأخرى بقوة. مثال بارز هو موقع في حلقة التفعيل في كينازات CMGC الذي يحمل تقريبًا دائمًا حمضًا أمينيًا ذا شحنة موجبة، على عكس معظم الفئات الأخرى. تُظهر النماذج الهيكلية أنه في كيناز CMGC نموذجي، يساعد هذا البقايا على تثبيت مواقع مفسفرة مجاورة تكون حاسمة لتشغيل الإنزيم. ومن المثير للاهتمام أن كينازًا "غير مصنف" يُدعى CDC7 يشارك بيئة مشابهة في هذا الموقع، مما يدعم التنبؤ بأنه يتصرف مثل كيناز CMGC رغم اختلاف تاريخه التطوري.

Figure 2
الشكل 2.

تعليم الآلات لتوسيم المجهول

لتحويل هذه الرؤى إلى تنبؤات عملية، درّب الفريق نماذج تعلّم آلي خاضعة للإشراف—بما في ذلك الانحدار اللوجستي والغابات العشوائية ومصنّف احتمالي—على البصمات الفيزيكو-كيميائية للكينازات ذات التسميات المعروفة. بعد ضبط دقيق والتحقق المتقاطع، تمكنت هذه النماذج من تعيين الكينازات بدقة إلى الفئات الرئيسية باستخدام عدد قليل فقط من المكونات الرئيسية. عند تطبيقها على 66 كينازًا تُركت في مجموعة "أخرى" العامة، أعادت النماذج بشكل متسق تصنيف عدة منها، مثل CDC7 وأعضاء عائلة ULK، إلى فئات كيناز محددة. دعمت الفحوصات الهيكلية لهذه الإعادات، لا سيما حول المواقع الرئيسية المحددة سابقًا، تنبؤات الآلة ووضّحت كيف يمكن للطريقة أن توجه إعادة التصنيف والمتابعة التجريبية.

وصفة عامة لرسم خرائط عائلات البروتين

بعبارات يومية، تُظهر هذه الدراسة أن البروتينات يمكن فرزها ليس فقط بكتابة تسلسلاتها، بل بتقطير كيف تتصرف أجزاؤها الأساسية فيزيائيًا وكيميائيًا. بالنسبة للكينازات، تستعيد هذه الرؤية المركزة على النطاق والمعتمدة على الخصائص العائلات المعروفة، وتساعد على إعادة وسم الشاذين، وتبرز "نقاطًا ساخنة" هيكلية مهمة للنشاط والتنظيم. وبما أن الوصفة تعتمد فقط على محاذاة نطاق مشترك وواصفات عامة للأحماض الأمينية، يظهر المؤلفون أيضًا أنها قابلة للتطبيق على مجموعات بروتينية أخرى مثل GTPases الصغيرة، وقد تمتد إلى الغلوبولينات المناعية، ومستقبلات البروتين G المقترنة، وغيرها. ومع تحسّن هذه الخرائط، يمكن أن توجه تصميم أدوية أكثر خصوصية، وتساعد في تفسير الطفرات المسببة للأمراض، وتقدّم أطلسًا أوضح يركّز على الوظيفة لعالم البروتينات.

الاستشهاد: Fadaei, S., Krebs, F.S. & Zoete, V. Novel universal domain-centric method for protein classification. Sci Rep 16, 11850 (2026). https://doi.org/10.1038/s41598-026-41142-w

الكلمات المفتاحية: كينازات البروتين, تصنيف البروتينات, التعلّم الآلي, مجالات البروتين, علم الأحياء القائم على البنية