Clear Sky Science · he

יצירה de novo ומסנון במחשב של מועמדי פפטידים אנטי־סוכרתיים באמצעות מסגרת למידת עומק עם מנגנון תשומת לב ומיזוג תכונות פיזיקוכימיות

· חזרה לאינדקס

מדוע עיצוב פפטידים חכם יותר חשוב לסוכרת

סוכרת משפיעה על מאות מיליוני אנשים ברחבי העולם ותרופות נוכחיות אינן פועלות באופן מושלם אצל כולם. טיפולים רבים מאבדים את יעילותם עם הזמן או גורמים לתופעות לוואי. אפשרות מבטיחה חדשה היא קבוצה של חלבונים זעירים הנקראים פפטידים אנטי־סוכרתיים, היכולים לכוונן את רמות הסוכר בדם בדיוק גבוה. האתגר הוא שגילוי תרופות פפטידיות במעבדה איטי ויקר. מחקר זה מציג צינור עבודה ממוחשב שיכול להמציא ולסנן כמויות גדולות של פפטידים מועמדים אנטי־סוכרתיים, ולהכוון חוקרים לכיוונים המבטיחים ביותר לבדיקה בעולם האמיתי.

מפפטידים ידועים לסוכרת לנתוני התחלה נקיים

החוקרים התחילו באיסוף אוסף איכותי של פפטידים שהוכחו ניסויית כמשפיעים על רמות הסוכר, בעיקר על ידי השפעה על הורמונים כגון GLP-1 או על אנזימים כמו DPP‑IV. אלה שימשו כדוגמאות "חיוביות". לאחר מכן הם בנו סט "שלילי" תואם של פפטידים ללא פעילות אנטי־סוכרתית מדווחת, שנבחר בקפידה כך שאורכם, הרכבם והכימיה הבסיסית שלהם יידמו את אלו החיוביים. כדי להימנע מהטיית המודל על ידי דופליקטים קרובים, השתמשו בכלי דמיון רצפים כדי לוודא שפפטידים קרובים מבחינה רצף מעולם אינם מופיעים גם בקבוצות האימון וגם בקבוצות הבדיקה. חלוקה זו המודעות להומולוגיה הבטיחה שהמערכת תוערך על יכולתה לזהות דפוסים חדשים באמת במקום לשנן ישנים.

Figure 1
Figure 1.

קידוד הכימיה כך שמכונות יכולות לקרוא פפטידים

עבור מחשב, פפטיד הוא סתם מחרוזת אותיות שמייצגות חומצות אמינו. כדי לקשר אותן לביולוגיה, הצוות הפך כל חומצת אמינו לחמש תכונות כימיות בסיסיות: כמה היא דוחה מים (הידרופוביות), מטען חשמלי, נטייה ליצור קשרי מימן, מסת מולקולה והאם יש לה טבע ארומטי. זה הפך כל פפטיד ל"תמונה" קטנה ששואפת ללכוד גם סדר וגם כימיה. בנוסף לכך הוסיפו תיאורים כוללים של הפפטיד כמו מטען כולל, הידרופוביות ממוצעת ואינדקס בומן, שמתייחס לנטייה של פפטיד להתחבר לחלבונים אחרים. יחד התכונות הללו מאפשרות למודל להסתכל גם על דפוסים מקומיים—מוטיבים קצרים של חומצות אמינו—וגם על תכונות גלובליות המשפיעות על התנהגות הפפטיד בגוף.

מנוע למידת עומק שמסביר את בחירותיו

ליבה של הצינור היא מודל היברידי של למידת עומק. רשת נוירונים להתכנסות (CNN) סורקת לאורך הפפטיד, מחפשת מוטיבים קצרים הנוטים להופיע בפפטידים פעילים, בדומה למסננים במערכת זיהוי תמונות. מעל לכך, שכבת תשומת לב לומדת אילו מיקומים ברצף חשובים ביותר, ותופסת יחסי מרחק ארוכי טווח בין שאריות מרוחקות. פלט המנוע הרצפי הזה מאוחד עם התיאורים הכימיים הגלובליים ומועבר למספר מסווגים סטנדרטיים של למכונה—מכונות וקטורים תומכות, עצי החלטה, שכני k הקרובים ועצים מואצים בגרדיאנט. שיטת אופטימיזציה מיוחדת, שנקראת OptimizedTPE, מגדירה אוטומטית את הפרמטרים שלהם, ומוצאת איזון בין דיוק לסיכון של התאמה יתרה. מנגנון התשומת לב גם מספק "מפות חשיבות" ברמת השאריות, שעוזרות למדענים לראות אילו חלקים בכל פפטיד מניעים את החלטות המודל.

Figure 2
Figure 2.

המצאת מועמדים חדשים תוך הימנעות מדליפת נתונים

כדי להתגבר על המספר הקטן של פפטידים אנטי־סוכרתיים ידועים, הצוות הוסיף שלב יצירה שמספק אימון בלבד. הם השתמשו בתערובת של אסטרטגיות—מוטציות מונחות, רקומבינציה של מוטיבים ואוטואנקטודור ווריאציוני (VAE)—להצעת רצפים חדשים שדומים אך אינם מעתקים פפטידים פעילים ידועים. מועמדים אלה סוננו דרך "שערי תיאורים" מחמירים שמכפים מטען ריאלי, גודל ונטייה לקשור, בנוסף לכלים חיצוניים שמדרגים דמיון לפפטידים ביואקטיביים ידועים. רק רצפים שעברו את המסננים האלה ונשארו שונים בבירור מכל פפטידי המבחן נשמרו כתוויות חיוביות חלשות לאימון; אף אחד מהם לא שימש להערכת המודל. גישה זו הרחיבה את סט האימון תוך שמירה על סט בדיקה נקי וללא הטיות.

כמה טוב המערכת עובדת ומה המשמעות

כאשר נבחנה מול פאנל עצמאי לחלוטין של 180 פפטידים שנחקרו ניסויית ונאספו מהספרות העדכנית, המסגרת סיווגה נכון בערך 99 מתוך 100 רצפים, עם דיוק וזיכרון (precision ו‑recall) בסמוך ל‑0.99. במונחים מעשיים, זה אומר שהיא נדירה בפספוס פפטיד אנטי־סוכרת אמיתי ונדירה בהגדרת פפטיד לא פעיל כמבטיח. ניתוחי מפת התשומת לב ומבחני מוטציה הראו שהמודל למד חוקים כימיים הגיוניים: הוא נשען בחוזקה על שאריות בעלות מטען חיובי ועל שאריות הידרופוביות מסוימות הידועות כחשובות לקשירה למטרות הקשורות לסוכרת. סימולציות דוקינג מולקולרי הראו בנוסף שכמה מהפפטידים החדשים שהורכבו יכולים ליצור מגעים סבירים עם קולטן ה‑GLP‑1 האנושי. אף שהתחזיות הללו דורשות עדיין אימות במעבדה, המחקר מדגים דרך שחזורית ומבוססת ביולוגית לחקור את המרחב העצום של תרופות פפטידיות אפשריות ולהעדיף את המעטים הסבירים ביותר לעזרה בניהול סוכרת.

ציטוט: Asl, Z.R., Rezaee, K., Ansari, M. et al. De novo generation and in silico screening of anti-diabetic peptide candidates via a deep learning–attention framework with physicochemical feature fusion. Sci Rep 16, 6580 (2026). https://doi.org/10.1038/s41598-026-39985-4

מילות מפתח: פפטידים אנטי־סוכרתיים, למידת עומק, גילוי תרופות, עיצוב פפטידים, קולטן GLP-1