Clear Sky Science · he

DPAS: ניקוד אי-תקינות פפטידים הקשורים למחלות לזיהוי פפטידים פתוגניים באמצעות למידה חד-כיתתית

· חזרה לאינדקס

מדוע חתיכות חלבון זעירות חשובות לבריאות שלנו

פפטידים — מקטעים קצרים של חלבונים — הפכו לשחקנים בולטים ברפואה מודרנית. הם יכולים לשמש כמסרנים מדויקים בגוף ומשתמשים בהם יותר ויותר כתרופות וכסמנים למחלה. עם זאת, זיהוי אלו פפטידים באמת קשורים למחלה בדרך כלל תלוי בדוגמאות ברורות של פפטידים "חולים" ו"שאינם חולים", דבר שבביולוגיה נדיר לספק. במחקר זה מוצע שיטה חדשה לאיתור פפטידים שעלולים להיות מזיקים תוך שימוש רק באלו שכבר ידועים כמעורבים במחלה, ומציעה דרך מהירה ופחות מוטית לגלות אבחנות וטיפולים עתידיים.

Figure 1
Figure 1.

האתגר במציאת קבוצת "שאינה-מחלה"

מודלים מסורתיים במחשוב לומדים על ידי השוואת שני צדדים: דוגמאות חיוביות הידועות כקשורות למחלה ודוגמאות שליליות שנחשבות כבטוחות. במחקר פפטידים, הקבוצה השנייה מהווה בעיה. פפטידים רבים פשוט לא נבדקו, ולכן תיוגם כ"שאינם-מחלה" עלול להיות מטעה ולהכניס הטיה. מחקרים קודמים על פפטידים אנטי-סרטן או אנטי-דלקתיים השיגו דיוק מרשים, אך לעיתים הסתמכו על מערכי נתונים שליליים שנבנו באופן ידני או בהשערה. כתוצאה מכך, המודלים שלהם עלולים להתקשות בזיהוי אותות נדירים או סוגים חדשים של פפטידים מחלתיים שאינם דומים לנתוני האימון.

ללמוד ממה שאנו יודעים, במקום ממה שאנו מנחשים

המחברים בוחרים בדרך שונה: במקום לכפות בעיה דו‑צדדית, הם מתייחסים לפפטידים הקשורים למחלה כקבוצה אחת קוהרנטית ושואלים, "איך הקבוצה הזו נראית בפירוט?" הם אוספים למעלה מ‑760,000 פפטידים אנושיים מוטנטיים מתוך מאגר ייעודי הקשור לסרטן ומתארים כל פפטיד באמצעות סט עשיר של תכונות. אלה כוללות תדירות הופעת כל חומצת אמינו, איך זוגות חומצות אמינו מסודרים, תכונות פיזיקליות וכימיות בסיסיות כמו נפח והתנהגות הידרופילית/הידרופובית, ודפוסי רצף קצרים החוזרים על עצמם המכונים מוטיפים. טכניקה בשם ניתוח רכיבים עיקריים דוחסת אז את התיאור הרב-ממדי הזה לצורה קומפקטית יותר תוך שמירת מקורות השונות העיקריים.

זיהוי פפטידים חריגים באמצעות מודלים חד-כיתתיים

עם מרחב תכונות דחוס זה, הצוות מאמן שלושה מודלים "חד-כיתתיים" — אלגוריתמים שמיועדים ללמוד את צורתה של קבוצה אחת ולסמן כל דבר שאינו מתאים. הם בודקים מכונות וקטורים תומכות חד-כיתתיות (One-Class SVM), יערות בידוד (Isolation Forests), וסוג של רשת עצבית הנקראת אוטואנקודר. האוטואנקודר לומד לדחוס את תכונות כל פפטיד לייצוג פנימי צר ואז לשחזרן; פפטידים השייכים לדפוס המחלה הנלמד משוחזרים בדיוק רב, בעוד שפפטידים חריגים גוררים שגיאת שחזור גבוהה יותר. השוואת ציוני אנומליה מנורמלים בין כל השיטות מראה שהאוטואנקודר יוצר את הצביר הצר ביותר של פפטידים טיפוסיים ואת ההפרדה הברורה ביותר בין פנימיים לחיצוניים. על ידי קביעת סף לשגיאת השחזור סביב הפרצנטיל ה‑95, המודל מסווג את רוב הפפטידים ככנראה מקושרים למחלה תוך סימון עקבי של חלק קטן כחריג.

Figure 2
Figure 2.

הפיכת ציונים מורכבים למספר יחיד משמעותי

כדי להקל על הפרשנות הביולוגית של התוצאות, המחברים מציגים את ניקוד אי‑תקינות הפפטיד (DPAS). ניקוד זה משלב שני מרכיבים: כמה פפטיד נראה חריג לאוטואנקודר (שגיאת השחזור המנורמלת שלו) ועד כמה התכונות שלו תורמות לחיזוי, כפי שנמדד על ידי שיטת הסבר פופולרית שנקראת SHAP. במציאות, מוטיפים ותכונות פיזיקליות‑כימיות ספציפיות בולטות כמעניינות במיוחד. DPAS משלב אותות אלה כך שפפטידים שהם גם מבניים מוזרים וגם נתמכים על ידי תכונות בעלות משמעות ביולוגית מקבלים דירוג גבוה יותר. הפפטידים בעלי הדירוג הגבוה נבדקים לאחר מכן עם כלי חיפוש מוטיפים שמקשר ביניהם לבין חתימות פונקציונליות ידועות כגון אתרי פוספורילציה, אזורים הקושרים מתכות ודפוסים רגולטוריים אחרים המעורבים בדרך כלל בסיגנלינג ובבקרת אנזימים.

מה משמעות הדבר לאבחון ותרופות בעתיד

במילים פשוטות, עבודה זו מציעה מסנן חכם יותר לאיתור פפטידים חשודים ללא הצגתו של ידיעה אילו פפטידים בטוחים לחלוטין. על ידי למידה רק מדוגמאות מאומתות הקשורות למחלה ואז דירוג מועמדים חדשים באמצעות DPAS, חוקרים יכולים לתת עדיפות לרשימה קצרה וביולוגית סבירה של פפטידים לבדיקות מעבדה. רבים מהמועמדים המדורגים בראש מכילים מוטיפים פונקציונליים ידועים היטב, מה שמחזק את ההשערה שהם עשויים לשחק תפקידים בתהליכי מחלה. אף על פי שהשיטה עדיין תלויה בהנחות ואין בה פפטידים "בטוחים" שנבדקו ניסויית לאימות מלא, היא מספקת בסיס ריאלי ושקוף יותר לגילוי סמנים פפטידיים וניתן להתאימה לסוגי נתונים ביולוגיים אחרים שבהם דוגמאות שליליות אמינות נדירות.

ציטוט: Khalid, Z., Khalid, R. & Sezerman, O.U. DPAS: disease-associated peptide anomaly score for identifying pathogenic peptides via one-class learning. Sci Rep 16, 9170 (2026). https://doi.org/10.1038/s41598-026-40099-0

מילות מפתח: פפטידים הקשורים למחלות, זיהוי אנומליות, אוטואנקודר, גילוי סמני ביולוגיים, למידה חד-כיתתית