Clear Sky Science · he
מנתונים לגילוי: עלייתן של מודלים חיזוי תיאורטיים-אינפורמטיים בפיתוח תרופות
למה חשוב לגלות תרופות מהר יותר
רבות מהמחלות הקשות עדיין חסרות טיפולים יעילים, ואפילו כאשר נמצאות תרופות מבטיחות, המסע מרעיון למדף בבית המרקחת ארוך ויקר. מאמר זה בוחן כיצד מודלים ממוחשבים חכמים יכולים לסנן אוספים עצומים של נתונים כימיים וביולוגיים כדי לזהות יותר מהר ובאמינות גבוהה יותר מועמדים פוטנציאליים לתרופות. בהשאלה מרעיונות בתורת המידע — המתמטיקה של כמה ניתן ללמוד מנתונים — המחברים מראים דרך לצמצם את חיפוש התרופות ולהבין טוב יותר מה הופך מולקולה לסבירה שתפעל בגוף.
מניסיונות וטעיות לעיצוב מונחה נתונים
גילוי תרופות מסורתי נשען על שילוב של ניחושים מלומדים, סינון במעבדה ולעתים מקריות מביאנית כמו גילוי הפניצילין. היום חוקרים יכולים לבדוק מיליוני תרכובות במחשב לפני שמגיעים לצינור מבחנה. כלי סינון וירטואלי ממיינים מולקולות לפי התנהגות ביולוגית חזויה, ועוזרים למדענים להתמקד בבטוחים ביותר. עם זאת, כלים רבים קיימים מתייחסים לכל מולקולה בנפרד או נותנים הערכות הסתברות גסות, ולעתים מתקשים לתפוס כיצד ההקשר הביולוגי במציאות — כמו אופן תנועת התרופה בגוף — מעצב הצלחה או כישלון.

דרך חדשה לקרוא טביעות אצבע ביולוגיות
המחברים מנתחים מאגר ציבורי גדול של תוצאות סינון ביולוגיות עבור מולקולות המכוונות לקולטן פפטידי פורמיל, חלבון המעורב בדלקת ובהגנות החיסון. כל דגימה מלווה בעשרות תכונות מדידות, או "תיאורים", כגון גודל מולקולרי, קלות התמוססות בשומן או במים, יכולת לחצות את מחסום דם–מוח, ויכולת ליצור קשרי מימן. במקום לנסח משוואות קבועות לאופן שבו תכונות אלה צריכות להתנהג, הצוות משתמש במערכת אוטומטית בשם Eidos, הבונה מודלים חיזוי תיאורטיים-אינפורמטיים ישירות מן הנתונים. מודלים אלה, המתוארים כניתוח ASC (מערכתי-אוטומטי-קוגניטיבי), לומדים כיצד שילובים של תכונות מקושרים לעובדה האם דגימה מתנהגת כפעילה (פוטנציאלית שימושית) או לא פעילה במבחנים ביולוגיים.
ניקוי הנתונים ובחירת מה שחשוב
נתוני סינון מעשיים רעשניים: מדידות עשויות להיות לא עקביות, וחלק מהדגימות עשויות לא להתאים לאף דפוס ברור. מערכת Eidos מסננת קודם כל "ארטיפקטים" אלה, מסירה למעלה מאלף רשומות חשודות ושומרת מעט יותר מאלפיים דגימות אמינות בלבד. לאחר מכן היא בוחנת יותר מ-300 תכונות כדי לראות אילו מהן אכן עוזרות להבחין בין דגימות פעילות ללא פעילות. באמצעות מושגים מתורת המידע, כל תכונה מדורגת לפי כמה היא מפחיתה את אי-הוודאות לגבי התוצאה. הניתוח מגלה שרק מיעוט התכונות נושא את מרבית המידע השימושי, כלומר החוקרים יכולים בבטחה להתעלם מהרבה מדידות ועדיין לשמור כמעט את כל עוצמת החיזוי. הייעול הזה מפשט את המודלים, הופך אותם לקלים יותר לפרשנות ומהירים יותר להרצה.

למצוא ניצחונות נדירים בים של כשלונות
במאגר הנתונים הנחקר, רק כ-1.4% מהמולקולות אכן פעילות, מה שמקשה לזהות את המעטים המנצחים בין אלפי הכשלונות. המודלים מבוססי ASC בונים אוטומטית "דיוקנאות מידע" המראים עד כמה כל תכונה ושילוב תכונות דוחפים דגימה לעבר מצב פעיל או לא פעיל. מתוך יותר משלושת אלפים דגימות מקוריות, המערכת מדגישה רק שתיים שבולטות כמועמדות אמינות במיוחד לתרופות המכוונות לקולטן הפפטידי פורמיל, עם אמינות מודל המתקרבת ל-99.9% במבחנים רטרוספקטיביים. דיאגרמות רשת חזותיות מציגות אילו תכונות מולקולריות תומכות בעוצמה במצב פעיל, ומעניקות לחוקרים מפה מפושטת של הגורמים שמניעים התנהגות מבטיחה.
כיצד גישה זו עומדת מול אחרות ומה צופן העתיד
המחברים משווים את שיטתם לכלי חיזוי מוקדמים פופולריים כמו pkCSM, SwissADME ו-ADMETlab, שמעריכים כיצד תרופה נספגת, מתפזרת, נשברת ומופרשת. בעוד שמערכות אלה נשענות בעיקר על חוקים מוגדרים מראש או למידת מכונה כללית, מסגרת ה-ASC מודדת במפורש כמה כל תכונה תורמת לידיעתנו לגבי התנהגות דמויית-תרופה ויכולה לדמות שינויים בהקשר הביולוגי. יחד עם זאת, המחקר מציין גבולות: מאגר הנתונים קטן יחסית ומאוזן בצורה לא שווה, והשיטה יושמה עד כה רק על קולטן אחד. המחברים מציעים שגרסאות עתידיות יכולות לשלב מודלי ASC עם למידה עמוקה ולהתרחב לכמה מטרות.
מה משמעות הדבר לתרופות עתידיות
במונחים מעשיים, עבודה זו מראה שמודלים עשירים במידע יכולים להפוך נתוני סינון מבולגנים לניבויים ברורים הניתנים לבחינה אילו מולקולות ראויות לתשומת לב נוספת. על ידי ניקוי אוטומטי של נתונים, דירוג חשיבות התכונות והדגשת תרכובות נדירות אך מבטיחות, הגישה יכולה לצמצם את הזמן והעלות הנדרשים להגיע למעבדה ובסופו של דבר למרפאה. למרות שהיא אינה מחליפה ניסויים בבעלי חיים או ניסויים קליניים בבני אדם, היא פועלת כמסנן וכמדריך רב-עוצמה, ועוזרת למדענים לעבור מנתונים גולמיים לפוטנציאליים-לטיפולים ביתר יעילות ובביטחון רב יותר.
ציטוט: Saied, H., Alfahad, O., Aljaffer, A.A. et al. From data to discovery: The rise of information-theoretic predictive models in drug development. Sci Rep 16, 12857 (2026). https://doi.org/10.1038/s41598-026-45644-5
מילות מפתח: גילוי תרופות, סינון וירטואלי, מודלים חיזוי, נתוני ביוססי, קולטן פפטידי פורמיל