Clear Sky Science · he
מאגר מאוחד לעיצוב נוגדנים וננונוגדנים הכולל רצף, מבנה ונתוני זיקה
מדוע כלים חיסוניים זעירים ונתונים גדולים חשובים
נוגדנים ובני הדודים הקטנים שלהם, הננונוגדנים, הם הטילים המונחים המדויקים של הגוף נגד זיהומים וסרטן. מפתחי תרופות מנסים כיום לעצב מולקולות אלה במחשב, בדומה לאופן שבו מהנדסים מעצבים כלי טיס. אבל עד לאחרונה החומר הגולמי לעיצוב באמצעות בינה מלאכותית — נתונים אמינים על רכיבי הנוגדנים, צורותיהם וכמה חזק הן נקשרות למטרותיהן — היה מפוזר במסדי נתונים רבים שאינם תואמים זה לזה. מאמר זה מציג את מאגר העיצוב לנוגדנים וננונוגדנים (ANDD), משאב ציבורי מאוחד שנבנה כדי לספק לחוקרים את הנתונים הנקיים והמקיפים שהם זקוקים להם כדי לעצב את הדור הבא של טיפולים ממוקדים.

מנעול ומפתח ביולוגיים לתוכנית דיגיטלית
נוגדנים הם חלבונים גדולים בצורת Y, בעוד שננונוגדנים הם גרסאות קטנות בהרבה של חלק יחיד הנמצאות בבעלי חיים כמו למה ולתקניים. שניהם מזהים "מנעולים" ספציפיים על וירוסים, תאים סרטניים או חלבונים אחרים הקשורים למחלה. כדי שמודלים ממוחשבים ילמדו כיצד ההכרה הזו פועלת, הם צריכים ארבעה סוגי מידע לדוגמאות רבות: רצף חומצות אמינו (רשימת החלקים), מבנה תלת־ממדי (הצורה), האנטיגן (המטרה) ועוצמת הקישור (כמה חזק השניים נדבקים זה לזה). עד כה רוב המשאבים תיעדו רק חלק אחד או שניים בכל פעם, מה שאילץ מדענים לקפוץ בין מאגרי נתונים ולחבר ביד את המידע, מה שהאט את ההתקדמות והכניס שגיאות.
איסוף הפיזורים לספרייה מאורגנת אחת
צוות ANDD אסף נתונים מ־15 מקורות מרכזיים, כולל מאגרי נוגדנים וננונוגדנים ייעודיים, מאגרי חלבונים כלליים ואף מסמכי פטנטים. הם העבירו את הקלטים הגולמיים הללו דרך צינור מתוזמר בקפידה: הורדה, המרה לסכימה משותפת, בדיקת חפיפות של מזהים, הסרת כפילויות ואחידות כללי מיתוג השמות. כאשר מסדי נתונים שונים לא הסכימו, נותנה עדיפות למקורות מתועדים ולניסויים ישירים. התוצאה הסופית היא טבלה אחת בנוסף למערך קבצי מבנה שמקשרים בין רצף, מבנה, מטרה ומידע זיקה בצורה עקבית, כאשר כל רשומה מתוייגת כך שהמשתמשים יכולים לעקוב בדיוק מהיכן היא הגיעה וכיצד עובדה.
שכבות פרטים לצרכים מחקריים שונים
לא כל ערך ב־ANDD עשיר באותו האופן, לכן המחברים ארגנו את האוסף לשכבות של פירוט הולך וגדל. ברמה הרחבה יש 48,683 רשומות של נוגדנים וננונוגדנים עם מידע רצף. תת־קבוצה גדולה יותר מוסיפה מבנים תלת־ממדיים, ותת־קבוצה קטנה יותר כוללת גם את רצפי חלבוני המטרה. שכבת הפירוט המלאה — אלפי ערכים — מוסיפה ערכי זיקה נמדדים או חזויים. לדוגמה לנוגדנים, 18,464 רשומות כוללות רצפים, אותה כמות משלבת רצף ומבנה, למעלה מ־8,000 כוללות גם רצפי אנטיגן, ו־7,737 מכילות רצף, מבנה, אנטיגן ונתוני זיקה מלאים. היררכיה מקבילה קיימת לננונוגדנים, מה שנותן לאמפיריציסטים ולבוני מודלים גמישות: הם יכולים לבחור מאגרים גדולים ופשוטים או תתי־קבוצות קטנות ועשירות יותר במידע.
מילוי החסר בזיקת הקישור
עוצמת הקישור חיונית לעיצוב תרופות, אך ערכים ניסוייתיים נדירים ומדווחים באופן לא אחיד. כדי להתמודד עם הפער הזה מבלי לטשטש את הגבול בין נתונים לבין חיזוי, המחברים השתמשו בכלי למידה עמוקה ייעודי, ANTIPASTI, כדי לאמוד את עוצמת הקישור רק עבור ערכים שהיו להם מבנים אך חסרו מדידות. 2,271 הערכים החזויים הללו מתויגים בבירור ומופרדים מהכ־7,000 הערכים שנמדדו בניסוי. הצוות בדק לאחר מכן עקביות כללית באמצעות מודל נוסף, AlphaBind, ובהשוואה בין מדדים מתמטית קשורים של קשר. מתאם חזק ושגיאה נמוכה רמזו שהערכים הניסוייתיים המעובדים אמינים, והערכים החזויים פועלים לפי מגמות סבירות מבלי להיחשב לאמת מוחלטת.

הנעת עיצוב חכם יותר של תרופות עתידיות
כדי להדגים את הערך המעשי של ANDD, המחברים כווננו דק מודל חישובי קיים היוצר נוגדנים וננונוגדנים. אימון על המידע המשולב של ANDD — רצף, מבנה, מטרה וזיקה — הניב מולקולות שנוצרו עם חיזוי זיקה משופר וצורות מציאותיות יותר מאשר מודל בסיסי שאומן על נתונים ישנים ופשוטים יותר. מעבר למחקר המקרה הזה, ANDD זמין באופן פתוח ברישיון מרחיב, מציע תיעוד מלא וצינור בנייה בר־שיחזור, ונועד להיות מתעדכן באופן קבוע. עבור לא־מומחים, המסר המרכזי הוא ש־ANDD הופך רשת נתוני נוגדנים מבולגנת לספרייה עקבית ומהימנה — ונותן לכלי בינה מלאכותית נקודת התחלה טובה בהרבה לעיצוב תרופות ביולוגיות מדויקות ויעילות יותר.
ציטוט: Wu, Y., Liu, X., Hrovatin, K. et al. A Unified Dataset for Antibody and Nanobody Design Including Sequence, Structure, and Binding Affinity Data. Sci Data 13, 295 (2026). https://doi.org/10.1038/s41597-026-06878-0
מילות מפתח: עיצוב נוגדנים, ננונוגדנים, זיקה קישורית, תרופות ביולוגיות, גילוי תרופות באמצעות בינה מלאכותית