Clear Sky Science · he
שיוך פאז'׳ים-מארחים ברזולוציה גבוהה באמצעות חלבונים מרכזיים ועל ידי מודלי שפה גדולים
ציד הוירוסים הבלתי נראים במעיים שלנו
כל אדם נושא טריליוני חיידקים ואת הוירוסים שלהם במעיים, רבים מהם עדיין בלתי מוכרים. וירוסים נסתרים אלה עשויים לעצב את בריאותנו, מעיכול ועד השמנת יתר, ובכל זאת מדענים לעיתים אינם יודעים איזה וירוס מדביק איזה חיידק. המחקר מציג את VirHost Hunter, כלי חדש מונחה-נתונים שמקשר וירוסים במעיים למארחיהם החיידקיים באמצעות מספר מועט של חלבונים ויראליים מרכזיים, ומפתח דרכים מדויקות יותר לחקור ואולי לכוונן את המיקרוביוטה.
דרך חדשה להתאים וירוסים וחיידקים
שיטות מסורתיות לזיווג וירוסים עם מארחיהם החיידקיים מסתמכות על גנומים ויראליים מלאים או רמזים גנטיים מיוחדים כגון סימני CRISPR. גישות אלה פועלות רק כאשר קיימים נתוני ייחוס מתאימים ועלולות לפספס חלק גדול מהרצפים הויראליים, המכונה לעתים "חומר אפל" ויראלי. המחברים מתמקדים במקום זאת בשני סוגי חלבונים ויראליים המהותיים לזיהום: חלבוני זנב, המסייעים לווירוס לזהות ולהתחבר לחיידק, וליזינים, המסייעים לפצח את דופן התא החיידקי. על ידי ריכוז בחלבונים אלה הם נמנעים מהרעש של גנים לא רלוונטיים ויכולים לפעול גם כשזמינים רק קטעי גנום ויראלי.

ללמד מחשבים את שפת החלבונים וה-DNA
כדי לקרוא משמעות בחלבונים אלה, הצוות פונה לטכניקות למידת מכונה שפותחו במקור לשפה האנושית. הם משתמשים במודל שפת חלבונים בשם ProtT5 להמרת רצפי חומצות אמינו לדפוסים מספריים צפופים שתופסים דמיון פונקציונלי חבוי, גם כאשר הרצפים נראים שונים במבט ראשון. במקביל הם מנתחים את ה-DNA שמקודד את החלבונים האלה באמצעות מודל Vision Transformer ורשת קונבולוציה מרובת מסלולים, אשר יחד קולטות תכונות כמו שימוש אופייני בקודונים ודפוסים בטווח ארוך לאורך ה-DNA. אותות החלבון וה-DNA הללו מאוחדים ומוזרמים לזוג מסווגים שמחליטים במשותף איזו משפחה, סוג או מין חיידקי הווירוס צפוי להדביק.
חיזויי מארח חדים ועמוקים יותר
החוקרים בחנו את VirHost Hunter על מספר אוספי ביקורת של בקטריופאז'ים. הם מראים ששילוב מידע חלבוני ו-DNA עולה בבירור על שימוש בכל אחד בנפרד, וכי ההתמקדות בחלבוני זנב וליזינים נותנת חיזויים טובים יותר מאשר שימוש בחלקים ויראליים אחרים כמו ראשי ואריזת גנום. ברמות סיווג חיידקי שונות, VirHost Hunter מדויק יותר מכלים חינמיים קיימים ואמינה גם כשווירוסים חולקים רק דמיון רצף נמוך. בהערכתו על פאז'ים ממקור מגדל עם מארחים ידועים בניסוי, הוא מזהה מארחים נכונים בדיוק גבוה יותר משיטת CRISPR סטנדרטית, ושימוש שניהם יחד משפר את התוצאות אף יותר.
חשיפת וירוסים נסתרים במעיים קשורים למחלות
בעזרת המודל הכיול, הצוות החל ליישם את VirHost Hunter על מאגר גדול של Gut Phage Database שהכיל בעבר מידע מארח עבור פחות משליש מהרשומות. בסריקה של חלבוני זנב וליזין הם כמעט הכפילו את חלק הפאז'ים עם מארחים שיוחסו וגילו וירוסים המכוונים ל-29 משפחות של חיידקי מעיים, רבים מהם קשורים למחלות כרוניות כגון מחלת מעי דלקתית, מחלות לב והשמנת יתר. במיוחד, הם מצאו עשרות פאז'ים שלא זוהו בעבר וחזו כי הם מדביקים חיידקים כמו Akkermansia muciniphila ו-Prevotella copri, שמעורבים במצבים אוטואימוניים ומטבוליים אך לא היו להם פאז'ים ידועים.

מפירושים דיגיטליים לאנטימיקרוביאלי ממוקד
כדי להפוך חיזויים אלה למשאב מעשי, המחברים בנו מאגר ליזיני פאז'י של המעיים הכולל יותר ממאה אלף ליזינים עם מארחי מעיים ממופים. הם בחנו את המבנים, היציבות והמגוון שלהם, וגילו אשכולות רבים ומוטיבים שמורים האחראים לפיצוח דופן התא החיידקי. כהוכחה לרעיון, הם בחרו ליזין אחד שחזה שיפגע באופן ספציפי ב-Megamonas, חיידק שמקושר להשמנת יתר. לאחר סינתזה של החלבון, הם הראו בניסויי מעבדה שהוא הורג ביעילות Megamonas תוך שמירה על מיקרובים אחרים נפוצים במעי וזני פרוביוטיקה, ומדגים כיצד כורה מודל-מונחה של "החומר האפל" הויראלי יכול להניב כלים בררניים מאוד.
מדוע זה משנה לטיפול עתידי במיקרוביוטה
עבודה זו מראה שניתן לקשר מספרים עצומים של וירוסים נסתרים במעיים למארחיהם החיידקיים באמצעות מספר מועט של חלבונים מרכזיים ולמידת מכונה מודרנית. על ידי הארה מי מדביק את מי במיקרוביוטה, VirHost Hunter משפר את יכולתנו לחקור את מגוון הוירוסים במעיים ולעצב התערבויות מדויקות, כגון ליזינים מותאמים, שמגבילות באופן סלקטיבי חיידקים מזיקים מבלי להפריע לקהילה המיקרובית הרחבה. בעוד שנדרשים ניסויים והנדסה נוספים לפני שימוש קליני, המסגרת מספקת מפה עוצמתית להפיכת רצפי וירוס נסתרים לאסטרטגיות ממוקדות לחקירה וביום מן הימים לכוונון המערכת האקולוגית הפנימית שלנו.
ציטוט: Du, Z., Li, M., Lin, K. et al. High-resolution phage-host assignment through key proteins using large language models. Nat Commun 17, 4439 (2026). https://doi.org/10.1038/s41467-026-70613-x
מילות מפתח: וירום המעיים, בקטריופאז'ים, למידת מכונה, ליזיני פאז', טיפול במיקרוביוטה