Clear Sky Science · he

BiG-SCAPE 2.0 ו-BiG-SLiCE 2.0: אשכולות רצפים של מקטעי גנים מטבוליים בקנה מידה רחב, מדויקים ואינטראקטיביים

· חזרה לאינדקס

אוצרות כימיים נסתרים ב-DNA מיקרוביאלי

הרבה מהתרופות והחומרי ההגנה על גידולים שאנו סומכים עליהם מקורם במולקולות קטנות שמייצרים מיקרובים. אורגניזמים אלה מסתירים את המתכונים למולקולות אלה ברצועות DNA שנקראות אשכולות גנים. עם התקדמות מהירה של רצף ה-DNA, החוקרים טובעים בכמות עצומה של נתונים, אך עדיין מכירים רק חלק קטן ממה שמיקרובים מסוגלים לייצר. מאמר זה מציג את BiG-SCAPE 2.0 ו-BiG-SLiCE 2.0, שני כלי תוכנה משודרגים שעוזרים למדענים לסנן ארכיונים גנומים עצומים כדי למפות, להשוות ולארגן את ה"מפעלי המולקולות" הנסתרים האלה, ובכך מקרבים את הדור הבא של אנטיביוטיקה וחומרי חקלאות לגילוי.

Figure 1
Figure 1.

מדוע אשכולות גנים חשובים לבריאות ולחקלאות

מיקרובים משתמשים במולקולות קטנות מומחיות כדי להתחרות, לתקשר ולהתאים את עצמם לסביבתם. שרטוטי ה-DNA לייצור או פירוק מולקולות אלה לרוב מקובצים יחד באשכולות גנים מטבוליים. אלה כוללים אשכולות גנים ביוסינתטיים שבונים תוצרים טבעיים מורכבים, ואשכולות גנים קטבוליים שמאפשרים למיקרובים לפרנס על תרכובות מסוימות או על הפרשות שורשים. מכיוון שהגנים באשכול פועלים במשותף, מציאת אזור כזה בגנום דומה לזיהוי "קו ייצור" עצמאי שיכול לרמוז על מבנה ותפקוד המולקולה. כלים לחיפוי גנומי כבר מזהים מפעלים כאלה בחיידקים ובפטריות, אבל האתגר האמיתי הוא להשוות מאות אלפי אשכולות כדי לראות כיצד הם קשורים ומהי המגוון הכימי שהם עשויים להכיל.

שני מנועים למיון מפעלי מולקולות

BiG-SCAPE ו-BiG-SLiCE נוצרו במקור כדי לקבץ אשכולות גנים עם מאפיינים ליבתיים דומים ל"משפחות אשכולות גנים". צופה שהכל קבוצה תייצר את אותה מולקולה או מולקולות קרובות. BiG-SCAPE בונה רשתות מפורטות של דמיון בין אשכולות, בעוד ש-BiG-SLiCE מותאם למהירות, ויכול להתמודד עם מיליוני אשכולות על ידי המרתם לטביעות אצבע מספריות פשוטות ולאחר מכן אשכולת טביעות אלה. יחד הם מהווים תשתית הולכת וגדלה של צינורות חילוץ גנומי, מאגרי מידע וצופות אינטראקטיביות שעוזרות לחוקרים לנווט בכימיה המיקרוביאלית בקנה מידה פלנטרי.

מה חדש ב-BiG-SCAPE 2.0

גרסת 2.0 של BiG-SCAPE מציגה סדרה של שדרוגים המכוונים הן לביולוגיה והן לחישוב. כעת היא מזהה את המושג המתוקן של "אזור" המשומש בכלי antiSMASH הנפוץ, שמפריד אשכולות חופפים או שילובים להלבניות קטנות ומשמעותיות יותר שנקראות פרוטו-אשכולות. מצבי יישור חדשים ואסטרטגיות שונות מאפשרים ל-BiG-SCAPE 2.0 להתמקד בגני הליבה החשובים באמת בתוך כל אשכול, ולהתמודד טוב יותר עם גנים שמסודרים מחדש ועם גבולות אשכול מטושטשים. מתחת למכסה המנוע, קוד הבסיס נכתב מחדש לגמרי למען מהירות וקיימות, תוך שימוש במסד נתונים משותף SQLite וספריית Python מודרנית לחיפושי פרופילים. כתוצאה מכך, BiG-SCAPE 2.0 יכול לפעול עד שמונה פעמים מהר יותר מקודמו, תוך שימוש בכמעט חצי מהזיכרון, וכעת מציע מספר זרימות עבודה מוכנות לשימוש לאשכולות, שאילתות, הסרת כפילויות וביצוע הערכות ביצועים דרך ממשק ווב אינטראקטיבי משודרג.

Figure 2
Figure 2.

כיצד BiG-SLiCE 2.0 מסתגל להצפת הנתונים

BiG-SLiCE 2.0 מתמקד בהפיכת ניתוחים בהיקף עצום ליותר מדויקים מבלי לאבד את המהירות האופיינית לו. גרסאות קודמות התייחסו לכל סוגי אשכולות הגנים באותו אופן, מה שלעיתים העדיף משפחות מסוימות על פני אחרות. על ידי מעבר למדד מרחק דמוי קוסינוס ועדכון ספריית חתימות החלבונים הביוסינתטיים לסטנדרטים העדכניים ביותר, BiG-SLiCE 2.0 כעת מקבץ סוגים שונים של אשכולות בצורה מאוזנת יותר. אופטימיזציות קוד והמעבר לאותה ספריית חיפוש פרופילים מהירה כמו ש-BiG-SCAPE משתמש בה מביאים מהירויות נוספות, ואופציות חדשות לייצא את כל התוצאות כטבלאות טקסט פשוטות מקלות על שילוב BiG-SLiCE בצנרת ניתוח אחרת. בדיקות מול תשעה מאגרי נתונים של משפחות גנים שעברו עיבוד ידני מראות כי הדיוק של BiG-SLiCE 2.0 מתקרב כעת לזה של BiG-SCAPE, במיוחד עבור אשכולות גנים קצרים ומטמיעים יותר.

חשיפת יקום כימי עצום ובלתי מנוצל

המחברים השתמשו בשני הכלים כדי לבחון 260,630 אזורים ביוסינתטיים מתוך מסד נתונים ציבורי של גנומי מיקרובים. BiG-SCAPE 2.0 ו-BiG-SLiCE 2.0 ייצרו הערכות דומות להפליא של מספר משפחות אשכולות הגנים השונים הקיימות במאגר זה, ותומכות בעבודות קודמות שמראות שרק כ-3% מהפוטנציאל הביוסינתטי שמקודד בגנומי חיידקים תואר עד כה. במילים אחרות, הרוב המכריע של הכימיה המיוצרת על ידי מיקרובים נותרה לא ידועה. על ידי כך שהם מאפשרים אשכולה והדמיה מדויקות של אשכולות גנים על פני מאות אלפי גנומים—ועל פי ההמשך, מיליונים—BiG-SCAPE 2.0 ו-BiG-SLiCE 2.0 מספקים עדשות עוצמתיות לחקר יקום כימי זה שטרם נחקר, ומסללים את הדרך לתרופות חדשות, כלי הגנה על גידולים בטוחים יותר ותובנות עמוקות יותר על האופן שבו מיקרובים מעצבים מערכות אקולוגיות ואת בריאותנו.

ציטוט: Draisma, A., Loureiro, C., Louwen, N.L.L. et al. BiG-SCAPE 2.0 and BiG-SLiCE 2.0: scalable, accurate and interactive sequence clustering of metabolic gene clusters. Nat Commun 17, 2000 (2026). https://doi.org/10.1038/s41467-026-68733-5

מילות מפתח: אשכולות גנים ביוסינתטיים, גילוי תוצרי טבע, חילוץ גנומי, מטבוליטים מיקרוביאליים, אשכולות חישוביים