Clear Sky Science · he
הערת 200 גנומים של חרקים עם BRAKER להשוואות עקביות בין מינים
מדוע גנומים של חרקים חשובים
החרקים מעצבים את עולמנו: הם מאביקים גידולים, מפיצים מחלות, ממחזרים חומרים תזונתיים ומעניקים השראה לחומרים וטכנולוגיות חדשות. כיום ניתן לקרוא את ה‑DNA של אלפי מיני חרקים, אבל עצם קיומם של גנומים לבד אינו מספיק. יש צורך במפה ברורה של היכן כל גן נמצא ומה תפקידו המשוער. מאמר זה מתאר מאמץ רחב ומתועד סטנדרטית לתיאור הגנים ב‑200 מיני חרקים באמצעות תהליך אוטומטי בשם VARUS‑BRAKER, שמקל משמעותית על יכולתם של מדענים להשוות בין מינים ולחשוף כיצד החרקים פיתחו את מגוון התכונות המרשים שלהם.
בעיית המפות הגנטיות שלא הושלמו
בני שני העשורים האחרונים חלה התפוצצות בסדרה של רצפי גנומים של חרקים מ‑20 מינים בערך לכמעט ארבעת אלפים ומעלה. עם זאת, רק בערך אחד מכל עשרה גנומים אלה כולל הערת גנים תקינה בבסיסי נתונים ציבוריים. גם כשיש הערות, רבות נוצרו לפני שנים עם שיטות ישנות ועם נתונים מוגבלים. קבוצות מחקר שונות השתמשו לעתים בתוכנות ובראיות שונות, מה שעלול ליצור הבדלים מלאכותיים: גן עשוי להיראות חסר או מעוות במין אחד פשוט כי השתמשו בכלי שונה להערתו. האריגה הזו של שיטות מקשה על סיכום מהימן של ההבדלים האמיתיים בין גנים של חרקים במינים שונים.

תהליך "בלחצן אחד" עבור מינים רבים
המחברים מתמודדים עם צוואר הבקבוק הזה באמצעות בניית תהליך אוטומטי שמסתובב סביב צינור החיזוי של גנים BRAKER3. מערכת VARUS‑BRAKER שלהם מעוצבת כך שבמצב הפשוט ביותר המשתמש צריך לספק רק את השם המדעי של המין. התהליך מוריד אוטומטית את הגנום הטוב ביותר הזמין בארכיונים ציבוריים, אוסף נתוני ריצוף RNA תואמים שמראים אילו גנים פעילים ומקבל מידע חלבוני ממינים קרובים. הוא מסמן אזורים חוזרים של DNA, מיישר קריאות RNA על הגנום, ומשלב "רמזים" של RNA וחלבונים כדי ללמד את המודלים שלו היכן סביר שהגנים מתחילים, מסתיימים ומעברו. בדיקות איכות כמו BUSCO ו‑OMArk מעריכות לאחר מכן עד כמה ערכת הגנים שהתקבלה שלמה ונקייה.
סיור רחב לאורך עץ החרקים
באמצעות המערכת הזו הקבוצה תיארה 200 גנומי חרקים שנבחרו כדי לכסות את הענפים העיקריים של עץ המשפחה של החרקים, עם דגש על חרקים הולומטבוליים — אלו שעוברים מטמורפוזה מלאה מלארווה לתפילה (פאיפה) לבוגר — וכן על קבוצת קרובים מגוונת. המדגם שלהם משתרע על 77 משפחות ו‑14 סדרות, כולל זבובים, פרפרים, חיפושיות, דבורים, נמלים, כנאים, ג’וקים ואחרים. שמונים וחמישה מהמינים האלה לא כללו הערה קודמת ב‑GenBank. לכל מין חזה התהליך חיזוי של גנים המקודדים לחלבון, שהתואם ליותר מ‑4.2 מיליון רצפי חלבון. רוב הגנומים והפרוטאומים החזויים עברו בדיקות שלמות קפדניות, בדרך כלל עם כיסוי של לפחות 85–95% מהגן הליבה הצפוי, מה שמעיד שהגישה האוטומטית מייצרת תוצאות איכותיות.

מרשימות גנים למשמעות ביולוגית
רשימת גנים היא רק חלק מהסיפור; חוקרים זקוקים גם לרמזים לגבי תפקידי הגנים. לשם כך היישמו המחברים צינור הערכה פונקציונלית בשם FANTASIA, המשתמש בדגמי שפה לחלבונים מודרניים להקצאת מונחי Gene Ontology (GO) — תוויות סטנדרטיות לתפקידים ביולוגיים — לכל חלבון. בהשוואה לכלי הנפוץ InterProScan, FANTASIA תיארה כ‑1.6 פעמים יותר חלבונים, ועדיין התאמה קרובה כאשר שתי השיטות נתנו חיזוי. הצוות גם קיבץ גנים קרובים ל"אורתוגלופסים", קבוצות גנים השותפים לאב קדמון משותף, והשתמש בזה כדי לבנות עץ אבולוציוני של 200 המינים. מסגרת זו מאפשרת לשאול אילו גנים משותפים, נעלמים או מורחבים בענפים שונים של החרקים, ולחבר את מאגרי הגנים לתכונות כמו מטמורפוזה או התנהגות הלארווה.
משאב ניתן‑שימוש מחדש לגילויים עתידיים
כל הנתונים מהפרויקט — מבני הגנים, רצפי החלבון, תוויות פונקציונליות, אורתוגלופסים, עצי מינים וניבויי tRNA — זמינים בחופשיות דרך מאגרים ציבוריים. המחברים מפרסמים גם את כל תהליך VARUS‑BRAKER כקוד בקוד פתוח כדי שמדענים אחרים יוכלו לתאר גנומי חרקים חדשים, ואפילו בעלי חיים וצמחים אחרים, באותו אופן עקבי. עבור לא‑מומחים, המסקנה המרכזית היא שעבודה זו הופכת אוסף מפוזר של רצפי DNA לאטלס קוהרנטי והשוואתי של גני חרקים. עם המפות הסטנדרטיות האלה, מחקרים עתידיים יוכלו לגלות ביתר מהימנות כיצד החרקים פיתחו טיסה, מטמורפוזה והצלחה אקולוגית, ולמקד טוב יותר גנים הרלוונטיים לחקלאות, לשימור ולבקרת מחלות.
ציטוט: Saenko, S., Hoff, K.J. & Stanke, M. Annotation of 200 Insect Genomes with BRAKER for Consistent Comparisons across Species. Sci Data 13, 288 (2026). https://doi.org/10.1038/s41597-026-06840-0
מילות מפתח: גנומיקה של חרקים, הערת גנום, גנומיקה השוואתית, ביולוגיה אבולוציונית, ביואינפורמטיקה