Clear Sky Science · he
scLong: מודל יסוד עם מיליארד פרמטרים ללכידת הקשר רחוק-טווח של גנים בטרנסקריפטומיקה ברמת תא יחיד
להדריך מחשבים לקרוא את השפה הנסתרת של התאים
כל תא בגופך מכיל עיר סואנת של גנים שמודלקים וכבויים בדפוסים מסובכים. ריצוף RNA בתא יחיד מודרני יכול כעת להאזין לכל תא בנפרד, אך התוצאה היא מבול מספרים מכריע. מאמר זה מציג את scLong, מודל בינה מלאכותית עצום המיועד לפענח דפוסי פעילות גנים מורכבים אלה, כולל אותות חלשים ששיטות ישנות נוטות להתעלם מהם. מטרתו היא לסייע לחוקרים להבין כיצד תאים מגיבים להדלקה או כיבוי של גנים, להוספת תרופות או להתפתחות מחלות.

מדוע מפות גנים ברמת התא חשובות
מחקרים גנטיים מסורתיים מערבבים לעיתים מיליוני תאים יחד, ומממצעים תאים נדירים או יוצאי דופן. טכניקות של תא יחיד שינו זאת על-ידי מדידת פעילות הגנים בכל תא בנפרד, וחשפו סוגי תאים חבויים, תקשורת עדינה בין תאים ומעגלי בקרה מפורטים שמחליטים מה ייעשה בתא. עם זאת, ניתוח נתונים מסוג זה מאתגר מאוד: לכל תא עשויים להיות ערכי פעילות לעשרות אלפי גנים, שרבים מהם בקושי ניתנים לזיהוי. מודלי בינה מלאכותית קיימים מפשטים את הבעיה על-ידי התמקדות רק בגנים הפעילים ביותר, מה שמאיץ חישוב אך מפספס אותות עדינים שעשויים להיות חיוניים במצבים של מחלה, התפתחות או תגובת תרופות.
מודל חדש שמאזין לכל גן
scLong מתמודד עם האתגר הזה על-ידי הרחבה במקום קיצוץ. זהו מודל יסוד עם מיליארד פרמטרים שאומן על פרופילי פעילות גנים מכ־48 מיליון תאים אנושיים ממעל ל־50 רקמות. בשונה מגישות מוקדמות שמתמקדות בכמה אלפי גנים פעילים, scLong שוקל בקירוב 28,000 גנים בבת אחת, כולל כאלה שמביעים לעתים רחוקות או בעוצמות נמוכות. המודל משלב שני סוגי מידע עבור כל גן: עד כמה הוא פעיל בתא נתון ומה כבר ידוע על תפקודו מתוך אנציקלופדיית Gene Ontology, קטלוג רחב וממויין של תפקידי גנים ויחסי גומלין. רשת מיוחדת שפועלת על גְרָף קשרי גנים מזקקת את הידע המוקדם הזה לייצוגים קומפקטיים שהמודל יכול להשתמש בהם לצד ערכי הביטוי הגולמיים.
כיצד המודל מאזני בין כוח לחסכון
התבוננות בכל גן בפירוט יקרת משאבים חישובית, לכן scLong משתמש בעיצוב חכם עם שני מסלולים. בתוך כל תא, הגנים ממוינים לפי עוצמת הביטוי שלהם. הגנים הפעילים ביותר, שלרוב נושאים את האות הביולוגי העיקרי, עוברים דרך מודול קשב גדול וחזק יותר. הגנים השקטים, כולל מדידות נמוכות ואפילו אפסיות, מנותבים דרך מודול קטן יותר וקל משקל. לאחר מכן כל הגנים מאוחדים שוב ועוברים שכבת קשב נוספת שמאפשרת לכל גן להשפיע על כל שאר הגנים. עיצוב זה מאפשר למערכת לשמור ייצוגים זולים אך משמעותיים לאותות חלשים תוך שמירת קיבולת רבה יותר לאותות החזקים ביותר. במהלך אימון מקדים, המערכת מתחבאת באופן חוזר חלק מערכי פעילות הגנים ולומדת לשחזרם מהקשר הסובב, מה שמכריח אותה לגלות את הדפוסים שמקשרים בין גנים.

יישום המודל לבעיות אמיתיות
לאחר האימון, ניתן להתאים את scLong למגוון רחב של שאלות ביולוגיות. המחברים מראים שהוא חוזה כיצד פעילות גנים תשתנה כאשר גנים מסוימים מכובים או משונים, כולל שילובים של שני גנים שעשויים לפעול יחד. הוא גם חוזה כיצד תאים מגיבים לחשיפה לכימיקלים שונים, דבר חשוב לגילוי תרופות ובדיקות בטיחות. במחקרים על סרטן, scLong מסייע לצפות כיצד שורות תאים גידוליות יגיבו לתרופות בודדות ולזוגות תרופות שעשויות לעבוד טוב יותר בשילוב, ולעיתים עולה על מודלים ממוקדים ומודלי יסוד גדולים אחרים. מעבר לחיזוי, scLong יכול להסיק רשתות של יחסי בקרה בין גנים ולעזור לתקן עיוותים טכניים הנוצרים כאשר נתונים נאגרים במעבדות שונות או במכונות שונות.
מה המשמעות של זה לרפואה ומחקר עתידי
בהבנה פשוטה, scLong נותן למדענים מפת פעילות גנים ברזולוציה גבוהה ובהקשר, שאינה זורקת החוצה את הגנים השקטים או נדירים השימוש. על-ידי למידה ממיליוני תאים ושילוב ידע ביולוגי קיים, המודל מספק ניחושים מדויקים יותר לגבי כיצד תאים יגיבו כשהגנים מופרעים, כאשר תרופות חדשות מוכנסות או כאשר תהליכי מחלה מתפתחים. זה יכול להאיץ את החיפוש אחר טיפולים חדשים, להנחות בחירות טיפוליות מותאמות יותר אישית ולחדד את הבנתנו כיצד רשתות גנים מורכבות שולטות בבריאות ובמחלה. אף על פי שהמודל גדול ותובעני חישובית, הוא מצביע על עתיד שבו מערכות בינה מלאכותית עוצמתיות ורב-שימושיות משמשות ככלי לווי גמיש לחקירת המנגנונים הנסתרים של תאים שלנו.
ציטוט: Bai, D., Mo, S., Zhang, R. et al. scLong: a billion-parameter foundation model for capturing long-range gene context in single-cell transcriptomics. Nat Commun 17, 2380 (2026). https://doi.org/10.1038/s41467-026-69102-y
מילות מפתח: טרנסקריפטומיקה של תא יחיד, מודלי יסוד, ויסות גנים, חיזוי תגובת תרופות, ביטוי גנים