Clear Sky Science · he
הטמעה רב-מודאלית חלקית משותפת לומדת ייצוג הוליסטי של מצב התא
מדוע המחקר הזה חשוב
כל תא בגופנו הוא יקום זעיר, וכלים מודרניים מסוגלים לצפות ביקום הזה ממספר זוויות — על ידי קריאת גנים, מיפוי אריזת ה-DNA, או הדמיית חלבונים. עם זאת, מרבית השיטות המחשוביות משלבות את המבט הזה בצורה שמקשה לזהות איזו מדידה אחראית לאיזה תובנה. מאמר זה מציג את APOLLO, שיטה חדשה לשילוב נתונים תאיים מגוונים השומרת על מה שנמצא במשותף בין המדידות ומה הייחודי לכל אחת, ומציעה תמונה הוליסטית וברורה יותר של התנהגות התא.
לראות תאים דרך עדשות מרובות
ביולוגיה מודרנית מודדת באופן שגרתי כמה סוגי מידע מאותו תא: אילו גנים פעילים, עד כמה ה-DNA דחוס, אילו חלבונים מקשטים את המעטפת, או היכן חלבונים מסוימים ממוקמים בתוך התא. כל "מודליות" תופסת רק חלק ממצב התא האמיתי. חלק מהמאפיינים, כמו סוג תא רחב, עשויים להופיע בכל המודליות, בעוד שאחרים — כמו אריזת DNA עדינה או מיקום ספציפי של חלבון — עשויים להופיע רק במודליות אחת. שיטות חישוביות קיימות או מנתחות כל מודליות בנפרד או ממזגות אותן לייצוג מעורב יחיד. בשני המקרים, מדענים מתקשים לזהות מאיפה מגיעים תכונות מסוימות ולחזות מה מדידה חסרה הייתה מראה.

מפה חדשה של אותות משותפים וייחודיים
APOLLO מטפלת בבעיה הזו על ידי למידת מפה פנימית מובנית של כל תא. במקום סיכום אחד לא מובחן, היא מחלקת את המידע לשלושה חלקים: רכיב משותף המשקף את מה שיש במשותף בין המדידות, ודו-רכיבים ספציפיים לכל מודליות שתופסים את הייחודיות של כל סוג נתונים. בפן הטכני, APOLLO משתמשת במשפחה של רשתות ניורונים שנקראות אוטואנקודרים. בשלב האימון הראשון היא מטפלת בייצוג הפנימי של כל תא כקבוצת פרמטרים ניתנים לכוונון ומכווננת אותם יחד עם רשתות מפענחות כך שכל מודליות תישחזר בדיוק. בשלב השני מאמנים רשתות קידוד שיכולות להסיק את אותם ייצוגים פנימיים מתוך נתונים חדשים, מה שמאפשר לשיטה להכליל לתאים שלא נראו ולבצע חיזוי חוצה-מודליות.
בדיקת השיטה על נתונים מדומים ומציאותיים
המחברים מאמנים תחילה את APOLLO על מערכי נתונים מדומים שעוצבו בקפידה, שבהם המבנה האמיתי ידוע. במספר תרחישים, כולל כאלה שבהם גורמים משותפים וספציפיים למודליות קשורים סטטיסטית, APOLLO מצליחה להפריד ביניהם לתאים המיועדים. לאחר מכן הם מיישמים את השיטה על נתוני ביטוי גנים וזמינות כרומטין מזווגים מעור העור של עכבר, על נתונים המולכים ביטוי גנים עם רמות חלבונים על פני השטח בתאי חיסון, ועל תמונות תאיות רב-מולכפלות מאוד. במערכי הנתונים האמיתיים האלה החלל המשותף תופס נושאים ביולוגיים מרכזיים, כמו רגולטורים מפתח המגדירים סוג תא, בעוד החללים הספציפיים למודליות מדגישים שכבות נוספות כמו מצב מחזור התא או השפעות אצווה הייחודיות למדידה אחת.
חיזוי תמונות חסרות וגילוי מבנה התא
יישום בולט אחד משתמש בהדמיית תאי חיסון מחולי סרטן. כאן לכל תא יש צביעה של DNA ואחת או כמה צביעות חלבון, אך לא כל החלבונים נמדדים בכל תא. APOLLO לומדת כיצד דפוסים בארגון הכרומטין קשורים למיקום החלבון ואז יכולה לחזות כיצד חלבון שלא נמדד ייראה בתא נתון, בהתבסס רק על תמונת הכרומטין שלו. תמונות החלבון החזויות מספיק ריאליות עד שמסווג נפרד, שאומן להבחין באבחון החולה, מבצע כמעט באותה יעילות עליהן כמו על תמונות אמיתיות. במאגר הדמיות גדול נוסף, אגודת החלבון האנושית (Human Protein Atlas), APOLLO מפרידה כיצד צורות הגרעין, רשת המיקרוטובולים והראפ הממי הקשורות לאיפה שנמצאים החלבונים בתוך התא. עבור חלק מהחלבונים, שינויי מרקם גרעיני הם המידע המכריע; עבור אחרים, תכונות של השלד התאי הסובב שולטות.

תמונה ברורה יותר של זהות התא
לא-מומחה, המסר המרכזי הוא ש-APOLLO מאפשרת למדענים לשלב מדידות רבות ושונות של אותו תא מבלי לאבד עקבות באיזה מדידה הסבר מסוים נמצא. על ידי הפרדה מפורשת של מידע משותף ומידע ספציפי למודליות, השיטה יכולה גם לחזות נתונים חסרים — כמו תמונות חלבון שלא נמדדו — ולהראות איזה מחלקה תאית או סוג נתונים באמת מקושרים לתנוחת פנוטיפ נתונה, כגון מצב מחלה או שינוי מיקום חלבון. היכולת ליצור סיכום מובנה ומבין של כל תא מהווה בסיס לאבחון מדויק יותר ולהבנה מכניסטית עמוקה יותר של איך שכבות ביולוגיה שונות עובדות יחד.
ציטוט: Zhang, X., Shivashankar, G.V. & Uhler, C. Partially shared multi-modal embedding learns holistic representation of cell state. Nat Comput Sci 6, 285–300 (2026). https://doi.org/10.1038/s43588-025-00948-w
מילות מפתח: מידול מולטי-אומיקס בתא יחיד, למידת ייצוג, מצב התא, מקומם של חלבונים, הדמיית כרומטין