Clear Sky Science · he
למידה עמוקה מולטימודלית בלתי מפוקחת למיון מורפולוגיה של גלקסיות: שילוב ConvNeXtEmbeddings ופרמטרים מורפולוגיים למדעי סקרים בקנה מידה גדול
ללמד מחשבים "לקרוא" את צורות הגלקסיות
סקרי השמיים המודרניים מצלמים מיליארדי גלקסיות — הרבה יותר ממה שכל צוות אסטרונומים או קבוצת אזרחים-מחליטים יוכלו לסווג בעין. עם זאת, צורות הגלקסיות, מאליפסות חלקות ועד ספירלות מרשימות ומיזוגים כאוטיים, מכילות רמזים חיוניים לאופן שבו היקום בונה את המבנים שלו. המאמר מציג שיטה חדשה למחשבים לסווג גלקסיות באופן אוטומטי, מבלי שיקבלו הוראות מוקדמות לגבי מה לחפש, ופותח אפשרות לחקור מבנה קוסמי בקנה מידה עצום באמת.

מדוע צורות גלקסיות חשובות
גלקסיות אינן רק תמונות יפות; המראה שלהן מקודד את סיפור חייהן. מערכות חלקות ועגולות נוטות להיות ישנות ושקטות יותר, בעוד גלקסיות בעלות זרועות ספירליות בולטות או צורות מעוותות לעתים מסמנות הולדת כוכבים פעילה או התנגשות recente. במשך מאה שנים ארגנו אסטרונומים את הצורות הללו למשפחות — כגון אליפטיות, ספירליות ואי-סדירות — כדי לקשר מבנה נראה לעין לפיזיקה הבסיסית. אך ככל שפרויקטים כמו סקר השמיים של סלון (Sloan Digital Sky Survey) ותצפיות עתידיות כמו Legacy Survey of Space and Time של מצפה רובין מציבים תמונות בעומק חסר תקדים, סיווג ידני מסורתי הפך לבלתי-בר-קיימא.
מתוויות אנושיות לגילוי בלתי מפוקח
הרוב המכריע של ההתקדמות האחרונה בסיווג גלקסיות אוטומטי נשענת על למידה מפוקחת: מחשבים לומדים מאלפי דוגמאות שכבר תוינו בידי בני אדם. זה עובד טוב, אבל תלוי בערכות אימון שנבנו במאמץ רב ומוגבל לקטגוריות שהוגדרו מראש. המחברים בוחרים במסלול בלתי מפוקח, ובמקום להכתיב קטגוריות הם מבקשים מן האלגוריתם לגלות קיבוצים טבעיים בנתונים בעצמו. לשם כך משתמשים ברשתות ניתוח תמונה חזקות שאומן מלכתחילה על צילומים יומיומיים, מתאימים אותן לתמונות גלקסיות כדי להפיק טביעות-אצבע חזותיות עשירות — וכל זאת ללא צורך שתמונה אחת תישא תוית מוקצבת מראש.
מיזוג תמונות עם מדידות פיזיקליות
תמונות גלקסיות מכילות פרטים עצומים, אך אסטרונומים גם משתמשים בתיאורים מספריים פשוטים של המבנה, כגון עד כמה האור מרוכז במרכז, עד כמה הגלקסיה נראית אסימטרית, כמה אזורי היוולדות כוכבים סרבוליים, ועד כמה האור מפוזר באופן לא אחיד על פני הפיקסלים. הצוות משלב את שני העולמות: תכונות חזותיות עמוקות משתי רשתות עצביות מודרניות וחמש מדידות מבניות קלאסיות. מכיוון שהתיאור המבוסס-תמונה מייצר אלפי ערכים בעוד המדידות הפיזיקליות הן רק כמה מועטות, הם בונים "אוטו-אנקודר מולטימודלי" מיוחד — סוג של רשת עצבית המדחסת את כל המידע לקוד פנימי קומפקטי. הקוד בן 64 המספרים הזה מאלץ את המערכת לאזן בין מה שלמדה מהתמונות לבין מה שמוכר מפיזיקת גלקסיות בסיסית.
להניח לנתונים להתפלג למשפחות טבעיות
לאחר שכל אחת מ-4,950 הגלקסיות המסוננות בקפידה מסקר סלון מקוצרת לקוד מאוזן בן 64 ממדים זה, המחברים מיישמים טכניקת אשכולית הסתברותית המתייחסת לאוכלוסיית הגלקסיות כתערובת חלקה של קבוצות החופפות זו את זו. במקום לכפות גבולות חדים, השיטה מעניקה לכל גלקסיה דרגת חברות במספר אשכולות ומסמנת רק את ה-2% הקיצוניים כאנומליות או ארטיפקטים אמיתיים. האשכולות העיקריים שנוצרו מסתדרים היטב עם משפחות מוכרות: מערכות חלקות ודחוסות הדומות לגלקסיות טיפוסיות מוקדמות; דיסקים דלילים וגושיםיים הדומים לספירלות מאוחרות; מערכות באינטראקציה ומפורעות; ודיסקים בינוניים, מעבריים. בדיקות פנימיות מראות שהייצוג המשולב של תמונה ופיזיקה מניב קבוצות נקיות וקוהרנטיות יותר מאשר שימוש רק בתמונות או רק במדידות המבניות.

בדיקה מול כללים קלאסיים והגדלה בקנה מידה
כדי לבדוק האם הקיבוצים הבלתי מפוקחים של המחשב יש להם משמעות פיזיקלית, המחברים משווים אותם נגד גבולות-כלל מקובלים המבוססים על דיאגרמות מבנה פשוטות. אף על פי שהאלגוריתם מעולם לא ראה תוויות אנושיות, בערך מחצית מהסיווגים שלו מתיישרים עם הקטגוריות המסורתיות, והשאר חושפים וריאציות עדינות יותר שהכללים הישנים, המבוססים על שני פרמטרים, מטשטשים יחדיו. חשוב לא פחות, כל צנרת העיבוד רצה במהירות: כל גלקסיה ניתנת לעיבוד בעשרות מילישניות בודדות על חומרה מודרנית, קצב המתאים לסקרים בקנה מידה פטאבייט שעתידים לקרוא בקרוב מיליארדי גלקסיות.
מפה חדשה של גלקסי זואו
בלשון יומיומית, עבודה זו מראה כיצד ללמד מחשב "לראות" ולסווג גלקסיות באופן שמכבד הן את מה שאסטרונומים כבר יודעים והן את מה שהנתונים עדיין עלולים להסתיר. על‑ידי שילוב דפוסים חזותיים עם מדידות פיזיקליות פשוטות ובהתירה למעברים הדרגתיים במקום תיבות נוקשות, השיטה בונה טקסונומיה גמישה ומדרגית של גלקסיות. גישה זו עשויה לסייע למדענים למיין את גל המידע התצפיתי שיבוא, לזהות מערכות נדירות או לא שגרתיות ולשכלל את תמונתנו לגבי האופן שבו גלקסיות נוצרות, מתאחדות ומשתנות לאורך זמן קוסמי.
ציטוט: Selim, I.M., Farahat, A.S., Basmsm, L.H. et al. Unsupervised multimodal deep learning for galaxy morphology taxonomy: integrating ConvNeXtEmbeddings and morphological parameters for scalable survey science. Sci Rep 16, 12183 (2026). https://doi.org/10.1038/s41598-026-45369-5
מילות מפתח: מורפולוגיה של גלקסיות, למידה בלתי מפוקחת, למידה עמוקה, סקרי שמים אסטרונומיים, אִשּׁוּר/אִשּׁוּי (clustering)