Clear Sky Science · he
השפעת אסטרטגיית הגדלת מרחב הנתונים על דיוק המודל והכללה בסיווג מותקני דק של סלעים
מדוע תמונות סלע חכמות יותר חשובות
מתחת לפני השטח, האופן שבו מאורגנים הסלעים קובע היכן מים, נפט, גז ואפילו פחמן דו‑חמצני יכולים לזרום או להיאגר. גיאולוגים בוחנים פרוסות סלע דקות מאוד תחת מיקרוסקופ כדי לקרוא את הארכיטקטורה המוסתרת הזו. יותר ויותר, מחשבים מאומנים לזהות סוגי סלעים מתמונות כאלה. המאמר הזה שואל שאלה שמתחפשת לפשוטה אך יש לה השלכות מעשיות גדולות: כאשר אנו מגדילים באופן מלאכותי את אוספי התמונות באמצעות "הגדלת נתונים", האם אנחנו באמת מחכימים את המחשב — או שלעיתים אנחנו עלולים להחליש אותו?

להכשיר מחשבים עם מעט תמונות סלע
הכשרת מערכת זיהוי תמונות בדרך כלל דורשת אלפי דוגמאות. בגיאולוגיה, איסוף כמות כזו של תמונות מיקרוסקופיות של סלעים הוא איטי ויקר: יש לקדוח, לחתוך, ללטש ולצלם דגימות, והרבה מערכי נתונים נשמרים בסודיות על‑ידי חברות. המחברים עבדו עם אוסף מציאותי של 34,775 תמונות מיקרוסקופ של פרוסות סלע דקות, מחולקות ל‑36 קטגוריות סלעיות כגון חולית, חרסית ובסלט. הם גם הגדירו גרסה קטנה יותר של "נתונים מוגבלים" עם רק 100 תמונות אימון ו‑50 תמונות ולידציה לכל כיתה כדי לחקות את המצב השכיח שבו הנתונים דלים.
להמתיח את הנתונים בלי לשבור את הסלעים
כדי לפצות על חוסר בתמונות, חוקרים לעתים יוצרים העתקים מותאמים של המקור — השטחה (flip), הזזה, סיבוב, זום או מיזוג תמונות — כדי לעזור למודל ללמוד להתעלם מהבדלים חסרי חשיבות. המחקר השווה שתי גישות רחבות לכך. בהגדלה סטטית (static augmentation), יוצרים תמונות נוספות ושומרים אותן לפני האימון, מה שמגדיל את מערך הנתונים בקביעות. בהגדלה דינמית (dynamic augmentation), המחשב מייצר טרנספורמציות אקראיות בזמן אמת במהלך האימון, כך שכל מעבר עלול לראות גרסה מעט שונה של אותו סלע. הצוות בחן 133 תצורות טרנספורמציה מפורטות — החל מהיפוכים עדינים ועד זומים וסיבובים קיצוניים, וכן טכניקות מתקדמות יותר של "מיזוג תמונות" שבהן שני סלעים מעורבבים או משולבים מתמטית.

בחינת חמישה מוחות
החוקרים אימנו חמישה רשתות עצביות קונבולוציוניות שונות: שלוש ארכיטקטורות מוכרות שאומנו מראש על צילומים יומיומיים, ושתי מודלים פשוטים יותר שנבנו מאפס. ב‑691 ניסויים נפרדים הם מדדו כמה פעמים כל מודל סיווג נכון את תמונות הוולידציה לאחר שימוש באסטרטגיות הגדלה שונות. ללא הגדלה ובכמות נתונים גדולה, הרשת המוכנה הטובה ביותר כבר הגיעה לכ‑98–99% דיוק. עם קבוצת האימון הקטנה יותר, הדיוק ירד, מה שהופך את ההגדלה לפוטנציאלית חשובה — אבל התוצאות הראו שלא כל נתון נוסף מועיל.
מתי גיוון רב יותר מזיק במקום לעזור
הממצא הבולט ביותר הוא שהגדלה היא חרב בעלת שני חודים. רבות מהטריקים הגיאומטריים הנפוצים, במיוחד זומים חזקים וסיבובים גדולים, הפחיתו למעשה את הדיוק, לעיתים בקיצוניות, כאשר יושמו באופן דינמי במהלך האימון. פעולות אלה יכולות למתוח או לטשטש את גרגרי המינרלים והמרקמים הזעירים שנושאים מידע גיאולוגי חיוני, וללמד את המודל לשים לב לדפוסים שאינם מופיעים בדגימות אמיתיות. הגדלה סטטית, שבה התמונות המומרות קבועות ומשומשות שוב ושוב, הביאה בדרך כלל לתוצאות יציבות יותר ולפעמים טובות יותר. היפוכים פשוטים והזזות קטנות נטו להיות בטוחים, אך טרנספורמציות אגרסיביות היו מסוכנות אלא אם כן נשלטו בקפידה.
מיזוג תמונות לשיפור הכללה
השיטות המבטיחות ביותר היו טכניקות מיזוג תמונות ליניאריות ולא ליניאריות, המשלבות שתי תמונות סלע ליצירת דוגמת אימון חדשה. וריאנטים שעשו ממוצע, טילינג או מיזוג פיקסל‑בפיקסל שמרו בקביעות על הדיוק או שיפרו אותו, במיוחד עבור מערך הנתונים הקטן יותר. מודל שהתאמן על תמונות מעורבות סטטית הכליל טוב יותר לנתונים שלא נראו קודם, כולל תמונות סלע סינתטיות שנוצרו על‑ידי מערכת בינה מלאכותית אחרת וסלעים אמיתיים שעובדו בצורות לא שגרתיות, כמו הסרת רקע או עיוותים מורכבים. באופן מרשים, המודל המוגדל הזה, שאומן על הרבה פחות תמונות מקור, לפעמים עלה על ביצועיו של מודל גדול בהרבה שאומן על המערך המלא ללא הגדלה.
מה משמעות הדבר לעתיד הבינה הגיאולוגית
עבור לא‑מומחים, המסר המרכזי הוא ש"יותר נתונים" שנוצרים בעזרת טריקים פשוטים בתמונות אינם הופכים מערכת בינה מלאכותית לאמינה יותר באופן אוטומטי. במרקמים העדינים של סלעים מיקרוסקופיים, עיוותים מסוימים יכולים למחוק בדיוק את התכונות שגיאולוגים דואגים להן. המחקר מראה שהגדלה סטטית שנבחרה בקפידה ומיזוג תמונות מושכל יכולים לפצות לחלק מהחסר בנתונים ולשפר את היכולת של מודלים להתמודד עם תמונות חדשות ובלתי שגרתיות. במקביל, שימוש בלתי מבוקר בטרנספורמציות דינמיות אגרסיביות עלול לאט אבל בטוח לשחוק את הדיוק. במילים אחרות, בסיווג אוטומטי של סלעים — וככל הנראה גם במשימות רבות של דימות מדעי — האופן שבו אנו ממציאים תמונות אימון חדשות חשוב בדיוק כמו הכמות שיש לנו.
ציטוט: Habrat, M., Młynarczuk, M. Impact of data space augmentation strategy on model accuracy and generalization in thin-section rock classification. Sci Rep 16, 13927 (2026). https://doi.org/10.1038/s41598-026-44320-y
מילות מפתח: מיקרוסקופיה של סלעים, הגדלת נתונים, בינה מלאכותית בגיאולוגיה, מיון תמונות, מותקני דק