Clear Sky Science · ar
تأثير استراتيجية تكبير فضاء البيانات على دقة النموذج والتعميم في تصنيف مقاطع الصخور الرقيقة
لماذا تهم صور الصخور الأذكى
في أعماق الأرض، يحدد تنظيم الصخور أماكن تدفق أو تخزين الماء والنفط والغاز وحتى ثاني أكسيد الكربون. يدرس الجيولوجيون شرائح صخرية رقيقة جداً تحت المجهر لقراءة هذه البنية المخفية. وبشكل متزايد، تُدرَّب الحواسيب على التعرف على أنواع الصخور من مثل هذه الصور. يطرح هذا المقال سؤالاً يبدو بسيطاً لكنه ذو عواقب عملية كبيرة: عندما نقوم بتضخيم مجموعات الصور هذه اصطناعياً عبر «توسيع البيانات»، هل نجعل الحاسوب أكثر ذكاءً فعلاً—أم أننا قد نُضعفه في بعض الأحيان؟

تدريب الحواسيب بصور صخرية محدودة
عادة ما يتطلب تدريب نظام تعرف على الصور آلاف الأمثلة. في علم الصخور، جمع هذا العدد من صور المجهر بطيء ومكلف: يجب حفر العينات وقطعها وتلميعها وتصويرها، وكثير من المجموعات محفوظة سرياً لدى الشركات. عمل المؤلفون مع مجموعة واقعية تضم 34,775 صورة مجهرية لمقاطع صخرية رقيقة، مقسمة إلى 36 فئة صخرية مثل الحجر الرملي والحجر الجيري والبازلت. كما عرّفوا نسخة أصغر «ذات بيانات محدودة» تضم فقط 100 صورة تدريب و50 صورة تحقق لكل فئة لمحاكاة الوضع الشائع لنقص البيانات.
تمديد البيانات دون تدمير الصخور
لمواجهة قلة الصور، غالباً ما ينشئ الباحثون نسخاً معدّلة من الأصل—عبر قلبها، أو تحريكها، أو تدويرها، أو تكبيرها، أو مزج الصور معاً—لمساعدة النموذج على تعلم تجاهل الاختلافات غير الهامة. قارنت هذه الدراسة طريقتين عامتين لذلك. في التوسيع الثابت، تُنشأ الصور الإضافية وتُحفظ قبل التدريب، مما يكبر مجموعة البيانات بشكل دائم. أما في التوسيع الديناميكي، فيولد الحاسوب تحولات عشوائية أثناء التدريب، لذلك قد يرى النموذج نسخة مختلفة قليلاً من نفس الصخر في كل تمرير. استكشف الفريق 133 إعداد تحويل مفصّل—من انعكاسات خفيفة إلى تكبيرات وتدويرات متطرفة، بالإضافة إلى أساليب أكثر تقدماً لـ«مزج الصور» حيث يتم خلط أو قص صورتين صخريتين رياضياً معاً.

اختبار خمسة أدمغة
درّب الباحثون خمسة شبكات عصبية تلافيفية مختلفة: ثلاث بنى معروفة مُدربة مسبقاً على صور الحياة اليومية، ونموذجان أبسط مُنشئان من الصفر. عبر 691 تجربة منفصلة، قاسوا كم مرة صنفت كل شبكة صور التحقق بشكل صحيح بعد استخدام استراتيجيات توسعة مختلفة. من دون أي توسعة ومع توافر بيانات وفيرة، وصل أفضل نموذج مُدرَّب مسبقاً إلى نحو 98–99% دقة. مع مجموعة التدريب الأصغر، انخفضت الدقة، مما جعل التوسعة تبدو مفيدة—لكن النتائج أظهرت أن جميع البيانات الإضافية ليست بالضرورة مفيدة.
عندما تؤذي المزيد من التنوع بدلاً من أن تفيد
النتيجة الأكثر لفتاً أن التوسعة سيف ذو حدين. العديد من الحيل الهندسية الشائعة، وخصوصاً التكبيرات القوية والتدويرات الكبيرة، خفضت الدقة فعلياً، وأحياناً بشكل كبير، عند تطبيقها ديناميكياً أثناء التدريب. يمكن أن تمدد هذه العمليات أو تمحو حبيبات المعادن الصغيرة والأنسجة التي تحمل معلومات جيولوجية أساسية، ما يعلّم النموذج أن يركز على أنماط لا توجد في العينات الحقيقية. أما التوسيع الثابت، حيث تظل الصور المحوّلة ثابتة وتُعاد استخدامها باستمرار، فقد أدى عموماً إلى نتائج أكثر استقراراً وأحياناً أفضل. كانت الانقلابات البسيطة والتحركات الصغيرة آمنة إلى حد كبير، لكن التحويلات العدوانية كانت محفوفة بالمخاطر ما لم تُسيطر بعناية.
مزج الصور لتعزيز التعميم
كانت الأساليب الأكثر وعداً تقنيات مزج الصور الخطية واللاخطية، التي تجمع صورتين صخريتين لخلق مثال تدريب جديد. المتغيرات التي كانت تأخذ متوسطاً أو تبدّل بلاطات أو تدمج الصور بكسلاً بكسل حافظت باستمرار على الدقة أو حسّنَتها، خاصة للمجموعة الأصغر. النموذج المدرب باستخدام صور مختلطة ثابتة تعمم بشكلٍ أفضل على بيانات لم تُرَ سابقاً، بما في ذلك صور صخرية صناعية أنشأها نظام ذكاء اصطناعي آخر وصخور حقيقية عُولجت بطرق غير مألوفة، مثل إزالة الخلفية أو تشويهها تعقيدياً. بشكل لافت، تفوق هذا النموذج الموسّع المدرب على عدد أقل من الصور الأصلية أحياناً على نموذج أكبر بكثير مدرّب على مجموعة كاملة غير موسعة.
ماذا يعني هذا لذكاء الجيولوجيا المستقبلي
لغير المتخصصين، الرسالة الرئيسية هي أن «المزيد من البيانات» المخلوقة بحيل صور بسيطة لا يجعل نظام الذكاء الاصطناعي أكثر موثوقية تلقائياً. في النسيج الدقيق للصور المجهرية للصخور، يمكن لبعض التشوّهات أن تمحو بالضبط الميزات التي يهتم بها الجيولوجيون. تظهر هذه الدراسة أن التوسعة الثابتة المختارة بعناية ومزج الصور المدروس يمكن أن يعوّضا جزئياً عن قلة البيانات ويحسنا قدرة النماذج على التعامل مع صور جديدة وغير مألوفة. وفي الوقت نفسه، يمكن للاستخدام غير الناقد لتحويلات ديناميكية عدوانية أن يقوّض الدقة بهدوء. بعبارة أخرى، في تصنيف الصخور الآلي—ومن المحتمل في العديد من مهام التصوير العلمي—طريقة اختراع صور التدريب الجديدة تهم بقدر أهمية عددها.
الاستشهاد: Habrat, M., Młynarczuk, M. Impact of data space augmentation strategy on model accuracy and generalization in thin-section rock classification. Sci Rep 16, 13927 (2026). https://doi.org/10.1038/s41598-026-44320-y
الكلمات المفتاحية: ميكروسكوبيات الصخور, توسيع البيانات, الذكاء الاصطناعي في الجيولوجيا, تصنيف الصور, المقاطع الرقيقة