Clear Sky Science · ar

التخفيف من السمات الزائفة عبر التعلم التبايني في تمييز شظايا الفخار

· العودة إلى الفهرس

لماذا تهم الأواني المكسورة العلم الحديث

للوهلة الأولى، تبدو أكوام الفخار المكسور من قرية عمرها 7000 عام في جنوب الصين بعيدة عن عالم الذكاء الاصطناعي الحديث. ومع ذلك، تشكل هذه الشظايا مفتاحًا لفهم حياة الناس في العصر النيوليثي — كما تكشف عن نقطة ضعف خفيّة في أنظمة التعرف على الصور الحالية. تستخدم هذه الدراسة تقنيات تعلم آلي متقدمة لفرز شظايا فخار هيمودو القديمة حسب النوع، مع مواجهة مشكلة تؤثر على العديد من أنظمة الذكاء الاصطناعي: الميل إلى الاعتماد على «اختصارات» بصرية مضللة بدلاً من الدلائل الجوهرية الحقيقية.

Figure 1
Figure 1.

الأواني القديمة وقصصها الخفية

أفادت حفريات موقع هيمودو بوجود نحو 400,000 قطعة من الفخار، ما يشكل كنزًا لإعادة بناء الحياة اليومية والتقنية والتبادل في جنوب الصين النيوليثي. يهيمن نوعان رئيسيان من الفخار في الموقع. الفخار المملوء بالرمل يحتوي على رمل وحصى، ما يجعله كثيفًا وصلبًا ومقاومًا للحرارة. أما الفخار الممزوج بالفحم فيحتوي على مادة نباتية محترقة، تاركًا مسامًا دقيقة وآثارًا شبيهة بالرماد تجعل الأواني أخف وأنعم. يصنف علماء الآثار هذه الأنواع أساسًا من خلال نسيج السطح وتركيب المواد، وليس من خلال الحدود غير المنتظمة لكل قطعة مكسورة. قد يوفر أتمتة هذا التصنيف وقتًا كبيرًا من جهود الخبراء، لكن ذلك ممكن فقط إذا ركز الحاسوب على نفس الدلائل التي يثق بها المتخصصون.

عندما يتعلم الذكاء الاصطناعي الدرس الخاطئ

أنشأ الباحثون مجموعة صور محكومة بعناية في موقع الحفر، صوّروا فيها 1,864 شظية داخل خيمة معتمة بإضاءة ثابتة وخلفيات بيضاء. من المدهش أن التجارب الأولية أظهرت أن شبكة عميقة قياسية تستطيع تصنيف الفخار جيدًا اعتمادًا فقط على أشكال الشظايا، محققة دقة عالية على صور ثنائية اللون تُظهِر المحيط فقط. بالمقابل، عندما قَصّ الباحثون الحواف واحتفظوا فقط بنسيج السطح الداخلي، هبطت الدقة. هذا يعني أن النموذج اكتشف اختصارًا سهلًا لكنه غير موثوق: أشكال الكسر المحددة، التي ينظر إليها علماء الآثار على أنها حوادث عشوائية للكسر وليست علامات موثوقة لنوع الفخار. بمصطلحات تعلم الآلة، كانت شكل الشظية يعمل كـ «سمة زائفة» — نمط يرتبط بالوسم في مجموعة البيانات لكنه ليس مرتبطًا فعليًا بالفئة الأساسية.

تعليم النموذج لتجاهل الاختصار

لدفع النظام نحو دلائل أكثر معنىً، صمم الفريق استراتيجية تدريب مبنية على التعلم التبايني، وهي تقنية تعلم النموذج أي الصور التي يجب اعتبارها «مشابهة» أو «مختلفة». لكل صورة فخار، أنشأوا نسخة مقصوصة عشوائيًا بحيث يختفي الكثير من المحيط بينما يبقى السطح الداخلي. مرّرا الصورتين عبر نفس شبكة استخراج الميزات، وأجبرت عملية التدريب تمثيلاتهما الداخلية على التقارب. في الوقت نفسه، دُفعت صور من أنواع فخار مختلفة بعيدًا في فضاء الميزات هذا. وظيفة خسارة متخصصة تُسمى «Triplet-center» ضبطت تكتلات الشظايا من نفس الفئة وأبعدت تكتلات قطع الفخار الملحئة بالرمل عن تلك الممزوجة بالفحم، حتى عندما بدت نسيجاتها متشابهة للوهلة العادية.

Figure 2
Figure 2.

جعل التعلم أكثر استقرارًا وموثوقية

بعد تشكيل هذا فضاء الميزات، جمده الباحثون ودربوا مُصنّفًا بسيطًا فوقه. لتجنّب الفخ المألوف للإفراط في التخصيص — أي الأداء الممتاز على بيانات التدريب ولكنه الضعف على عينات جديدة — استخدموا تقنية تُدعى flooding. بدلًا من دفع خطأ التدريب إلى الصفر بالكامل، يثبت flooding الخسارة عند مستوى صغير وغير صفري، مشجِّعًا النموذج على الاستقرار في منطقة حلول واسعة ومسطحة تميل إلى التعميم بشكل أفضل. كما اختبروا العديد من خدع تكبير البيانات الشائعة، مثل تغييرات اللون والتشويش. التعديلات التي أضرت بمعلومات النسيج عمومًا أضرت بالأداء، بينما تلك التي عاثت في الشكل — مثل الانعكاسات الأفقية والقصوص العشوائية المضبوطة بعناية — ساعدت النموذج على تجاهل إشارات المحيط المضللة.

ماذا يعني هذا لعلم الآثار والذكاء الاصطناعي

بفضل هذا المزيج من التدريب التبايني، وخسارة Triplet-center، وتقنية flooding، بلغ النظام دقة 97.3% على مجموعة بيانات فخار هيمودو، متفوقًا على عدة نماذج معروفة للتعرف على الصور. حسنت الطريقة أيضًا الأداء على معيار منفصل حيث تظهر أنواع الأشياء في خلفيات جديدة وغير مألوفة، مما يشير إلى أنها قد تساعد العديد من أنظمة الرؤية على مقاومة الارتباطات الزائفة. بالنسبة لعلماء الآثار، تعد مثل هذه الأدوات بفرز أسرع وأكثر اتساقًا لمجموعات الشظايا الضخمة، ما يحرر الخبراء للتركيز على التفسير بدلًا من الوسم المتكرر. بالنسبة للقارئ غير المتخصص، الخلاصة واضحة: بإجبار الذكاء الاصطناعي على تجاوز الاختصارات المريحة لكن غير الموثوقة — مثل المحيط المسنن لقطعة فخار مكسورة — يمكننا بناء أنظمة تُدرك العالم بطريقة أقرب إلى فهم الخبراء البشر.

الاستشهاد: Yu, X., Li, T., Song, Z. et al. Mitigating spurious features by contrastive learning in pottery sherd recognition. npj Herit. Sci. 14, 135 (2026). https://doi.org/10.1038/s40494-025-02170-3

الكلمات المفتاحية: فخار هيمودو, التعلم التبايني, الارتباطات الزائفة, تصوير أثري, تصنيف الصور