Clear Sky Science · ar

تصنيف صور العمارة القديمة باستخدام التعلم الزائدي الزائف للمقلوب التدريجي

· العودة إلى الفهرس

لماذا تلتقي المباني القديمة بالخوارزميات الحديثة

في أنحاء الصين، تُلتقط صور بأعداد هائلة للمساجد والقصور ذات الأسقف المنحنية والدعامات الخشبية المعقدة. يحتاج أمناء الأرشيف والمحافظون إلى ترتيب هذه الصور بسرعة، لكن القيام بذلك بالعين المجردة بطيء وذو طابع شخصي. تقدّم هذه الورقة طريقة جديدة لتعليم الحواسيب التعرف على صور المباني القديمة وتصنيفها بدقة وكفاءة أكبر، مما يساعد على حماية التراث الثقافي في العصر الرقمي.

Figure 1
الشكل 1.

ما الذي يجعل تمييز هذه المباني صعبًا

تتميز العمارة الصينية القديمة بأنماط متكررة غنية: خطوط سقف منحنية، مجموعات دعامات متعددة الطبقات تحت الحواف، عوارض منحوتة وزخارف سطحية ملونة. تشترك العديد من المباني في ترتيبات مماثلة تختلف فقط في فروق دقيقة مثل انحناء السقف أو شكل الدعامة. يمكن لأنظمة التعرف على الصور التقليدية، التي تتعلم عن طريق تعديل الأوزان الداخلية تدريجيًا، أن تتشتت بفعل هذه الفروق الدقيقة وبفعل إشارات مشتتة مثل لون الجدران أو الإضاءة. كما تميل إلى الإفراط في التكيّف مع منطقة أو طراز واحد عند تدريبها دفعة واحدة على مجموعة كبيرة من الصور، مما يقلل من قدرتها على التعميم إلى مبانٍ من مواقع أخرى.

طريقة أذكى للتركيز على التفاصيل الأساسية

يقدّم المؤلفون إطار عمل يسمى تصنيف صور العمارة القديمة باستخدام التعلم الزائف للمقلوب التدريجي (AAPSP). في جوهره يوجد مكوّن أطلقوا عليه تجميع الميزات الرئيسية بتعلم المقلوب الزائف (KFSP). بدلاً من البدء من إعدادات عشوائية تمامًا، يبني KFSP عدة «متعلّمين أساسيين» متوازيين، كل واحد مهيأ بنماذج أوزان مصممة لمطابقة سمات بصرية معينة. تم ضبط فرعين ليكونا حساسَين بشكل خاص للهياكل الناعمة والمستمرة مثل محارف السقف، في حين تم ضبط فرع ثالث لالتقاط أنسجة أكثر تشتتًا مثل الزخارف. تسمح مقدمة رياضية تُعرف بتعلم المقلوب الزائف بتدريب هذه الفروع بشكل جوهري في خطوة واحدة، متجنبةً تحديثات الأوزان البطيئة والمتدرجة الخاصة بالتعلّم العميق التقليدي.

ترك النموذج يولي الاهتمام حيث يهم

وجود فروع متعددة وحده لا يكفي؛ يجب على النظام أيضًا أن يقرر أي فرع هو الأنسب لكل قرار. لتحقيق ذلك، يستخدم KFSP آلية انتباه تقيس مدى تطابق مخرجات كل فرع مع تسميات المباني الحقيقية. تُعطى الفروع التي تلتقط عناصر مميزة — مثل شكل قوس الدلو أو محيط زينة الحافة — تأثيرًا أكبر تلقائيًا عند دمج مخرجاتها. يشكل هذا التمثيل المتراكم فضاء ميزات يتبع بشكل أوثق «منطق الشكل» الكامن في العمارة القديمة، بحيث تتجمع المباني ذات المكونات الهيكلية المماثلة وتنفصل الأنماط المختلفة بوضوح أكبر.

Figure 2
الشكل 2.

التعلم من أكثر الصور إفادة

المكوّن الأساسي الثاني، التعلم التحسيني التدريجي (POL)، يتعامل مع مشكلة مختلفة: الصور التدريبية المكررة. تعرض العديد من الصور في مجموعة البيانات مناظر متشابهة تقريبًا لنفس الواجهة، مما يقدّم معلومات جديدة ضئيلة. يبدأ POL بتقسيم البيانات إلى مجموعة تدريب أولية وحوض مرشّح أكبر. باستخدام أفكار من التعلم النشط، يحلل مدى ثقة النموذج الحالي في تصنيف كل صورة مرشّحة ومدى غرابة ميزاتها. تُنقل تدريجيًا إلى مجموعة التدريب الصور التي تكون غير مؤكدة ومتميزة في الوقت نفسه — مثل ترتيبات دعامات نادرة أو توليفات سقف غير مألوفة. يتكرر هذا الدوران، مع إثراء تدريجي لبيانات التدريب بأمثلة صعبة ومتنوعة دون زيادة العدد الإجمالي للصور المستخدمة.

ما مدى فعاليته عمليًا

اختبر المؤلفون منهجهم على مجموعة عامة تضم 2269 صورة من ستة معابد وقصور مشهورة. بعد تطبيق KFSP وحده، تفوق النظام بالفعل على طريقة مماثلة اعتمدت على إسقاطات عشوائية بالكامل. عندما أضيف اختيار العينات التدريجي لـ POL، تحسنت دقة التصنيف أكثر، وارتفعت مقاييس الدقة والاستدعاء ودرجة F1. بعبارة أخرى، أصبح النموذج أكثر موثوقية في توقعاته الصحيحة وأكثر قدرة على اكتشاف الفئات الأقل شيوعًا. كما أبرزت الدراسة تحديًا متبقٍ: لا تزال الفئات التي تحتوي على صور قليلة جدًا مشكلة، لأن حتى المتعلّم الذكي يواجه صعوبة عندما تكون التنوعات قليلة جدًا للتعلم منها.

لماذا هذا مهم للتراث الثقافي

من خلال توجيه ما يوليه النموذج من اهتمام وبعناية اختيار الصور التي يتعلم منها، يوفر AAPSP أداة أكثر دقة لفرز ودراسة صور المباني التاريخية. بالنسبة لمحترفي التراث، يعني هذا إنشاء أرشيفات رقمية أسرع، ودعمًا أفضل لتأريخ ومقارنة الأنماط المعمارية، ورصدًا أكثر قوة للمواقع المنتشرة عبر مناطق مختلفة. وعلى الرغم من أن الطريقة مصممة لعمارة الصين القديمة، يمكن تكييف أفكارها الأساسية — إبراز التفاصيل الهيكلية الرئيسية والتركيز التدريجي على الأمثلة النادرة والمفيدة — لتشمل أنواعًا أخرى من الأشياء الثقافية، من التماثيل إلى الواجهات التاريخية.

الاستشهاد: Cai, Z., Sun, X., Zhang, S. et al. Ancient architecture image classification with progressive stacking pseudoinverse learning. Sci Rep 16, 14626 (2026). https://doi.org/10.1038/s41598-026-44876-9

الكلمات المفتاحية: العمارة القديمة, تصنيف الصور, التراث الثقافي, تعلم الآلة, التعلم النشط