Clear Sky Science · ar

نحو تحسين التجميع غير المراقَب للّوح الكورية في القرن العشرين عبر ميزات متعددة الأنماط

· العودة إلى الفهرس

رؤية الأنماط في الفن الكوري الحديث

ماذا لو استطاع حاسوب أن يساعدنا على فهم مدى تشابه الرسامين — أو اختلافهم التام — بمجرد النظر إلى أعمالهم؟ تستخدم هذه الدراسة الذكاء الاصطناعي لفحص اللوحات الكورية من القرن العشرين، كاشفة عن أنماط خفية في اللون والملمس والأسلوب. للزوار المتحفيين ومحبي الفن والقراء الفضوليين، تقدّم طريقة جديدة لرؤية مدى تميّز الفنانين، وكيف تتجمع أعمالهم بهدوء في عائلات أسلوبية قد يناقشها الخبراء أحيانًا.

بناء مجموعة فنية مختارة بعناية

لإعطاء الحاسوب مادة ذات معنى ليتعلم منها، جمع الباحثون أولاً مجموعة رقمية مركّزة: 1100 لوحة لِأَحَدَ عَشَرَ فنانًا رئيسيًا من فناني الحداثة والمعاصرة الكوريين، من رسامي المناظر بالحبر إلى التشكيليين التجريديين والواقعيين. أسهم كل فنان بمئة عمل، جُمِعَت أساسًا من المتحف الوطني للفن الحديث والمعاصر (MMCA) ومؤسسات ومؤسسات موثوقة أخرى. تشمل المجموعة شخصيات محورية مثل رواد التجريد، رسامي الواقعية في حياة الناس اليومية، مبتكري الحبر والغسق، وفنانين يدمجون التقاليد الشعبية مع التعبير الحديث. ساعد ظهورهم في معارض وطنية بارزة، بما في ذلك مجموعة لي كون-هي الشهيرة، على ضمان أن تعكس قاعدة البيانات جوهر الفن الكوري في القرن العشرين بدلاً من أن تكون مجموعة عشوائية من الصور.

ترجمة اللوحات إلى أرقام

لا يمكن للحواسيب «رؤية» الفن كما يفعل البشر، لذا حوّل الفريق كل لوحة إلى حزمة من الميزات الرقمية. التقطوا معلومات اللون الأساسية بطريقتين مختلفتين (RGB وHSV)، وقاسوا أنماط الملمس الدقيقة باستخدام طريقة تُدعى التلازم الرمادي لمستويات التدرج (gray-level co-occurrence)، وأضافوا لقطة دلالية قوية من نموذج رؤية-لغة مدرّب مسبقًا يُعرف باسم CLIP. تم تدريب CLIP أصلاً على أعداد هائلة من أزواج الصورة-النص من الإنترنت، لذا يحمل حسًا واسعًا واعيًا للغة حول شكل الصور. لكل لوحة، جُمعت هذه التدفقات الأربعة — اللون، وتباين اللون، والملمس، والانطباع الدلالي — وتم توحيدها ثم دمجها في متجه ميزات واحد ومتوازن، مكوّنًا بصمة مدمجة لكن غنية للطابع البصري للعمل الفني.

Figure 1
Figure 1.

ترك التجمعات لتظهر بمفردها

بدلاً من إخبار الحاسوب أي لوحة تنتمي لأي فنان أثناء التدريب، استخدم الباحثون نهجًا غير مراقَب: طلبوا من الخوارزمية أن تجمع اللوحات المتشابهة بنفسها. أولاً، ضغطت تقنية تُدعى t-SNE بصمات الهوية عالية الأبعاد إلى بعدين حتى يمكن تصوير البنية العامة. ثم قسّم تجميع K-means اللوحات إلى مجموعات صغيرة عديدة، تم تنقيحها لاحقًا للتركيز على التجمعات الأكثر معنى. وبعد هذه العملية فقط، أضاف الفريق أسماء الفنانين، باستخدام تصويت الأغلبية البسيط داخل كل مجموعة، للتحقق من مدى توافق التجمعات مع التأليف الحقيقي. النسخة الأفضل من المنهج — المزيج المتساوي بين CLIP واللون والملمس — طابقت اللوحات مع فنانيها بنجاح حوالي 82% من الوقت، متفوّقة على نسخ اعتمدت على دلائل فردية مثل اللون فقط أو الملمس فقط.

ما رآه الحاسوب في اللون وضربات الفرشاة

لم تكن نتائج التجميع أرقامًا فحسب؛ بل أنتجت قصصًا بصرية قابلة للتعرّف. عندما رسم الفريق التجمعات، شكّل معظم الفناني نقاطًا متقاربة ومعزولة جيدًا، كل جزيرة مليئة بأعمال تمثيلية تتشارك سمات واضحة: مناظر طبيعية أحادية اللون بالحبر مع ضربات فرشاة رقيقة، تجريدات هندسية جريئة بالألوان الأساسية، أو صامتات هادئة بتراكيب ثابتة وملمس متكرر. عند الفنانين الذين يرتكز عملهم على لوحة ألوان مميزة — مثل حقول لونية زاهية أو تناغمات لونية محددة — عملت دلائل اللون البسيطة جيدًا بالفعل. بالنسبة لآخرين، مثل رسامي الحبر أو التعبويين الذين يتميزون بضربات فرشاة درامية، كانت معلومات الملمس والدلالات ضرورية. حدثت الأخطاء في التصنيف غالبًا في حالات يتردد فيها الخبراء البشر أيضًا: التشكيليون التجريديون ذوو التراكيب المماثلة، أو الفنانون الذين يشاركون خطوطًا سائبة وخيارات لونية متداخلة. في هذه الحالات، تحولت الأخطاء إلى دلائل عن قرابات بصرية أصيلة عبر أسماء مختلفة.

Figure 2
Figure 2.

من البيانات إلى فهم أعمق للفن

للغير متخصصين، الخلاصة الأساسية هي أن الحاسوب، بالنظر فقط إلى صور رقمية، يمكنه استعادة الكثير مما يعرفه مؤرخو الفن بالفعل عن من رسم ماذا — وحتى الإيحاء بعلاقات غير متوقعة. من خلال الجمع بين اللون والملمس والانطباعات الدلالية المتعلمة، يقدم الإطار طريقة قابلة للتكرار وموضوعية لتجميع ومقارنة أعمال رسامي الحداثة والمعاصرة الكوريين. إنه لا يحل محل الحكم البشري أو السياق الثقافي الغني الذي يقدمه الخبراء، لكنه يوفر خريطة كمية يمكن أن توجه العين إلى التجمعات ومناطق الحدود والأشباه البصريين الجديرين بالمراجعة الدقيقة. بهذه الطريقة، يصبح التعلم الآلي رفيقًا جديدًا للقيّمين والمشاهدين، يساعدهم على التنقل في المجموعات الكبيرة واكتشاف كيف تنسج أصوات الفن الكوري الحديث المتعددة معًا في مشهد بصري معقد لكنه قابل للتحليل.

الاستشهاد: Baek, S., Park, SJ., Park, SE. et al. Toward enhanced unsupervised clustering of 20th century Korean paintings via multimodal features. npj Herit. Sci. 14, 76 (2026). https://doi.org/10.1038/s40494-026-02304-1

الكلمات المفتاحية: الفن الكوري الحديث, الذكاء الاصطناعي, تحليل أسلوب الرسم, تجميع الصور, تاريخ الفن الرقمي