Clear Sky Science · ar

تكنولوجيا توليد الصور بالتعلّم العميق لتعزيز مظهر الأعمال الفنية المعتمدة على الذكاء الاصطناعي

· العودة إلى الفهرس

لماذا يهم تطوّر الفن بالذكاء الاصطناعي

الأدوات الرقمية التي تحوّل الكلمات إلى صور تغيّر طريقة ابتكارنا للصور، والملصقات، والألعاب، وحتى الأعمال المعروضة في المعارض. ومع ذلك من جربها يعلم حدودها: فقد تغفل عن المزاج العام لعمل مرجعي، تضيّع تفرّد ضربات الفرشاة، أو تصبح التفاصيل ضبابية عند تكبير الصورة. تقدّم هذه الدراسة إطاراً جديداً للذكاء الاصطناعي اسمه StyleDiffusion-HD، صُمّم لمنح الفنانين والمصممين تحكّماً أدق في المظهر والهبّة مع إنتاج صور كبيرة وواضحة وصالحة للاستخدام المهني.

من الفكرة والأسلوب إلى الصورة المكتملة

في الفن البشري هناك عادةً فكرة ومرجع بصري: ماذا نرسم وكيف نرسمه. ينسخ StyleDiffusion-HD هذه العملية بأخذ مدخلين في آن واحد: وصف نصي يوضح المشهد، وصورة مرجعية تحدد الأسلوب الفني. يترجم نموذج بصري-لغوي أولاً كلّاً من الكلمات والعمل المثال إلى فضاء مشترك ومجرّد حيث يمكن مقارنة معانيهما ودمجهما. هذا «المخطط» المدموج يوجّه عملية إنشاء الصورة بأكملها بحيث يُعامل المحتوى والأسلوب كشريكين بدلاً من كونهما متنافسين.

Figure 1. كيف يمكن لدمج الكلمات وصورة مرجعية أن ينتج لوحة واحدة عالية الجودة مولدة بالذكاء الاصطناعي
Figure 1. كيف يمكن لدمج الكلمات وصورة مرجعية أن ينتج لوحة واحدة عالية الجودة مولدة بالذكاء الاصطناعي

توجيه كل ضربة فرشاة في الصورة

جوهر النظام هو نموذج انتشار، وهو نوع من الشبكات العميقة الذي يحول الضوضاء العشوائية تدريجياً إلى صورة متماسكة. أضاف المؤلفون وحدة جديدة تسمى انتباه حقن الأسلوب (Style Injection Attention) التي تغذي المخطط المدموج للنص والأسلوب عبر عدة طبقات من هذه الشبكة. في المراحل المبكرة، يميل النظام أكثر إلى النص لتثبيت التخطيط العام للمشهد. في المراحل اللاحقة، يتبع العمل المرجعي بشكل متزايد، مشكلاً الألوان والقوام ونمط ضربات الفرشاة. وبما أن هذا التوجيه يُطبّق على أعماق متعددة في الشبكة، تميل الصورة النهائية إلى الاتساق من التركيب الكلي وصولاً إلى التفاصيل الدقيقة.

شحذ الصور دون فقدان الطابع

تنتج معظم أدوات الفن بالذكاء الاصطناعي صوراً متوسطة الحجم تبدو جيدة على الهاتف لكنها تنهار عند الطباعة بالحجم الكبير. لمعالجة ذلك، أضاف الفريق وحدة ثانية تكبّر الصورة أربع مرات في كل اتجاه، من 512×512 إلى 2048×2048 بكسل. بدلاً من طرق إزالة الضوضاء التقليدية خطوة بخطوة، يستخدمون منهجاً معتمداً على التدفق يتعلم «مساراً» مباشراً من الصور منخفضة الدقة إلى عالية الدقة. تعزّز هذه العملية ذات الخطوة الحواف والقوام بحدة مع الحفاظ على الأسلوب الموروث من نموذج الانتشار، متجنّبة المظهر الصناعي أو المرقّع المشاهد في العديد من أدوات التكبير.

Figure 2. كيف يشكل الذكاء الاصطناعي أولاً صورة تقريبية بالنص والأسلوب ثم يشحذها إلى عمل فني مفصّل وعالي الدقة
Figure 2. كيف يشكل الذكاء الاصطناعي أولاً صورة تقريبية بالنص والأسلوب ثم يشحذها إلى عمل فني مفصّل وعالي الدقة

اختبار النموذج

لا يعتمد الباحثون على الأمثلة البصرية وحدها. يقارنون StyleDiffusion-HD بأنظمة مستخدمة على نطاق واسع، بما في ذلك Stable Diffusion وأدوات تجارية، باستخدام ثلاث مقاييس رئيسية: مدى طبيعية الصور، ومدى تطابقها مع النص المدخل، ومدى تقيدها بأسلوب العمل المرجعي. عبر مجموعات اختبار واسعة تغطي عشرات الحركات الفنية، ينتج الإطار الجديد صوراً أقرب إلى الأعمال الحقيقية، ومتطابقة أفضل مع الموجزات، وأكثر ولاءً للأسلوب من البدائل. تؤكد اختبارات مجهولة مع فنانين محترفين وقيّمين وزوّار عاديين هذه النتائج، مانحةً النظام الجديد أعلى الدرجات في اتساق الأسلوب وجودة التفاصيل والجاذبية العامة.

ماذا يعني هذا للمبدعين

بالنسبة لغير المتخصصين، الخلاصة أن أدوات الصور بالذكاء الاصطناعي تتجاوز الألعاب الذكية لتصبح شركاء إبداعيين أكثر موثوقية. يبيّن StyleDiffusion-HD أنه من الممكن الجمع بين تحكم واضح في المحتوى والأسلوب ودقة جاهزة للطباعة، مما يجعل مخرجات الذكاء الاصطناعي أكثر استعمالاً في التوضيح، والمعارض، والعمل التصميمي. ومع أن النموذج لا يزال يواجه صعوبة مع الأساليب المجردة جداً أو المختلطة بكثافة ويحتاج تكلفة تدريب عالية، إلا أنه يحدد مساراً عملياً نحو أنظمة ذكاء اصطناعي تحترم فكرة الفنان ولغته البصرية المختارة، بدلاً من التضحية بأحدهما لصالح الآخر.

الاستشهاد: Gao, Y., Zhang, L. & Kim, J. Deep learning image generation technology for enhancing the presentation effect of image art based on artificial intelligence. Sci Rep 16, 14982 (2026). https://doi.org/10.1038/s41598-026-45739-z

الكلمات المفتاحية: توليد الفن بالذكاء الاصطناعي, التحكم في أسلوب الصورة, نماذج الانتشار, زيادة الدقة, الرسوم التوضيحية الرقمية