Clear Sky Science · ar

خوارزمية K-means المحسّنة لتجزئة الصور بناءً على خوارزمية سُرَيات الجعاريد المطورة

· العودة إلى الفهرس

صور أوضح بفضل خوارزميات أكثر ذكاءً

يومياً تعتمد الهواتف وأجهزة الفحص الطبية والسيارات ذاتية القيادة على الحواسيب لفصل الأجزاء المهمة من الصورة عن الخلفية. تُسمى هذه العملية تجزئة الصور، ولها تأثير واسع — من اكتشاف الأورام في الفحوصات إلى رصد المشاة في حركة المرور. تلخّص الدراسة هنا طريقة جديدة لجعل هذا الفصل أكثر دقة وموثوقية عن طريق دمج فكرتين: طريقة تجميع كلاسيكية واستراتيجية بحث مستوحاة من سلوك الجعاريد.

Figure 1
Figure 1.

لماذا تجزئة الصورة صعبة

قد يبدو في الوهلة الأولى أن تقسيم الصورة إلى مناطق تشترك في سطوع أو لون أو نسيج مشابه أمر بسيط. أداة شائعة تعرف باسم K-means تقوم بذلك بتجميع البكسلات في عناقيد. لكن لـ K-means جانب هش: نتائجها تعتمد بشدة على نقطة البداية. إن أعطيتها تخمينًا ابتدائيًا سيئًا، فقد تستقر على حل متوسط يفوت تفاصيل دقيقة أو يطمس الحواف. يصبح هذا الأمر مشكلة خاصة مع الصور المشوشة أو ذات الإضاءة المعقدة أو النسيجات الدقيقة، مثل الصور الطبية أو المشاهد الخارجية ذات الانعكاسات والظلال.

التعلّم من حياة الجعاريد

لتحسين هذا الوضع، يبني المؤلفون على طريقة نسبياً جديدة من «ذكاء السرب» مستوحاة من سلوك الجعاريد. في الطبيعة، تدحرج هذه الحشرات كرات الروث، وتخفيها، وتسرقها، وتبحث عنها، وتعدّل مساراتها مع تغير الظروف. تحاكي خوارزمية تحسين سلوك الجعاريد الأصلية هذه التصرفات للبحث عن حلول جيدة في فضاء رياضي. ومع ذلك، مثلها مثل كثير من طرق البحث، يمكن أن تعلق مبكراً أو تتقارب ببطء على مشاكل صعبة. يقترح الباحثون خوارزمية سُرَيات الجعاريد المحسّنة، أو IDBO، التي تُحسّن كيفية استكشاف هذه الجعاريد الافتراضية وتركيزها على المناطق الواعدة.

ثلاث تحسينات للبحث الأفضل

تقدم الطريقة الجديدة ثلاث ترقيات رئيسية. أولاً، تستخدم تقنية عيّنة تُسمى أخذ العينات المكعب اللاتيني لتوزيع مواقع الجعاريد الابتدائية بشكل متساوٍ عبر فضاء البحث، ما يتجنّب التكتلات والمناطق المهملة. ثانياً، استراتيجية حركة هجينة تتيح للجعاريد التبديل بسلاسة بين الاستكشاف الواسع والتكرير المركز مع تطور البحث، باستخدام قاعدة قرار متغيرة ومنافسة بسيطة حيث يضبط بعض الجعاريد مساراتهم بناءً على الآخرين. ثالثاً، خطوات تعديل محلية خاصة، تعتمد على دوال رياضية تتضمن قفزات قصيرة ونادرة طويلة، تساعد الجعاريد على تحسين المواقع الجيدة مع الحفاظ على القدرة على الفرار من الفخاخ المحلية الصغيرة. تهدف هذه الخطوات مجتمعة إلى العثور على حلول أفضل بسرعة أكبر وبثبات أعلى من التصميم الأصلي.

Figure 2
Figure 2.

الاختبار على مشاكل مرجعية وصور حقيقية

لفحص ما إذا كانت IDBO مفيدة فعلاً، اختبرها المؤلفون أولاً على مجموعة من المسائل الرياضية القياسية المستخدمة لمقارنة طرق التحسين. عبر دوال وأبعاد عديدة، عادةً ما تصل IDBO إلى إجابات أفضل بسرعة أكبر وبتباين أقل بين تجارب متعددة مقارنة بالخوارزميات المنافسة، بما في ذلك نسخ سابقة من خوارزمية الجعاريد وطرق سربية شعبية أخرى. بعد ذلك، دمجوا IDBO في خط أنابيب K-means لاستخدامها في اختيار مراكز العناقيد الابتدائية الأفضل لتجزئة الصور. على صور اختبار كلاسيكية — مثل بجعة على الماء، ومصور الكاميرا، وحبوب الأرز، وزهرة — ينتج K-means المعزَّز بـ IDBO حدوداً أنظف، ومناطق أقل عرضة لكونها مفرطة السطوع أو مغسولة، ونُسُج أكثر حفاظًا على الواقع. تؤكد مقاييس عددية للتشويه وجودة الإشارة هذه المكاسب المرئية.

ماذا يعني هذا للصور اليومية

بعبارة بسيطة، تُظهر الدراسة أن توجيه K-means باستراتيجية بحث أكثر حكمة ومستوحاة من سلوك الجعاريد يجعلها أقل عرضة للرضا بحل ضعيف لتقسيم الصورة. بدلاً من ذلك، تميل إلى إيجاد تجزئات تحافظ على الحواف والبنية حتى عندما تكون الإضاءة والنسيج معقدين. وبينما لا تزال الطريقة تتطلب قوة حوسبية وقد تحتاج لمزيد من الضبط للمهمات الكبيرة جداً أو الزمن الحقيقي، فهي تشير إلى مستقبل تتحسّن فيه رؤية الآلات للعالم بشكل غير ملحوظ بفضل استراتيجيات بحث ذكية.

الاستشهاد: Li, N., Luo, Y., Feng, Z. et al. Optimized K-means algorithm for image segmentation based on improved dung beetle algorithm. Sci Rep 16, 11187 (2026). https://doi.org/10.1038/s41598-026-38438-2

الكلمات المفتاحية: تجزئة الصور, التجميع, ذكاء السرب, خوارزميات التحسين, رؤية الحاسوب