Clear Sky Science · he

אלגוריתם K‑means משופר לחלוקת תמונות מבוסס על אלגוריתם חיפוש משופר בהשראת חגבוני הקצים

· חזרה לאינדקס

תמונות חדות יותר מתוך אלגוריתמים חכמים יותר

יום־יום טלפונים, סורקים רפואיים ורכבים אוטונומיים מסתמכים על מחשבים כדי להפריד חלקים חשובים בתמונה מהרקע. תהליך זה, הנקרא פילוח תמונה, משפיע על כל דבר החל בזיהוי גידולים בסריקות ועד לזיהוי הולכי רגל בתנועה. המחקר שמסוכם כאן מציג דרך חדשה להגדיל את הדיוק והאמינות של ההפרדה הזו על ידי שילוב של שתי רעיונות: שיטת אשכולות קלאסית ואסטרטגיית חיפוש בהשראת חגבוני הקוצים.

Figure 1
Figure 1.

למה פירוק תמונה קשה

מבט ראשון על פריסת תמונה לאזורים בעלי בהירות, צבע או מרקם דומים עשוי להיראות פשוט. כלי נפוץ, המוכר כ‑K‑means, עושה זאת על ידי קיבוץ פיקסלים לאשכולות. אבל ל‑K‑means יש צד שחור: התוצאות שלו תלויות מאוד בנקודת ההתחלה. אם נותנים לו ניחוש התחלתי גרוע, הוא עלול להיצמד לפתרון בינוני, לפספס פרטים עדינים או לטשטש קצוות. זה בעייתי במיוחד לתמונות עם רעש, תאורה מורכבת או מרקמים עדינים — לדוגמה תמונות רפואיות או סצנות חיצוניות עם השתקפויות וצללים.

ללמוד מחיי חגבוני הקוצים

כדי לשפר את המצב, המחברים בונים על שיטת "בינה עדרית" יחסית חדשה המושפעת מהתנהגות חגבוני הקוצים. בטבע החרקים האלה מגלגלים, מסתירים, גונבים ומחפשים כדורי זבל, ומתאימים את דרכיהם כשהתנאים משתנים. אלגוריתם האופטימיזציה המקורי בהשראת חגבוני הקוצים מדמה התנהגויות אלה כדי לחפש פתרונות טובים בנוף מתמטי. עם זאת, כמו שיטות חיפוש רבות, הוא עלול להיתקע מוקדם מדי או להתכנס באיטיות בבעיות קשות. החוקרים מציעים אלגוריתם משופר — IDBO — שמחדד את האופן שבו החגבונים הווירטואליים חוקרים ומתמקדים באזורים מבטיחים.

שלושה שדרוגים לחיפוש טוב יותר

השיטה החדשה מציגה שלושה שדרוגים מרכזיים. ראשית, היא משתמשת בטכניקת דגימה הנקראת Latin hypercube sampling כדי לפזר את מיקומי החגבונים ההתחלתיים באופן אחיד על פני מרחב החיפוש, ולהימנע מצברים ואזורים שאינם נשקלים. שנית, אסטרטגיית תנועה היברידית מאפשרת לחגבונים לעבור בצורה חלקה בין חיפוש רחב להתמקדות מדויקת ככל שהחיפוש מתקדם, באמצעות כלל החלטה שמשתנה ומתחרה פשוטה שבה חלק מהחגבונים מתאימים את דרכם על פי אחרים. שלישית, צעדי כוונון מקומיים מיוחדים, המבוססים על פונקציות מתמטיות הכוללות קפיצות קצרות ולעיתים ארוכות, מסייעים לחגבונים לחדד את המיקומים הטובים ביותר ועדיין להימלט מלכודות מקומיות קטנות. יחד, שלבים אלה שואפים למצוא פתרונות טובים יותר מהר יותר ובעקביות רבה יותר לעומת העיצוב המקורי.

Figure 2
Figure 2.

בדיקות על מבחנים ותמונות אמיתיות

כדי לבדוק האם ה‑IDBO אכן מסייע, המחברים מממשים אותו קודם על אוסף בעיות מתמטיות סטנדרטיות המשמשות להשוואת שיטות אופטימיזציה. על פני פונקציות וממדים רבים, ה‑IDBO בדרך כלל מגיע לתשובות טובות יותר מהר יותר ובפחות שונות מריצת ריצה לעומת אלגוריתמים מתחרים, כולל גרסאות קודמות של חגבוני הקוצים ושיטות עדר פופולריות אחרות. בהמשך הם משלבו את ה‑IDBO בשרשרת K‑means, כשהוא משמש לבחירת מרכזי האשכול ההתחלתיים. על תמונות מבחן קלאסיות — כגון ברבור על מים, צלם, גרגרי אורז ופרח — ה‑K‑means המשודרג ב‑IDBO מייצר גבולות נקיים יותר, פחות אזורים בהירים מדי או שטופים ויותר שימור מרקם. מדידות מספריות של עיוות ואיכות אות מאשרות את השיפורים הוויזואליים האלה.

מה משמעות הדבר לתמונות יום‑יום

פשטנית, המחקר מראה כי הנחיית ה‑K‑means באמצעות חיפוש מושכל יותר, בהשראת חגבוני הקוצים, מקטינה משמעותית את הסיכוי שיזדקק לפתרון חלש של פירוק התמונה. במקום זאת, הוא נוטה למצוא פילוחים השומרים על קצוות ומבנה, גם כאשר התאורה והמרקמים מורכבים. בעוד שהשיטה עדיין דורשת כוח חישובי وقد עשויה להזדקק לכוונון נוסף למשימות גדולות או בזמן אמת, היא מצביעה על עתיד בו אסטרטגיות חיפוש חכמות ישפרו בשקט את האופן שבו מכונות רואות את העולם ברקע.

ציטוט: Li, N., Luo, Y., Feng, Z. et al. Optimized K-means algorithm for image segmentation based on improved dung beetle algorithm. Sci Rep 16, 11187 (2026). https://doi.org/10.1038/s41598-026-38438-2

מילות מפתח: פילוח תמונה, איחוד אשכולות, בינה עדרית, אלגוריתמי אופטימיזציה, ראייה ממוחשבת