Clear Sky Science · he
מחקר על זיהוי תבניות בתמונות בד בטיק מבוסס על YOLOv11 משופר
בד עתיק פוגש קוד מודרני
בד בטיק של קהילות המיאו בסין הוא יותר מקישוט: הפרפרים, הדרקונים, הציפורים והפרחים שלו מתעדים בשקט היסטוריה, אמונות וחיי יומיום בהיעדר כתב. אך כאשר טקסטילים אלה מתבלים והצוותים הצעירים נוטשים אומנויות מסורתיות, מידע תרבותי חיוני עלול ללכת לאיבוד בערמות תמונות ללא תיוג ובבדים דהויים. מחקר זה מראה כיצד תוכנת זיהוי תמונה מתקדמת יכולה לאתר ולהכיר באופן אוטומטי מוטיבים זעירים ומחוברים בתמונות בטיק מורכבות, ומציעה דרך חדשה לשמור ולחקור את אמנות החיות הזאת בקנה מידה רחב.

מדוע תבניות אלה חשובות
בטיק סיני הוא טכניקת צביעה ידנית שהצליחה להתקיים יותר משתי אלפי שנים, ובמיוחד בקרב העם המיאו במחוז גוויג’ו. מאחר שבקהילה זו היסטורית לא היה לה כתב, מוטיבים בבטיק הפכו לארכיון חזותי של מיתוסים, טקסים, אסתטיקה ומנהגים חברתיים. חוקרים החלו לדיגטל ולנתח תבניות אלה באמצעות כלים מתמטיים, עיצוב ובינה מלאכותית. עבודות קודמות יכלו לסווג מוטיבים מבודדים די טוב, אך בדרך כלל היה צריך לחתוך אותם מהבד המקורי, ובכך לנתק את הקשר בין כל סמל להרכב הכולל. הדבר הקשה על הבנת האינטראקציה בין מוטיבים בבגד או בטקסטיל ואת הדרכים בהן הם מעבירים משמעויות רב-שכבתיות.
מתוויות פשוטות לזיהוי חכם
המחברים טוענים שיש צורך לא רק בסיווג אלא בזיהוי עצמים מלא: לאתר כל מוטיב בתמונה שלמה ולתת לו שם. זו בעיה קשה בתמונות בטיק אמיתיות, שבהן העיצובים דחוסים זה לצד זה, משתנים בגודל משמעותית ולעיתים מתבלים, סדוקים או מוסתרים חלקית. מערכות זיהוי סטנדרטיות, כולל גרסאות מוקדמות של משפחת האלגוריתמים הפופולרית YOLO ("You Only Look Once"), נאבקו בתנאים אלה. הן נטו לפספס סמלים זעירים מאוד, להתבלבל מרקעים מורכבים או להיכשל כאשר התאורה ואיכות התמונה לא אחידים — בדיוק סוג התמונות שאוצרי מוזיאונים וחוקרי שדה אוספים לעתים קרובות.
להדריך רשת נוירונית לקרוא בד
כדי להתמודד עם האתגרים האלה, הצוות יצר תחילה את מה שנחשב כיום למאגר הנתונים הגדול ביותר לזיהוי בטיק סיני: 861 תמונות ברזולוציה גבוהה שסומנו עם 9933 תיבות גבול בשבע קטגוריות מוטיבים (פרפר, דג, דרקון, ציפור, תוף, פרח ופירות). הם איזנו בקפידה את גודל ואיכות התמונות, והרחיבו את הנתונים המוגבלים על ידי יישום טשטוש מבוקר, שינויי צבע, היפוכים, מוזאיקה ושאר טרנספורמציות כדי שהמודל לא יזכור פשוט את דגמי האימון. על בסיס מאגר זה בנו גרסה משופרת של YOLOv11, מסגרת זיהוי עצמים עכשווית שנבחרה בשל מהירותה וגודלה הקומפקטי — תכונות חשובות אם הכלי אמור לפעול על מחשבים שגרתיים במוזיאונים ומרכזים תרבותיים.
להסתכל רחוק ולראות ברור יותר
המודל המשופר מוסיף שתי רעיונות מרכזיים. ראשית, רכיב בהשראת מנגנון ה-VOLO "vision outlooker" מאפשר לרשת להביט בחלקים מרוחקים בתמונה בבת אחת, במקום להסתכל רק על שכונות מקומיות קטנות. זה עוזר לה לזהות ששתי צורות זעירות המרחוק עלולות להשתייך לאותו דפוס משמעותי, ושהתפקיד של מוטיב תלוי בשכניו. שנית, הצוות עיבד מחדש את אופן עיבוד תכונות התמונה בעזרת מבנה הנקרא Fused-MBConv. עיצוב מחודש זה שומר על חישובים יעילים תוך חידוד יכולת המודל להפריד פרטים עדינים מבדים רעשיים ומזדקנים. בבדיקות ובמחקרי אבולציה קפדניים, העיצוב הסופי שלהם השיג דיוק זיהוי ממוצע גבוה יותר מאשר ה-YOLOv11 הבסיסי ומכמה גלאים קלים אחרים, ועדיין עבד במהירות מספקת לשימוש בזמן אמת או כמעט-זמן אמת.

מתגיות אוטומטיות לסיפורים תרבותיים
מעבר לציוני זיהוי גולמיים, החוקרים קישרו את המודל שלהם לגרף ידע על בטיק שמחבר כל סוג מוטיב לסיפורים על מוצאו, המשמעויות הסמליות ודוגמאות קשורות. במערכת תוכנה אב-טיפוסית, משתמש יכול להעלות תמונה של בד, לראות את המוטיבים שנתגלו מסומנים, ולאחר מכן לנווט כדי לחקור את הרקע התרבותי שלהם. לאנשי ארכיון, הדבר משמעותו קטלוג מהיר ואחיד יותר של אוספים גדולים. למחנכים ומבקרים, זה הופך זיהוי תבניות לנקודת כניסה ללימוד על אמונות המיאו, טקסיהם ואסתטיקה שלהם. אף על פי שהמערכת הנוכחית מאומנת רק על בטיק סיני, המחברים רואים בה תבנית לכלים בין-תרבותיים שעשויים יום אחד לסייע בשמירה על מסורות הטקסטיל מאינדונזיה ועד הודו, ולהבטיח שהתכנונים על הבד ימשיכו לדבר, גם כשהבד עצמו מתבלה ודוהה.
ציטוט: Li, Y., Quan, H., Li, Q. et al. Research on batik image pattern detection based on improved YOLOv11. npj Herit. Sci. 14, 143 (2026). https://doi.org/10.1038/s40494-026-02404-y
מילות מפתח: זיהוי תבניות בטיק, מַורֶשֶׁת תרבותית בלתי מוחשית, ראייה ממוחשבת, זיהוי עצמים YOLO, אמנות טקסטיל מיאו