Clear Sky Science · he

זיהוי כותב לכלי חרס משוררים של תנח׳ (שושלת טאנג) באמצעות מודל תשומת לב גלובלית רב-קני-שבילי

· חזרה לאינדקס

שירים על חימר, סיפורים של אנשים

על פני כלי פורצלן קטנים וכריות מתקופת שושלת טאנג נמשכו לפני יותר מאלף שנה שורות שירה אלגנטיות על זיגוג רטוב. היצירות הקצרות האלה מוערכות היום לא רק על יופיין, אלא גם על מה שהן עשויות לגלות לגבי האנשים שכתבו אותן. עד כה, קישור כתובת מסוימת לכותב מסוים התבסס על העין המאומנת של מספר מומחים. מחקר זה מראה כיצד בינה מלאכותית מודרנית יכולה לעזור ‘‘לקרוא’’ את היד האנושית מאחורי הממצאים השדופים האלה, ולפתוח חלון חדש לחיי היומיום, לעבודה ולמסחר בסין של ימי הביניים המוקדמים.

Figure 1
Figure 1.

מדוע הכלים האלה חשובים

מכבש צאנגשה, שפעל בתקופת השגשוג של שושלת טאנג, ייצר כלי חרס צבעוניים מקושטים בציור, בקוליגרפיה ובשירה. חפצים אלה נסעו באופן נרחב לאורך דרכי המסחר הקדומות והפכו נשאים של ספרות וטעם, וגם לכלים שימושיים. הכתובות עליהן שומרות לא רק טקסט אלא גם את האנרגיה של משיכות המכחול ואת הבחירות של כותבים פרטיים. עם זאת, רוב הפריטים ששרדו מפוזרים במוזיאונים ובאוספים פרטיים, ותמונות באיכות גבוהה נדירות. לא התקיים מאגר תמונות ציבורי ומתקן של הכתובות הללו, מה שהקשה על חוקרים להשוות פריטים, לבחון שיטות דיגיטליות או לשאול שאלות בסיסיות כגון: האם חרסן-כּותב אחד כתב את השירים על מספר כלי חרס שונים?

בניית ספרייה דיגיטלית של כתב טאנג

כדי להתמודד עם הבעיה, המחברים הרכיבו תחילה אוסף תמונות חדש מתוך קטלוגים פורסמים של כלי צאנגשה. מ-135 חפצים בודדים — בעיקר כדים, צלחות וכריות שעליהם שירה או הערות קצרות — חילצו בקפדנות 1,865 תמונות של תווים בודדים. מאחר שהכתובות נמצאות על משטחים קמורים של כלי חרס, תווים ליד הקצוות נראים מעוותים בתמונות. הצוות השתמש בתהליך ייעודי של חיתוך תמונה והשטחת משטח כדי לתקן את העיקום, לאחר מכן ניקה לכלוך וסדקים, המיר תמונות לגווני אפור, שינה גודל, צמצם רעש ולחץ מעט חלק מהתמונות כדי להגדיל את המגוון. התוצאה היא מאגר הנתונים המסור הראשון של כתב שירי ממכבש צאנגשה, משאב שיכול לתמוך בזיהוי כתב, בניתוח סגנון ובמחקרים רבים אחרים בעתיד.

להקנות לרשת עצבית ראייה של סגנון

עם אותו מאגר נתונים, החוקרים תכננו מערכת ראייה ממוחשבת שתפקידה להחליט האם שתי תמונות של תווים נכתבו ככל הנראה על ידי אותו אדם. המודל מקבל זוג תווים דרך שני ערוצי מקביל שמשתפים את אותו תהליך עיבוד. לאחר סינון בסיסי, שתי התמונות עוברות רשת עצבית עמוקה (ResNet-34) שיוצרת דפוסים בעובי המשיכות, בעקמומיות, במרווחים ובתכונות עדינות אחרות. בליבו של המערכת נמצת מודול תשומת לב גלובלית רב-קני חדש. במקום להסתכל רק על רמת פירוט אחת קבועה, מודול זה בוחן את התווים בכמה קני מידה במקביל — ממבנה גס ועד לתזוזות קו עדינות — ולומד כיצד חלקים מרוחקים של משיכה קשורים זה לזה. על ידי שילוב תצפיות אלה, המודל בונה "טביעת אצבע" פנימית עשירה של סגנון כל כותב ואז משווה בין שתי טביעות האצבע כדי להפיק ציון דמיון בין 0 ל-1.

Figure 2
Figure 2.

בדיקת המערכת

הצוות השווה מספר רשתות גב (backbone) מנודעות ומנגנוני תשומת לב פופולריים וגילה שהרשת הדו-מסלולית שלהם עם מודול התשומת לב החדש ביצעה בצורה הטובה ביותר. היא הגיעה לדיוק זיהוי של כ-97.9%, תוך עליונות ברורה על דגמי תשומת לב ישנים בעלי קני מידה יחידיים. כדי לראות מה האלגוריתם למד, המחברים ייצרו מפות חום שמראות היכן הרשת "מביטה" ביתר שאת. אלו מדגישות פניות משיכות, משיכות משופעות שמאלה ואזורים נוספים שבהם לחץ ומקצב המכחול משתנים מאדם לאדם — בדומה למה שמומחה אנושי היה בוחן. החוקרים ערכו אז בדיקות בקבוצות גדולות בתוך חפצים בודדים ובין חפצים שונים. בתוך כלי אחד, המערכת שפטה בעקביות שכל התווים דומים מאוד זה לזה, ותמך ברעיון שכל שיר על כלי נכתב בידי כותב יחיד במקום בכמה כותבים.

רמזים חדשים על אומנים קדמונים

התוצאה המפתיעה ביותר הופיעה כאשר המודל השווה פריטים מאוספים שונים. שתי כריות קרמיקה עם שירי אהבה בני שבעה תווים הראו דמיון סגנוני גבוה מאוד, אף על פי שהן מאוחסנות כיום במוסדות נפרדים. רשומות ארכאולוגיות מציבות את שתי הכריות באותו אתר כבשן, וצורותיהן, מוטיבי הקישוט והנושאים תואמים זה את זה בקירוב. פסק דינו של האלגוריתם — הסתברות של 85.8% שהאותה יד כתבה את שתי הכתובות — מגבה את המסקנה שהן נוצרו בידי כותב יחיד. לעומת זאת, שלושה כדים דומים למי היין שנושאים פסוקים זהים אודות חרטה הראו ציוני דמיון נמוכים, מה שמרמז על שלושה קליגרפים שונים שהעתיקו נוסח טקסטואלי משותף. יחד, ממצאים אלה מראים כיצד "עין" של בינה מלאכותית יכולה לסייע להיסטוריונים לעקוב אחר ארגון הסדנה, חלוקת העבודה ונהגי המסחר.

מה זה אומר על העבר והעתיד

על ידי שילוב הדמיה דיגיטלית קפדנית עם רשת עצבית מתוחכמת, מחקר זה הופך עקבות דיו שבריריות על חרס לראיות כמותיות לגבי מי כתב מה. עבור הקורא הכללי, המסקנה המרכזית היא שמחשוב ראייה מסוגל כיום להבחין בידיים פרטניות בכתב עתיק כמעט באמינות של מומחה אנושי, אך מהר בהרבה ועל פני כמות עצומה יותר של פריטים. כך ניתן לקשר פריטים מפוזרים ברחבי העולם, למפות את הקריירות של אומנים שנשכחו זמן רב ולהבין טוב יותר כיצד ייצור המוני וביטוי אישי התקיימו יחד בתקופת טאנג. אף שהשיטה אינה מושלמת ותלויה בנתונים מוגבלים ולעתים פגומים, היא מציעה כלי חדש עוצמתי למוזיאונים ולחוקרים — ודגם ליישום בינה מלאכותית על סוגים רבים אחרים של כתב היסטורי.

ציטוט: Jiang, C., Li, M., Guo, Y. et al. Scribe identification for Tang Dynasty Changsha Kiln poetic ceramics via dual-path multi-scale global attention model. npj Herit. Sci. 14, 146 (2026). https://doi.org/10.1038/s40494-025-02152-5

מילות מפתח: כתב עתיק, כלי חרס של שושלת טאנג, זיהוי כותב, למידה עמוקה, מורשת דיגיטלית