Clear Sky Science · he

שחזור תווים על גלילי לייה של שושלת צ'ין בעזרת רשת יריבות מייצרת עם אילוץ רכיב מחובר יעיל

· חזרה לאינדקס

מילים עתיקות שהוחזרו לחיים

הרבה לפני המצאת הנייר, פקידי סין כתבו על רצועות דקות של במבוק ועץ. אלפי רישומים שבירים אלה, הידועים כגלילי לייה מתקופת צ'ין, נחפרו מבור נטוש לאחר שעמדו יותר משני אלפים שנה מתחת לאדמה. הם שומרים על פקודות יומיומיות, חשבונות ודוחות מהממלכה הסינית המאוחדת הראשונה. עם זאת, מים, בוץ ומיקרובים השחיתו את הדיו ורבים מהסימנים מטושטשים או חסרים, מה שהופך את קריאת הגלילים בעין אנושית לתהליך איטי ומייסר. המחקר הזה מראה כיצד מערכת בינה מלאכותית מודרנית יכולה באופן דיגיטלי "לנקות" את התווים הפגומים ולעזור להיסטוריונים לשחזר קולות מהעבר הרחוק.

מדוע הרשומות הקבורות הללו חשובות

גלילי לייה אינם צווי מלוכה או כיתובים מפוארים; הם ניירת של ממשל שפועל. יותר מ‑30,000 רצועות מתעדות מיסים, עבודה ומינהל שגרתי במחוז בקצה אימפריית צ'ין. בשונה מגלילים דומים שנמצאו בקברים יבשים, חלקי לייה נטלו בשרידי משקעים רטובים בתחתית באר. רבים מעוקמים, סדוקים ומוכתמים; משיכות המברשת מטושטשות או אוכלו. פענוח אצווה אחת עשוי לקחת מומחים שנים, ומספר הממצאים הגדל חרג ממה שעיניים אנושיות בלבד יכולות לעמוד בו. אוטומציה של חלק מתהליך השחזור יכולה לזרז מאד את המחקר תוך שמירה על הצורות העדינות שהופכות כל תו לקריא.

Figure 1
Figure 1.

ללמד מחשב לראות דרך הנזקים

המחברים מתייחסים לשחזור כסוג של תרגום תמונה: המחשב מקבל תמונה קטנה ורועשת של תו ומתבקש לייצר כיצד היה נראה תו זה אם היה נקי וחודד. לשם כך הם בונים על סוג של בינה מלאכותית שנקרא רשת יריבות מייצרת, או GAN. רשת אחת ("הגנרטור") מנסה להפוך תמונה פגומה לברורה, בעוד אחרת ("הדיסקרימינטור") שופטת האם התוצאה נראית כתו אמיתי וכתוב היטב. דרך המאבק ההדדי הזה לומד הגנרטור בהדרגה לייצר שחזורים משכנעים יותר שמטיעים את המבקר.

תשומת לב חדה יותר למברשות זעירות

כלי תמונה סטנדרטיים לעתים מפספסים את הפרטים העדינים ביותר של דיו על במבוק, במיוחד כשהרקע כתום או כשהדיו דהוי. הצוות משפר את הלב של ה‑GAN באמצעות עיצוב בצורת U הידוע כ‑U‑Net, שמאזן בין הקשר רחב לבין פרטים ברמת הפיקסל. הם מחליפים את אבני הבניין הנפוצות ברשת זו בבלוקים צפופים שרידואליים מקומיים שתוכננו במיוחד. בלוקים אלה מעודדים את המערכת להשתמש מחדש בתבניות מועילות תוך הימנעות מהחלקה-יתר שעלולה לגרום למשיכות סמוכות לטשטש האחת את השנייה. קטע "הבקבוקון" החזק יותר במרכז הרשת מחדד עוד יותר את התכונות החשובות ביותר ועוזר למודל להבחין בין משיכות אמת לרעש גם כאשר המקור דהוי קשות.

שמירה על שלד כל תו שלם

חידוש מרכזי הוא מה שהמחברים קוראים לו אילוץ תחום מחובר יעיל. במקום לשפוט כל פיקסל לחוד, כלל זה מסתכל על אזורי הדיו המרכזיים בתו: כמה הם גדולים והיכן נמצאים מרכזיהם. המודל משווה את "האיים" הגסים של הדיו ביציאת המודל לאלה בתמונות ייחוס ששוחזרו בקפידה, ומתמקד במיוחד בכמה האיים הגדולים שיוצרים את שלד התו. אם משיכה מרכזית חסרה, התמזגה עם אחרת או הוזזה ממקומה, המערכת מתוגמלת ומחויבת להתאים את פלטיה. בדיקה גיאומטרית פשוטה זו מוכיחה יציבות יוצאת דופן גם כאשר המשיכות שבורות, הקצוות מחוספסים או שהדיו נשזף לרקע.

Figure 2
Figure 2.

עד כמה התיקונים הדיגיטליים עובדים

מכיוון שלא היה נתון מתאים קיים, הצוות יצר מאגר זוגי משלו של 600 תמונות תווים מגלילי לייה, כל אחת מותאמת לשחזור מומחה ומדויק. על מדד זה שיטה שלהם עולה על כמה גישות מתקדמות אחרות, כולל GANs נוספים, מודל מבוסס Transformer ומודל דיפוזיה, על פי שלושה מדדי איכות תמונה סטנדרטיים. השוואות חזותיות צד-אל-צד מראות פחות משיכות שבורות, הפרדה נקייה יותר בין קווי מברשת קרובים ופחות רעש רקע. מדריכי קליגרפיה שבחנו את התוצאות במבחן עיוור נתנו ציונים גבוהים עבור רציפות משיכות, דיוק מבני וקריאות כללית, ומבחנים נפרדים מצביעים על כך שהמודל אינו רק שוריין את נתוני האימון.

להחזיר את הכתיבה הקבורה לפוקוס

לא-מומחים יכולים להבין את המסר: על ידי שילוב ידע מומחה בכתב עתיק עם עיצובים מותאמים של בינה מלאכותית, כעת ניתן לשחזר כתיבה קריאה מגלילי במבוק שנראו פעם פגומים מאוד. המודל לא רק שומר על קיומו של התו, אלא גם על המרחב היחסי בין משיכותיו, מה שהופך את הפלט למשמעותי עבור היסטוריונים וחוקרי שפה. על אף שהגישה עדיין תלויה בנתוני אימון מוגבלים ועדיין לא הותאמה לחומרים אחרים כמו משי או אבן, היא מצביעה על עתיד שבו טקסטים רבים ושבריריים וקשים לקריאה יוכלו להיות משוחזרים דיגיטלית ונחקרים בקנה מידה רחב, ויפתחו חלונות חדשים על חיי היומיום באימפריות המוקדמות.

ציטוט: Li, X., Huang, Y., She, S. et al. Restoration of Liye Qin slips characters using generative adversarial network with effective connected component constraint. npj Herit. Sci. 14, 194 (2026). https://doi.org/10.1038/s40494-026-02434-6

מילות מפתח: שחזור גלילי במבוק, כתבים סיניים עתיקים, רשתות יריבות מייצרות, שימור מורשת דיגיטלי, שחזור תווים בכתב יד