Clear Sky Science · he

Prism-OBI: מסגרת חדשה לזיהוי כתב על עצמות-מנבא באמצעות תפיסה חזותית ופיצול תכונות

· חזרה לאינדקס

רמזים עתיקים בעצמות הסדוקות

לפני למעלה מאלף שנים ושלוש, אנשים בסין הקדומה חרטו שאלות לאלים על עצמות בעלי חיים ושריון צבים, ויצרו את הצורה העתיקה הידועה ביותר של הכתב הסיני. כיום כתבי העצמות של המנבא הם רמזים יקרי ערך להיסטוריה הקדומה — אך רובם שרדו רק כחתיכות בלויות וסדוקות שקשה מאוד לקרוא גם למומחים. מאמר זה מציג את Prism-OBI, מערכת בינה מלאכותית חדשה שנועדה לחדור דרך הנזק, להפריד מהלכים בעלי משמעות מהבלבול הגיאולוגי, ולעזור לחוקרים לפתוח את הרישומים הרגישים האלה בקנה מידה גדול.

מדוע עצמות ישנות כל כך קשות לקריאה

עצמות המנבא שרדו אלפי שנים מתחת לאדמה, נדחקו על ידי קרקע, ספגו ויבשו בעקבות שינויי מזג אוויר ונשברו במהלך חפירות. הכתיבה לעיתים קרובות חלשה, שבורה או חסרה, ומשטחי העצם מלאים בסדקים וכתמים שנראים דומים להפליא לקווי החריטה. שיטות מסורתיות הסתמכו או על מומחים שהשוו כל סימן בעיני רוחם, או על תוכנות זיהוי תווים סטנדרטיות שנבנו לטקסט מודפס מודרני ונקי. שתי הגישות מתקשות כאשר תו יחיד עלול להיות מפוצל על ידי סדק, מאוכל או מצויר בצורות מעט שונות על ידי כתבנים שונים ובתקופות שונות. כתוצאה מכך, חלק גדול מהחומר הזה נשאר לא מנוצל, נעול מאחורי הקושי הפשוט לזהות איזה תו הוא איזה.

להדריך מחשבים לראות מעבר לנזק

Prism-OBI מתמודד עם הבעיה על ידי פירוק משימת הזיהוי לשני שלבים מתואמים במדויק במקום להשתמש במודל בודד מקצה לקצה. בשלב הראשון המערכת מתמקדת רק באיפה נמצאים התווים בהעתק משטח העצם, לא במה הם משמעותם. לפני שה-AI בוחן את התמונה, תהליך ניקוי דו-שלבי מעלה את הניגודיות וסינון רעשי סורק מפוזרים, ובכך מדגיש את הקווים החרוטים. ההעתק הנוקה עובר לאחר מכן לגלאי מותאם, המבוסס על רשת זיהוי אובייקטים מהירה שעוצבה מחדש להיות "מודעת להידרדרות". היא מפרידה צורות רחבות מפרטים עדינים, מדגישה דפוסי מהלך סבירים, מפחיתה מהדגשת סדקים אקראיים ומשלבת מידע בגדלים שונים כך שתווים קטנים וגדולים יתגלו באופן מהימן. פלט השלב הוא סט של תיבות צמודות סביב כל חתיכת תו חשודה.

Figure 1
Figure 1.

מחתכים של סימנים לזיהוי תווים

בשלב השני כל חתיכת תו ממוקדת מומרת לגודל ריבועי סטנדרטי ומוזנת לרשת נוירונים עמוקה שנגזרת ממודל ראייה נפוץ. הממיין הזה מתמחה בהבחנה בין מאות סימנים שמבחינים זה בזה בדקויות על ערכת הנתונים OBC306, המכילה מעל 300,000 תווי עצמות מנבא ב-306 קטגוריות, כל אחת מקושרת לשוות-ערך מודרני בסינית. מאחר שהגלאי כבר ביצע את עבודת הניקוי והבידוד, הממיין יכול להתרכז בהבחנות עדינות בצורת המהלכים ובפריסתם — כגון ווים קטנטנים, שברים או חיבורים — במקום להיאבק ברעשי הרקע של ההעתק המקורי. מבחנים מראים שהשילוב של גלאי ממוקד עם ממיין חזק מניב דיוק זיהוי גבוה יותר ממערכות פשוטות של שלב אחד, ובכל זאת פועל במהירות מספקת לשימוש כמעט בזמן אמת.

Figure 2
Figure 2.

מה שקורה מאחורי הקלעים של הגלאי החדש

מאחורי הקלעים, גלאי Prism-OBI משתמש בכמה טריקים מותאמים כדי להתמודד עם ארטיפקטים בלויים מאוד. מודול אחד מפצל את האות החזותי לרכיבים בתדירויות נמוכות (קווי מתאר כלליים) ולרכיבים בתדירויות גבוהות (קצוות חדים) כדי שהמודל יוכל לטפל בצורות רחבות ובקצות מאמצי הקו השבריריים באופן שונה, ואז מיישם מנגנוני תשומת לב כדי להדגיש דפוסי מהלך עקביים על פני סדקים אקראיים. מודול נוסף בונה פירמידת תצפיות בקני מידה שונים ולומד עד כמה לסמוך על כל אחת מהן, משפר את הגילוי של תווים זעירים וגדולים בלי להיטרף מרעש. מודול שלישי לומד לשקלל תכונות משכבות רשת שונות במקום פשוט לערמן זו על גבי זו, ובכך מסייע לשמר אותות מידע תוך השתקת אותות לא אמינים. לבסוף, ראש הגילוי מקודד במפורש מיקום אופקי ואנכי, שהוא חיוני בפריסות צפופות שבהן תווים שכנים עלולים לטשטש זה את זה.

מה משמעות התוצאות עבור מורשת תרבותית

בערכת נתונים סטנדרטית לזיהוי כתבי עצמות, הגלאי המשופר משפר משמעותית את הדיוק, הזכירה ואיכות כללית של תיבות ההקפה בהשוואה למודל הבסיס, ומקטין הן תווים חסרים והן אזעקות שווא הנובעות מסדקים. בשילוב עם הממיין, מסגרת Prism-OBI כולה משיגה ביצועי זיהוי תווים חזקים תוך עיבוד של כ-32 תמונות לשנייה על GPU של מחשב נייד. מבחנים איכותיים מוקדמים גם מראים כי אותו גלאי, ללא אימון חוזר, יכול למקם תווים באופן משמעותי גם בכתבי עתיקים אחרים כגון כתבי ברונזה וכתב החותם, אם כי עדיין נדרש כוונון עדין לתוצאות מיטביות. עבור שאינם מומחים, המסקנה המרכזית היא ש-Prism-OBI מציע נתיב מעשי והרחיב אל אוטומציה של קריאת כתבים עתיקים פגועים קשות. על ידי הפרדה ברורה בין "איפה הכתוב?" ל"מה כתוב?", המערכת הופכת משטחים עצמות מבולגנים וסדוקים לטקסט מובנה וחיפוש־התאם, ועוזרת להיסטוריונים וארכיאולוגים לחקור את רשומות הכתיבה המוקדמות של האנושות במהירות וביסודיות משופרת לעבר מה שהיה אפשר בעבר.

ציטוט: Li, J.W., He, J.R., Wu, J.R. et al. Prism-OBI: a novel framework for oracle bone inscription recognition via visual perception and feature decoupling. npj Herit. Sci. 14, 218 (2026). https://doi.org/10.1038/s40494-026-02493-9

מילות מפתח: כתבי עצמות מנבא, זיהוי כתב עתיק, למידה עמוקה, דיגיטציה של מורשת תרבותית, ראייה ממוחשבת