Clear Sky Science · he

מודל דיפוזיה עם הזרקת ריבוי-פריירים ותשומת לב ממוקדת לשיקום תמונות של סלעי חואשאן

· חזרה לאינדקס

להחזיר לחיים ציורי מצוקים עתיקים

אמנות הסלע צ'ואוג'יאנג חואשאן בדרום סין מהווה גלריה ענקית על עברי מצוק בצבעי עפרה, שנצבעה לפני למעלה מאלפיים שנים. כיום רבות מהדמויות והסמלים האוכראיים דהויים, סדוקים או חסרים לגמרי. המאמר מציג שיטה דיגיטלית המשתמשת בטכניקות מתקדמות לייצור תמונה כדי לתקן את היצירות העדינות הללו באופן וירטואלי, במטרה לתמוך בשימור זהיר, במחקר ובהנגשה ציבורית מבלי לגעת בסלע עצמו.

Figure 1
Figure 1.

למה ציורי המצוקים האלה חשובים

אמנות הסלע של חואשאן משתרעת לאורך מצוקים תלולים של נהר ומתארת דמויות אדם בישיבה, סצינות פולחניות וצורות סמליות אחרות בגוונים עזים של אדום. זהו אחד ממתחמי אמנות הסלע הגדולים והעשירים בדרום סין ובדרום-מזרח אסיה, וחלק מרכזי מהמורשת התרבותית של זואנג. צבעי הפיגמנטים, המיוצרים ממינרלים עתירי ברזל, רגישים מאוד לגשם, רוח, צמיחה ביולוגית ומגע אנושי. לאורך המאות זה הוביל לדהיית צבעים, קווי מתאר שבורים, התקלפות וטקסטורות מזוהמות וממוחשבות שיכולות להקשות על ההבחנה בין הניקוד המצויר לבין הפאה המוצפת של הסלע. שיקום ידני מסורתי איטי, סובייקטיבי וקשה לשכפול, מה שהופך את ההגנה על אתר גדול ושביר כזה לאתגר בקנה מידה.

כיצד שיקום אינטליגנטי יכול לסייע

שיקום תמונה דיגיטלי מציע דרך "למלא את הפערים" באופן וירטואלי, בהתאם לעיקרון השימור של התערבות מינימלית. במקום לצבוע מחדש את המצוק, מחשבים מסיקים צורות וטקסטורות סבירות באזורים חסרים, ומפיקים תוצאות עקיבות והפיכות שניתן לארכיון ברזולוציה גבוהה, להשתמש בהן למחקר ולשתף אותן לציבור בתערוכות ובחוויות סוחפות. עבודות קודמות בתחום הבינה המלאכותית בחקר מורשת התרבות התמקדו בעיקר בזיהוי נזק או בסגמנטציה של מוטיבים, או בשיקום ציורי קיר שבהם הצורות והטקסטורות סדירות יותר. אמנות סלע מציבה אתגר קשה יותר: משמעותה טמונה בקווי מתאר עדינים ובפוזות סמליות, בעוד שהמשטחים שלה מעוותים ושחוקים באופן חזק. שיטת שיקום חייבת לכבד את הצורות המקוריות ובכל זאת להשלים טקסטורות גסות ושבורות באופן אמין אך לא מוגזם בהמצאה.

מסד נתונים חדש לפני משטחים סלע מזדקרים

המחברים בונים תחילה מסד תמונות ייעודי לשיקום אמנות הסלע של חואשאן. הם אוספים 528 תמונות מועמדות מתוך אטלסים מודפסים ומקורות מקוונים ציבוריים, ומסננים בקפידה כדי לשמור 177 שמציגות בבירור מוטיבים של אמנות סלע יחד עם ירידה ברורה באיכות כגון דהייה, התקלפות וגבולות מטושטשים. כל התמונות הנבחרות מומרות לפורמט צבע משותף ומותאמות לגודל של 512×512 פיקסלים, כאשר אזור הציור המרכזי ממורכז. כדי לאמן ולבחון שיטות שיקום באופן מבוקר הם מייצרים לשלוש עבור כל דוגמה: (1) תמונת ייחוס נקייה, (2) תמונת קלט שבה 30–65% מהאזורים מוסתרים בכתמים שחורים כדי לחקות נזק, ו-(3) מסכה המציינת את האזורים החסרים. סידור זה מאפשר הערכה אובייקטיבית ברמת פיקסל של עד כמה השיטות השונות מצליחות לשחזר את היצירה הבסיסית.

Figure 2
Figure 2.

ללמד את המודל לכבד צורה ומשטח

ליבת המאמר היא מסגרת שיקום המבוססת על מודלי דיפוזיה, קבוצה חדשה של שיטות גנרטיביות שהופכות בהדרגה רעש לתמונה דרך שלבי ניקוי רבים וקטנים. במקום לטפל בכל הרמזים הוויזואליים כבחבילה אחת, המחברים מפרידים את ההנחיה לשני "פריירים" נפרדים: אחד שמדגיש מבנה (קצוות וקונטורים בדומה למקשים), ואחד שמדגיש טקסטורה (גרעין דק וגסות משטח). פריירים אלה מחושבים מהחלקים שעדיין נראים בתמונה הפגועה באמצעות פילטרים דטרמיניסטיים ואז מקודדים למפות תכונה. מודול מיזוג תשומת לב ממוקדת (gated attention fusion) מחליט, בכל שלב ניקוי, עד כמה להסתמך על הנחיה מבנית לעומת הנחיה טקסטורלית וכמה להזריק אותן לתהליך הדיפוזיה. בשלב מוקדם המערכת נוטה יותר לקווי המתאר היציבים; בהמשך, ככל שהרעש מצטמצם, היא מקדישה תשומת לב רבה יותר לשחזור פרטי טקסטורה התואמים את משטח הסלע הסובב.

כמה טוב המבצע הדיגיטלי שוחזר

הצוות מאמן ובוחן את השיטה שלהם על מסד חואשאן ומשווה אותה למגוון רחב של דגמי שיקום תמונה קיימים, מרשתות מקודד-מפענח קלאסיות ועד גישות גנרטיביות ומודלים מרחב-מצב מתקדמים. באמצעות מדדי שגיאה, חדות ודמיון מבני סטנדרטיים, המודל שלהם משיג שגיאות פיקסל נמוכות יותר והסכמה מבנית גבוהה יותר מכל קווי הבסיס במבחן אמנות הסלע. לימודי אבולוציה (ablation) מראים שכל רכיב נוסף — חילוץ הפרייר דו-סניפי והמיזוג בתשומת לב ממוקדת — תורם שיפורים ברורים. השוואות ויזואליות חושפות המשכיות חלקה של קווי אנוש וסמלים ושילוב טבעי יותר של אזורים ששוקמו עם רקעים שחוקים. מפות תשומת לב מצביעות גם שהמודל מתמקד בגבולות חסרים, בקווי מתאר של סמלים מרכזיים ובאזורים של מעבר טקסטורה, במקום לצבוע באופן עיוור אזורים רחבים.

מה המשמעות של זה להגנה על העבר

לעיני לא-מומחים, המסקנה העיקרית היא ששיטה זו מציעה דרך זהירה וברורה יותר לשחזור דיגיטלי של ציורי סלע עתיקים. על ידי הפרדת רמזי צורה ומשטח והתאמת השפעתם לאורך הזמן, המודל יכול לחבר דמויות שבורות ולמלא פתחים חסרים תוך שמירה על המראה והתחושה החומרית של המצוק המקורי. המחברים מדגישים שהמערכת היא כלי לסייע ולא להחליף שיפוט מומחה, וכי נדרשים נתונים מגוונים יותר והערכה מומחה נוספת. עם זאת, העבודה מצביעה על עתיד שבו אמנות סלע בסכנה תוכל להיות מתועדת, נחקרת ומשותפת בצורת שיקום דיגיטלי, תוך שימור הן של ההשפעה הוויזואלית והן של המשמעות התרבותית ללא התערבות פיזית.

ציטוט: Zhao, T., Huang, L., Qi, X. et al. A gated-attention multi-prior injection diffusion model for Huashan rock art image restoration. Sci Rep 16, 10414 (2026). https://doi.org/10.1038/s41598-026-41226-7

מילות מפתח: שיקום ציורי סלע, מורשת תרבותית, מודלי דיפוזיה, שיחזור תמונות, ציורי חואשאן