Clear Sky Science · he
אלגוריתם היברידי לגילוי וטיפול בטשטוש מרחבי בתמונות מסמכים שצולמו בסמארטפון
מדוע תמונות מטושטשות של ניירות מהטלפון חשובות
כל מי שצילם פעם תמונה של הערות, טופס או מכתב ישן בטלפון מכיר את התסכול של קריאת טקסט מטושטש ולא אחיד אחר כך. טשטוש הנובע מידרדרות, חוסר מיקוד או תאורה לקויה לא רק מעיק על קוראים אנושיים — הוא גם מבלבל תוכנות קריאת טקסט אוטומטיות שמשמשות באפליקציות סריקה, בארכיונים ובבתי משפט. המאמר מציג דרך מעשית להציל תמונות מסמכים פגומות כאלה, ולהפוך דפים מבולגנים ומטושטשים באופן לא אחיד לתמונות שחור-לבן נקיות וקריאות למחשב, בלי להסתמך על מודלים כבדים של בינה מלאכותית.

הבעיה עם תמונות מסמכים מהעולם האמיתי
כשאנחנו מצלמים מסמכים בטלפונים, הטשטוש נדיר כשהוא אחיד. חלקים בדף עלולים להיות חדים בעוד אזורים אחרים מחוץ לפוקוס, מטושטשים על ידי תנועה או מוצלים. רוב כלי הניקוי המסורתיים מתייחסים לכל התמונה כאילו הטשטוש זהה בכל מקום, מה שעלול להוביל לחספוס יתר של טקסט חדים או לכישלון בתיקון אזורים שנפגעו קשה. מערכות מודרניות מבוססות למידה עמוקה יכולות להצליח יותר, אך הן דורשות מערכי נתונים מסומנים גדולים, כרטיסי גרפיקה חזקים ואימון קפדני — משאבים שלא תמיד זמינים במשרדים, בארכיונים או במכשירים זולים. המחברים שואפים במקום זאת לשיטה קלת משקל, ללא צורך באימון, שעובדת היטב על מחשבים וטלפונים רגילים.
צנרת ניקוי בשלושה שלבים
החוקרים מתכננים צנרת שלב-אחרי-שלב שפועלת כמו משמר דיגיטלי זהיר. ראשית, כל עמוד שצולם במצלמה מיושר כך שהגיליון נראה כסריקה שטוחה במקום כצילום מעוות שצולם בזווית. לאחר מכן מופעל הליך חידוד קלאסי הנקרא דה-קונבולוציית ריצ'רדסון–לוסי עם צורת טשטוש פשוטה כדי להחזיר בעדינות חדות כללית ולהדגיש מכות עדינות. אחרי שלב זה הדף בהיר יותר אך עדיין מכיל כתמים של טשטוש ושרידים של רעש, ולכן השיטה לא נעצרת כאן.
איך השיטה מוצאת ומתקנת כתמי טשטוש
השלב השני מתמקד בגילוי המדויק של המקומות שבהם הדף עדיין מטושטש. המערכת בוחנת כל שכונה קטנה בשתי דרכים משלימות: בתחומי התמונה הרגיל היא משתמשת במדד לפלאסיאן לחוזק הקצוות המקומיים (קצוות חדים מרמזים על טקסט ברור, וקצוות חלשים מצביעים על טשטוש), ובתחום התדרים היא בוחנת כמה פרטים עדינים אבדו. על ידי שילוב שתי הרמזים האלה היא בונה מסכת טשטוש המפרידה בין אזורים מטושטשים ללא-מטושטשים. פעולות ניקוי צורה פשוטות ואז מחליקות את המסכה לחסימת טקסט קוהרנטית במקום פיקסלים רועשים מפוזרים.

טיפול שונה בטקסט חדה ומטושטשת
בשלב השלישי הדף נפרד במישרין לשתי גרסאות: אחת שמכילה בעיקר בלוקי טקסט מטושטשים והשנייה שמכילה בעיקר בלוקים חדים, בהנחיית מסכת הטשטוש. לכל קבוצה של אזורים, השיטה מיישמת המרה אדפטיבית לשחור-לבן המותאמת לתנאים מקומיים. לאזורים מטושטשים מוקדשים חלונות ניתוח גדולים יותר והתאמות ניגודיות חזקות יותר כדי לשחזר מכות דהויות, בעוד שאזורים שכבר חדים מטופלים בעדינות יותר כדי להימנע מיצירת גרעון או שבירת מכות. האלגוריתם שומר רק נתוני מיקום לאזורי אלה — המאוחסנים בקבצי מטא־דאטה קלים — כדי שיוכל לאחד את החלקים המעובדים חזרה למסמך ביינריזציה אחד נקי, המוכן לזיהוי תווים אופטי.
כמה זה עובד ולמה זה חשוב
המחברים בוחנים את הגישה שלהם על 417 תמונות מסמכי סמארטפון אמיתיות ועל רמות שונות של טשטוש, בעיות תאורה ורעש שהוספו. הם משווים את הצנרת שלהם מול כמה שיטות ביינריזציה פופולריות ומול מערכות שיחזור תמונה מודרניות, באמצעות מגוון רחב של מדדי איכות ומדידות ישירות של דיוק זיהוי הטקסט. הן ברמות טשטוש בינוניות והן בחמורות, השיטה שלהם שומרת בעקביות על יותר מכות, מאבדת פחות תווים ומחזיקה ביציבות גבוהה יותר מאשר החלופות, וכל זאת מבלי לאמן רשת עצבית. עבור משתמשים יום-יומיים, משמעות הדבר היא שתמונות טלפון של הערות, מסמכים משפטיים או דפים היסטוריים יכולות להפוך למסמכים חדים, קריאים וחיפשים יותר, גם על חומרה צנועה ובאזורים עם משאבים מוגבלים.
ציטוט: Karthik, U., Nair, B.J.B., Rani, N.S. et al. A hybrid spatial blur detection and restoration algorithm for smartphone captured document images. Sci Rep 16, 12648 (2026). https://doi.org/10.1038/s41598-026-38494-8
מילות מפתח: שיחזור תמונת מסמך, סריקות מטושטשות בסמארטפון, זיהוי תווים אופטי, שיפור תמונה, ארכיב דיגיטלי