Clear Sky Science · he

בינה שקופה למתמטיקה: דגמי שפה מבוססי טרנספורמר לחילוץ קשרי יישות מתמטיים עם XAI

· חזרה לאינדקס

מדוע המרת בעיות מילוליות לנתונים חשובה

הרבה מאיתנו זוכרים את המאבק עם בעיות מילוליות בשיעורי מתמטיקה: סיפורים על מנגו, קבוצות או חבילות שוקולד שמתארים בעצם משוואות במעט מילים. מחשבים מתקשים עוד יותר במשימות אלה, כי הם צריכים לזהות אילו מספרים מעורבים וכיצד הם קשורים זה לזה. המאמר הזה מראה כיצד טכנולוגיית שפה מודרנית יכולה לקרוא סיפורי מתמטיקה יומיומיים כאלה, לזהות את הפעולה החבויה—חיבור, חילוק או אפילו שורש ריבועי—ולמעשה להסביר מדוע הגיעה למסקנה זו. התוצאה היא צעד לקראת כלים חכמים ושקופים יותר לחינוך ולעבודה מדעית.

מסיפורים למבנה מתמטי

בלב המחקר עומדת הרעיון שכל בעיית מילים מתמטית יכולה להיתפס כקטנה של "ישויות" ו"קשרים". הישויות הן הכמויות (כמו "שנים-עשר מנגו" או "שלושה ילדים"), והקשר הוא הפעולה שמחברת ביניהן (כגון חילוק, חיבור או חישוב שורש ריבועי). המחבר מטפל בבעיות אלה כמשימת "ישות–קשר": המספרים הם ישויות, והפעולה היא הקשר ביניהן. בהפיכת משפטים מבולגנים למבנה פשוט זה, מחשבים מתקרבים לדרך שבה בני אדם מארגנים בעיה מתמטית בראשם לפני הפתרון. מבנה זה יכול גם להניע כלי חיפוש, מפות ידע ועוזרים אוטומטיים שמבינים טקסטים מתמטיים בספרי לימוד או במאמרים מדעיים.

Figure 1
Figure 1.

בניית מאגר נתונים של סיפורי מתמטיקה יומיומיים

כדי לאמן מערכת בינה מלאכותית לזהות קשרים אלה, המחקר נדרש תחילה לדוגמאות. המחבר אסף מאגר נתונים חדש על ידי שילוב שני אוספים קודמים של טקסטים מתמטיים בבנגלית ובאנגלית. ממקורות אלה נבחרו משפטים באנגלית וזוהו בקפידה ביטויי מספרים כמו "חמשת אלפים וארבעים" כישויות מתמטיות בודדות, ולא כסדרה של מילים מפוזרת. כל בעיה הותאמה למשוואה המתאימה לה כדי לתייג את הקשר בין שתי הכמויות המרכזיות כאחת משש פעולות בסיסיות: חיבור, חיסור, כפל, חילוק, עצרת (factorial) או שורש ריבועי. לאחר הסרת כפילויות, ניקוי סמלים זרים ופישוט השפה בשלבים כגון הסרת מילים נפוצות והטמעת שורשים (lemmatization), המאגר הסופי הכיל 3,284 ביטויים מתמטיים מובחנים עם ישויות וקשרים מסומנים בבירור.

להדריך טרנספורמרים לקרוא בעיות מתמטיות

עם הכנת מאגר הנתונים, השלב הבא היה לבחון דגמי שפה חזקים מבוססי טרנספורמר—אותם משפחות דגמים ששינו את עיבוד השפה הטבעית המודרני. הוערכו מספר מועמדים: BERT, ELECTRA, RoBERTa, ALBERT, DistilBERT ו-XLNet. כל מודל קיבל את הטקסט המטוהר והותאם עדין כך שהתוצאה שלו אינה פתרון מלא של הבעיה, אלא פשוט סוג הקשר המחבר את שתי הכמויות העיקריות. ההערכה השתמשה במדדים מקובלים כגון דיוק וניקוד F1 על נתוני מבחן שמורים. BERT עלה כזוכה ברור, וזיהה נכונה את הקשר כמעט בכל המקרים, עם דיוק של 99.39%. עקומות הלמידה הראו שהמודל השתפר בעקביות ללא שיבוט יתר, ומטריצת הבלבול חשפה רק כמה טעיות, בעיקר בין פעולות דומות כמו חיבור וחיסור או חילוק וכפל.

להוציא את הקופסה השחורה בהסברים

דיוק גבוה לבדו אינו מספיק כאשר מצפים ממערכות בינה מלאכותית לתמוך בלמידה או במחקר. משתמשים צריכים להבין מדוע ניתנה תחזית מסוימת. כדי להתמודד עם זאת, המחבר יישם SHAP, שיטה נפוצה מתחום הבינה להסברה, על מודל BERT המאומן. SHAP מקצה לכל מילה במשפט ציון תרומה המשקף עד כמה היא דוחפת את המודל לכיוון או הרחק מפעולה מסוימת. על ידי הזנת בעיות מתמטיות שלא נראו קודם למסביר SHAP, המחקר הפיק חזותיות שבהן מילים מועילות זוהרות בחיוב ומילים מטעיות מושכות בכיוון ההפוך. לדוגמה, מילים כמו "חולק", "באופן שווה" ו"לכל" תומכות בעוצמה בתחזית של חילוק, בעוד שמילות הקשר שאינן מצביעות על חילוק מפחיתות את הבטחון. במגוון דוגמאות הראה הניתוח שהמודל התבסס יותר על מילים שמרמזות על פעולה מאשר על המספרים הגולמיים עצמם, בדומה לאופן שבו בני אדם מחפשים רמזים כמו "סה"כ", "מ-" או "שורש" כשמפענחים בעיה.

Figure 2
Figure 2.

מה המשמעות של זה לכלי מתמטיקה עתידיים

באופן פשוט, עבודה זו מוכיחה שניתן לאמן מודל שפה מודרני לקרוא סיפורי מתמטיקה קצרים ולזהות כמעט באופן מושלם את הפעולה המרכזית הקושרת את המספרים, תוך הצגת ההיגיון באופן קריא לבני אדם. בשילוב של בניית מאגר נתונים זהיר, מודל טרנספורمر חזק והסברים מבוססי SHAP, המחקר מציע מסגרת שקופה להמרת בעיות מתמטיות נרטיביות לקשרים מובנים. גישה זו יכולה להיות הבסיס למערכות שבד לא רק פותרות בעיות, אלא גם מדגישות את הביטויים המרכזיים, תומכות בבדיקת טקסטים מתמטיים באופן אוטומטי ובניית מפות ידע עשירות ונגישות של ידע מתמטי לסטודנטים ולחוקרים.

ציטוט: Aurpa, T.T. Transparent AI for mathematics: transformer-based large language models for mathematical entity relationship extraction with XAI. Sci Rep 16, 13038 (2026). https://doi.org/10.1038/s41598-026-43507-7

מילות מפתח: בעיות מילוליות במתמטיקה, דגמי שפה מבוססי טרנספורמר, בינה להסברה (Explainable AI), חילוץ קשרי יישות, הסברים בעזרת SHAP