Clear Sky Science · he
אבחון שגיאות דקדוק באמצעות רשתות קונבולוציה גרפיות עם שילוב של גרף ידע
מדוע כלי דקדוק חכמים חשובים
כל מי שראה מעבד תמלילים מסמן משפטים יודע שבודקי דקדוק אוטומטיים רחוקים מלהיות מושלמים. הם לעתים קרובות מפספסים שגיאות עדינות, וכאשר הם כן מציעים תיקון — הם לעיתים נדירות מסבירים מדוע. מאמר זה מציג סוג חדש של מערכת לאבחון דקדוק שמטרתה לא רק לתקן טעויות בכתיבה באנגלית, אלא גם להראות את ההיגיון מאחורי התיקונים — מה שהופך אותה ליותר מועילה עבור סטודנטים, מורים וכל מי שלומד או משתמש באנגלית כשפה שנייה.

הפיכת משפטים לרשתות
רוב כלי הדקדוק הנוכחיים קוראים טקסט כשורה פשוטה של מילים. המחברים טוענים שזה שטחי מדי, כי משפטים אמיתיים בעלי מבנה: נושאים קשורים לפעלים, סעיפים מחוברים זה לזה, והמשמעות תלויה במי מקושר למי. המערכת שלהם משתמשת בטכניקה מעולם הבינה המלאכותית המודרנית שנקראת רשת קונבולוציה גרפית. במקום להתייחס למשפט כמחרוזת שטוחה, היא הופכת כל משפט לרשת קטנה שבה כל מילה היא נקודה, וקווים ביניהן לוכדים יחסי דקדוק כגון «נושא של» או «מושא של». המודל מפזר מידע ברשת זו שכבה אחרי שכבה, כך שהייצוג של כל מילה מעוצב לא רק על ידי שכניה, אלא גם על ידי המילים שאליהן היא קשורה דקדוקית, אפילו אם הן מופיעות רחוק במשפט.
בניית מפה של ידע דקדוקי
מעל לרשת המשפטית הזו, החוקרים בונים מבנה שני: גרף ידע דקדוקי גדול. זה דומה למפה מאורגנת בקפידה של דקדוק אנגלי, תפור יחד מספרי עיון קלאסיים, קווי הנחיות למבחנים ומשאבים חינוכיים. הוא מכיל אלפי «צמתים» לרעיונות כמו זמנים פעלים, שימוש בארטיקל, או התאמה בין נושא לפועל, בנוסף לצמתים נפרדים עבור סוגי שגיאות נפוצות, כללי אבחון, אסטרטגיות תיקון וקישורים לחומרי תרגול. הקישורים מקודדים יחסים כמו «כלל זה מזהה את השגיאה הזאת» או «אסטרטגיה זו מתקנת את הבעיה הזו». מומחים בדקו ולטשו את הקישורים כך שהגרף ישקף את הדרך שבה מורים באמת חושבים על בעיות דקדוק בכיתה.
שילוב בין נתונים לחוקים
כאשר המערכת מנתחת משפט חדש, היא קודם כל בונה את רשת המשפט ומריצה את המודל הגרפי כדי לזהות אילו מילים עשויות להיות שגויות ואיזה סוג של שגיאה הן מייצגות. במקביל, היא מחפשת ערכים קשורים בגרף הידע הדקדוקי — למשל כללים שמקשרים מילה המציינת זמן עבר כמו «yesterday» לצורך בפועל בזמן עבר. המודל מערבב בין מה שהוא «לומד» מהנתונים לבין מה שאוחסן במפת החוקים הזו. חיצים ברשת מדגישים אילו חיבורים וכללים היו המשפיעים ביותר, ומאפשרים למערכת לעקוב מידית מהשגיאה הקונקרטית חזרה אל העיקרון שהיא מפרה. בבדיקות, הגישה המשולבת הזו הייתה חזקה במיוחד בזיהוי בעיות מבניות כמו שינויי זמן פועל וחוסר התאמה בין נושא לפועל — בעיות התלויות בקישורים מרחוק בתוך המשפט.

בחינת המערכת במבחן
המחברים העריכו את שיטתם על אוספים נפוצים של אנגלית לומדים, כולל CoNLL-2014, JFLEG ו-BEA-2019. מאגרי נתונים אלה מכילים חיבורים של אנשים שלומדים אנגלית, עם אנוטטורים אנושיים שסימנו היכן וכיצד כל משפט שגוי. בהשוואה למערכות חזקות קיימות המבוססות על מודלים מסוג טרנספורמר כגון BERT ותגיות מתמחות כמו GECToR, המערכת החדשה המבוססת על גרפים השיגה ציוני F1 גבוהים יותר — מידה סטנדרטית שמאזנת בין זיהוי כמה שיותר שגיאות אמיתיות לבין הימנעות מהודעות שגויות. חשוב לציין שהיא עשתה זאת עם הרבה פחות פרמטרים במודל, דבר שמרמז שמבנה מפורש וידע דקדוקי יכולים להחליף את הגודל הגולמי. מחקר קטן בסגנון כיתתי עם סטודנטים באוניברסיטה רמז בנוסף שהסברים המבוססים על גרף הידע עזרו לתלמידים לשפר את היכולת לזהות ולהבין טעויות, אם כי המחברים מדגישים שנדרשים מחקרים גדולים וארוכים יותר.
מה משמעות הדבר לכותבים יומיומיים
במילים פשוטות, המאמר מראה שבודקי דקדוק נעשים מדויקים ומלמדים יותר כאשר הם «רואים» משפטים כרשתות של יחסים ומיוועצים במפה מאורגנת של כללי דקדוק, במקום להסתמך רק על זיהוי תבניות. המערכת שהוצעה לא רק מציינת שמשהו לא בסדר, אלא גם יכולה להפנות חזרה לכלל הבסיסי — כמו «נושאים ברבים צריכים פעלים ברבים» — ולהציע תיקון ממוקד. בעוד שהגישה עדיין מתקשה בבחירת מילים עדינה, בביטויים סלנגיים ובמשפטים מאוד רועשים, היא מסמנת צעד לעבר כלי שפה שמתנהגים יותר כמו מורה סבלני מאשר עיפרון אדום חד. עם פיתוח נוסף, מערכות דומות המבוססות על גרפים יכולות לתמוך בלומדי שפות רבות על ידי שילוב חוזקות של בינה מלאכותית מודרנית עם ידע דקדוקי מפורש וקריא לבני אדם.
ציטוט: Zhang, J., Ma, Y. Grammar error diagnosis using graph convolutional networks with knowledge graph integration. Sci Rep 16, 10867 (2026). https://doi.org/10.1038/s41598-026-45622-x
מילות מפתח: תיקון שגיאות דקדוק, רשתות עצביות גרפיות, גרפי ידע, טכנולוגיות ללימוד שפות, עיבוד שפה טבעית