Clear Sky Science · he

חקר ביצועי ה-AI בתרגום אוטוביוגרפיה ספרותית: עד כמה דגמי AI מתקרבים לתרגום אנושי

2026-03-07 · חזרה לאינדקס

מדוע זה חשוב לקוראים ביום־יום

רובנו מסתמכים כיום על כלי תרגום מקוונים, וחלק אף משתמשים ב-AI כדי לקרוא רומנים או זכרונות בשפות אחרות. אבל האם המערכות האלה באמת מסוגלות ללכוד את הרגש, הקצב והעומק התרבותי של סיפור חיים? המחקר הזה בוחן כיצד שלוש מערכות AI פופולריות ומתורגמני־מקצוע עושים עם אוטוביוגרפיה ספרותית סינית מפורסמת, ומגלה היכן המכונות מצטיינות, היכן הן נתקעות ומה פירוש הדבר עבור קוראים שנכנסים ליצירות עולם דרך מסך.

סיפורים החוצים שפות

החוקרים מתמקדים ב-The Great Flowing River, אוטוביוגרפיה סינית שנחמדה בשבחים, המשלבת זיכרון אישי עם ההיסטוריה הסוערת של סין בזמן המלחמה וטאיוואן שלאחריה. הגרסה האנגלית הופקה במשך שנים על ידי צוות מתרגמים מומחים שעבדו בצמוד למחבר כדי לשמור על דיוק עובדתי וסגנון שקט ורגשי־מצונן. תרגום אנושי זה נלקח כתקן. מולו משווים המחברים שלוש פלטות של AI: מערכת הנוירלית של Google Translate, מודל שפה כללי (ChatGPT-4o) ומודל חדש יותר המתמקד בהסקה (OpenAI-o1). לכולם הוטל לתרגם את אותם פרקים מסינית לאנגלית בהגדרות יומיומיות, ברירת המחדל, בדומה לאופן שבו משתמש טיפוסי יפעל.

מציצים מתחת למכסה הלשונית

כדי לצאת מעבר לאינטואיציות לגבי "תרגום טוב" או "רע", המחקר משתמש בכלי בשם Coh-Metrix, שמודד יותר ממאה תכונות של טקסטים באנגלית. אלה נעים מספירות פשוטות — כמה פעלים או תארים מופיעים — ועד תכונות עדינות יותר כמו עד כמה המשפטים מקושרים זה לזה, כמה מוחשית הדיאלקטיקה וכמה קל לעקוב אחר הקטע. המחברים מקבצים את המדדים האלה לשש קטגוריות רחבות: בחירת מילים, מבנה משפט, קישורים מפורשים בין רעיונות, חיבורים קונספטואליים עמוקים יותר, מאפייני משטח כמו אורך משפט, וקריאות כללית. על ידי השוואת הניקוד בממדים אלה, ניתן להראות בכמותיות עד כמה הסגנון והמבנה של כל AI דומים לתרגום האנושי.

איך ה-AI השונים מתנהגים

השלוש מערכות ה-AI מתגלות כבעלות "אישיויות" מובחנות. Google Translate נוטה להשתמש באוצר מילים נפוץ יותר ובמשפטים יחסית פשוטים, מה שעושה את הפלט לקריא אך פחות עשיר ופחות קשור בקולו האישי של המספר. הוא משתמש בפחות כינויי גוף רבים בגוף ראשון כמו "אנחנו" ופחות בפעלים חזקים ותיאורים מקומטים מאשר בני אדם, מה שמחליש את תחושת החוויה המשותפת שהיא מרכזית לאוטוביוגרפיה. שני מודלי השפה הגדולים, לעומת זאת, מעדיפים יותר תארים ותוארי פועל וטווח רחב יותר של אוצר מילים. הניסוח שלהם עלול להרגיש מפורט ודינמי יותר, ובמקרים מסוימים להוסיף נגיעות תיאוריות שלא הודגשו על ידי המתרגמים האנושיים. זה עשוי לשפר בהירות במקומות, אך גם לסכן את הטון המנומנם של המקור, במיוחד בקטעים שבהם הכוח של הספר נובע מהצנעה ולא משפע של תיאורים.

עומק, קוהרנטיות ותת־הזרמים הרגשיים

כשמדובר בקישור רעיונות בין משפטים ופסקאות, אף אחת ממערכות ה-AI אינה מתאימה במלואה למתרגמים האנושיים. הגרסה האנושית עושה שימוש עקבי בשמות שמורים שחוזרים על עצמם, במילות קישור שנבחרו בקפידה וברמזים ברורים של סיבה ותוצאה שמסייעים לקוראים לעקוב אחרי אירועים מורכבים ושינויים רגשיים. ה-AI לעיתים מסתמכים פחות על סימני הדרכה מפורשים אלה. במקביל, הם לפעמים מבליטים יתר על המידה פעולה וסיבתיות, תוך שימוש בפעלים סיבתיים ובכוונתיים רבים שעלולים להפוך מצבים לברורים יותר אך גם למילוליים יותר מהמקור. המודל הממוקד בהסקה, OpenAI-o1, נוטה במיוחד להסיק פרטים נוספים — למשל לציין את שמו המלא של מנהיג פוליטי או להפוך "שינוי נסיבות" ל"משבר". השערות אלו יכולות להפוך את הנרטיב לישיר יותר אך גם לסטות ממה שהמחבר כתב בפועל.

איזה AI מרגיש הקרוב ביותר לאנושי

בכלל המדידות, ChatGPT-4o מתקרב ביותר לפרופיל של המתרגמים האנושיים. הוא מציע בדרך כלל אוצר מילים עשיר יותר וניסוח המותאם לקונטקסט לעומת Google Translate, תוך הימנעות מקפיצות פרשניות נועזות שבוצעו על ידי OpenAI-o1. Google Translate, אף שאינו ניואנטי כמו האחרים, נשאר לעתים נאמן יותר לניסוח החיצוני ומפיק טקסט קריא מאוד, במיוחד לקהל לא־מומחה. OpenAI-o1, על אף שנועדה "לחשוב יותר", מתיישרת הכי פחות עם התרגום האנושי במשימה הספציפית הזו. חוזקותיה בהסקה מובילות אותה לעתים לניסוח מחדש או להרחבה של ביטויים באופן שעשוי להיות סטייליסטית לא מתאים או לא מדויק מבחינה תרבותית לכתיבה ספרותית מסוג זה.

מה המשמעות לקוראים ולמתרגמים

לקורא מן השורה, המסקנה היא ש-AI של היום כבר מסוגלים להפיק תרגומים של אוטוביוגרפיה ספרותית שהם חלקים ולפעמים מרשימים — אך הם עדיין נופלים ממומחים אנושיים בשימור הקול, הרגש העדין והניואנסים התרבותיים. מבין המערכות שנבדקו, ChatGPT-4o מציע כיום את ההתאמה הקרובה ביותר לעבודת מקצוע, כאשר Google Translate אינו רחוק מאחור בכל הנוגע לקריאות מעשית. המודל הממוקד בהסקה מפגר במשימה הספציפית הזו. עם זאת, מתרגמים אנושיים נשארים חיוניים: יכולתם לשקלל היסטוריה, תרבות וסגנון מאפשרת להם לבנות נרטיבים קוהרנטיים ורב־שכבתיים רגשית שהמכונות רק משכפלות חלקית. ככל שיישומי ה-AI ממשיכים להשתפר, המחקר הזה מציע לראות בהם לא כמחליפים למתרגמים ספרותיים אלא כמסייעים חזקים שעדיין זקוקים לשיפוט אנושי כדי להעביר סיפורי חיים באופן מלא בין שפות.

ציטוט: Huang, Y., Cheung, A.K.F. Exploring AI’s performance in literary autobiography translation: how closely do AI models match human translation. Humanit Soc Sci Commun 13, 518 (2026). https://doi.org/10.1057/s41599-026-06630-4

מילות מפתח: תרגום ספרותי, תרגום מכונה, מודלים שפתיים גדולים, אוטוביוגרפיה סינית, AI מול מתרגמים אנושיים