Clear Sky Science · he

מסגרת של סוכן מפקד מבוסס מודל שפה גדול להסקת מרחב בסימולציית לחימה

2026-03-13 · חזרה לאינדקס

מפות חכמות יותר להחלטות קריטיות

הבינה המלאכותית המודרנית מסוגלת לכתוב מאמרים ולעבור מבחנים, אך היא עדיין מתקשה בהחלטות התלויות בגיאוגרפיה — כגון איפה למקם כוחות בשדה הקרב או איך לנוע בבטחה דרך שטח מורכב. מאמר זה מציג את "גאומפקד" (Geo-Commander), מערכת בינה מלאכותית שלומדת מודלים גדולים של שפה לא רק לקרוא ולהסיק מסקנות, אלא "לחשוב עם מפות", וכך להפוך אותם לעוזרים שיכולים להציע מיקומים טקטיים סבירים בסימולציות לחימה מפורטות.

מדוע מילים לבדן אינן מספיקות

מודלים גדולים של שפה מצטיינים בהיסק טקסטואלי, אך החלטות בעולם האמיתי תלויות לעתים קרובות במיקום של אובייקטים, במשטח השטח ובאופן שבו התנאים משתנים עם הזמן. בסימולציות צבאיות, בחירה לא מוצלחת של עמדה עלולה לחשוף לכוחות אויב או לגרום להחמצת הזדמנות קריטית. מערכות קודמות הסתמכו על חוקי אצבע נוקשים או התמקדו בתכנון לטווח ארוך ללא שליטה עדינה על מיקומים ספציפיים. מודלי שפה-ויזואליים יכולים לנתח תמונות מפה, אך הם נוטים לתפעל אותן כתמונות סטטיות, וחושפים בכך חוסר הבנה של יחסים מרחביים עמוקים וקווי ראות משתנים החיוניים בלחימה. הפער הזה בין היסק מילולי להבנת מרחב מגביל את יעילות ה-AI במשימות התלויות בגיאוגרפיה.

הפיכת השטח למגרש משחקים מובנה

גאומפקד מתמודד עם הבעיה על ידי מתן תצוגה מובנית מאוד של שדה הקרב למערכת. השטח מומר לרשת משושה, פורמט מוכר ממשחקי מלחמה, שבה כל תא נושא מידע פשוט אך עשיר: מיקומו, גובהו וסוג הקרקע — שדות פתוחים, יערות, מבנים או נהרות. מבנה זה מסייע ל-AI להבין מי רואה מי ומי יכול לנוע לאן. מודול ראשון, בשם Geo-Choice, פועל כמסנן חכם. במקום לחייב את המודל לשקול אלפי מיקומים אפשריים, הוא משתמש בידע טקטי בסיסי כדי לצמצם את המפה לעד עשרה מועמדים מבטיחים התואמים למשימה הנוכחית — בין אם זה להסתתר מהאויב, לירות מרחוק בצורה סנייפית, או לתקוף מקרוב.

מתן אפשרות ל-AI להיגרר בכל מהלך

לאחר שהמפה מצומצמת, רכיב שני, שרשרת ה-ReAct המרחבית (Spatialized ReAct Chain), מאפשר ל-AI לחשוב על אפשרויותיו בלולאה מפורשת של צעדים. מודל השפה בוחן כל נקודת מועמד, קורא לכלים מתמחים כדי למדוד מרחק לאויבים, את הזמן שייקח לכוחות ידידים להגיע אליה ומה רוחב שדה הראייה שלה. אחרי כל סבב חישובים הוא משקף את שיקול דעתו מחדש, בדומה למפקד אנושי שבודק מפה, מבקש הערכות טווח ואז שוקל מחדש. משנה חשוב: התהליך מייצר מסלול הסבר נגיש — המערכת יכולה להסביר בשפה פשוטה מדוע תא רשת נבחרה כאופציה עדיפה מבחינת מיגון, נראות או אפשרויות תמרון לעומת חלופות.

בדיקת המערכת במבחן

החוקרים העריכו את גאומפקד בתוך סימולציית לחימה של טנקים מקצועית. הם עיצבו משימות "סטטיות", שבהן ה-AI נדרש לבחור את נקודת ההתחבאות, הסנייפ או ההתקפה הטובה ביותר במפה קבועה, וכן קרבות "דינמיים", שבהם פלוגות טנקים אדומות וכחולות נעות ונלחמות על פני שטחים משתנים. מומחים צבאיים בני אדם הכינו קודם לכן טבלת דירוג מפורטת של תאי רשת טקטיים עדיפים, מה שסיפק סף קשה לבחינה. מערכת גאומפקד המלאה, שמחברת את מסנן Geo-Choice ולולאת ההיסק, בחרה בעקביות במיקומים טובים יותר מאשר מודלי שפה-ויזואליים סטנדרטיים, מהדורות מזוקקות של המערכת עצמה ומפקד מבוסס-חוקים קיים. בקרבות מדומים מלאים היא אף עקפה סוכן למידה-מועצם מתקדם שאומן במיליון משחקי self-play.

ממשחקי מלחמה לעולמות רחבים יותר

גאומפקד מראה שמודלים של שפה יכולים להפוך ל"חושבים מפות" כשנותנים להם את המבנה המרחבי הנכון וכלים מתאימים, לא רק יותר טקסט. על ידי שילוב קידוד שטח מבוסס רשת עם מעגל מפורש של הסקה, פעולה ותצפית, המערכת הופכת שיפוטי בינה מלאכותית שקופים בהמלצות טקטיות ברות מעקב. בעוד שהמחקר מתמקד בסימולציות לחימת טנקים ונשאר כלוא באופן בטוח בתרחישים וירטואליים, אותן רעיונות יכולים לחול על תכנון תגובה לאסונות, ניווט במבצעי חיפוש והצלה או כל משימה שבה החלטות תלויות במיקום הבא. בפשטות, העבודה ממחישה דרך שבה ה-AI יכול לעבור מלדבר על העולם לניווט בו, כאשר בני אדם עדיין שומרים על הפיקוד.

ציטוט: Chen, Yb., Ping, Y., Zhou, S. et al. A framework of large language model commander agent for spatial reasoning in combat simulation. Sci Rep 16, 13431 (2026). https://doi.org/10.1038/s41598-026-43365-3

מילות מפתח: הסקת מרחב, סימולציית לחימה, מודלים גדולים של שפה, תמיכה בקבלת החלטות, בינה גאופרסטית