Clear Sky Science · he
שיטות בנייה וחילוץ משופרות של גרף ידע המבוסס על מודלים שפתיים גדולים
מפות חכמות להחלטות מורכבות
החלטות מודרניות בתחומי סיכון גבוה—כמו מבצעים בקנה מידה גדול, ניהול תשתיות או תגובה לאסונות—תלויות ביכולת לפרש במהירות כמויות עצומות של מידע מפוזר. מדריכים, זרמי חיישנים, דוחות וסימולציות כולם מספרים חלק מהסיפור, אך לרוב אינם מאורגנים בצורה שנוחה לשימוש עבור בני אדם או מחשבים. מאמר זה מציג דרך להפוך את המידע המפוזר ל"מפות ידע" חיות המנוהלות על ידי מודלים שפתיים גדולים, כך שתכנונאים ואנליסטים יוכלו לשאול שאלות טובות יותר ולקבל תשובות מהירות ואמינות יותר.

ממקרים מפוזרים לידע מקושר
המחברים מתמקדים בגרפי ידע, דרך להצגת מידע כרשת של עובדות מקושרות—מי עשה מה, עם איזה מערכת, תחת אילו תנאים. בסביבות יום‑יומיות גרפים כאלה כבר מאחורי מנועי חיפוש ומערכות המלצה, אך תחומים ממוקדים מציבים אתגרים קשים יותר: הנתונים רגישים, המונחים צפופים, הפורמטים נעים מדוחות חופשיים ליומני חיישנים, והתנאים משתנים במהירות. כלים מסורתיים המבוססים על חוקים כתובים ביד או על מודלים קטנים מתקשים לעמוד בקצב, ומודלים שפתיים כלליים עלולים לפרש לא נכון מונחים טכניים או לפספס יחסים עדינים שמכריעים בהחלטות בעולם האמיתי.
להקנות למודלים שפתיים מומחיות חדשה
כדי להתמודד עם זאת, המחקר מעדכן (fine‑tune) מודל שפה חזק על מערך נתונים תחומי ומהונדס בקפידה. המערך שואב ממסמכי פקודות, מדריכי ציוד, תרחישים מדומיינים וספרות מומחים. לפני שהחומר מגיע למודל הוא עובר תהליך דסנסיטיזציה משמעותי: קואורדינטות קונקרטיות הופכות למיקומים יחסיים, שמות יחידות מוחלפים בקודים כלליים, והלוגיקה הרגישה מוחלקת במידה מסוימת תוך שמירה על דפוסים כלליים. הנתונים מאוחסנים בפורמט מובנה המתאר את המצב הרחב, המשימות הספציפיות (כדוגמת תכנון, דירוג איומים או מענה לשאלות) והקשרים ביניהן. מבנה זה מאפשר למודל ללמוד לא רק עובדות מבודדות אלא גם כיצד משימות שונות חולקות הקשר.
שכבות התאמה למשימות שונות
במקום לאמן מחדש כל פרמטר במודל השפה—תהליך יקר ומסוכן—המחברים משתמשים בטכניקה הנקראת התאמה בדרגה נמוכה (low‑rank adaptation), המובנית בכמה שכבות שכל אחת מתמקדת בהיבט שונה של הבעיה. שכבה אחת לתופסת את הטרמינולוגיה והקונספטים הבסיסיים, אחרת משבצת כללים ותנאים מבצעיים, ושלישית מתמחה בהתאמה למשימות מסוימות, כמו תכנון או הערכת איומים. מרכיב בקרה נפרד, רשת ה"ניתוב" (routing), בוחנת כל קטע קלט ומחליטה אילו שילובים של מתאמים קלים יש להשתמש. עיצוב זה מאפשר למערכת להחליף ביעילות בין משימות תוך שמירה על יכולת שפה כללית ומומחיות תחומית ייחודית.

בנייה ובדיקה של רשת הידע
על גבי המודל המותאם, המחברים מעצבים צנרת היברידית לבניית גרף הידע עצמו. תחילה מנקים ומאחדים את הנתונים הגולמיים כך שמונחים ופורמטים יהיו עקביים. לאחר מכן שיטות מבוססות‑חוקים ותבניות שנוצרו על ידי מומחים מחלצות ישויות ואירועים ברורים. מודל השפה המותאם נכנס לפעולה כדי לטפל בעבודות מורכבות יותר: קיצור דוחות מבולגנים לסיכומים תמציתיים, זיהוי שחקנים מרכזיים וציוד, והסקת קשרים כגון שרשראות סיבה‑תוצאה או תיאום בין יחידות. כל עובדה שמופקת מדורגת מכמה זוויות—כמה היא מתאימה לדפוסים ידועים, עד כמה היא מקושרת לעובדות אחרות, והאם היא מתיישבת עם מסלולי היגיון רב‑שלביים דרך הגרף. רק תוצאות בעלות ביטחון גבוה מתווספות, ותוצאות בעלות ביטחון נמוך מסומנות לבדיקה.
שיפורים מוכחים בדיוק ובאמינות
הצוות מעריך את הגישה בשלוש משימות מרכזיות המשקפות צרכים בעולם האמיתי: מענה על שאלות מורכבות לגבי חוקים וציוד, הצעת תוכניות פעולה למצבים נתונים, ודירוג תרחישי איומים לפי חומרה. בכל המשימות המודל המותאם עולה בעקביות על מערכות כלליות ידועות, כולל מודלים מתקדמים עם אימון כללי רחב יותר. הוא עונה נכון על יותר שאלות, מייצר תוכניות ריאליסטיות יותר ומדרג איומים ביתר דיוק. גרף הידע המתקבל גדול ומקושר היטב, כאשר יותר מ‑90 אחוז מהעובדות המאוחסנות עברו בדיקות ביטחון מחמירות וסייעו למתכננים להגיע להחלטות מושכלות מהר יותר.
מדוע זה חשוב לעתיד
לקורא שאינו מומחה, המסר המרכזי הוא שניתן להפוך מודלים שפתיים מרהוטים למנתחים מוסמכים וממוקדי תחום—אם מאמנים אותם על הנתונים הנכונים, מגבילים אותם באמצעות חוקים ברורים ובודקים אותם כל העת באיכות. עבודה זו מראה כיצד לעשות זאת בתחום רגיש המשתנה במהירות וגם להגן על מידע פרטי. המסגרת לא רק מארגנת ידע מפוזר לרשת שימושית, אלא גם שומרת על הרשת מעודכנת ואמינה, ומספקת מפה לפיתוח מערכות תמיכה בקבלת החלטות בעתיד בכל תחום שבו קבלת ההחלטות המורכבות חשובה באמת.
ציטוט: Peng, L., Yang, P., Juexiang, Y. et al. The construction and refined extraction techniques of knowledge graph based on large language models. Sci Rep 16, 8104 (2026). https://doi.org/10.1038/s41598-026-38066-w
מילות מפתח: גרף ידע, מודל שפה גדול, תמיכה בקבלת החלטות, התאמת תחום, דסנסיטיזציה של נתונים