Clear Sky Science · he

הגברת חוסן מול התקפות במטמון סמנטי עבור מערכות ייצור מועשר-אחזור מאובטחות

· חזרה לאינדקס

מדוע זיכרון חכם יותר של בינה מלאכותית חשוב

כאשר צ׳אטבוטים ועוזרי בינה מלאכותית נכנסים למקומות עבודה, לכיתות ואפילו לבתי חולים, הם מסתמכים יותר ויותר על טריק שנקרא "זיכרון" של שאלות קודמות כדי לענות על שאלות דומות מהר וזול יותר. זיכרון זה, המכונה מטמון סמנטי, יכול לקצר משמעותית עלויות ועיכובים — אך גם לפתוח פתח אחורי לתוקפים שיוכלו להטעות מערכות כדי לדלוף סודות או לתת תשובות שגויות. מאמר זה חוקר את הסיכונים הנסתרים ומציג עיצוב חדש, SAFE-CACHE, שנועד לשמור על מהירות הזיכרון של ה-AI תוך הקשחתו מפני שימוש לרעה.

כיצד העוזרים המודרניים משתמשים בתשובות קודמות

מודלי שפה גדולים (LLMs) מודרניים פועלים לעתים בתוך מסגרת הנקראת ייצור מועשר-אחזור (RAG). כשהמשתמש שואל שאלה, המערכת תחילה מוצאת מסמכים רלוונטיים ולאחר מכן המודל מנסח תשובה באמצעות החומר הזה. מכיוון שרבים שואלים כמעט את אותה שאלה במילים שונות, חברות מוסיפות כיום מטמון סמנטי: מאגר של שאלות ותשובות ישנות, יחד עם טביעות אצבע מתמטיות של משמעותן. כאשר מגיע שאילתה חדשה, המערכת בודקת האם הטביעת האצבע שלה "מספיקה קרובה" לזו שבמטמון; אם כן, היא פשוט משתמשת בתשובה הישנה במקום להריץ שוב את תהליך האחזור והייצור. רעיון זה, המיושם בכלים כמו GPTCache ובפלטפורמות ענן של מיקרוסופט וגוגל, חוסך כסף ומאיץ תגובות בשירותי תמיכה, כלים שיחתיים ארגוניים ושירותי AI עתירי תעבורה.

Figure 1
Figure 1.

מתי ניסוח חכם הופך לחור אבטחה

אותו קיצור דרך שמגביר את המהירות יכול גם להיות מנוצל נגד המערכת. תוקפים יכולים לעבד שאילתות שנראות דומות במבנה אך בעלות משמעות שונה — לשנות תאריך, להחליף אדם או מקום, או להפוך את משמעות השאלה. מאחר שמטמונים קיימים סומכים בעיקר על דמיון מספרי של ההטמעות (אותן טביעות אצבע של משמעות), שאילתה עוינת יכולה "להתנגש" עם שאילתה תמימה במרחב הווקטורי, גם אם הכוונה השתנתה. ההתנגשות הזו יכולה לגרום למטמון להחזיר תשובה שגויה, לחשוף מידע סודי או לאפשר לאחסן נתונים רעים לשימוש עתידי. עבודות קודמות כבר הראו שניתן להרעל מסדי נתונים וקטוריים ומטמונים סמנטיים באופן זה, במיוחד כשרבים משתמשים חולקים את אותו מטמון במערכות מולטי-טננט.

ממירה שאלות מפוזרות לאשכולות כוונה יציבים

המחברים טוענים שהבעיה העיקרית היא טיפול בכל שאילתה בנפרד. הפתרון שלהם, SAFE-CACHE, מאגד זוגות שאלה–תשובה קודמים לאשכולות שמייצגים כוונות יסוד — כמו "מי ניצח במרוץ הסנאט של אריזונה ב-2022?" או "מה המחיר של תוכנת הנהיגה העצמית המלאה של טסלה?" במקום להתאים שאילתות חדשות ישירות לפריטים בודדים ישן, SAFE-CACHE משווה אותן למרכז האשכול, או לצנטרואיד, של כל אשכול. כדי לבנות אשכולות אלה, הוא קודם כל מטמיע כל שאלה-תשובה מלאה (ולא רק את השאלה לבדה) כך שהבדלים בתגובות — כמו סירוב לחשוף נתונים רגישים — מעצבים גם הם את הקיבוץ. לאחר מכן הוא משתמש באלגוריתם לגילוי קהילות כדי למצוא אשכולות טבעיים ובמבחנים סטטיסטיים כדי לסמן קבוצות רועשות שעשויות לערבב כוונות שונות או כניסות עוינות. אשכולות חשודים אלה מנוקו ומפוצלים באמצעות בי-אנקודר מאומן במיוחד שלמד לקרב דוגמאות אמינות ולהרחיק דוגמאות מורעלות.

להכשיר מודל קטן לחזק את זיכרון ה-AI

יש כוונות שמופיעות רק מספר מעט פעמים בתנועה האמיתית, מה שהופך את האשכולות שלהן לפגיעים. כדי לייצב אותן, SAFE-CACHE משתמש במודל שפה קל משקל מותאם-דק (גרסה של Gemma-3 עם מיליארד פרמטרים) כדי לייצר פרפרזות המשמרות את אותה הכוונה תוך שינוי הניסוח. דוגמאות נוספות אלה מעבות את האשכולות והופכות את הצנטרואידים שלהן לאמינים יותר, מבלי להזדקק לסימון ידני של אלפי וריאנטים. בזמן ריצה, כל שאילתה חדשה מוטמעת ומושווית לצנטרואידים אלה. אם הדמיון שלה לצנטרואיד המתאים ביותר גבוה מחריג סף מכויל בקפידה, מוחזרת התשובה מהמטמון; אחרת, המערכת חוזרת לצנרת RAG מלאה ומחליטה מאוחר יותר כיצד לקבץ את הזוג החדש. בניסויים עם שיטות התקפה חזקות המבוססות על שכתוב מטמורפי ו-GPT‑4.1, SAFE-CACHE הקטין ניסיונות הרעלה מוצלחים בכ-שתי שלישים עד שלושה רבעים בהשוואה לעיצוב בסגנון GPTCache, תוך שמירה על מהירות תגובה כמעט ללא שינוי.

Figure 2
Figure 2.

מה משמעות הדבר למשתמשי AI ביום-יום

עבור לא-מומחים, המסקנה היא שלתת למערכות AI "זיכרון" אינו חינם: עיצובים נאיביים עלולים לדלוף סודות או להיות מטוּעים להפצת תשובות שגויות. SAFE-CACHE מראה שאם מארגנים את הזיכרון סביב דפוסים עמוקים יותר ברמת הכוונה ומחזקים את הדפוסים האלה באמצעות פרפרזות ממוקדות, ניתן לשמור על יתרונות המהירות והעלות של מטמון סמנטי תוך הפחתה חדה של סיכון להתקפה. ככל שעוזרי ה-AI יהפכו לדלת הכניסה לנתונים רגישים — מרשומות חברה ועד מידע אישי — גישות כמו SAFE-CACHE יהיו מרכזיות כדי להבטיח שמה שה-AI זוכר לא יוכל בקלות לשמש נגדנו.

ציטוט: Afiffy, M., Fakhr, M.W. & Maghraby, F.A. Enhancing adversarial resilience in semantic caching for secure retrieval augmented generation systems. Sci Rep 16, 5936 (2026). https://doi.org/10.1038/s41598-026-36721-w

מילות מפתח: מטמון סמנטי, ייצור מועשר-אחזור, התקפות עוינות, הגנה מבוססת אשכולות, אבטחת מודלים גדולים