Clear Sky Science · he

יצירת נתוני מקרים לבדיקות רב‑צדדיות מאובטחות באמצעות רשתות מתן־אתגר (GAN)

2026-01-13 · חזרה לאינדקס

מדוע בדיקות תוכנה חכמות חשובות

מפעלים מודרניים, רשתות חשמל ומתקנים תעשייתיים מפעילים תוכנה מורכבת שצריכה לתקשר בצורה מושלמת על גבי רשתות דיגיטליות. טעות קטנה באופן חילופי ההודעות בין שתי מערכות עלולה להוביל לכשלי ציוד, תקריות בטיחותיות או מתקפות סייבר. עם זאת, נתוני הבדיקה הנחוצים לגילוי הבאגים הנסתרים מפוזרים לעתים קרובות בין ארגונים רבים ונמנעים משיתוף בגלל חוקי פרטיות וסודיות תאגידית. מאמר זה מציג דרך חדשה לאפשר לחברות לשתף פעולה ביצירת מקרים בדיקה רבי עוצמה מבלי לשתף אי‑פעם את הנתונים הגולמיים הרגישים שלהן.

אתגר הבדיקה בעולם מחובר

כלי הבדיקה המסורתיים תוכננו לעידן פשוט יותר, שבו צוות אחד שלט ברוב הקוד והנתונים. רשתות תעשייתיות כיום שונות מאוד: מכשירים של ספקים רבים, המדברים פרוטוקולים תקשורתיים מחמירים, פרוסים במפעלים, בחברות תשתית ובספקים. כל ארגון רואה רק חלק אחד של התעבורה, וחוקים או חוזים לעתים קרובות אוסרים על איחוד היומנים. כתוצאה מכך, חבילות בדיקה שנבנו בבידוד עלולות להחמיץ שילובים נדירים של הודעות שמופיעים רק כאשר מערכות של בעלי־אחזקה שונים מתקשרות זו עם זו. כלים קיימים לשמירת פרטיות, שמטשטשים או מסירים שדות רגישים, גם הם לא מספקים פתרון: אם "כללים" את נתוני הפרוטוקול מדי, ההודעות פשוט לא נשארות תקפות ולא ניתנות לשימוש בבדיקה ריאליסטית.

מסגרת שיתופית שמעמידה פרטיות בראש מעייניה

החוקרים מציעים את FAT‑CG, מסגרת שמאפשרת לצדדים רבים לאמן במשותף יוצר נתוני בדיקה תוך שמירה על סודיות המעקבים הפרוטוקוליים המפורטים שלהם. ברמה המקומית, כל משתתף מנקה ומאנונן את הנתונים שלו, ואז מזין אותם לאוטואנקודר — סוג של רשת עצבית שמצמצמת הודעות לסיכומים מספריים קומפקטיים. הסיכומים הללו עשירים מספיק כדי לשמר את הדקדוק והמבנה של פרוטוקולים תעשייתיים, אך אינם חושפים עוד כתובות גולמיות או ערכים קנייניים. במקום לשלוח יומנים, הארגונים משתפים רק עדכוני מודל מוצפנים. מתאם מרכזי משתמש בקריפטוגרפיה מיוחדת (הצפנה הומומורפית) ובכמות מבוקרת של רעש (פרטיות דיפרנציאלית) כדי לשלב את העדכונים לאפליקציה משותפת וחזקה יותר, מבלי שתהיה לו היכולת לשחזר את התעבורה המקורית של אף משתתף.

להכשיר מכונות ליצירת מקרים בדיקה חזקים

במרכז FAT‑CG עומדת רשת מתן־אתגר (GAN), זוג רשתות עצביות המתחרות זו בזו. רשת אחת, המייצרת, מנסה ליצור הודעות פרוטוקול חדשות; השנייה, המבדילה, מנסה להבחין בין הודעות אמיתיות למזויפות. עם הזמן, התחרות הזאת דוחפת את המייצרת ללמוד דפוסים עדינים באופן שבו הודעות תקפות בנויהן. FAT‑CG מוסיפה תפנית נוספת: תיאורים פורמליים של כללי הפרוטוקול משמשים לבדיקת כל הודעה שנוצרה, והפרות מקבלות עונש במהלך האימון. זה משמר את התעבורה הסינתטית גם ריאליסטית וגם מגוונת. המערכת פועלת בלולאה: ברגע שנוצרו הודעות, הן נורו אל מכשירים תעשייתיים מדומים בסנדבוקס. כל מקרה שגורם לקריסות, נזילות זיכרון או תגובות חריגות מוזן חזרה לתהליך האימון, ודוחף את המייצרת אל הפינות המבטיחות ביותר של מרחב החיפוש.

פרטיות, מהירות וגילוי באגים במבחנים אמיתיים

הצוות בדק את FAT‑CG על מספר פרוטוקולים תעשייתיים נפוצים, כולל Modbus‑TCP ו‑OPC UA, תוך שימוש בתצורה ריאליסטית עם מספר התקני קצה ושרת מרכזי. בהשוואה לכלי פאוזינג קיימים ושיטות למידת פדרציה פשוטות יותר, הגישה החדשה ייצרה הודעות בדיקה שהקפידו על כללי הפרוטוקול בלמעלה מ‑90% מהמקרים וגילו כמעט פי שלוש יותר אנומליות לכל אלף בדיקות. במקביל, השכבות ההגנתיות שלה הקטינו באופן משמעותי את הסיכון שמתוקפן ישחזר נתוני אימון מהעדכונים המשותפים של המודל. באמצעות דחיסת מאפייני הפרוטוקול לקודים קטנים ומובנים לפני הצפנה, המערכת גם צמצמה את העלות התקשורתית בכמעט פי שלושים, קיצרה סיבובי אימון וגרמה לכך שיהיה מעשי עבור רשתות תעשייתיות עם רוחב פס מוגבל.

מה זה אומר למערכות קריטיות

במילים פשוטות, עבודה זו מראה שחברות המנהלות תשתיות קריטיות אינן חייבות לבחור בין שמירת פרטיות נתוניהן ובין בדיקה יסודית של המערכות שלהן. FAT‑CG מציעה דרך לרבים לשתף את הידע שלהם לגבי התנהגות רשתות אמתיות מבלי למסור אי‑פעם יומנים רגישים. התוצאה היא יוצר בדיקות משותף שמצטיין ב"לדבר" את שפת המכשירים התעשייתיים ובעל יכולת לגרום למקרים קיצוניים ומסוכנים—בדיוק הכלי הנחוץ כדי לתפוס פגיעויות לפני שהן גורמות להפרעות או תאונות. למרות שהמחקר מתמקד בפרוטוקולים תעשייתיים, רעיונות דומים יוכלו לסייע גם בתחומים רגישים אחרים, כגון בריאות או פיננסיים, שבהם ארגונים חייבים לשתף פעולה על בטיחות ואמינות מבלי לקרוע את סודיות המידע.

ציטוט: Wang, Z., Zhao, L., Meng, F. et al. Secure multi-party test case data generation through generative adversarial networks. Sci Rep 16, 5085 (2026). https://doi.org/10.1038/s41598-026-35773-2

מילות מפתח: בדיקות תוכנה תעשייתיות, למידת פדרציה, רשתות מתן־אתגר, בינה מלאכותית משמרת פרטיות, פאוזינג של פרוטוקולי רשת