Clear Sky Science · he

עמידות עליונה להרעלה ויכולת לשכוח בלמידה מכונה קוונטית

· חזרה לאינדקס

מדוע ניקוי נתונים רעים חשוב לבינה מלאכותית

מערכות בינה מלאכותית מודרניות לומדות מתוך אוספים עצומים של דוגמאות, אך דוגמאות אלה לעתים קרובות אינן מושלמות. חלקן מתויגות באופן שגוי בטעות, ואחרות עלולות להיות משוחדות במכוון. ברגע שנתונים "רעילים" כאלה חודרים לאימון, הם יכולים לשנות את התנהגות המודל בדרכים מזיקות וללא רעש. מאמר זה שואל שאלה מפתיעה: אם נבנה מערכות למידה על מחשבים קוונטיים במקום קלאסיים, האם הן יגיבו אחרת לנתונים רעים — והאם קל להן יותר לשכוח אותם כשצריך?

Figure 1
Figure 1.

שתי דרכים ללמוד מידע מרופט

המחברים משווים בין שני סוגי רשתות עצביות שאומנו על אותן משימות. אחת היא רשת קלאסית מוכרת, מערום של חיבורים משוקללים הפועלת על מחשב רגיל. השנייה היא רשת עצבית קוונטית המשתמשת בקיוביטים ושערים קוונטיים כדי לעבד מידע בסופרפוזיציה. שתיהן מתבקשות לפתור שתי משימות סיווג: להבחין בין ספרות כתובות־יד בערכת MNIST ולהבדיל בין שתי פאזות חומר במודל פיזיקלי קוונטי. בכל מקרה, החוקרים מזהמים במכוון חלק מנתוני האימון — או על ידי החלפת התוויות של כמה דוגמאות או על ידי החלפת מאפייני הקלט ברעש אקראי — ואז בוחנים כיצד כל מודל מתמודד עם זה.

כשהתוויות משקרות, מודלים קוונטיים שומרים על עמידות

ההבדל הבולט ביותר מופיע כאשר התוויות מומרות. הרשת הקלאסית מנסה להסתפק בכל דוגמת אימון, כולל הסותרים, ומרימה בהדרגה את גבול ההחלטה הפנימי שלה כדי להתאים להן. הביצועים שלה על נתונים חדשים ובלתי־נראים יורדים בהתמדה ככל שיותר תוויות נפגמות. לעומת זאת, הרשת הקוונטית מציגה רמה של עמידות: בטווח רחב של רמות רעש היא ממשיכה לסווג היטב נתוני ואלידציה נקיים, ומתעלמת בפועל ממקרים חריגים המתויגים באופן שגוי. רק כאשר התוויות המזוהמות הופכות לדומיננטיות — בסביבות הנקודה שבה חצי מהתוויות שגויות — ביצועיה מתמוטטים לפתע, בשינוי חד הדומה למעבר פאזה. התנהגות זו מצביעה על כך שהלומד הקוונטי מעדיף את הדפוס הפשוט והקוהרנטי ביותר בנתונים ומתייחס לסתירות מפוזרות כהפרעות חסרות רלוונטיות עד שהן משחיתות את האות האמיתי.

קל יותר לגרום לקוונטיים לשכוח אימון רע

מעבר לעמידות מפני זיהום, המחברים חוקרים "שכיחת מכונה": עד כמה ביעילות ניתן לאלץ מודל מאומן לשכוח את השפעת הנתונים הרעים מבלי להתחיל מאפס. הם בוחנים מספר אסטרטגיות, כגון אימון מחדש רק על החלק הנקי של הנתונים, כיוונון עדין מתוך המודל הרעיל, דחיפה מפורשת של תחזיות המודל הרחק ממה שלמד על תת־הקבוצה המזוהמת, ושימוש בצעדי גרדיאנט שמבטלים את השפעת הדוגמאות הללו. עבור הרשת הקלאסית, כל השיטות היעילות והמקורבות מפגרות אחרי אימון מחדש מלא, מה שמעיד שהייצוג הפנימי התקשה סביב הדגימות המזוהמות. הרשת הקוונטית פועלת אחרת. גם כשהיא מתחילה ממצב רעיל היא ניתנת להכוונה על ידי שיטות שכיחה מקורבות כך שתשיג או תעלה על ביצועי אימון מחדש יקר בתוך אותו חלון זמן. זה מראה שהייצוג שהיא למדה גמיש יותר — מספיק מובנה כדי להיות שימושי, ועדיין גמיש מספיק כדי לתוקן.

Figure 2
Figure 2.

הנוף החבוי שמאחורי עמידות ופלסטיות

כדי להסביר את ההתנהגויות הנגדיות האלה, המחברים בוחנים את "נוף פונקציית ההפסד", משטח רב־ממדי שמודד עד כמה המודל מתאים את הנתונים עבור כל קביעת פרמטרים. ידוע שהכללה טובה מקושרת לעמקי נוף רחבים ושטוחים, בעוד שזיהוי יתר שביר מקושר לעתים קרובות למינימות חדות וצרות. על ידי ניתוח האופן שבו העקמומיות של נוף זה משתנה בעת רעילת נתונים, הם מגלים שרשתות קלאסיות חוות גסות דרמטית: אזור שהיה שטוח סביב הפתרון הופך לחד מאוד כשהמודל משנן נקודות מתויגות שגוי. הבריחה מעמק תלול זה במהלך שכיחה קשה, מה שמסביר את ההתעקשות של זכרונות קלאסיות. רשתות קוונטיות, לעומת זאת, שומרות כמעט על אותה עקמומיות עדינה גם לאחר הרעילה. הנופים שלהן יציבים מבחינה מבנית, מוקפים על־פי המתמטיקה של פעולות קוונטיות, מה שמונע יצירת מינימות חד־משמעיות וחדות ומכוון את הלמידה באופן טבעי לעבר פתרונות חלקים ומתכללים טוב יותר.

מה משמעות הדבר עבור בינה מהימנה בעתיד

ללא מומחיות מיוחדת, המסקנה היא שלמידה מכונה קוונטית אינה רק עניין של מהירות או חומרה אקזוטית. בניסויים אלה, מודלים קוונטיים פועלים יותר כעורכים זהירים מאשר ככותבים אובססיביים: הם בולטים בסיפור הראשי בנתונים מרוטים, מתנגדים להשפעה של כמה דוגמאות רעות, וניתן לפתות אותם לשכוח השפעות מזיקות בלי לבנותם מחדש. שילוב העמידות לרעילה ויכולת השכחה מציע סוג חדש של יתרון קוונטי — אחד המשתורש באמינות ובבטיחות יותר מאשר בכוח חישובי טהור — ומרמז שמערכות AI מועשרות קוונטית בעתיד עשויות להיות שותפים טובים יותר בנוף מידע רועש ומשתנה תמיד.

ציטוט: Chen, YQ., Zhang, SX. Superior resilience to poisoning and amenability to unlearning in quantum machine learning. Nat Commun 17, 3716 (2026). https://doi.org/10.1038/s41467-026-70420-4

מילות מפתח: למידה מכונה קוונטית, רעילת נתונים, שכיחת מכונה, בינה מלאכותית חסינה, נוף פונקציית ההפסד