Clear Sky Science · he
למידת מכונה מגלה קודים-אלופים חדשים
מדוע זה חשוב לחיים הדיגיטליים שלכם
כל תמונה שאתם שולחים, סרט שאתם משדרים, או אות המשודר בחלל מוגנים בשקט על ידי קודי תיקון שגיאות — טריקים מתמטיים שמאתרים ומתקנים שיבושים בנתונים. שיפור הקודים האלה משמעותו פחות שיחות שנופלות, אינטרנט מהיר יותר, הודעות חלל אמינות יותר ואחסון נתונים צפוף יותר. המאמר הזה מראה כיצד בינה מלאכותית מודרנית, אותו סוג טכנולוגיה שעומד מאחורי מודלים שפתיים גדולים, יכולה לעזור לגלות קודי "אלופים" שבורים שואפים שביצועים שלהם עולים על מה שמומחים אנושיים מצאו בעבר.

שמירה על הודעות מפני רעש
כאשר מידע נע—בין אם ברשת Wi‑Fi, בכבלים תת-ימיים, או בין כדור הארץ לחלל הרחוק—הוא עלול לעוות על ידי רעש. קודי תיקון שגיאות מגינים על זה על ידי הוספת ביטים נוספים שמעוצבים בקפידה כך שטעויות ניתן לאתר ולעיתים לתקן. מדד מפתח לחוזק קוד נקרא מרחק המינג המינימלי, שאומר במובן גס כמה שינויים היו דרושים לאויב או לתעלת רעש כדי להפוך הודעה תקפה להודעה תקפה אחרת. קודים שמשיגים את המרחק הגדול ביותר המוכר עבור גודלם מכונים קודי אלופים. מציאת אלופים כאלה קשה במיוחד: בדיקה מדויקת של קוד מועמד אחד יכולה לדרוש חיפוש ברוט‑פורס עצומי שגדל במהירות עם גודל הבעיה.
לתת למודל חכם לנחש מה קשה לחשב
הכותבים מתמקדים במשפחה מתמטית עשירה הנקראת קודים טוריים מוכללים, שנבנים מתוך דפוסים של נקודות על גריד. במקום לבחון כל אפשרות בנ Exhaustively, הם מאמנים טרנספורמר — ארכיטקטורת רשת נוירונים נפוצה במודלי שפה — כדי לאמוד את החוזק (המרחק המינימלי) של קוד ישירות מהמטריצות המגדירות אותו. בשימוש במיליוני דוגמאות על פני שני שדות סופיים, המסומנים F7 ו‑F8, המודל לומד לחזות מרחקים עם שגיאות שבדרך כלל בטווח של שלוש יחידות מהערך האמיתי, ועם שגיאות ממוצעות מוחלטות קרובות לאחת. דיוק כזה מספיק כדי להבדיל מועמדים מבטיחים מחלשים בלי להריץ כל פעם את האלגוריתם המדויק והאיטי.
אבולוציה במרחב הקודים
כדי להפוך את התחזיות המהירות הללו לתגליות חדשות, הצוות משלב את הטרנספורמר עם אלגוריתם גנטי — שיטת אופטימיזציה בהשראת אבולוציה. כאן, כל פרט באוכלוסייה הוא קבוצת נקודות על הגריד שמגדירה קוד. הדורות מתקדמים על ידי בחירה של פרטים טובים יותר, שילוב קבוצות הנקודות שלהם, ולעיתים מוטציה כדי לחקור אזורים חדשים. הכושר של מועמד מבוסס על המרחק שחזה המודל, עם הטייה שמעדיפה קודים בגודל יעד וממנעת גילוי חוזר של אותן פתרונות. רק כאשר התחזית מרמזת שקוד עשוי להיות מצטיין משקיעים החוקרים את החישוב הכבד הנדרש לאמת את המרחק האמיתי במדויק.

מכות על חיפוש אקראי ומציאת שיאים חדשים
ביישום על קודים מעל F7, גישה משולבת זו מוצאת באופן אמין מחדש קודי טוריק אלופים שדרשו בעבר עבודה מתמטית וחישובית מאומצת. באופן מרשים עוד יותר, בסביבה המורכבת יותר של F8 — שבה השיטות הקודמות נעצרו כי מרחב החיפוש עצום עד מאוד — השיטה חושפת למעלה מ‑500 מועמדי אלופים ומאמתת לפחות שישה שלא היו ידועים קודם. בהשוואה לחיפוש אקראי, המחברים מראים שהאסטרטגיה שלהם יכולה לחתוך בערך בחצי את מספר ההערכות המדויקות היקרות ברוב הקשיים, חסכון משמעותי כאשר כל בדיקה עלולה להיות בעלת עלות גבוהה.
מה המשמעות להמשך
ללא‑מומחה, המסקנה היא שבינה מלאכותית יכולה להנחות אותנו בנופים מתמטיים עצומי-ממדים שהם אחרת מחוץ להישג יד. על ידי למידת הטופוגרפיה הגסה — היכן סביר למצוא קודים טובים — והכוונת חיפוש אבולוציוני לאזורי הבטיחים ביותר, צמד הטרנספורמר והאלגוריתם הגנטי הופך בעיית מחט בערמת שחת לכדי מציאת אוצר ממוקדת יותר. המחברים מצפים שלמרות מערכי נתונים גדולים יותר, מודלים משופרים וכיול נוסף, טכניקות דומות יוכלו להאיץ את עיצובם של סוגים רבים של קודי תיקון שגיאות, כולל אלה לרשתות תקשורת עתידיות ואף למחשבים קוונטיים.
ציטוט: He, YH., Kasprzyk, A.M., Le, Q. et al. Machine learning discovers new champion codes. npj Artif. Intell. 2, 37 (2026). https://doi.org/10.1038/s44387-026-00077-3
מילות מפתח: קודי תיקון שגיאות, למידת מכונה, אלגוריתמים גנטיים, תקשורת דיגיטלית, תורת הקידוד