Clear Sky Science · he

למידת חיזוק עמוקה לאופטימיזציה של משאבי רשת ברשתות MIMO-NOMA למקסום ניצול עם עומס מינימלי

· חזרה לאינדקס

מדוע רשתות סלולר חכמות חשובות

בזמן שהטלפונים שלנו, המכוניות ומאות מיליוני חיישנים נאבקים על רוחב פס אלחוטי, הרשתות של היום מתקשות לשמור על חיבור חלק לכולם, במיוחד כאשר משתמשים נעים במהירות ברחבי ערים ובכבישים מהירים. מאמר זה מציג שיטה חדשה להפוך רשתות עתידיות בסגנון 5G ו-6G ליעילות ואמינות יותר על ידי לימוד בזמן אמת אילו חיבורים לבחור וכיצד לחלוק משאבי רדיו מוגבלים בין משתמשים רבים עם בזבוז מינימלי.

Figure 1
Figure 1.

אוויר עמוס ובעיית הצפיפות

מערכות אלחוט מודרניות חייבות לשרת מספר עצום של משתמשים שנעים תמיד. טכנולוגיות חדשות כמו MIMO, שמשתמשת במספר אנטנות בו־זמנית, ו-NOMA, שמאפשרת למספר משתמשים לחלוק את אותו חתך ספקטרום, מבטיחות רווחים גדולים בקיבולת. אך בפועל, כאשר אנשים נוסעים במכונית או ברכבת והאותות משתנים במהירות, קשה מאוד להחליט לאיזה תחנת בסיס לחבר כל משתמש, כמה הספק להקצות וכיצד למנוע מהמשתמשים להפריע אחד לשני. שיטות אופטימיזציה רבות מניחות תנאים יחסית יציבים או ידע מושלם על ערוץ הרדיו — הנחות שמקרוסות במצבים מהירים וצפופים בעולם האמיתי.

להניח לרשת לחזות את החיבור הטוב ביותר

המחברים מציעים גישה בשם OSIANRO שמתחילה בשיפור האופן שבו מכשירים מוקצים לרשתות ולערוצים. במקום להסתמך על כללים קבועים היא משתמשת בגרסה מחוזקת של שיטת למידת מכונה פופולרית הידועה כ-gradient boosting. המודל המשודרג לומד מרבים דוגמאות של התנהגות רשת בעבר — כגון עוצמת אות, השהיה וסוג היישום בשימוש — כדי לחזות האם בחירת חיבור מסוימת צפויה להצליח או להיכשל. השיטה עוצבה מחדש מתמטית כדי להעניש החלטות מורכבות מדי ולטפל במקרים נדירים אך חשובים, כמו משתמשים שקשה לשרת. על ידי ניקוד ומיון זהיר של אילו נתונים חשובים ביותר, היא מתמקדת רק בתכונות השימושיות ביותר, ובכך מקטינה זמן קבלת החלטות ושגיאות.

ללמד את הרשת לחלוק באופן הוגן ולהימנע מהתנגשויות

לאחר ש-OSIANRO בחרה רשת או ערוץ מבטיח, היא חייבת להחליט כיצד לחלוק ספקטרום והספק בין משתמשים רבים. המחברים בנו מודל מתמטי מפורט שמתאר כמה נתונים משתמשים יכולים לשלוח, כיצד האותות מפריעים זה לזה וכמה פעמים משתמשים מתנגשים כאשר הם מנסים להשתמש באוויר בו־זמנית. במקום לפתור את הפאזל המורכב הזה על ידי נוסחאות קבועות, המערכת משתמשת בלמידת חיזוק עמוקה, שבה רבים סוכנים תוכנתיים לומדים באמצעות ניסוי וטעייה. כל סוכן מייצג משתמש שבוחר באיזה משב רכיבי משאבים לגשת ובאיזו מידת תחרות לתבוע. הסוכנים מקבלים תגמולים כאשר שיעורי הנתונים הכוללים עולים ועונשים כאשר ההפרעה או העומס בערוץ גדלים, ומתכנסים לאט לאסטרטגיות שמשמרות התנגשויות נמוכות תוך כדי הגדלת התעבורה הכוללת.

Figure 2
Figure 2.

ביצועים ברחובות העיר וכבישים מהירים

כדי לבדוק את OSIANRO, המחברים מדמים מצבים עירוניים וכבישים מהירים ריאליסטיים באמצעות מודלים ידועים של ערוצים וכלים בקוד פתוח. הם משווים את המערכת שלהם מול בנצ׳מרק מתקדם שמשתמש במכשיר בהשראת מחשוב קוונטי לאופטימיזציה של הקצאת משאבים. לאורך ניסויים רבים, OSIANRO מגדילה בעקביות את שיעור הנתונים הכולל, מפיקה יותר מידע מכל יחידת ספקטרום וקוצצת בצורה חדה את מספר ההתנגשויות, גם כאשר מספר המשתמשים ומהירויותיהם גדלים. בחירת הרשת באמצעות gradient-boosted המשודרגה הוכחה כמדויקת ומהירה יותר מהגרסאות הסטנדרטיות, בעוד רכיב למידת החיזוק מסתגל בצורה חלקה לתנאי רדיו משתנים מבלי להסתמך על ידע מקדים מושלם.

מה המשמעות של זה לחיבור יומיומי

באופן פשוט, העבודה מראה שלתת לרשתות אלחוטיות יכולת לחזות וללמוד בעצמן יכול להפוך אווירי תדר צפופים להתנהגות הדומה יותר לכבישים מסודרים מאשר למגרשי חניה כאוטיים. על ידי בחירה חכמה באיזו אנטנה ובאילו ערוצים כל מכשיר צריך להשתמש, ובהתאמה מתמשכת של אופן חלוקת הספקטרום בין משתמשים, OSIANRO מספקת יותר נתונים ליותר משתמשים עם פחות האטות ותקלות. אמנם התוצאות מבוססות על סימולציות מפורטות ולא על פריסות חיות, הן מצביעות על דרך מעשית לרשתות סלולריות שישמרו על מהירות, הוגנות ויציבות גם כאשר נמלא אותן במכוניות, רכבות ומיליארדי מכשירים מחוברים הנעים.

ציטוט: Lahza, H., Sreenivasa, B.R., Lahza, H. et al. Deep reinforcement learning for network resource optimization in MIMO-NOMA networks to maximize utilization with minimal overhead. Sci Rep 16, 12635 (2026). https://doi.org/10.1038/s41598-026-42953-7

מילות מפתח: הקצאת משאבים ברשתות 5G, MIMO NOMA, למידת חיזוק עמוקה, אופטימיזציה של רשת, הפרעות אלחוטיות