Clear Sky Science · he
מסגרת חדשנית לשידור נתונים מאובטח באמצעות סיווג מבוסס למידת מכונה ואלגוריתם ElGamal עם מספרים ראשוניים של Ramanujan
מדוע חשוב להגן על הודעות יומיומיות
בכל יום בנקים, בתי חולים וממשלות שולחים הודעות דיגיטליות קצרות שיכולות לנוע בין התראות שגרתיות ועד עדכוני חשבון רגישים מאוד. להתייחס לכל ההודעות כאילו כולן שווי ערך מבחינת סודיות מבזבז כוח עיבוד, אך רפיון יתר עלול לחשוף אנשים להונאות ולפגיעה בפרטיות. מסמך זה חוקר שיטה למיין אוטומטית הודעות לפי רמת הרגישות שלהן ואז להגן עליהן בדרגות הצפנה תואמות, במטרה לאזן בין בטיחות למהירות ולניצול משאבים.
להפריד פתקים חפים מפשע מהתראות קריטיות
כדי להתחיל, המחברים בונים מערכת פשוטה לסיווג טקסט שמפרידה בין הודעות שגרתיות, כגון כותרות חדשות כלליות, לבין הודעות רגישות מאוד, כגון הודעות בנק ועמלות עסקאות. הם יוצרים מאגר נתונים קטן של 200 משפטים קצרים, כתובים בקפידה — חצי פיננסיים וחצי חדשות כלליות — ומנקיים את הטקסט על ידי הסרת פיסוק, מספרים ומילות עצירה נפוצות. כל הודעה מומרת לטביעת אצבע מספרית באמצעות טכניקה סטנדרטית שמדגישה מילים תכופות בהודעה אחת אך נדירות בכלל. נבחנות מספר שיטות למידת מכונה פופולריות, כולל K-Nearest Neighbors, מכונות וקטור תמיכה (SVM), ניתוח דיסקרימיננטי ליניארי (LDA) ואשכולות K-means. באמצעות וולידציה צולבת בחמש קיפולים למניעת התאמה יתרה, מודל SVM מספק את הביצועים המדויקים והיציבים ביותר, מה שהופך אותו לכלי המועדף לקביעה האם הודעה היא רק שגרתית או אכן רגישה.
שני מסלולי הצפנה לשני סוגי נתונים
לאחר שההודעות מתויגות, הן נשלחות לאחד משני מסלולי הצפנה. הודעות רגילות רגישות מוגנות באמצעות סכמת המפתח הציבורי הסטנדרטית של ElGamal, שיטה ידועה שהתבססה על הקושי של בעיה מתמטית הנקראת בעיית הלוגריתם הדיסקרטי. הודעות רגישות מאוד עוברות מסלול משונן שהוא זהה באופן בו הוא מבלבל ומפענח נתונים אך שונה בבחירת אחד המספרים הסודיים הקריטיים, הקרוי מודול פריימי (prime modulus). כאן המחברים מתנסים במשפחה מיוחדת של מספרים ראשוניים שנקראים מספרים ראשוניים של Ramanujan, שיש להם תכונות מרווח מעניינות בין הראשוניים. חשוב להדגיש שהבחירה הזו אינה הופכת את המתמטיקה הבסיסית לקשה יותר לפיצוח; במקום זאת היא מציעה דרך מובנית וחדשנית ליצירת מפתחות מבלי לשנות את יסודות האבטחה המוכחים של ElGamal.

בדיקה שאין שינוי בהעברה
הצפנה לבדה אינה מבטיחה שההודעה לא שונתה בדרך. כדי להוסיף הגנה זו, המסגרת מצרפת לכל הודעה מוצפנת קוד אימות הודעה מבוסס גיבוב (HMAC) לפני השליחה. המנגנון משתמש בסוד משותף ובפונקציית גיבוב חד-כיוונית כדי לייצר תג קומפקטי שמשתנה גם אם ביט אחד בהודעה משתנה. בצד המקבל משתמשים בסוד ובפונקציית הגיבוב זהים כדי לחשב מחדש את התג ולהשוותו לתג שנשלח; רק אם הם תואמים ההודעה תתקבל כאמינה. המחברים מממשים את כל השלבים — סיווג, יצירת מפתחות, הצפנה, פענוח ו-HMAC — בתוך תוכנית Python אחת ומעריכים כמה זמן כל פעולה לוקחת וכמה נתונים ניתנים לעיבוד ביחידת זמן.
מה תוצאות מדידות הזמן מגלות
מבחני ביצועים משווים את הטיפול בהודעות רגילות רגישות והודעות רגישות מאוד, גם עם צעד ה-HMAC הנוסף וגם בלעדיו. כמצופה, הוספת אימות מגדילה את זמן העיבוד לכל ההודעות. כשמשתמשים במספרים ראשוניים של Ramanujan במסלול הרגיש מאוד, ההצפנה והפענוח של אותן הודעות מראים קצב נתונים ממוצע ותפוקה נמוכים יותר מאשר המסלול הרגיל, כלומר המערכת מעבדת פחות קילובייטים לכל מילישנייה וכל ביט נתונים לוקח זמן רב יותר לעיבוד. בפרספקטיבה כללית, המסגרת מתכוונת לבזבז יותר זמן ומשאבי חישוב על התעבורה הרגישה ביותר, בעוד שהודעות פחות קריטיות עוברות מהר יותר. יחד עם זאת, המחברים מציינים שהעומס הנוסף לנתונים קריטיים מתורגם לשימוש זיכרון נמוך יותר ליחידת נתונים, דבר שעשוי לסייע לשמור על דרישות משאבים ברות ניהול בשרתים עמוסים.

מה העבודה הזו משמעותה לתקשורת מאובטחת
במונחים פשוטים, המחקר מראה שניתן לתכנן מערכת אבטחה שמעריכה באופן אוטומטי עד כמה הודעה רגישה, ואז מנתבת אותה דרך רמת הגנה תואמת, כל זאת תוך שמירה על ערבויות הבטיחות הליבתיות של שיטת הצפנה מהימנה. השימוש במספרי Ramanujan מוסיף טוויסט מתמטי חדשני לאופן הבחירה של המפתחות הסודיים, מבלי לטעון שהוא מחזק את האבטחה מעבר ל-ElGamal הסטנדרטי. אף שהמסווג הטקסטואלי הוא רק הוכחת קונספט המבוססת על מאגר נתונים קטן ובנוי בקפידה, הארכיטקטורה הכוללת מצביעה על מערכות עתידיות שבהן ניתן לטפל בהודעות יומיומיות, התראות פיננסיות ועדכונים רפואיים בצורה שונה אך עקבית, לחסוך משאבי חישוב מבלי לפגוע בפרטיות ובשלמות המידע שהאנשים מעריכים ביותר.
ציטוט: Haritha, N., Narayanan, V. & Srikanth, R. An innovative framework for secure data transmission using machine learning based classification and ElGamal encryption with Ramanujan primes. Sci Rep 16, 11090 (2026). https://doi.org/10.1038/s41598-026-40797-9
מילות מפתח: שידור נתונים מאובטח, סיווג טקסט, צפנת מפתח ציבורי, מספרים ראשוניים של Ramanujan, אימות HMAC