Clear Sky Science · he

שיפור זיהוי הונאות כרטיסי אשראי בגישה היברידית המשתמשת בלמידת מכונה ועמוקה

2026-03-27 · חזרה לאינדקס

מדוע זה חשוב לארנק שלכם

בכל פעם שאתם מנגבים את הכרטיס או קונים באינטרנט, מתחיל מירוץ שקט: האם מחשבי הבנק שלכם יזהו גנב לפני שהכסף נעלם? ככל שהתשלומים הדיגיטליים מתפשטים ברחבי העולם, הפורעים ממציאים כל הזמן שיטות חדשות, וכללים פשוטים מבוססי חוקים (כמו "לחסום כל עסקה מעל 5,000$ בלילה") כבר אינם מספקים. המחקר הזה מראה כיצד שילוב של כמה סוגי בינה מלאכותית בתוך "צוות מומחים" אחד יכול לתפוס כמעט כל עסקת אשראי מזויפת במאגר נתונים אמיתי נפוץ, ובו בזמן להסביר מדוע המערכת קיבלה כל החלטה.

גידול גל ההטעיה הדיגיטלית

הונאות בכרטיסי אשראי הן עסק ענק. ההפסדים העולמיים כבר מגיעים לעשרות מיליארדי דולרים בשנה והם צפויים לגדול עם התפתחות המסחר האלקטרוני, הבנקאות המקוונת ותשלומים ללא מזומן. רוב העסקאות לגמרי לגיטימיות, אבל חלק זעיר מהן הוא הונאה—לפעמים פחות משניים מתוך אלף. חוסר האיזון הזה מקשה על הבעיה: מערכת יכולה להיראות מדויקת מאד פשוט בכך שהיא תסווג כמעט הכל כ"נורמלי", ועדיין לפספס את רוב ההונאות. הכותבים מתמקדים בחוסר האיזון הזה ובכך שטקטיקות ההונאה משתנות כל הזמן, מה שדורש כלים גמישים מונחי נתונים במקום כללים קשיחים שנכתבו ביד.

להפוך הונאה נדירה לאות שניתן ללמוד ממנו

החוקרים מתחילים ממערך אמיתי של עסקאות כרטיסי אשראי אירופיות שנאספו במשך יומיים: כ־285,000 תשלומים, מהם רק 492 הונאות. כדי למנוע מהמודל לטבוע במקרים הנורמליים, הם משתמשים בטכניקה שמייצרת דוגמאות נוספות אמינות עבור המחלקה הנדירה כדי שהנתונים יהפכו מאוזנים יותר. השיטה המרכזית, בשם SMOTE, יוצרת נקודות סינתטיות הדומות להונאה בין מקרים אמיתיים של הונאה. הם גם בודקים שיטה היברידית מורכבת יותר שמוסיפה דוגמאות להמיעוט ומסירה דוגמאות רועשות מרוב המקרים. באמצעות קנה מידה קפדני של סכומי עסקאות וזמנים והסתרת פרטים רגישים מאחורי טרנספורמציות מתמטיות, הם מכינים מאגר נקי ששומר פרטיות וממנו המחשב יכול ללמוד.

בניית צוות של ציידי הונאות דיגיטליים

במקום להמר על אלגוריתם אחד, הכותבים מאמנים 37 מודלים שונים הנלקחים מלמידת מכונה קלאסית, עצי החלטה משופרים מודרניים ורשתות עצביות עמוקות. לאחר מכן הם מעצבים שני "אנצמבלים" מיוחדים מסוג סטאקינג, המתפקדים כמו פאנל של מומחים שהדעות שלהם משולבות על ידי שופט סופי. באנמצבל הראשון, מודל מהיר מבוסס עץ, רשת בסגנון זיהוי תבניות מסוג תמונה, ורשת המודעת לרצפים—כל אחד בוחן את אותן העסקאות. הפלטים שלהם מוזרמים למודל בוסטר חזק שלומד כמה להאמין בכל מומחה. האנצמבל השני משלב מספר סוגים של בוסטרים ועצי יער במבנה שכבות דומה. שני האנצמבלים מאומנים תחילה על הנתונים המקוריים המעוותים ואז שוב על הגרסה המאוזנת שנוצרה על ידי SMOTE והשיטה ההיברידית.

זיהוי כמעט מושלם והמחיר שלו

על הנתונים המאוזנים שנוצרו ב‑SMOTE, שני האנצמבלים המוצעים מגיעים לציונים גבוהים באופן מרשים בכל מדד סטנדרטי של הצלחה: הם כמעט אף פעם לא מפספסים עסקת הונאה וכמעט אף פעם לא מעוררים אזעקת שווא על עסקה אמיתית במאגר זה. כאשר הכותבים משווים כנגד מודלים רבים בודדים ונגד שיטות שפורסמו קודם שהשתמשו באותם נתונים, המערכות המשוכפלות שלהם יצאו בעקביות עליונות. הם גם מודדים את הצד המעשי: כמה זמן האימון לוקח וכמה זיכרון נדרש. האנצמבל השכור יותר לרשתות עצביות עמוקות יקר יותר מבחינה חישובית, בעוד שהאנצמבל המתמקד בעצים מספק דיוק דומה עם דרישות זמן וזיכרון נמוכות בהרבה, מה שהופך אותו לאטרקטיבי יותר למערכות בנקאיות בזמן אמת.

להביט בתוך הקופסה השחורה

חשש שכיח לגבי בינה מלאכותית מתקדמת הוא שהיא מתפקדת כמו קופסה שחורה: אפילו המעצבים שלה עשויים לא לדעת מדוע היא סומנה את הרכישה שלכם כחשודה. כדי להתמודד עם זה, המחקר משתמש בשני כלים להסברה שמראים אילו תכונות מוסתרות של עסקה חשובות ביותר להחלטה נתונה ובמערכת בכללה. ניתוחים חזותיים מגלים קבוצת קטנה של משתנים שעברו טרנספורמציה שמניעים שוב ושוב את תחזיות ההונאה, בעוד רבים אחרים משחקים תפקיד משלים בלבד. הכותבים גם בודקים היכן המודלים עדיין טועים, עד כמה הם בטוחים כששוגים, וכמה התוצאות נשארות יציבות ככל שמשתמשים בעוד נתונים. בדיקות אלה מרמזות שהמודלים באמת לומדים דפוסים יציבים במקום להעתיק בעל־פה את נתוני האימון.

מה זה אומר למשתמשי כרטיסי יום‑יום

עבור לא מומחים, הכותרת מרגיעה: על ידי איזון חכם של הנתונים ומתן אפשרות למספר גישות בינה מלאכותית לעבוד יחד, בנקים יכולים לבנות מזהי הונאה ששניהם מדויקים בצורה קיצונית על נתוני אב טיפוס ויחסית חסכוניים להפעלה. לא פחות חשוב, המערכת יכולה להסביר את החלטותיה, דבר שעוזר למוסדות לבטוח ולשפר אותה ועוזר לרגולטורים להבין את התנהגותה. בעוד שפריסה בעולם האמיתי עדיין נתקלת באתגרים—כמו טקטיקות פושעות שמשתנות כל הזמן והצורך בעדכונים מהירים ומתמשכים—גישה היברידית זו מציעה תבנית חזקה לשמירה על ביטחון הכרטיס שלכם בלי להציף אתכם באזעקות שווא.

ציטוט: Gamal, N., Younis, E.M.G. & Makram, W.M. Enhancing credit card fraud detection with a hybrid approach using machine and deep learning. Sci Rep 16, 10944 (2026). https://doi.org/10.1038/s41598-026-42891-4

מילות מפתח: זיהוי הונאות בכרטיסי אשראי, למידת מכונה, למידה עמוקה, מודלים מאוחדים, נתונים לא מאוזנים