Clear Sky Science · ru
Улучшение обнаружения мошенничества с картами: гибридный подход с машинным и глубоким обучением
Почему это важно для вашего кошелька
Каждый раз, когда вы прикасаетесь картой или покупаете онлайн, начинается тихая гонка: успеют ли вычислительные системы банка заметить вора раньше, чем исчезнут ваши деньги? По мере глобального роста цифровых платежей преступники постоянно придумывают новые уловки, и простые правила безопасности (например, «блокировать все операции свыше $5 000 ночью») уже недостаточны. В этом исследовании показано, как объединение нескольких видов искусственного интеллекта в единый «аналог экспертной команды» позволяет поймать почти все поддельные транзакции в широко используемом реальном наборе данных и при этом объяснить, почему система приняла каждое решение.

Рост цифровых махинаций
Мошенничество с кредитными картами — это большой бизнес. Глобальные потери уже достигают десятков миллиардов долларов ежегодно и, по прогнозам, будут расти по мере развития электронной коммерции, онлайн‑банкинга и безналичных платежей. Большинство транзакций полностью законны, но крошечная их часть является мошеннической — иногда меньше двух на тысячу. Такое несоответствие делает задачу сложной: система может выглядеть очень точной, просто помечая почти всё как «нормальное», но при этом пропускать большую часть мошенничеств. Авторы уделяют внимание этому дисбалансу и тому факту, что тактики мошенников постоянно меняются — это требует гибких, основанных на данных инструментов вместо жестко прописанных правил.
Преобразование редкого мошенничества в изучаемый сигнал
Исследователи начинают с реального набора европейских транзакций за два дня: примерно 285 000 платежей, из которых только 492 — мошеннические. Чтобы модель не «тонулa» в нормальных случаях, они применяют технику, которая синтезирует реалистичные дополнительные примеры редкого класса, делая данные более сбалансированными. Основной метод, называемый SMOTE, создаёт синтетические точки, похожие на мошеннические, между реальными случаями мошенничества. Они также проверяют более сложный гибридный метод, который одновременно добавляет примеры меньшинства и удаляет шумные примеры большинства. Тщательная шкалировка сумм и времени транзакций и скрытие чувствительных деталей с помощью математических преобразований позволяют подготовить чистый набор данных с сохранением конфиденциальности, пригодный для обучения компьютера.
Создание команды цифровых охотников на мошенников
Вместо того чтобы полагаться на один алгоритм, авторы обучают 37 различных моделей, взятых из классического машинного обучения, современных бустинговых деревьев решений и глубоких нейронных сетей. Затем они разрабатывают два специальных «стэкинговых ансамбля», которые работают как панель специалистов, чьи мнения объединяет финальный рефери. В первом ансамбле быстрый модель на основе деревьев, сеть, умеющая находить шаблоны вроде изображений, и сеть, учитывающая последовательности, каждую изучают одни и те же транзакции. Их выходы затем подаются в мощную модель‑бустер, которая обучается определять, насколько доверять каждому специалисту. Второй ансамбль объединяет несколько видов бустеров на основе деревьев и лесов в аналогичной многоуровневой структуре. Оба ансамбля сначала обучаются на исходных несбалансированных данных, а затем снова — на сбалансированной версии, полученной с помощью SMOTE и гибридного метода.

Почти идеальное обнаружение и во что это обходится
На сбалансированных данных, созданных с помощью SMOTE, оба предложенных ансамбля демонстрируют поразительно высокие показатели по всем стандартным метрикам: они почти никогда не пропускают мошенническую транзакцию и почти никогда не поднимают ложную тревогу по настоящей транзакции в этом наборе данных. При сравнении с множеством отдельных моделей и ранее опубликованных методов, использовавших те же данные, их стэки последовательно занимают лидирующие позиции. Авторы также оценивают практическую сторону: сколько времени занимает обучение и сколько памяти требуется. Ансамбль с сильным упором на глубокие нейронные сети более вычислительно затратен, тогда как деревообразный ансамбль достигает схожей точности при существенно меньших временных и памятьных затратах, что делает его более привлекательным для банковских систем в реальном времени.
Заглядывая внутрь «чёрного ящика»
Распространённая обеспокоенность относительно продвинутого ИИ в том, что он ведёт себя как «чёрный ящик»: даже его создатели могут не знать, почему он посчитал покупку подозрительной. Чтобы справиться с этим, исследование использует два инструмента объяснимости, которые показывают, какие скрытые признаки транзакции наиболее важны для конкретного решения и для системы в целом. Визуальные анализы выявляют небольшой набор преобразованных переменных, которые регулярно определяют прогнозы мошенничества, в то время как многие другие играют лишь вспомогательную роль. Авторы также изучают, где модели всё ещё ошибаются, насколько они уверены в своих ошибках и насколько устойчивы результаты при увеличении объёма данных. Эти проверки указывают на то, что модели действительно выучивают стабильные закономерности, а не просто запоминают обучающий набор.
Что это означает для повседневных пользователей карт
Для непрофессионалов главный вывод обнадеживающий: за счёт умного балансирования данных и совместной работы нескольких подходов ИИ банки могут создавать детекторы мошенничества, которые на эталонных данных чрезвычайно точны и при этом достаточно эффективны в эксплуатации. Не менее важно, что система способна объяснять свои решения, что помогает организациям доверять ей и дорабатывать её, а регуляторам — понимать её поведение. Хотя реальное развёртывание всё ещё сталкивается с трудностями — такими как постоянно меняющиеся тактики преступников и необходимость быстрых непрерывных обновлений — этот гибридный подход предлагает сильную модель для защиты вашей карты без наводнения ложными срабатываниями.
Цитирование: Gamal, N., Younis, E.M.G. & Makram, W.M. Enhancing credit card fraud detection with a hybrid approach using machine and deep learning. Sci Rep 16, 10944 (2026). https://doi.org/10.1038/s41598-026-42891-4
Ключевые слова: обнаружение мошенничества с кредитными картами, машинное обучение, глубокое обучение, ансамблевые модели, несбалансированные данные