Clear Sky Science · ru

Применение объяснимого искусственного интеллекта для интерпретации контролируемых ансамблевых моделей машинного обучения для надёжного обнаружения мошенничества по кредитным картам

· Назад к списку

Почему вам важны более умные проверки на мошенничество

Каждый раз, когда вы прикладываете карту или делаете покупку в интернете, невидимые системы за доли секунды решают, безопасен ли платёж. Если они слишком строги, ваша карта может быть заблокирована в магазине. Если слишком мягки — преступник сможет опустошить счёт. В этом исследовании рассматривается, как строить детекторы мошенничества, которые не только точны, но и могут объяснять свои решения, давая банкам инструменты, одновременно эффективные и заслуживающие доверия.

Figure 1. Как интеллектуальные фильтры мошенничества превращают потоки операций по картам в более безопасные результаты с помощью объяснимого машинного обучения.
Figure 1. Как интеллектуальные фильтры мошенничества превращают потоки операций по картам в более безопасные результаты с помощью объяснимого машинного обучения.

От простых правил к обучению на данных

Старые системы борьбы с мошенничеством в основном опирались на фиксированные правила, например блокировку любых покупок свыше определённой суммы или в другой стране. Злоумышленники быстро научились обходить такие ограничения. Авторы же исследуют контролируемое машинное обучение, где модели обучаются на прошлых транзакциях, помеченных как подлинные или мошеннические. Они сравнивают четыре популярных подхода — от простых линейных формул до более гибких ансамблевых деревьев, способных выявлять тонкие паттерны в поведении трат.

Тестирование на разных типах использования карт

Чтобы убедиться, что выводы не привязаны к одному специфическому набору данных, исследователи оценивают четыре модели на трёх существенно разных коллекциях операций по картам. Один — хорошо известный европейский набор с очень малой долей мошенничеств. Другой включает более богатые данные, такие как геолокация, информация о торговце и данные клиента. Третий, значительно больший синтетический набор от индустрии, содержит десятки миллионов транзакций. Во всех них ансамблевые методы, такие как Random Forest, XGBoost и LightGBM, как правило, обнаруживают подозрительное поведение намного лучше, чем более простая базовая модель.

Figure 2. Как модель ИИ оценивает подсказки в каждой операции по карте, отделяя безопасные покупки от вероятного мошенничества понятным образом.
Figure 2. Как модель ИИ оценивает подсказки в каждой операции по карте, отделяя безопасные покупки от вероятного мошенничества понятным образом.

Открывая «чёрный ящик» решений модели

Высокая точность сама по себе недостаточна для банков или регуляторов, которые всё чаще требуют понять, почему была заблокирована конкретная транзакция. Поэтому исследование связывает качество предсказаний с понятностью, используя метод SHAP, который назначает каждому входному признаку вклад в итоговое решение. Для целых наборов данных эти объяснения выявляют, какие подсказки склонны сигнализировать о мошенничестве — например отдельные категории торговцев, нетипичное время покупок или схемы мелких тестовых списаний, за которыми следуют большие. Для отдельных платежей они показывают, как конкретные детали подтолкнули модель к решению «мошенничество» или «легитимно», давая аналитикам ясную отправную точку для проверки.

Баланс между пропущенным мошенничеством и ложными срабатываниями

Поскольку мошеннические покупки встречаются очень редко, модели легко выглядеть точными, просто помечая почти всё как безопасное. Авторы подробно рассматривают этот дисбаланс, анализируя precision, recall и связанные метрики, уделяя особое внимание самому классу мошенничества. Они обнаруживают, что некоторые модели, например логистическая регрессия, могут выявлять много случаев мошенничества, но ценой огромного числа ложных тревог, тогда как другие, такие как XGBoost, предлагают лучшее соотношение между обнаружением плохих транзакций и сохранением удобства для честных клиентов. Также показано, как изменение порога принятия решения позволяет банкам настраивать этот компромисс в соответствии с их риском и финансовыми издержками ошибок.

Вывод объяснимых инструментов обнаружения мошенничества в реальную практику

В завершение статья описывает, как такие системы могут быть внедрены на практике. Авторы предлагают двухэтапную схему, в которой сначала быстлая модель с упором на полноту помечает подозрительные платежи, а затем более точная модель с встроенными объяснениями ранжирует и обосновывает эти сигналы для человеческих следователей. Они обсуждают технические требования, такие как низкое время отклика, масштабируемые облачные сервисы и мониторинг изменений в тактиках мошенников, а также юридические требования, чтобы клиенты получали понятные причины, когда автоматизированные системы влияют на них.

Что это значит для повседневных держателей карт

Проще говоря, исследование показывает, что современное машинное обучение может сделать проверки на мошенничество и точнее, и прозрачнее. Ансамблевые модели на основе деревьев, особенно XGBoost и LightGBM, как правило, дают наилучшее сочетание силы обнаружения и понятного обоснования на нескольких реалистичных наборах данных. Сочетая эти модели с инструментами объяснения и тщательной настройкой стоимости ошибок, банки могут проектировать системы борьбы с мошенничеством, которые лучше защищают ваши деньги, уменьшают число раздражающих отклонений операций и соответствуют строгим регуляторным требованиям.

Цитирование: Awad, S.S., Hamza, A.A., Sobh, M.A. et al. Applying explainable artificial intelligence to interpret supervised ensemble learning models for robust credit card fraud detection. Sci Rep 16, 15220 (2026). https://doi.org/10.1038/s41598-026-49939-5

Ключевые слова: мошенничество по кредитным картам, объяснимый ИИ, машинное обучение, ансамблевые модели, финансовая безопасность