Clear Sky Science · pl

Ulepszanie wykrywania oszustw kartowych przy użyciu hybrydowego podejścia z uczeniem maszynowym i głębokim

· Powrót do spisu

Dlaczego ma to znaczenie dla twojego portfela

Za każdym razem, gdy zbliżasz kartę do terminala lub robisz zakupy online, rozpoczyna się cicha rywalizacja: czy systemy banku wykryją złodzieja zanim znikną twoje pieniądze? Wraz z eksplozją płatności cyfrowych na całym świecie przestępcy nieustannie wymyślają nowe sztuczki, a proste zabezpieczenia oparte na regułach (np. „blokuj wszystkie transakcje powyżej 5 000 USD w nocy”) przestały wystarczać. Badanie pokazuje, jak połączenie kilku rodzajów sztucznej inteligencji w jeden „zespół ekspertów” pozwala wychwycić niemal każdą fałszywą transakcję kartową w powszechnie używanym, rzeczywistym zbiorze danych, przy jednoczesnym wyjaśnieniu, dlaczego system podjął taką decyzję.

Figure 1
Figure 1.

Rosnący napływ cyfrowych oszustw

Oszustwa kartowe to wielki biznes. Globalne straty sięgają już dziesiątek miliardów dolarów rocznie i prawdopodobnie będą rosnąć wraz z rozwojem e‑handlu, bankowości online i płatności bezgotówkowych. Większość transakcji jest w pełni legalna, ale niewielki odsetek to oszustwa — czasem mniej niż dwa na tysiąc. Ta nierównowaga utrudnia sprawę: system może wyglądać na bardzo dokładny, po prostu klasyfikując prawie wszystko jako „normalne”, a mimo to przegapić większość oszustw. Autorzy koncentrują się na tej nierównowadze oraz na tym, że taktyki oszustów ciągle się zmieniają, co razem wymaga elastycznych, opartych na danych narzędzi zamiast sztywnych, ręcznie napisanych reguł.

Przekształcanie rzadkich oszustw w sygnał uczący się

Badacze zaczynają od rzeczywistego zbioru europejskich transakcji kartowych zebranych w ciągu dwóch dni: około 285 000 płatności, z których tylko 492 okazały się oszustwami. Aby model nie zginął w morzu normalnych przypadków, stosują technikę, która tworzy realistyczne dodatkowe przykłady klasy rzadkiej, tak aby dane stały się bardziej zrównoważone. Główną metodą, nazwaną SMOTE, jest generowanie syntetycznych punktów przypominających oszustwa pomiędzy prawdziwymi przypadkami oszustw. Testują też bardziej złożoną metodę hybrydową, która zarówno dodaje przykłady mniejszości, jak i usuwa szumy z większości. Poprzez staranne skalowanie kwot i czasów transakcji oraz ukrywanie wrażliwych szczegółów za transformacjami matematycznymi, przygotowują czysty, chroniący prywatność zbiór danych, z którego komputer może się uczyć.

Budowanie zespołu cyfrowych łowców oszustw

Zamiast stawiać na jeden algorytm, autorzy trenują 37 różnych modeli pochodzących z klasycznego uczenia maszynowego, nowoczesnych drzew wzmacnianych i głębokich sieci neuronowych. Następnie projektują dwa specjalne „stackingowe” zespoły, które działają jak panel specjalistów, których opinie łączone są przez końcowego arbitra. W pierwszym zespole szybki model oparty na drzewach, sieć wykrywająca wzorce w stylu obrazu oraz sieć uwzględniająca sekwencje badają te same transakcje. Ich wyjścia są następnie podawane do potężnego modelu wzmacniającego, który uczy się, ile ufać każdemu specjaliście. Drugi zespół łączy kilka rodzajów wzmacnianych drzew i lasów w podobnej, warstwowej konfiguracji. Oba zespoły są trenowane najpierw na oryginalnie skośnych danych, a potem ponownie na zrównoważonej wersji uzyskanej za pomocą SMOTE i metody hybrydowej.

Figure 2
Figure 2.

Prawie idealne wykrywanie i jego koszty

Na zrównoważonych danych stworzonych za pomocą SMOTE oba proponowane zespoły osiągają zadziwiająco wysokie wyniki we wszystkich standardowych miarach sukcesu: w tym zbiorze prawie nigdy nie przeoczają oszukańczej transakcji i prawie nigdy nie zgłaszają fałszywego alarmu dla prawdziwej. Gdy autorzy porównują je z wieloma pojedynczymi modelami i z wcześniejszymi opublikowanymi metodami używającymi tych samych danych, systemy stackingowe konsekwentnie zajmują czołowe miejsca. Mierzą też stronę praktyczną: ile trwa trening i ile pamięci potrzeba. Zespół silnie oparty na głębokich sieciach neuronowych jest bardziej kosztowny obliczeniowo, podczas gdy zespół skupiony na drzewach daje podobną dokładność przy znacznie niższych wymaganiach czasowych i pamięciowych, co czyni go bardziej atrakcyjnym dla systemów bankowych działających w czasie rzeczywistym.

Zajrzeć do czarnej skrzynki

Powtarzającym się zmartwieniem w zaawansowanej sztucznej inteligencji jest to, że działa jak czarna skrzynka: nawet jej twórcy mogą nie wiedzieć, dlaczego oznaczyła twoje zakupy jako podejrzane. Aby temu sprostać, badanie korzysta z dwóch narzędzi wyjaśniających, które pokazują, które ukryte cechy transakcji mają największe znaczenie dla danej decyzji i dla systemu jako całości. Analizy wizualne ujawniają niewielki zestaw przekształconych zmiennych, które wielokrotnie napędzają predykcje oszustw, podczas gdy wiele innych pełni tylko rolę pomocniczą. Autorzy badają też miejsca, w których modele nadal popełniają błędy, jak pewne są, gdy się mylą, oraz jak stabilne są wyniki w miarę używania większej ilości danych. Te kontrole sugerują, że modele rzeczywiście uczą się stabilnych wzorców zamiast jedynie zapamiętywać dane treningowe.

Co to znaczy dla przeciętnych użytkowników kart

Dla osób niebędących ekspertami główna wiadomość jest uspokajająca: poprzez mądre zrównoważenie danych i współpracę kilku podejść AI, banki mogą zbudować detektory oszustw, które na benchmarkowych danych są zarówno niezwykle dokładne, jak i stosunkowo efektywne w działaniu. Równie istotne jest to, że system potrafi wyjaśniać swoje decyzje, co pomaga instytucjom mu ufać i go udoskonalać oraz ułatwia regulatorom zrozumienie jego zachowania. Chociaż wdrożenie w świecie rzeczywistym wciąż napotyka wyzwania — takie jak ciągle ewoluujące taktyki przestępców i potrzeba szybkich, ciągłych aktualizacji — to hybrydowe podejście stanowi silny wzorzec do ochrony twojej karty bez zalewania cię fałszywymi alarmami.

Cytowanie: Gamal, N., Younis, E.M.G. & Makram, W.M. Enhancing credit card fraud detection with a hybrid approach using machine and deep learning. Sci Rep 16, 10944 (2026). https://doi.org/10.1038/s41598-026-42891-4

Słowa kluczowe: wykrywanie oszustw kartowych, uczenie maszynowe, uczenie głębokie, modele zespołowe, dane niezrównoważone