Clear Sky Science · tr

Ensemble öğrenme ile abonelik dolandırıcılığı tespitinin iyileştirilmesi: Ethio Telecom örneği

· Dizine geri dön

Telefon dolandırıcılığı neden hepimizi ilgilendirir

Her arama yaptığımızda, mesaj gönderdiğimizde veya mobil veri kullandığımızda faturanın gerçekten kullandığımızı yansıttığına güveniriz. Ancak suçlular sahte kimliklerle hat açarak, büyük ödenmemiş tutarlar biriktirerek ve bu hatları başka suçlarda kullanarak telefon şebekelerini kötüye kullanabilirler. Bu çalışma, Etiyopya’nın ulusal operatörü Ethio Telecom’a odaklanıyor ve gelişmiş veri odaklı yöntemlerin şüpheli abonelikleri geleneksel araçlara kıyasla çok daha doğru biçimde tespit edebildiğini göstererek milyonlarca kullanıcı için telefon hizmetlerini daha uygun fiyatlı ve güvenli kılmaya yardımcı oluyor.

Figure 1
Figure 1.

Sahte telefon hesaplarının gizli maliyeti

Abonelik dolandırıcılığı, birinin sahte veya çalınmış bilgileriyle telefon hizmetine kaydolup asla ödeme yapma niyeti olmadığı durumlarda gerçekleşir. Dünya çapında bu, telekomünikasyon sektörünün en yıkıcı dolandırıcılık türlerinden biridir ve yıllık onlarca milyar dolara mal olmaktadır. Sadece Ethio Telecom için dolandırıcılığın yılda yaklaşık bir milyar doları aşırdığı, bunun yaklaşık %40’ının sahte aboneliklerden kaynaklandığı tahmin ediliyor. Kaybedilen gelirin ötesinde, bu hatlar dolandırıcılık, uluslararası arama yeniden satışı veya diğer yasadışı faaliyetler için kullanılabilir; bu da hem müşteriler hem de ulusal güvenlik için risk oluşturur.

Elle yazılmış kurallardan veriden öğrenmeye

Birçok operatör gibi Ethio Telecom da geleneksel olarak şüpheli davranışları işaretlemek için uzmanların sabit kurallar yazdığı sistemlere dayanıyordu—örneğin kısa sürede çok sayıda uluslararası arama yapıldığında hattı engellemek gibi. Bu kural tabanlı sistemler anlaşılması kolaydır fakat dolandırıcılar taktik değiştirdiğinde veya kullanım desenleri karmaşıklaştığında zorluk çekerler. Yazarlar, geçmiş verilerden doğrudan desenleri öğrenen makine öğreniminin daha hızlı ve duyarlı yanıt verebileceğini savunuyor. Tek bir modele bağlı kalmak yerine, birkaç modeli birleştiren “ensemble” yöntemlerini ve yeni veri geldikçe güncellemeye devam eden “adaptif” yöntemleri inceliyorlar.

Ara kayıt verilerinden araştırmacıların kurduğu yapı

Ekibin elinde, yoğun dolandırıcılık etkinliğiyle bilinen iki aylık bir dönemden elde edilen büyük bir arama detay kaydı seti vardı—kim kiminle aradı, ne kadar süreyle ve hangi koşullarda olduğuna dair loglar. Yaklaşık bir milyon ham kayıttan başlayarak veriyi temizlediler, hataları ve çoğaltmaları kaldırdılar, yoğun dengesiz sınıfları (dürüst kullanıcı sayısı dolandırıcılara göre çok daha fazla) dengelediler ve şüpheli davranışları daha iyi yakalayan yeni öznitelikler (feature) mühendisliği yaptılar. Özellikle abonenin çevirdiği uluslararası numara sayısı, tüm aramalar içindeki uluslararası aramaların payı ve aranan benzersiz numara sayısının toplam aramalara oranı gibi ölçüler önemliydi. Bu tür özet sinyaller genellikle basit sayımlar veya demografik bilgilerden çok daha iyi şekilde normal kullanımı organize suistimalden ayırır.

Modelleri birleştirmenin tespiti nasıl artırdığı

Araştırmacılar karar ağaçları, lojistik regresyon ve yapay sinir ağları olmak üzere üç standart modeli; bunlara ek olarak bagging (Random Forest), boosting (XGBoost), oylama ve stacking gibi birkaç ensemble stratejisini ve sürekli veri akışları için tasarlanmış adaptif modelleri (Hoeffding Tree ve Adaptive Random Forest) test ettiler. Her modelin ayarlarını dikkatle optimize ettikten sonra, birden çok temel modelin güçlü yönlerini nasıl harmanlayacağını öğrenen stacking yaklaşımı görülmemiş veride yaklaşık %99,3 doğruluk sağladı. Adaptif Rastgele Orman ise yaklaşık %99,2 doğrulukla neredeyse aynı gücü gösterdi ve ayrıca dolandırıcılık desenleri zamanla değiştikçe uyum sağlayabiliyordu. Her iki yaklaşım da tekil modellere kıyasla en tehlikeli hatayı—gerçek dolandırıcılığı kaçırmayı—keskin şekilde azalttı.

Figure 2
Figure 2.

Gerçek zamanlı olarak değişen hilelere ayak uydurmak

Dolandırıcılar yöntemlerini sürekli değiştirdiği için statik bir model hızla modası geçmiş hale gelebilir. Bunu ele almak için yazarlar, hangi sinyallerin en önemli olduğunu sürekli yeniden değerlendiren çevrimiçi bir öznitelik seçimi tekniği kullandılar; böylece sistemi baştan inşa etmeye gerek kalmıyor. Ayrıca gizliliğin önemini vurguluyorlar: analizden önce verideki tüm kişisel tanımlayıcılar anonimleştirildi ve sıkı erişim kontrolleri ile denetim izleri tavsiye ediyorlar. Pratik dağıtım için çalışma, yeni arama kayıtlarının Apache Kafka gibi araçlar üzerinden adaptif modellere gerçek zamanlı olarak aktığı ve bu modellerin davranıştaki ani değişimleri izlerken kendilerini anında güncellediği bir gerçek zamanlı mimari taslağı sunuyor.

Telefon kullanıcıları ve sağlayıcıları için anlamı

Basitçe söylemek gerekirse, çalışma birden fazla akıllı modelin birlikte “oy kullanmasına” izin vermenin ve bunların sürekli öğrenmesini sağlamanın, sahte abonelikleri dikkat çekecek derecede yüksek doğrulukla yakalayabileceğini ve yanlış alarmları yönetilebilir seviyelerde tutabileceğini gösteriyor. Ethio Telecom için bu önemli tasarruflara, daha stabil fiyatlandırmaya ve ağın suç amaçlı kullanılmasına karşı daha güçlü korumaya dönüşebilir. Müşteriler içinse sıra dışı ama meşru kullanımın dolandırıcılık olarak yanlış değerlendirilme olasılığı azalırken, gerçekten riskli hatlar daha hızlı tespit edilip kapatılacak demektir. Yazarlar, dikkatle seçilmiş, bağlama özgü göstergelere dayanan ensemble ve adaptif öğrenmenin modern telekom dolandırıcılığı tespiti için güçlü ve ölçeklenebilir bir yol haritası sunduğu sonucuna varıyorlar.

Atıf: Desta, E.A., Azale, K.W., Hailu, A.A. et al. Enhancing subscription fraud detection through ensemble learning the case of Ethio telecom. Sci Rep 16, 7867 (2026). https://doi.org/10.1038/s41598-026-38790-3

Anahtar kelimeler: telekom dolandırıcılığı, abonelik dolandırıcılığı, ensemble öğrenme, adaptif rastgele orman, arama detay kayıtları