Clear Sky Science · tr

Optimize edilmiş URL zekasıyla doğru tespit için derin öğrenme tabanlı oltalama sınıflandırma çerçevesi

· Dizine geri dön

Sahte web bağlantılarının neden artan bir sorun olduğu

Her gün e-postalardaki, mesajlardaki ve arama sonuçlarındaki bağlantılara ikinci bir düşünceye yer vermeden tıklıyoruz. Ancak bu bağlantıların bazılarının arkasında şifreleri, banka bilgilerini veya diğer özel verileri çalmaya yönelik özenle hazırlanmış tuzaklar bulunuyor. Saldırganlar bu sahte web adreslerinin görünüşünü sürekli değiştiriyor; bu da karaliste gibi geleneksel savunmaların ayak uydurmasını zorlaştırıyor. Bu çalışma, tehlikeli bağlantıları otomatik ve gerçek zamanlı olarak tespit etmenin yeni bir yolunu sunuyor ve web kullanıcıları ile kuruluşlara çevrimiçi dolandırıcılıklara karşı daha güçlü bir kalkan sağlamayı hedefliyor.

Çevrimiçi düzenbazların göz önünde nasıl saklandıkları

Günümüzdeki oltalama saldırıları nadiren bariz yazım hatalarına veya banka sitelerinin kaba kopyalarına dayanır. Bunun yerine çok kısa bağlantılar, hızla değişen alan adları ve güvenli görünen önekler gibi güvenilir görünmeyi sağlayan hileler kullanırlar. Mevcut birçok tespit aracı sabit kurallara veya bilinen kötü sitelerin listelerine dayanıyor. Bunlar dünün dolandırıcılıklarına karşı işe yarayabilir ama genellikle sıfırıncı gün saldırıları olarak adlandırılan yeni vakaları kaçırır ve alışılmadık ama zararsız siteleri yanlışlıkla işaretleyebilir. Yazarlar, web’in artık elle hazırlanmış kurallarla tek başına başa çıkamayacak kadar hızlı hareket ettiğini ve savunmaların desenleri doğrudan veriden öğrenmesi gerektiğini savunuyor.

Bir sisteme web adreslerini “okumayı” öğretmek

Makale, her web adresini zengin bir ipucu kaynağı olarak ele alan Uyarlanabilir Derin URL Zekâ Ağı (ADUIN) adlı bir yaklaşımı tanıtıyor. Sistemin tam sayfaları indirmek yerine üç tür bilgiye odaklandığını belirtiyor. Bağlantının kendisinin metnine —uzunluğu, karakter karışımı ve şüpheli kelimeler gibi— bakıyor; alan adının varlık süresi ve IP adresinin itibarı gibi barındırma bilgilerini inceliyor; ve kaç alt alan adı ve dizin kullandığı veya yönlendirme sıklığı gibi bağlantının yapısını inceliyor. Bu parçalar sayısal değerlere dönüştürülerek her URL için kompakt bir tanım halinde birleştiriliyor.

Figure 1. Akıllı URL analizi, zararlı bağlantılar tarayıcıya ulaşmadan nasıl filtrelenir?
Figure 1. Akıllı URL analizi, zararlı bağlantılar tarayıcıya ulaşmadan nasıl filtrelenir?

En belirleyici ipuçlarını seçmek

Birçok türde sinyal toplamak sistemi gürültüyle boğma riski taşır. Bunu önlemek için araştırmacılar, her ipucunu güvenli bağlantılarla tehlikeli bağlantılar arasındaki ayrımı ne kadar iyi sağladığına göre sıralayan bir özellik seçimi adımı geliştirdiler. İstatistiksel testler çoğunlukla birbirini yineleyen ölçümleri elerken öğrenmeye dayalı puanlar ise mevcut olduklarında hataları keskin biçimde azalttığı görülenleri öne çıkarıyor. Büyük orijinal kümeden sistem, yaklaşık 50 en bilgilendirici özelliği tutuyor. Bu budama tespiti hızlandırıyor, eğitim verisindeki tuhaflıklara aşırı uyum riskini azaltıyor ve oltalama girişimlerini meşru trafikten en iyi ayıran desenleri koruyor.

Derin öğrenmenin gizli desenleri görmesine izin vermek

En yararlı özellikler seçildikten sonra bunlar bir dikkat mekanizmasına sahip birkaç katmandan oluşan derin bir sinir ağına besleniyor. Bu katmanlar URL’nin farklı yönleri arasındaki karmaşık ilişkileri öğreniyor; örneğin belirli kelimelerin belirli bir barındırma geçmişi veya yol yapısıyla nasıl birleştiğini. Eğitim sırasında ağ yüzbinlerce gerçek ve kötü niyetli bağlantıyı görüyor ve hataları en aza indirmek için iç ağırlıklarını kademeli olarak ayarlıyor. Önemli olarak, sistem yeni URL grupları geldikçe güncellenebilecek şekilde tasarlanmış, böylece baştan yeniden inşa edilmeden yeni saldırı stillerine uyum sağlayabiliyor.

Figure 2. Katmanlı sinir ağının URL ipuçlarını güvenli ve oltalama bağlantıları olarak nasıl net şekilde ayırdığı.
Figure 2. Katmanlı sinir ağının URL ipuçlarını güvenli ve oltalama bağlantıları olarak nasıl net şekilde ayırdığı.

Yeni kalkanın performansı nasıl

Yazarlar ADUIN’i zaman içinde çeşitli kaynaklardan toplanmış büyük bir kamu oltalama ve meşru URL koleksiyonunda test ettiler. Verileri, eğitimin görmediği en yeni bağlantıların sıfırıncı gün saldırılarını temsil etmesi için bölüştürdüler. Birkaç güçlü makine öğrenmesi kıyasıyla karşılaştırıldığında, yeni sistem yaklaşık %95 genel doğruluk elde etti, işaretlenen oltalama bağlantılarının yaklaşık %93’ünü doğru tanımladı ve daha önce görülmemiş oltalama URL’lerinin yaklaşık %92’sini tespit etti. Aynı zamanda zararsız bağlantıların yalnızca yaklaşık %3,5’i yanlışlıkla tehlikeli olarak etiketlendi ve her URL yoğun yük altında bile yaklaşık beşte bir saniyede işlenebildi; bu da yöntemin yüksek trafikli ağ geçitleri ve kurumsal ağlar için uygun olduğunu gösteriyor.

Günlük gezinme için ne anlama geliyor

Uzman olmayanlar için kilit mesaj, bir web adresinin nasıl kurulduğuna dikkatle bakmanın niyeti hakkında çok şey açığa çıkarabileceğidir. Bağlantı metni, barındırması ve yapısından gelen birçok küçük ipucunu birleştirerek ve öğrenen bir sistemin sürekli uyum sağlamasına izin vererek önerilen çerçeve hem bilinen dolandırıcılıkları hem de hiçbir kara listede daha önce yer almamış yeni olanları yakalayabiliyor. Tek başına oltalamaya karşı nihai çözüm olmasa da ADUIN, URL’lerin daha akıllı ve hızlı analizinin e-posta kullanıcıları, çevrimiçi alıcılar ve kuruluşları sırlarını vermeye zorlayan dolandırıcılıklara karşı korumada önemli bir katman haline gelebileceğini gösteriyor.

Atıf: Gobinath, R., Manikandan, S. Deep learning-based phishing classification framework for accurate detection using optimized URL intelligence. Sci Rep 16, 15794 (2026). https://doi.org/10.1038/s41598-026-46481-2

Anahtar kelimeler: oltalama URL’leri, derin öğrenme, siber güvenlik, URL analizi, ağ güvenliği