Clear Sky Science · tr

Yüksek boyutlu kötü amaçlı URL çıkarımı için biyodan esinlenen optimizasyonla ölçeklenebilir hibrit hesaplamalı zeka çerçevesi

2026-03-24 · Dizine geri dön

Neden kötü bağlantıları tespit etmek önemlidir

Her gün tıkladığımız bağlantılar usulca dolandırıcılık, veri hırsızlığı ve bilgisayar enfeksiyonlarının kapısını açabilir. Siber suçlular sürekli yeni hileler icat ediyor; bu yüzden basit kara listeler ve kurallara dayalı filtreler sıklıkla yeni saldırıları kaçırır. Bu çalışma, birkaç farklı matematiksel modeli doğadan esinlenen arama stratejileriyle birleştirerek güvenli siteleri zararlılardan ayırmanın daha akıllı bir yolunu araştırıyor; amaç, tespiti hem doğru hem de güvenlik ekipleri için anlaşılır kılmak.

Basit kurallardan daha akıllı savunmalara

Kötü amaçlı sitelere karşı geleneksel savunmalar, bir bağlantının kara listede olup olmadığını veya metnindeki ya da sayfa içeriğindeki bilinen desenlerle eşleşip eşleşmediğini kontrol etmeye dayanır. Bu yöntemler bazı tehditleri durdurabilir, fakat saldırganlar adresleri gizlediğinde, sık sık değiştirdiğinde veya güvenilen siteleri taklit ettiğinde kolayca başarısız olurlar. Makale, çevrimiçi suçların hızlı değişen doğasının veriyle öğrenebilen, kararlarının güvenilirliğini test edebilen ve bir web adresinin ya da trafiğinin hangi ayrıntılarının en anlamlı olduğunu ortaya koyabilen esnek araçlar gerektirdiğini savunuyor.

Figure 1. Hibrit akıllı sistem, URL’lerde ve trafiğinde görülen ana desenleri kullanarak güvenli web sitelerini zararlı olanlardan ayırır.

Yeni tespit çerçevesi nasıl çalışıyor

Araştırmacılar, üç farklı sınıflandırıcıyı doğadan ilham alan ayarlama yöntemleriyle harmanlayan bir “hibrit” tespit çerçevesi kuruyor. İki sınıflandırıcı—lineer ve kuadratik diskriminant analizi—basit matematiksel biçimlerle güvenli ve güvensiz trafiğin arasına net sınırlar çizmekte iyidir. Üçüncüsü olan CatBoost ise URL uzunluğu, barındırdığı sıra dışı karakter sayısı veya ağ trafiğinin davranışı gibi karışık bilgi türlerini işleyebilen güçlü bir ağaç tabanlı yöntemdir. Varsayılan ayarlara güvenmek yerine çalışma, birçok olası parametre ayarını keşfetmek ve en iyilerini tutmak için bir koruyucu anne ve bir yırtıcı kuştan esinlenen iki arama stratejisi kullanır.

Modellerin web ve ağ ipuçlarından öğrendikleri

Çalışma gerçek dünya veriseti olarak 1.781 web adresi kullanıyor; bunların içinde zararsız ve zararlı olanlar bulunuyor ve her bir adres kayıt bilgileri, sunucu yanıtları ve ağ etkinliğinden çıkarılan ayrıntılarla tanımlanmış. Önce hangi bilgi parçalarının gerçekten iyi ile kötüyü ayırmada yardımcı olduğunu inceliyorlar. İstatistiksel testler birkaç basit özelliğin öne çıktığını gösteriyor: bir bağlantıda kaç özel sembol bulunduğu, URL’nin uzunluğu, metin kodlamasının nasıl ayarlandığı, sitenin adresinin ne sıklıkta sorgulandığı ve kaç uzak makineyle iletişim kurulduğu. Bu ana ipuçlarına odaklanarak çerçeve gürültü içinde kaybolmaktan kaçınır ve kararlarını yorumlamayı kolaylaştırır.

Doğadan esinlenen arama araçları işleri keskinleştiriyor

Çalışmanın özü, üç sınıflandırıcıyı ince ayar yapmak için biyodan esinlenen arama algoritmalarını kullanmakta yatıyor. Bir iyileştirici eğitim, tavsiye ve yetiştirme aşamalarını taklit ederek aday çözümlerden oluşan dijital bir “aileyi” genişçe keşfetmeye ve ardından en iyi seçenekleri rafine etmeye teşvik ediyor. Diğeri ise bir balık kartalının avı görüp taşıma şeklini kopyalayarak önce geniş çapta tarama yapıp sonra umut veren bölgelere yoğunlaşıyor. Bu yöntemler birlikte karar ağaçlarının ne kadar karmaşık olması gerektiği veya sınıflar arasındaki sınırları ne kadar yumuşatılacağı gibi iç ayarları düzenliyor. Tekrarlanan çapraz doğrulama deneyleri her sınıflandırıcının bu ayardan faydalandığını, ancak CAMA adı verilen optimize edilmiş CatBoost modelinin en iyi performansı gösterdiğini ortaya koyuyor.

Figure 2. Tek bir URL’nin özelliklerine ayrılması, katmanlı modeller tarafından işlenmesi ve doğadan esinlenen iyileştiricilerle güvenli veya güvensiz kararına ulaşılmasının adım adım görünümü.

Daha güçlü sonuçlar ve daha net içgörüler

Birçok testte hibrit modeller, doğruluk, kesinlik, geri çağırma ve kaçırılan tehditlerle yanlış alarmları dengeleyen ilgili ölçütlerde daha basit versiyonları geride bırakıyor. En iyi model yaklaşık %96 oranında doğru sınıflandırma yaparken, yanlış olarak engellenen güvenli site sayısını da düşük tutuyor. Sistemin gizemli bir kara kutu haline gelmesini önlemek için yazarlar, her tahmine hangi özelliklerin kararı güvenli veya güvensiz yönde ne kadar ittiğini gösteren “krediler” atayan bir yöntem uyguluyor. Bu, örneğin yüksek sayıda tuhaf sembol ve olağandışı adres sorgulama davranışının tehlike konusunda güçlü uyarılar olduğunu ortaya koyuyor.

Günlük web güvenliği için bunun anlamı

Uzman olmayan okuyucular için mesaj şu: web adresleri ve bunların trafiği hakkında iyi seçilmiş bir avuç ipucu, birkaç işbirlikçi model tarafından incelendiğinde ve doğadan ödünç alınan fikirlerle ayarlandığında, tehlikeli siteleri yüksek güvenilirlikle işaretleyebilir. Çalışma mütevazı büyüklükte bir veri kümesi kullanıyor ve hâlâ daha büyük, değişen çevrimiçi trafik akışlarında test edilmeye ihtiyaç duyuyor olsa da çeşitliliği, dikkatli aramayı ve açık açıklamaları birleştirmenin otomatik savunmaları hem daha keskin hem de daha güvenilir kılabileceğini gösteriyor.

Atıf: Liu, H. A scalable hybrid computational intelligence framework with bio inspired optimization for high dimensional malicious URL inference. Sci Rep 16, 14842 (2026). https://doi.org/10.1038/s41598-026-44851-4

Anahtar kelimeler: kötü amaçlı URL tespiti, siber güvenlik, makine öğrenimi, biyodan esinlenen optimizasyon, web trafik analizi