Clear Sky Science · tr

Gerçek zamanlı trafik riski tahmini için uyarlanabilir veri yeniden dengeleme çerçevesi

2026-02-17 · Dizine geri dön

Trafik verilerini dengelemenin güvenlik için önemi

Otoyoldaki kazalar, olağan ve sorunsuz sürüşe kıyasla nadir olaylardır. Bu durum güvenlik açısından iyi olsa da, nerede ve ne zaman kaza olabileceğini gerçek zamanlı tahmin etmeye çalışan bilgisayarlar için gizli bir sorun yaratır. Veriler güvenli durumlarla baskın olduğunda, algoritmalar “hiçbir şey olmayacak” tahmininde çok iyi olabilir ve kağıt üzerinde hâlâ doğru görünür—ama gerçekten tehlikeli anları sessizce kaçırır. Bu çalışma bu dengesizliği doğrudan ele alarak, uyarı sistemlerinin nadir ama önemli risk koşullarını gerçek dünyada kullanılabilecek hızda daha iyi tanımasına olanak veren uyarlanabilir bir veri “yeniden dengeleme” yöntemi önerir.

Gerçek trafiğin uyarı sinyallerine dönüştürülmesi

Araştırmacılar çerçeveyi, Alman otoyollarında drone tabanlı geniş bir veri kümesinden kaydedilmiş ayrıntılı yörünge verileri üzerine kuruyor. Her aracın konumu ve hızı, altı şeritli otoyol kesitleri boyunca saniyede birçok kez izleniyor. Bu zengin hareket kaydından, takip eden aracın öndeki araca çarpmasının ne kadar süreceğini tahmin eden yaygın kullanılan bir güvenlik göstergesi olan çarpışma süresine (time-to-collision) ilişkin hesaplamalar yapılıyor. Bu süre üç saniyenin altına düştüğünde durum "yüksek risk" olarak etiketleniyor; aksi takdirde "risk değil" olarak ele alınıyor. Bu ölçümler 10 saniyelik dilimlerde toplanıp altı şeritli yollara odaklanıldıktan sonra, her riskli örneğe karşılık yaklaşık dokuz güvenli örnek elde ediliyor; bu, gerçek otoyol koşullarını yansıtan güçlü bir eğilimli veri kümesi oluşturuyor.

Önemli olanı kaybetmeden eğimi düzeltmek

Bu eğimi ele almak için çalışma iki yaygın stratejiyi karşılaştırıyor. Biri, taşınma (oversampling) olarak adlandırılan yöntem; nadir olan riskli durumların yapay örneklerini oluşturarak bunları çoğaltıyor. Diğeri, alt örnekleme (undersampling) olarak anılan yöntem; çok sayıda güvenli durumu rastgele atarak azaltıyor. Yazarlar popüler bir taşınma yöntemi (SMOTE) ile basit bir rastgele alt örnekleme yöntemini kullanıyor ve bunları güvenli ile riskli örnek oranlarını sabit tutarak 1:1, 2:1, 3:1 ve 4:1 oranlarında uyguluyor. Orijinal ve değiştirilmiş veri kümelerinin her ikisini de iki geleneksel makine öğrenimi yaklaşımı ve zaman serileriyle çalışmaya uzman iki derin öğrenme modeli olmak üzere dört tahmin modeline besliyorlar. Tüm bu kombinasyonların test edilmesi, veriyi dengelemenin sistemin risk tespit yeteneğini güvenli durumu tanımayı sürdürürken nasıl değiştirdiğini göstermeyi sağlıyor.

Algoritmanın en uygun noktayı aramasına izin vermek

Mükemmel eşit sayıda güvenli ve riskli örneğin en iyisi olduğunu varsaymak yerine, araştırmacılar evrimden esinlenen bir arama yöntemi olan genetik algoritmanın en etkili dengeyi aramasına izin veriyor. Bu optimizasyon aracı, gerçekçi bir aralık olan 1:1 ile 4:1 arasında güvenli-risk oranını ayarlıyor, aday oranlar üretiyor, değerlendiriyor ve yüzlerce yineleme boyunca bunları iyileştiriyor. Kritik olarak, yalnızca tahmin doğruluğuna bakmıyor: aynı zamanda modelin eğitim ve tahmin süresinin ne kadar olduğuna da dikkat ediyor; bu, trafik kontrol merkezlerinin gerçek zamanlı gereksinimlerini yansıtıyor. Doğruluk ile hesaplama süresi adil biçimde birleştirilebilmesi için, tüm ölçüler normalize edildikten sonra algoritmanın minimize etmeye çalıştığı tek bir "uygunluk" skorunda harmanlanıyor.

Modellerin yolda risk hakkında öğrendikleri

Çok sayıda deney boyunca öne çıkan tek bir desen var. Verilerin dengelenmesi, orijinal eğimi bırakmaya kıyasla risk tahminini geliştiriyor ve yapay riskli örneklerle yapılan taşınma genellikle güvenli örnekleri atmaya göre daha iyi sonuç veriyor. Sabit ayarlamalar arasında 2:1 güvenli-risk oranı en iyi performansı veriyor ve yaygın kullanılan 1:1 seçeneğini geride bırakıyor. Genetik algoritmanın bu oranı ince ayar yapmasına izin verildiğinde, biraz tekdüze olmayan ama optimal değerlere ulaşıyor—taşınmada yaklaşık 2.3:1 ve alt örneklemede yaklaşık 2.7:1. Tahmin modelleri arasında, gated recurrent unit (GRU) olarak bilinen belirli bir tür tekrarlayan sinir ağı özellikle güçlü sonuçlar veriyor; bu, taşınma ve optimizasyon ile eşleştirildiğinde daha da belirgin. Modeller ayrıca otoyolda bir noktanın yukarısındaki ve aşağısındaki ortalama araç hızlarının, basit araç sayımlarından daha bilgilendirici olduğunu ortaya koyuyor.

Kararlılığı kontrol etmek ve gerçek dünyaya hazırlık

Optimizasyon yöntemleri bazen yanıltıcı çözümlere takılabileceği için, yazarlar aramalarının zaman içindeki davranışını inceliyor. Uygunluk skorlarının istikrarlı bir şekilde düştüğünü ve sonunda düzleştiğini gösteriyorlar; bu, algoritmanın zıplamak yerine kararlı, yüksek kaliteli oranlara doğru yakınsadığını düşündürüyor. Sonra seçilen oranları birkaç yüzde puan yukarı ve aşağı iterek performansın çöküp çökmediğini test ediyorlar. Pratikte küçük değişiklikler altında doğruluk yalnızca hafifçe düşüyor; bu da sistemin sağlam olduğunu ve tek, kırılgan bir ayara aşırı derecede bağımlı olmadığını gösteriyor. Ancak test için ayrılan veri payı çok büyük olduğunda modeller daha hassas hale geliyor; bu da yeterince zengin eğitim verisinin gerekliliğini vurguluyor.

Daha güvenli, daha akıllı otoyollar için çıkarımlar

Günlük anlatımla çalışma, bilgisayarların yoldaki tehlikeyi tanımasının yalnızca zekice modellerle ilgili olmadığını; aynı zamanda bu modellere nadir ama kritik olayların adil bir görünümünü vermekle de ilgili olduğunu gösteriyor. Hangi sayıda güvenli ve riskli örneğin eğitimde kullanılacağını dikkatle ayarlayarak—ve doğruluk ile hız arasındaki en iyi uzlaşmayı bulması için uyarlanabilir bir algoritmanın karar vermesine izin vererek—önerilen çerçeve gerçek zamanlı otoyol risk tahminini daha güvenilir ve daha uygulanabilir hale getiriyor. Trafik kurumları bu yaklaşımı, trafik dedektörü verilerini izleyip olası arkadan çarpışmalar hakkında erken uyarılar veren sistemlere entegre ederek sürücü uyarılarını, devriye konuşlandırmasını veya otomatik frenleme stratejilerini yönlendirmede kullanabilir. Çalışma Alman otoyollarında iyi hava koşullarında gösterilmiş olsa da, uyarlanabilir veri dengelemenin temel fikri, tehlikeli olayların nadir olduğu ama kaçırılmasının büyük sonuçlar doğuracağı her yerde güvenlik tahminlerini iyileştirmek için genel bir reçete sunuyor.

Atıf: Chen, S., Cui, B. & Chang, A. An adaptive data rebalancing framework for real-time traffic risk prediction. Sci Rep 16, 8882 (2026). https://doi.org/10.1038/s41598-026-39539-8

Anahtar kelimeler: trafik güvenliği, kaza riski tahmini, dengesiz veri, makine öğrenimi, otoyol yörüngeleri