Clear Sky Science · tr
Bir dikkat tabanlı mimari kullanarak bağlam mühendisliğini yeniden düşünün
Neden Daha Akıllı Yazılım Yardımcıları Önemli
Bir iş uygulamasında yaptığınız her tıklama—giriş yapma, dosya yükleme, rapor çalıştırma—bir iz bırakır. Yazılım, bir sonraki hareketinizi güvenilir şekilde tahmin edebilseydi, veriyi önceden yükleyebilir, kısayollar önerebilir ve neredeyse anında yanıt verebilirdi. Bu makale, bilgisayarlara bu eylem izlerini o kadar iyi öğretecek yeni bir yaklaşımı inceliyor ki dijital asistanlar bir sonraki adımınızı, neyi başarmaya çalıştığınızı ve ne zaman oturumu kapatmaya hazırlandığınızı önceden sezinleyebilir.

Basit Zincirlerden Zengin Desenlere
Kullanıcının bir sonraki adımını tahmin eden birçok mevcut sistem, yalnızca en son eyleme bakarak bir sonraki adımı tahmin eden klasik matematiksel araç Markov zincirlerine dayanır. Hızlı ve kullanışlı olmakla birlikte, bu “tek adımlık hafıza” yaklaşımı; bir makine öğrenimi hattı kurma veya bir pano hazırlama gibi görevlerin birçok adım boyunca ve farklı araçlar kullanılarak ilerlediği gerçek iş ortamlarında yetersiz kalır. Yazarlar, bu tür basit modellerin uzun menzilli yapıları kaçırdığını, aynı anda yalnızca bir tahmin hedefiyle başa çıkabildiğini ve genellikle özel günlükler ve şeffaf olmayan veri temizleme tercihleri nedeniyle çalışmalar arasında karşılaştırılmasının zor olduğunu öne sürüyorlar.
Yeni Bir Çok Görevli Öğrenme Planı
Bu sınırlamaları aşmak için makale, kullanıcı davranışı için yeniden tasarlanmış dikkat tabanlı bir dönüştürücü modeli—modern dil araçlarının arkasındaki teknik aileyle aynı—tanıtıyor. Sadece bir şeyi öğrenmek yerine, model aynı anda üç ilişkili görevi çözmek üzere eğitiliyor: bir sonraki eylemi tahmin etmek (bir kullanıcının hangi API çağrısını yapacağını), oturumun genel amacını çıkarsamak (örneğin bir makine öğrenimi iş akışı çalıştırma, veri analizi yapma, kullanıcı yönetimi veya hızlı görselleştirme oluşturma) ve mevcut adımın oturumun sonu olma olasılığını belirlemek. Bu üç görevin tümü, kısa bir eylem geçmişini tek, zengin bir temsil haline getiren ortak bir “omurga” paylaşıyor; bu temsil daha sonra üç küçük tahmin modülüne besleniyor.
İn Silico Gerçekçi Bir Test Ortamı Kurmak
Gerçek kurumsal etkinlik günlükleri genellikle hassas ve paylaşılması zor olduğundan, yazarlar veri profesyonellerinin büyük bir iç platformu nasıl kullandığını taklit eden karmaşık bir simüle edilmiş ortam kuruyorlar. Kimlik doğrulama, veri girişi, işleme, model eğitimi, görselleştirme, dışa aktarma ve yönetim gibi 10 işlevsel alana gruplanmış 100 farklı API tanımlanıyor. Veri bilimciler, iş analistleri, geliştiriciler ve ileri düzey kullanıcılar olmak üzere dört kullanıcı kişiliği, belirgin ama kusurlu iş akışlarını izliyor; bu akışlar hem rutin davranışı hem de ara sıra sapmaları yansıtan olasılıklar içeriyor. Ortaya çıkan veri kümesi 2.000 kullanıcı oturumu ve 20.000 API çağrısı içeriyor; “makine öğrenimi hattı” ve “hızlı görselleştirme” gibi oturum amaçları, oturum açma, veri yükleme, veriyi işleme, grafik oluşturma ve sonucu dışa aktarma gibi tanınabilir yollar üretiyor.

Modelin Ne Kadar İyi Öngördüğü
Bu yapılandırılmış ancak çeşitli ortamda eğitilen dönüştürücü model, dikkat tabanlı öğrenmenin kullanıcı davranışındaki gizli düzenlilikleri eski yöntemlere kıyasla çok daha iyi yakalayabildiğini gösteriyor. Ana görev için—100 seçenek arasından tam olarak bir sonraki API çağrısını tahmin etme—doğru cevabı neredeyse %80 oranında kesin olarak buluyor ve doğru seçeneği ilk beş önerisi arasında %99,9’dan fazla bir sıklıkla yerleştiriyor; bu, basit bir Markov zincirine göre dört katın üzerinde bir artış. Aynı zamanda, kullanıcının genel oturum amacını yaklaşık %82 doğrulukla belirliyor ve bir oturumun sona ermek üzere olduğunu neredeyse kusursuza yakın tespit ediyor. Yazarlar ayrıca modelin nispeten küçük ve verimli olduğunu, canlı asistanların fark edilir gecikme olmadan yanıt vermesi gereken gerçek zamanlı kullanım için uygulanabilir olduğunu vurguluyorlar.
Başkalarının Yeniden Kullanması ve Genişletmesi İçin Araçlar
Yaklaşımlarını tek seferlik bir deneyimin ötesine taşımak için yazarlar, context-engineer adlı açık kaynaklı bir yazılım paketi ve tam simüle edilmiş veri kümesini yayımlıyorlar. Bu kaynaklarla diğer araştırmacılar ve uygulayıcılar bildirilen sonuçları yeniden üretebilir, ortak bir kıyas setinde alternatif modelleri test edebilir veya kendi iç günlüklerini eylemleri ve oturum etiketlerini basit bir sayısal formata eşleyerek sisteme entegre edebilirler. Bu açıklık, geçmişteki birçok sistemin verileri ve kodu erişilemez olduğu için adil karşılaştırma veya yeniden kullanım engeli oluşturan büyük bir sorunu gideriyor.
Günlük Kullanıcılar İçin Anlamı
Uzman olmayan biri için temel çıkarım, makalenin dijital araçları daha “bir adım önde” hissettirecek pratik bir tarif sunduğudur. İnsanların ne yapmaya çalıştığını, bir sonraki neye tıklama olasılıklarını ve işleri ne zaman sonlandırdıklarını birlikte öğrenerek, önerilen dönüştürücü tabanlı sistem kullanıcı geçmişlerini bir tür bağlam farkındalığına dönüştürüyor. Gerçek uygulamalarda bu, istemeden önce bir sonraki raporu hazırlayan sohbet botları, mantıklı takip eylemlerini öneren analitik platformlar ve bekleme süresini sessizce azaltan kurumsal panolar anlamına gelebilir. Mevcut çalışma simüle edilmiş verilere dayansa ve gerçek günlüklerde test edilmesi gerekse de, birçok tür dijital platformda daha akıllı, daha öngörülü yazılım yardımcıları oluşturmak için açık ve tekrarlanabilir bir temel sunuyor.
Atıf: Yin, Y. Rethink context engineering using an attention-based architecture. Sci Rep 16, 8851 (2026). https://doi.org/10.1038/s41598-026-43111-9
Anahtar kelimeler: kullanıcı davranışı tahmini, ardışık öneri, dikkat tabanlı dönüştürücü, proaktif dijital asistanlar, bağlam mühendisliği