Clear Sky Science · tr

Altyapısal çok ajanlı pekiştirmeli öğrenme ile eklemeli geri getirme tabanlı endüstriyel belge soru-cevap

2026-03-14 · Dizine geri dön

Karmaşık El Kitaplarından Daha Akıllı Yardım

Günümüz sektörleri, enerji şebekeleri ve üretim gibi, ekipmanların güvenli çalışmasını sağlamak için kalın el kitaplarına, devre şemalarına ve parametre tablolarına dayanır. Operatörlerin bir alarmın neden çaldığını veya hangi anahtarın çevrileceğini gibi acil soruları olduğunda, cevap genellikle bu uzun, karışık formatlı belgelerin bir yerinde gömülüdür. Bu makale, MARL‑RAGDoc adını taşıyan yeni bir YZ sistemini tanıtıyor; amaç, bu düğümlenmiş bilgiyi tarayarak tahminler yerine doğru ve iyi dayanaklı yanıtlar sunmaktır.

Neden Sıradan YZ Gerçek El Kitaplarında Yolunu Kaybediyor

Çoğu mevcut soru‑yanıt sisteminin tüm bilgiler düz metin olduğunda, örneğin çevrimiçi bir makalede, iyi çalıştığı görülür. Endüstriyel belgeler çok farklıdır: onlarca sayfaya yayılmış metin, şemalar, akış diyagramları ve tabloları karıştırır. Farklı sorular farklı parçalara dayanır—kablolama için resimler önem taşıyabilirken, derecelendirme veya ayarlar için tablolar önemlidir. Var olan sistemler genellikle tüm içerik türlerini aynı şekilde ele alır, sabit sayıda parça çeker ve sonra bir yanıt üretir. Hangi içerik türüne ne kadar güvenileceğini veya soruya göre ne kadar derin aranacağına karar veremeyen bu yaklaşımlar, genellikle kritik kanıtları kaçırır, çok fazla alakasız materyal getirir ve bazen belgelerle desteklenmeyen “halüsinasyonlar” üretir.

Uzmanlaşmış Bir YZ Yardımcılar Takımı

MARL‑RAGDoc, belge aramayı farklı rollere sahip birkaç YZ “ajanının” birlikte oynadığı bir işbirliği oyunu olarak ele alarak bu sorunu çözer. Önce sistem, bir belge koleksiyonunu metin blokları, resimler ve tablolar gibi birçok küçük parçaya böler; her parça sayfa üzerindeki konumuyla ve başlık ya da açıklama gibi rolüyle etiketlenir. Bu parçalar, farklı formatlardaki ilişkili öğelerin birbirine yakın düşeceği ortak bir matematiksel alana eşlenir. Ardından, belirli bir soru için sistem her format içinde olası adayların kısa listelerini oluşturur—örneğin yanıtı içerebilecek en iyi metin blokları, resimler ve tablolar gibi.

Nereye Bakılacağını Öğrenen Bir Koordinatör

MARL‑RAGDoc'un merkezinde, her içerik türüne ne kadar dikkat verileceğine ve kaç adımlık aramaya ihtiyaç duyulduğuna karar veren üst düzey bir koordinatör ajan bulunur. Bu koordinatörün altında ise metin, resim ve tablo olmak üzere üç uzman ajan yer alır. Bu ajanlar hangi adayların tutulacağını, ne zaman komşu materyale (örneğin bir tablo satırının geri kalanı veya bir resmin altındaki başlık) bakılacağını ve ne zaman aramanın durdurulacağını seçer. Kritik olarak, tüm bu kararlar pekiştirmeli öğrenme yoluyla öğrenilir: ajanlar hem ilgili kanıtları ne kadar iyi getirdiklerine hem de nihai cevabın kalitesine göre ödüller alır. Zamanla sistem, sayısal sorgular için tablolara veya mekansal düzen hakkındaki sorular için diyagramlara daha fazla güvenmek gibi stratejiler öğrenir.

Kanıttan Güvenilir Yanıtlara

Ajanlar en iyi kanıtlarını bir araya getirdikten sonra, büyük bir dil modeli soru ile seçilen metin, resim ve tabloları önemlerine göre ağırlıklandırarak alır. Ardından bir cevap ve bu cevabın ne kadar eksiksiz ve iyi desteklendiğini gösteren bir kalite skoru üretir. Skor düşükse sistem başka bir getirme turunu tetikleyebilir ve ajanlardan ek materyal toplamalarını isteyebilir. Bu “getir–akıl yürüt–yansı” döngüsü, MARL‑RAGDoc’un ilk denemede emin olmadığı durumlarda kendini düzeltmesini sağlar ve desteklenmeyen tahminlerle boşlukları doldurma riskini azaltır. Aynı döngü, hangi getirme kalıplarının güçlü yanıtlara yol açtığını öğretmek için eğitime geri bildirim de sağlar.

Sistemi Teste Sokmak

Araştırmacılar, MARL‑RAGDoc’u iki kamu kriteri ve gerçek el kitapları, kılavuzlar ve teknik raporlardan oluşturdukları yeni bir enerji sektörü veri seti dahil olmak üzere üç zorlu çok modlu belge koleksiyonu üzerinde değerlendirdiler. Üçünün tamamında yeni sistem, güçlü genel amaçlı çok modlu modellerden uzmanlaşmış belge anlama ve getirme‑destekli sistemlere kadar geniş bir yelpazedeki rakipleri geride bıraktı. Toplam doğrulukta yaklaşık yüzde 5–9 puanlık iyileşme ve doğru yanıtların erken sıralanmasını ve tam eşleşmeyi gerektiren daha katı ölçümlerde benzer kazançlar sağladı. Yararlar özellikle çok uzun, çok sayfalı belgeler ve metin, tablolar ile diyagramların birleştirilmesini gerektiren sorular için belirgindi.

Gerçek Dünyadaki Operatörler İçin Anlamı

Günlük ifadeyle MARL‑RAGDoc, büyük teknik ciltleri taramayı, her soru için doğru diyagramlara veya tablolara başvurmayı ve yanıtlamadan önce işlerini çift kontrol etmeyi bilen eğitimli asistanlardan oluşan bir ekip gibidir. Belgelerin hangi bölümlerinin en önemli olduğunu dinamik olarak belirleyip geribildirimden öğrenerek, tek beden herkese uyar yaklaşımlardan daha doğru ve daha iyi gerekçelendirilmiş yanıtlar sunar. Çalışma enerji sistemi belgelerine odaklansa da aynı çerçeve, fabrika teknisyenlerinden hastane personeline kadar birçok alandaki çalışanların karmaşık el kitaplarında hızlı ve güvenli şekilde gezinmesine yardımcı olabilir.

Atıf: Qian, Y., Han, B., Yuan, Y. et al. Hierarchical multi-agent reinforcement learning for retrieval-augmented industrial document question answering. Sci Rep 16, 13512 (2026). https://doi.org/10.1038/s41598-026-41684-z

Anahtar kelimeler: endüstriyel belge SÇ, çok modlu getirme, pekiştirmeli öğrenme ajanları, getirme‑destekli üretim, teknik el kitapları