Clear Sky Science · tr
BERT modeli ve en kısa yol algoritmasına dayalı kısa metin varlık ayırt etme yöntemi
Karışık İsimleri Ayıklamanın Neden Önemli Olduğu
Her gün kısa, çoğunlukla dağınık metin parçaları—tweetler, arama sorguları, sohbet mesajları—ile arama yapar, kaydırır ve iletişim kurarız. Bu parçalar; “Apple” gibi bir meyveyi ya da şirketi ifade edebilen kişi, yer, şirket ve nesne adlarıyla doludur. Bilgisayarların bizim hangi anlamı kastettiğimizi tahmin etmesi gerekir; yanlış tahmin ettiklerinde arama sonuçları, öneriler ve çevrimiçi hizmetler çok daha az yararlı olur. Bu makale, modern dil modelleri ile akıllı bir grafik algoritmasını birleştirerek özellikle Çin sosyal medyası ve aramalarda kısa metinlerdeki bu belirsiz adların makineler tarafından doğru yorumlanmasına yardımcı olacak yeni bir yöntemi sunar.
Anahtar kelimeler: varlık ayırt etme, kısa metin, BERT, bilgi grafiği, doğal dil işleme