Clear Sky Science · tr

Coğrafi anlamsal özellikleri entegre ederek Çince mekânsal ilişki çıkarımı modeli

· Dizine geri dön

Bilgisayarlara Yerlerin Nerede Olduğunu Öğretmek

Her gün konumları basit ifadelerle tanımlarız: bir kasaba nehrin güneyinde yer alır, bir park bir üniversitenin yakınındadır, bir kara yolu bir vilayetten geçer. Bu tür günlük dili hassas dijital bilgiye dönüştürmek akıllı haritalar, navigasyon uygulamaları ve coğrafi araştırmalar için hayati öneme sahiptir. Bu makale, PURE‑CHS‑Attn adını taşıyan yeni bir yöntemi sunar; bu yöntem bilgisayarların Çince metinleri okumasına ve yerler arasındaki mekânsal ilişkileri önceki yaklaşımlardan daha doğru biçimde otomatik olarak belirlemesine yardımcı olur.

Mekânsal Dil Neden Önemli?

Mekânsal ilişkiler, yerlerin mekânda nasıl bağlantılı olduğunu anlatan “içinde”, “yanında”, “kuzeyinde” veya “30 kilometre uzaklıkta” gibi sözcükler ve öbeklerdir. Bunlar, haritalarda gördüğümüz gerçek dünya ile kafamızdaki kavramlar arasında köprü kurar. Coğrafi bilgi sistemlerinde (CBS) bu ilişkiler, verilerin nasıl düzenlendiğinin, arandığının ve analiz edildiğinin temelini oluşturur. Uydu görüntülerinin birleştirilmesi, videodaki hareketlerin izlenmesi, endüstriyel yerleşim planlaması veya iklim ile arazi şekillerinin biyolojik çeşitliliği nasıl etkilediğinin incelenmesi gibi başka alanlarda da merkezidir. Bu bilgilerin büyük bölümü doğal dilde yazıldığı için metni okuyup mekânsal ilişkileri otomatik olarak çıkarabilen güvenilir araçlara sahip olmak giderek daha önemli hale geliyor.

Figure 1
Figure 1.

Ham Metinden Haritalı İlişkilere

Yazarlar Çince metinlere odaklanıyor ve PURE olarak bilinen güçlü bir derin öğrenme hattı modelinin üzerine inşa ediyorlar. Geliştirdikleri model PURE‑CHS‑Attn birkaç aşamada çalışıyor. İlk olarak, dağlar, nehirler, şehirler ve idari bölgeler gibi coğrafi varlıkları cümlelerde tarayıp her birini bir türle (örneğin kara yüzeyi, su kütlesi, kamu tesisi, tarihi alan veya idari bölge) etiketliyor. Sonra iki yerin nasıl ilişkili olduğunu gösteren “sözcük özelliği” niteliğindeki mekânsal ilişki kelimelerini—örneğin “sınır komşusu”, “üzerinden akar”, “güneyinde” veya “yakınında”—tespit ediyor. Güçlü bir dil modeli olan BERT‑wwm‑ext, her cümledeki karakterleri anlam ve bağlamı yakalayan sayısal vektörlere dönüştürüyor. Bu vektörler, varlıkları ve ilişki sözcüklerini tanıyan ayrı bileşenlere besleniyor ve ardından sonuçlarını bir füzyon modülüne iletiyor.

İnsan Bilgisini Makine Öğrenimiyle Harmanlamak

Çalışmanın önemli yeniliklerinden biri, coğrafi bilgiyi öğrenilmiş metin kalıplarıyla nasıl birleştirdiğidir. Her kelimeyi eşit düzeyde ele almak yerine model, insanların doğal olarak kullandığı iki tür anlamsal bilgiden yararlanıyor: her coğrafi varlığın türü ve onları birbirine bağlayan özgül mekânsal özellik sözcükleri. Füzyon modülü ilk olarak iki varlığın vektörlerini, farklı yer türlerinin (örneğin iki idari bölge ile bir nehir ve bir ilçe arasındaki ilişkiler) farklı ilişki türlerine katılma sıklığına bağlı ağırlıklarla birleştiriyor. Ardından mekânsal özellik sözcüklerinin vektörlerini harmanlıyor. Bu “temel füzyon”un üzerine yazarlar, modelin varlık–sözcük kombinasyonunun en bilgilendirici kısımlarına dinamik olarak odaklanmasını sağlayan bir dikkat (attention) mekanizması ekliyor. Son füzyon temsili bir sınıflandırıcıya veriliyor; sınıflandırıcı cümledeki her iki yer çifti arasındaki topolojik (içerme veya bitişiklik gibi), yönsel (kuzey, güney vb.) veya uzaklığa dayalı olmak üzere bir veya daha fazla ilişki türü atayabiliyor.

Modeli Teste Sokmak

Yaklaşımını değerlendirmek için ekip, Çin Coğrafyası Ansiklopedisi’nden derlenmiş ve dikkatle açıklanmış bir veri kümesi oluşturdu; bu küme 1381 cümle ve 368 mekânsal ilişki çiftinden oluşuyor. Modelin birkaç versiyonunu karşılaştırdılar: yalnızca kaba konum bilgisi kullanan bir temel model, daha ince varlık türleri içeren bir versiyon, ayrıca mekânsal özellik sözcüklerini ekleyen bir versiyon ve yeni füzyon ve dikkat tasarımına sahip tam PURE‑CHS‑Attn modelleri. Kesinlik (precision), geri çağırma (recall) ve F1 skoru gibi standart metriklere göre PURE‑CHS‑Attn, temele kıyasla yaklaşık %7 daha iyi kesinlik, %6,5 daha iyi geri çağırma ve %6,7 daha iyi F1 sağladı. Özellikle topolojik ve yönsel ilişkileri tanımada güçlüydü ve nadir görülen “few‑shot” ilişki türlerini daha basit modellere göre daha iyi işledi. Büyük dil modellerine dayanan bir sistem de dahil olmak üzere üç son teknoloji sistemle karşılaştırıldığında PURE‑CHS‑Attn yakından ikinci oldu; buna karşın çok daha hafif ve dağıtımı daha kolay kaldı.

Figure 2
Figure 2.

Zorluklar ve Gelecek Yönelimleri

Bu kazanımlara rağmen model hâlâ özellikle az sayıda eğitim örneğinin bulunduğu durumlarda mesafe ilişkileriyle zorlanıyor. Yazarlar veri setlerinin bu tür örnekleri çok az içerdiğini gösteriyor; bu da veri‑açgözlü herhangi bir yöntemin öğrenebileceklerini sınırlıyor. Ayrıca bir cümledeki birçok mekânsal özellik sözcüğünü körü körüne ortalamak gürültü ekleyebilir; dikkat mekanizmaları buna yardımcı oluyor fakat tamamen çözmüyor. İleriye bakıldığında, veri çoğaltmayla eğitim verilerini genişletme ve dengeleme ile coğrafi anlamsal füzyonu büyük dil modelleri ve prompt‑temelli öğrenme teknikleriyle birleştirmenin, veri kıtlığı olan senaryolarda performansı daha da artırırken sistemi verimli tutmanın iki umut verici yol olduğunu öneriyorlar.

Günlük Haritacılık İçin Ne Anlama Geliyor?

Basitçe söylemek gerekirse, bu araştırma bilgisayarlara Çince mekânsal betimlemeleri insanların yaptığına daha çok benzer şekilde okumayı öğretiyor; hangi tür yerlerin bahsedildiğine ve ilişkilerinin tam olarak nasıl ifade edildiğine dikkat ederek. PURE‑CHS‑Attn modeli yapılandırılmış coğrafi bilgiyi modern derin öğrenmeyle harmanlamanın metinden “kim nereye, neye göre” bilgisini çıkarmada daha doğru ve dayanıklı sonuçlar verdiğini gösteriyor. Bu, daha akıllı ve daha otomatik CBS sistemlerine, zenginleşmiş coğrafi bilgi grafikleri ve bilim, politika ile günlük iletişimde mekânın nasıl tasvir edildiğini keşfetmeye yönelik daha iyi araçlara giden yolu açıyor.

Atıf: Ye, P., Wang, Y., Jiang, Y. et al. Chinese spatial relation extraction model by integrating geographic semantic features. Sci Rep 16, 5537 (2026). https://doi.org/10.1038/s41598-026-35282-2

Anahtar kelimeler: mekânsal ilişki çıkarımı, coğrafi yapay zeka, coğrafi anlambilim, Çince metin madenciliği, CBS otomasyonu