Clear Sky Science · tr
Haber metni madenciliği ve büyük dil modeli ile Çin’de yüksek hassasiyetli heyelan olayları kataloğu
Bu heyelan haritası neden önemli
Heyelanlar her yıl binlerce insanın ölümüne ve evlerin, yolların ile tarım arazilerinin yıkımına yol açar; ancak ne zaman ve nerede gerçekleştikleri gibi temel bilgiler şaşırtıcı derecede zor bulunabilir. Bu çalışma, yıllarca süren haber raporlarını okuyacak şekilde eğitilen bir bilgisayar sistemi sayesinde Çin anakarasında binin üzerinde heyelanın ayrıntılı bir kataloğunu oluşturuyor. Ortaya çıkan açık veri seti, uyarı sistemlerini iyileştirmeye, daha güvenli yapılaşmayı yönlendirmeye ve daha akıllı afet planlamasını desteklemeye yardımcı olabilir.

Dağınık hikâyelerden ulusal bir resme
Bugüne kadar Çin’de heyelanlara ilişkin kayıtlar kısmiydi. Resmî bültenler her yıl veya her ilde kaç olay olduğunu saydı ama nadiren kesin konumlar veya zamanlar verdi. Uluslararası kataloglar ise dünya çapında en büyük veya en ölümcül olaylara odaklandı ve sıklıkla Çince yerel raporları kaçırdı. Bu durum, araştırmacılarda ülke genelindeki heyelanların nerede daha tehlikeli olduğu veya riskin zaman içinde nasıl değiştiği konusunda net, ayrıntılı bir resim bırakmadı.
Bilgisayarların haberleri okumasına izin vermek
Yazarlar, ülke genelinden sürekli haber yayınlayan büyük bir ulusal haber sitesi olan China News Network’e yöneldi. 2008–2024 arasında “heyelan” kelimesini içeren 33.000’den fazla makaleyi kazıdılar ve ardından terimin mecaz anlamda, örneğin bir seçim ya da piyasa çöküşü için kullanıldığı parçaları ayıkladılar. Sonra her gerçek afet raporundan ana bilgileri çıkarmak için büyük bir dil modeli kullandılar; bu, büyük miktarda metin üzerinde eğitilmiş gelişmiş bir yapay zekâ türüydü. Her olay için sistem meydana geldiği zamanı, yeri, tetikleyicisini ve kaç kişinin öldüğünü, yaralandığını veya kayıp olduğunu belirlemeye çalıştı.
Olayları temizleme, kontrol etme ve haritaya yerleştirme
Ham yapay zekâ çıktısı kusursuz değildir, bu yüzden ekip birden fazla kontrol katmanı ekledi. Açık zaman veya yer bilgisi olmayan kayıtlar kaldırıldı ve yalnızca bir il gibi geniş bir bölge adı veren raporlar elendi. Aynı afet hakkında birden çok haberin olması yaygın bir sorun olduğundan, olayların zaman açısından ne kadar yakın olduğunu ve konum açıklamalarının ne kadar benzer olduğunu karşılaştırarak olası kopyalar birleştirildi. Kalan tüm kayıtları insan uzmanlar gözden geçirdi ve hataları düzeltti. Yazılı yer adlarını harita koordinatlarına dönüştürmek için yazarlar bir çevrimiçi harita hizmeti ve en iyi eşleşmeyi seçmek için özel kurallar kullandı; şüpheli vakalar için tekrar manuel kontroller yapıldı.

Yeni katalogun ortaya koydukları
Nihai veri seti sıra dışı bir kesinlikle 1.582 heyelan içeriyor. Olayların yaklaşık yarısı tam saate veya hatta dakikaya kadar tarihlendirilebiliyor ve yüzde 80’den fazlası köy ölçeğinde veya yol kesimi ya da yamaç gibi belirli bir noktada konumlandırılabiliyor. Kayıtlı heyelanların çoğu özellikle Güney Çin’de görülen şiddetli yağmur nedeniyle tetiklenirken, deprem kaynaklı olaylar Tibet Platosu’nun doğu kenarına yakın bölgelerde kümeleniyor. İki yaygın kullanılan küresel heyelan veri tabanı ile karşılaştırıldığında, bu yeni katalog aynı yıllar için Çin’de yaklaşık iki buçuk kat daha fazla olayı içeriyor ve bunları hem zaman hem de mekân açısından daha kesin konumlandırıyor.
Haberleri yapay zekâyla okumanın güvenilirliği ne kadar
Doğruluğu test etmek için ekip, yapay zekâ tarafından çıkarılan kayıtlarını iyi bilinen afetlere ilişkin resmî raporlar ve ayrıntılı yerel jeolojik incelemelerle karşılaştırdı. Sistem, bir heyelanın ne zaman ve nerede meydana geldiği ve tetikleyicisinin ne olduğu gibi temel bilgileri çıkarmada çok başarılı bulundu; ancak ölü, yaralı ve kayıp sayılarını saymada daha az güvenilir olduğu görüldü çünkü bu rakamlar acil durumlar ilerledikçe sıkça değişiyor. Genel olarak, haber raporları zamanlama ve konum açısından hükümet kaynaklarıyla yakından örtüşerek böyle bir katalog oluşturmak için güvenilir bir temel oluşturduklarını doğruladı.
Gelecekteki güvenlik için bunun anlamı
Uzman olmayanlar için kilit mesaj şudur: Bilgisayarlar artık yılların haber kapsamını tarayarak tehlikeli yamaçların nerede çöktüğüne dair net, ayrıntılı haritalar oluşturabiliyor. Bu Çin heyelan kataloğu her olayı, özellikle medyada az iz bırakan küçük olayları tamamen kaydetmiyor olabilir ve can kaybı rakamları dikkatle ele alınmalı. Yine de, zamanlama ve konumdaki yüksek doğruluğu, uyarı modellerini test eden bilim insanları, nerelere yol ve yerleşim yapılacağına karar veren planlamacılar ve gelecek fırtına ile depremlere hazırlanan yetkililer için güçlü bir araç sunuyor.
Atıf: Zhao, B., Zhang, L., Liu, Z. et al. A high-precision catalogue of landslide events in China based on news text mining with large language model. Sci Data 13, 722 (2026). https://doi.org/10.1038/s41597-026-07066-w
Anahtar kelimeler: heyelan kataloğu, Çin tehlikeleri, haber metni madenciliği, büyük dil modeli, afet riski verisi