Clear Sky Science · tr
Büyük ölçekli finansal olmayan bilgi açıklamaları için çok düzeyli görsel temsil veri seti
Şirket Raporlarının Görünümünün Neden Önemli Olduğu
Büyük şirketler çevresel veya sosyal etkilerinden söz ederken artık sade siyah‑beyaz belgeler yayımlamıyorlar. Sürdürülebilirlik raporları, dikkat çekmek ve izlenimleri şekillendirmek üzere fotoğraflar, simgeler ve canlı renklerle dolu. Ancak bugüne dek bu görsel tercihlerin nasıl kullanıldığını ölçmek için büyük ve nesnel bir yöntem yoktu. Bu çalışma, binlerce Çinli sürdürülebilirlik raporunun görünümünü sayısal verilere dönüştüren yeni bir veri seti ve ölçüm sistemi sunuyor; araştırmacıların, düzenleyicilerin ve vatandaşların şirketlerin tasarım yoluyla nasıl iletişim kurduğunu sözlerin ötesinde anlamasına yardımcı oluyor.

Rapor Yığınlarından Düzenli Görsel Veriye
Yazarlar, Shanghai ve Shenzhen borsalarında listelenen Çinli şirketlerin sürdürülebilirlik raporlarını ülkenin resmi açıklama platformu CNINFO üzerinden topladı. 2006–2024 mali yıllarını kapsayan koleksiyon, Çin’de finansal olmayan raporlamanın nadir bir uygulamadan, özellikle borsanın yeni kuralları firmaları sosyal ve çevresel konuları raporlamaya teşvik ettikten sonra yaygın bir uygulamaya dönüşümünü yakalıyor. Tüm belgeler, görsel düzenlerini korumak amacıyla orijinal PDF formatında indirildi. Otomatik bir Python betiği bozuk dosyaları elemiş, hisse kodu ve yıl gibi temel bilgileri çıkarmış ve her dosyanın zaman içinde benzersiz ve güvenilir şekilde izlenebilmesi için raporları standartlaştırılmış bir klasör sisteminde düzenlemiş.
Sayfaları Metin, Resim ve Renge Bölmek
Görselleri ölçekli olarak analiz etmek için ekip her rapor sayfasını yüksek çözünürlüklü görüntülere dönüştürdü ve ardından bu sayfaları anlamlı parçalara ayırmak için modern bilgisayarla görme araçları kullandı. Bir düzen analizi modeli, her sayfada metin bloklarının, resimlerin, tabloların, başlıkların ve diğer öğelerin nerede göründüğünü belirledi. Metin bölgeleri, yalnızca kelimeleri okumakla kalmayıp satır aralığı, sayfaya göre yazı tipi boyutu ve her satırda ve sayfada kaç kelime yer aldığı gibi özellikleri de ölçen optik karakter tanıma sistemine aktarıldı. Görsel bölgeler, şirketin veri odaklı görsellere mi yoksa duygusal, fotoğraf temelli anlatıma mı daha çok dayandığını yakalamak için “soyut” (grafikler veya simgeler gibi) veya “gerçekçi” (fotoğraflar gibi) olarak sınıflandırıldı. Aynı zamanda bir renk analizi rutini her pikseli tarayıp birkaç temel renk kategorisinden birine ayırdı ve her rengin sayfada ne kadar yer kapladığını hesapladı.
Görsel Tarzı Sayılara Dönüştürmek
Bu yapı taşlarından araştırmacılar, her sayfanın ve her raporun metin, görüntü ve renk kullanımını gösteren 18 ayrıntılı gösterge tanımladı—resimlerin kapladığı alan payından sıcak ve soğuk tonlar arasındaki dengeye kadar. Ardından bu göstergeleri iki ana indekste birleştirdiler. Bilgi Entropisi İndeksi, renk paletinin ne kadar çeşitli olduğuna bakarak görsel karmaşıklığı ölçer: benzer oranlarda çok sayıda farklı renk kullanan sayfalar yüksek puan alırken basit, neredeyse tek renkli sayfalar düşük puan alır. Özellik‑Korelasyon İndeksi ise bu 18‑boyutlu özellik uzayında sayfaların birbirine ne kadar benzediğini hesaplayarak bir raporun sayfalar arası görsel tutarlılığını yakalar. Düşük değerler sayfaların istikrarlı bir görsel stil izlediğini; yüksek değerler ise belgenin içinde tasarımın daha dramatik şekilde değiştiğini gösterir.

Sayıların İnsan İzlenimleriyle Uyuştuğunu Kontrol Etmek
Herhangi bir indeksin değeri insanların gerçekten gördüklerini yansıtıp yansıtmadığına bağlı olduğundan ekip ölçümlerini dikkatle doğruladı. Bilgisayarla görme modellerini binlerce elle etiketlenmiş sayfa ve görüntü üzerinde ince ayar yaptı ve düzen öğelerini tanıma, metni okuma ile soyut diyagramları gerçekçi fotoğraflardan ayırmada yüksek doğruluk seviyelerine ulaştı. Yeni indeksleri test etmek için NFIVI puanlarını insan uzmanların ve farklı raporların ne kadar karmaşık ve ne kadar tutarlı göründüğünü değerlendirmeleri istenen birkaç yapay zeka sisteminin verdiği derecelendirmelerle karşılaştırdılar. Güçlü korelasyonlar, daha yüksek entropi puanlarının gerçekten daha yoğun, daha renkli düzenlerle; daha düşük özellik‑korelasyon puanlarının ise insan gözüne görsel olarak daha sabit ve bütünleşmiş görünen raporlarla ilişkili olduğunu gösterdi.
Okuyucular ve İzleyiciler İçin Ne Anlama Geliyor
Günlük ifadeyle bu çalışma binlerce kurumsal sürdürülebilirlik raporu için bir tür “görsel parmak izi” oluşturuyor. Araştırmacıların, örneğin çevresel performansı zayıf olduğu düşünülen firmaların parlak renkler ve parlak görsellerle daha mı çok örtbas etmeye çalıştığını, yoksa daha ciddi tasarımların daha güvenilir açıklamalarla mı eşlik ettiğini sorgulamasına olanak tanıyor. Düzenleyiciler ve denetleyici kuruluşlar bu araçları potansiyel olarak yanıltıcı tasarımları tespit etmek veya yeni kurallar getirildikten sonra raporlama stillerinin nasıl değiştiğini izlemek için kullanabilir. Sayfa düzenlerini, görsel seçimlerini ve renk şemalarını şeffaf metriklere çevirerek veri seti, şirketlerin ne söylediğini değil, nasıl göstermeyi seçtiklerini de incelemeyi mümkün kılıyor.
Atıf: Li, B., Xia, B., Cheng, Z. et al. A multi-level visual representation dataset for large-scale non-financial information disclosure. Sci Data 13, 500 (2026). https://doi.org/10.1038/s41597-026-06848-6
Anahtar kelimeler: sürdürülebilirlik raporlaması, görsel iletişim, kurumsal açıklama, veri odaklı denetim, çevresel sosyal yönetişim