Clear Sky Science · tr

Açık veri, özel öğrenciler: öğrenme analitiği için kimliksizleştirilmiş öğrenci etkinliği ve performans veri seti

· Dizine geri dön

Çevrimiçi çalışma alışkanlıklarınız neden önemli

Bir öğrenci çevrimiçi bir derse her giriş yaptığında, ders slaytlarına tıkladığında veya bir tartışma gönderisini okuduğunda geride dijital ayak izleri bırakır. Bu izler kimlerin zorlandığını, kimlerin işi kolay atlattığını ve hangi öğretim stratejilerinin gerçekten işe yaradığını açığa çıkarabilir. Ancak aynı zamanda oldukça kişiseldir. Bu makale, bireysel öğrenenleri açığa çıkarmadan daha iyi öğretim için içgörü sağlamayı amaçlayan, üniversite öğrencilerinin çevrimiçi öğrenme davranışlarının büyük ve özenle anonimleştirilmiş bir veri setini tanımlar.

Figure 1
Figure 1.

Sınıf tıklamalarından araştırma değerine

Veri seti, üç akademik yıl boyunca—birçok öğretimin çevrimiçiye kaydığı COVID-19 salgını dönemini de içeren—KU Leuven’deki birinci sınıf işletme öğrencilerinden gelir. Öğrenciler iki giriş düzeyi dersi—Muhasebe ve Küresel Ekonomi—aldılar. Dersler büyük ölçüde bir öğrenme yönetim sistemine dayanıyordu; öğrenciler okumalar, slaytlar, sınavlar ve tartışma forumlarına buradan erişti. Bir dosyayı açmak veya bir forum başlığını görüntülemek gibi her etkileşim zaman damgası ile birlikte kaydedildi. Sınav sonuçlarıyla birleştirildiğinde, bu günlükler öğrencilerin yalnızca sınav günü gerçekleştirdikleri performans değil, haftalar ve aylar boyunca gerçekte nasıl çalıştıklarına dair zengin bir tablo sunar.

Veri paylaşırken öğrencileri korumak

Bu tür bilgilerin paylaşılması ciddi gizlilik endişeleri doğurur: ham kayıtlar benzersiz öğrenci tanımlayıcıları, kesin notlar ve bireyleri yeniden tanımlamayı mümkün kılabilecek kesin etkinlik zamanları içerir. Bunu önlemek için yazarlar veri setini yayımlamadan önce birkaç katman kimlik gizleme uyguladı. Öğrenci kimlikleri rastgele kodlarla değiştirildi ve gerçek kimliklere geri dönülebilecek bağlantı yok edildi. Sınav puanları kesin sayılar halinde paylaşılmadı; başarısız, sınırda, başarılı veya mükemmel gibi geniş aralıklara gruplandırıldı. Bir öğrencinin belirli çalışma programıyla ilgili ayrıntılar kaldırıldı ve çevrimiçi platformdaki içerik öğeleri, orijinal dosya adlarını korumak yerine ders materyali veya değerlendirmeler gibi genel türlere atandı.

Figure 2
Figure 2.

Hikâyeyi kaybetmeden ayrıntıları bulanıklaştırmak

Sadece isimleri çıkarmak güçlü gizlilik için yeterli değildir, bu yüzden ekip veride zaman ve yapının nasıl göründüğünü de düzeltti. Örneğin, her öğrencinin zaman damgalarına birkaç saniyelik küçük, rastgele bir kaydırma eklediler. Bu, günlükleri gerçek dünya olaylarıyla eşleştirmeyi çok daha zor hale getirirken, eylemlerin sırasını korur; bu da öğrenme desenlerini incelemek için kritik öneme sahiptir. Forum gönderileri, oturum tanımlayıcıları ve içerik kimlikleri rastgele yeniden numaralandırıldı. Araştırmacılar daha sonra k-anonimlik adı verilen standart bir ölçüt kullanarak sonucun ne kadar anonim olduğunu kontrol ettiler; bu ölçüt aynı özellik kombinasyonunu paylaşan öğrenci sayısına bakar. Çoğu durumda, dönüştürülmüş veriler bireyleri daha büyük grupların içine karıştırarak gizlilik korumasını artırdı.

Veri hâlâ gerçeği yansıtıyor mu?

Elbette, anonimleştirme veriler araştırma için yeterince gerçekçi kaldığı sürece yararlıdır. Bunu test etmek için yazarlar, önceki çalışmaların sıra dışı çalışma desenlerini tespit etmek ve sınav başarısını tahmin etmek için kullandığı onlarca öğrenme özelliğini yeniden oluşturdu. Bu özellikler arasında öğrencilerin ne sıklıkla giriş yaptığı, çalışma oturumlarını döneme nasıl yayıldığı ve forumları ne kadar aktif kullandıkları gibi ölçütler bulunur. Ekip, her bir özelliğin orijinal ve kimliksizleştirilmiş verideki dağılımlarını istatistiksel testlerle karşılaştırdı. Neredeyse tüm durumlarda iki versiyon ayırt edilemezdi; bu da gizlilik önlemlerinin öğrencilerin çevrimiçi çalışma biçiminin genel hikâyesini bozmadığını gösteriyordu. Küçük farklılıklar çoğunlukla içerik türlerinin nasıl kategorize edildiğinin iyileştirilmesinden kaynaklanıyordu, doğrudan gizlilik önlemlerinden değil.

Araştırmacılar bununla ne yapabilir

Veri seti iki farklı dersi ve pandemi gibi büyük bir kesintiyi de içeren üç yılı kapsadığı için, bulguların dersler, kohortlar ve değişen koşullar arasında ne kadar geçerli olduğunu incelemek için kullanılabilir. İnce zaman bilgisi, ders materyalleri boyunca tipik yolları izleyen süreç madenciliği çalışmalarını desteklerken, zengin forum kayıtları akran etkileşiminin sosyal ağ analizlerine temel oluşturabilir. Yazarlar ayrıca öğrenme özelliklerini yeniden inşa etmek için kod sağlıyor; bu, yeni modelleri ve yöntemleri mevcut çalışmalarla karşılaştırmayı kolaylaştırır ve eğitimde açıklanabilir yapay zekâyı araştırmayı destekler.

Kimlikleri açmadan kapıları açmak

Günlük ifadeyle, bu makale öğrencilerin çevrimiçi derslerde nasıl tıkladıklarından ve kaydırdıklarından çok şey öğrenmenin mümkün olduğunu, ancak kim olduklarını ifşa etmeden bunu yapmanın da mümkün olduğunu gösterir. Kişisel ayrıntıları düşünceli bir şekilde maskeleyip önemli desenleri koruyarak, yazarlar üniversitelerin öğrenmeyi ölçekte anlamasına ve iyileştirmesine yardımcı olabilecek halka açık bir kaynak sunuyor. Öğrenciler için bu, veriye dayalı ama gizliliklerinden ödün verilmeyen daha akıllı destek ve daha duyarlı öğretim anlamına gelebilir.

Atıf: Tiukhova, E., Van Landuyt, D., Baesens, B. et al. Open data, private learners: a de-identified student activity and performance dataset for learning analytics. Sci Data 13, 548 (2026). https://doi.org/10.1038/s41597-026-06821-3

Anahtar kelimeler: öğrenme analitiği, öğrenci gizliliği, eğitim verileri, çevrimiçi öğrenme, veri anonimleştirme