Clear Sky Science · tr

Yorumlanabilirlikle öğrenci başarısını tahmin etmek için çok parametreli optimize edilmiş inanç kural tabanı

2026-01-19 · Dizine geri dön

Notları tahmin etmek neden herkesin işi?

Karne notları basit görünebilir, ancak bir öğrencinin notlarını şekillendiren etkenler kesinlikle öyle değildir. Okullar, zorlanan öğrencileri erken tespit etmek ve destek yönlendirmeleri yapmak için giderek daha fazla bilgisayar modellerine başvuruyor. Yine de bu modellerin çoğu "kara kutu" niteliğinde: doğru olabilirler ama öğretmenler ve veliler bile bir tahminin neden yapıldığını göremez. Bu makale, hem yüksek doğruluk hem de anlaşılabilirlik hedefleyen yeni bir yaklaşım sunuyor; böylece eğitimciler sonuçlara güvenebilir ve ona göre hareket edebilir.

Sinyalleri okumada daha akıllı bir yol

Çalışma, okulların zaten topladığı bilgiler kullanılarak öğrencilerin nihai performansının nasıl olacağını tahmin etmeye odaklanıyor: not ortalaması (GPA), devamsızlık, çalışma süresi, geçmiş ve aile ile etkinlik faktörleri. Şeffaf olmayan derin öğrenme sistemlerine dayanmaktansa, yazarlar inanç kural tabanı adlı bir tekniği temel alıyor. Bu çerçevede uzmanlar, bir öğretmenin söyleyebileceğine çok benzeyen kurallar yazarlar: "Eğer GPA yüksek ve devamsızlık düşükse, öğrenci muhtemelen iyi performans gösterecektir." Her kural, Mükemmel, İyi, Geçer, Orta veya Başarısız gibi olası sonuçlara ilişkin bir inanç derecesi taşır. Bu, akıl yürütme sürecini görünür kılar ve ilke olarak uzman olmayanlara açıklanabilir hale getirir.

Anlamı kaybetmeden karmaşıklığı kontrol altına almak

Kural tabanlı sistemlerin başlıca zorluklarından biri, çok sayıda öğrenci özniteliği dahil edildiğinde kontrolden çıkabilmesidir: her ekstra faktör olası kural sayısını katlayarak artırır. Bu "kural patlaması"ndan kaçınmak için araştırmacılar önce performans tahmininde hangi özelliklerin en önemli olduğunu ölçmek üzere yaygın kullanılan bir karar ağacı topluluğu olan rastgele orman (random forest) kullanıyorlar. Kamuya açık 2.392 öğrenciden oluşan gerçek veri kümelerinde, GPA ve devamsızlık sayısı modelin öngörü gücünün yaklaşık %73'ünü açıklıyor. Maksatlı olarak yalnızca bu iki girişi tutarak, nihai model kompakt ve yorumlaması daha kolay kalırken öğrenci sonuçlarındaki çoğu değişimi yine de yansıtıyor.

İnsanların izleyebileceği kurallar oluşturmak

IBRB-m adlı yeni modelin çekirdeği, GPA ve devamsızlık düzeylerini beş performans kategorisi için inanç dereceleriyle birleştiren özenle yapılandırılmış 25 kural setidir. Yazarlar bu tür bir modelin "yorumlanabilir" olması ne anlama geldiğini resmi hâle getirir. Gereksinimleri arasında: her referans düzeyi (örneğin "düşük GPA") açık ve ayırt edici bir aralığı kapsamalı; kural tabanı girdilerin tüm gerçekçi kombinasyonlarını kapsamalı; kural ağırlıkları ve öznitelik ağırlıkları gibi parametrelerin günlük hayatta anlamı olmalı; ve sistemin iç hesaplamaları bilgiyi şeffaf, matematiksel olarak tutarlı bir şekilde dönüştürmelidir. Bu geleneksel koşulların üzerine, modelin tahminlerini sağduyuya uygun şekillere zorlayan eğitim-odaklı yönergeler eklerler—örneğin aynı anda bir öğrencinin hem çok muhtemel şekilde başarılı hem de başarısız olarak değerlendirilmesi gibi garip durumların önlenmesi.

Uzmanların söylediklerini verinin ince ayarıyla bırakmak

İnsan uzmanlar her zaman aynı fikirde olmaz ve başlangıç kuralları kesin olmayabilir. Bu kuralları modeli kara kutuya çevirmeden iyileştirmek için yazarlar, sıkı yorumlanabilirlik kısıtlarına uyan daha iyi parametre değerlerini arayan geliştirilmiş bir optimizasyon algoritması tasarlarlar. Bu algoritma yalnızca kural ağırlıklarını ve inanç derecelerini değil, aynı zamanda Mükemmel veya Geçer gibi kategorileri tanımlayan eşik noktalarını da ayarlar. Tüm değişiklikleri uzman onaylı sınırlar içinde tutar ve notlar boyunca makul, düzgün inanç paternlerini dayatır. Fiilen bilgisayar, uzman sistemini daha yüksek doğruluğa doğru "dürter", ancak bilgili bir öğretmeni şaşırtacak kurallar icat etmesine izin verilmez.

Pratikte ne kadar iyi çalışıyor?

Kaggle öğrenci performansı veri seti üzerinde test edildiğinde, IBRB-m modeli nihai performans düzeylerini vakaların %99'undan fazlasında doğru tahmin ederek önceki inanç-kuralı sistemleri ve sinir ağları, rastgele ormanlar ve k-en yakın komşu gibi yaygın makine öğrenmesi araçlarını geride bırakıyor. Aynı derecede önemli olarak, optimize edilmiş kurallar basit bir uzaklık metriğiyle ölçüldüğünde orijinal uzman değerlendirmelerine yakın kalıyor; bu da her tahminin arkasındaki akıl yürütmenin hâlâ izlenip gerekçelendirilebileceği anlamına geliyor. Verinin birden çok bölünmesi üzerinden yapılan çapraz doğrulama, modelin performansının tesadüfi bir şans bölünmesi olmadığını, istikrarlı olduğunu gösteriyor.

Bu sınıflar için ne anlama geliyor?

Okur için temel çıkarım, güçlü ve anlaşılabilir öğrenci tahmin araçlarının mümkün olduğudur. Gizemli risk puanları vermek yerine model, "orta düzey GPA ama sık devamsızlık" gibi somut desenleri vurgulayabilir ve bunların nasıl Orta ya da Başarısız tahminine yol açtığını gösterebilir. Öğretmenler ve danışmanlar daha sonra devamsızlık desteği veya çalışma becerileri koçluğu gibi hedefe yönelik önlemlerle yanıt verebilir ve öğrencilere ve velilere modelin sonucuna neden vardığını güvenle açıklayabilir. Yazarlar, doğruluk ile şeffaflığın bu birleşiminin, veri odaklı sistemlerin adil ve etkili eğitimi desteklemede güvenilir bir rol oynaması için gerekli olduğunu savunuyorlar.

Atıf: Li, J., Zhou, W., Jiang, S. et al. The multi-parameter optimized belief rule base for predicting student performance with interpretability. Sci Rep 16, 5772 (2026). https://doi.org/10.1038/s41598-026-35950-3

Anahtar kelimeler: öğrenci performansı tahmini, yorumlanabilir yapay zeka, inanç kural tabanı, eğitsel veri madenciliği, Açıklanabilir makine öğrenmesi