Clear Sky Science · tr

SCB-YOLO: karmaşık sınıf ortamlarında öğrenci davranışı tespiti için hafif uyarlanabilir dikkat güçlendirilmiş ağ

· Dizine geri dön

Sınıfa Yeni Bir Bakış

Öğretmenler her zaman öğrencilerin dinleyip dinlemediğini, okuyup okumadığını veya sessizce dalıp dalmadığını gözleri ve içgüdüleriyle değerlendirmiştir. Ancak günümüzün kalabalık sınıflarında ve veri odaklı okullarında tek bir kişinin her çocuğun davranışını gerçek zamanlı izlemesi neredeyse imkânsızdır. Bu makale, sıradan sınıf videolarından—zayıf aydınlatma, kalabalık ve görsel karmaşa gibi zorlu koşullar altında bile—öğrencilerin el kaldırma, okuma veya yazma gibi temel davranışlarını otomatik olarak tespit edebilen kompakt bir yapay zeka sistemi olan SCB-YOLO’yu sunuyor. Amaç öğretmenlerin yerini almak değil; öğrencilerin nasıl katıldıkları hakkında daha nesnel ve sürekli bir bilgi akışı sağlayarak daha kişiselleştirilmiş ve duyarlı öğretime kapı açmaktır.

Figure 1
Figure 1.

Öğrenci Davranışlarının Önemi

Basit sınıf hareketleri beklenmedik derecede fazla bilgi taşır. Sık el kaldırma, düzenli okuma ve odaklanmış yazma, öğrencilerin ne kadar iyi öğrendiği ve kendilerini ne kadar ilgili hissettikleriyle güçlü bir şekilde ilişkilidir. Geleneksel olarak öğretmenler veya gözlemciler bu davranışları elle kaydetmeye çalıştı; bu süreç yavaş, öznel ve birkaç dersten fazlasına ölçeklendirmesi zordur. Otomasyona yönelik ilk girişimler taşınabilir sensörler veya odadaki özel donanımlar kullanıyordu; bu cihazlar müdahaleci, maliyetliydiler ve gizlilik endişeleri doğuruyordu. Buna karşılık modern bilgisayarlı görü, birçok okulda zaten bulunan sıradan video akışlarından çalışabilir ve sınıfı bozmayarak ham pikselleri öğrencilerin davranışlarının bir kaydına dönüştürebilir.

Ham Videodan Tanınmış Davranışa

SCB-YOLO, bir görüntüde nesneleri tek hızlı geçişte tespit edip konumlandırabilen YOLO olarak bilinen popüler bir görme modeli ailesi üzerine kuruludur. Yazarlar, hafif YOLOv11n varyantını uyarlayarak ilkokul sınıfları için yeniden şekillendirir; bu ortamlar eşit olmayan aydınlatma, dağınık sıralar ve duvarlar, ayrıca öğrencilerin sıkça birbirini engellemesi gibi zorluklar barındırır. SCB-Dataset3-S adlı veri setleri, el kaldırma, okuma ve yazma olmak üzere üç temel davranışla etiketlenmiş 5.000’den fazla gerçek sınıf görüntüsü içerir. Bu kategoriler, eğitim açısından önemli olmalarının yanı sıra görsel olarak da zorlu oldukları için seçilmiştir—özellikle yazma ile okumayı ayırt etmek, yalnızca el ve baş pozisyonundaki ince değişikliklerle farklılık gösterebilir.

Kenarlıkları Keskinleştirme ve Ölçekleri Birleştirme

SCB-YOLO’nun gerçek dünya sahnelerindeki karışıklıkla başa çıkmasına yardımcı olan iki ana yenilik vardır. Birincisi, Küresel Kenar Bilgisi Aktarım (Global Edge Information Transfer) modülü, havaya kaldırılmış bir kolun sınırı veya bir el ile defter arasındaki kenar gibi dış hatlara ve konturlara odaklanır. Klasik kenar filtreleri doğrudan ham görüntüye değil, ağın erken katman özelliklerine uygulanıp sonra bu rafine kenarlar daha derin katmanlara verildiğinde, sistem özellikle küçük veya kısmen gizlenmiş öğrenciler için el kaldırma ve yazma gibi davranışların etrafında sıkı kutular çizmede daha iyi olur. İkincisi, MANet_Star adlı yeni bir füzyon modülü farklı görüntü ölçeklerinden gelen bilgileri daha akıllıca birleştirir. Bu modül, dikkat benzeri birkaç hafif dal üzerinden özellikleri geçirerek en bilgilendirici desenleri güçlendirir ve aynı zamanda genel modeli gerçek zamanlı kullanım için yeterince kompakt tutar.

Figure 2
Figure 2.

Sistemin Performansı

SCB-Dataset3-S kıyaslamasında SCB-YOLO, çeşitli diğer hafif YOLO modellerinin önüne geçer. Standart bir doğruluk ölçüsü olan mAP@0.5’i YOLOv11n başlangıç noktasına göre 2.6 puan artırarak %71.8’e çıkarır ve hâlâ video hızlarında çalışır. Kazançlar özellikle en zor durum olan yazma kategorisinde büyük olup doğruluk diğer kategorilere göre daha fazla artmış ve okumayla karışma belirgin şekilde azalmıştır. Ağın iç ısı haritalarının görsel analizleri, temel modele kıyasla SCB-YOLO’nun kitaplara, ellere ve başlara—özellikle küçük veya uzak öğrenciler için—daha hassas odaklandığını gösterir. Güçlü bir masaüstü grafik kartından kompakt bir Jetson uç modülüne kadar değişen cihazlarda yapılan testler, sistemin gerçekçi konuşlandırmalarda rahatça gerçek zamanın üzerinde çalışabileceğini gösterir.

Geleceğin Sınıfları İçin Anlamı

Uzman olmayanlar için temel çıkarım, artık sınıf kameralarının sadece kayıt yapmanın ötesinde bir şeyler yapmasının mümkün olduğudur—öğrencilerin ne yaptığını ve ne kadar ilgili göründüklerini temel bir düzeyde anlayabilirler. SCB-YOLO, kenarları keskinleştiren ve ölçekler arasında bilgiyi harmanlayan özenle tasarlanmış modüllerle, nispeten küçük bir yapay zeka modelinin kalabalık ve kusurlu koşullarda bile temel öğrenme davranışlarını güvenilir şekilde tespit edebileceğini gösteriyor. Yakın gelecekte bu tür sistemler öğrenme analitiği ve etüt platformlarına veri sağlayarak dikkat azaldığında öğretmenleri uyarabilir, hangi derslerin öğrencileri kaybettiğini vurgulayabilir ve daha hedefli öğretimi destekleyebilir. Sorumlu kullanıldığında ve güçlü gizlilik önlemleriyle birlikte uygulandığında, bu teknoloji her çocuğun ihtiyacı olan dikkatle desteklenmesine sessiz ama güçlü bir yardımcısı olabilir.

Atıf: Guo, C., Yuan, B., Xie, J. et al. SCB-YOLO: a lightweight adaptive attention-enhanced network for student behavior detection in complex classroom settings. Sci Rep 16, 13309 (2026). https://doi.org/10.1038/s41598-026-43753-9

Anahtar kelimeler: akıllı sınıf, öğrenci katılımı, bilgisayarlı görü, davranış tespiti, hafif derin öğrenme