Clear Sky Science · tr

Çokmodlu bir dönüştürücü algoritmasına dayalı üniversite beden eğitimi derslerinde öğrenci katılımının öngörüsel analizi

· Dizine geri dön

Bu neden öğrenciler ve öğretmenler için önemli

Üniversite spor dersleri kondüsyon artırmalı, düzenli egzersiz alışkanlıkları kazandırmalı ve morali yükseltmeli, ancak birçok spor salonu ve saha hâlâ düşük katılım ve yarım ağızlı katılımla karşılaşıyor. Bu çalışma, giyilebilir cihazlar, sınıf kameraları ve kısa yazılı geri bildirimlerden elde edilen verilerin, öğretmenlere geleneksel kontrol listeleri veya dönem sonu anketlerinden daha hızlı ve daha nesnel bir içgörü sunarak öğrencilerin beden eğitimi derslerindeki katılım düzeyini otomatik olarak tahmin etmek için nasıl birleştirilebileceğini gösteriyor.

Spor derslerini zengin veri akışlarına dönüştürmek

Modern beden eğitimi derslerinde öğrenciler genellikle kalp atış hızı, adım sayısı ve hareketi izleyen cihazlar takar; kameralar grup etkinliklerini kaydeder ve çevrimiçi platformlar kısa mesajlar ve yorumlar toplar. Araştırmacılar, bu akışları bin üniversite öğrencisi için binlerce saatlik ders süresi boyunca bir araya getiren geniş bir ulusal veri kümesine erişiyor. Her on dakikalık ders dilimi, öğrencilerin nasıl hareket ettiği, bedenlerinin ne kadar zorlandığı ve derse dair söylediklerine göre eğitimli uzmanlar tarafından düşük, orta veya yüksek katılım olarak etiketlenir. Bu etiketlenmiş dilimler, bilgisayar modelinin dağınık izlenimler yerine ham veriden katılımı okumayı öğrenmesi için eğitim verisi olur.

Figure 1. Giyilebilir cihazlar, kameralar ve yorumlardan gelen veriler, öğrencilerin spor derslerine ne kadar dahil olduğunu izlemek için birleşir.
Figure 1. Giyilebilir cihazlar, kameralar ve yorumlardan gelen veriler, öğrencilerin spor derslerine ne kadar dahil olduğunu izlemek için birleşir.

Vücudu, yüzü ve kelimeleri okumayı öğreten bir model

Çalışma tek bir bilgi kaynağına güvenmek yerine sensörleri, metni ve videoyu eşit ortaklar olarak ele alan katmanlı bir model kurar. Kalp atışı ve ivme gibi sensör sinyalleri için bir dizi işleme ağı, sürekli çaba veya tekrarlayan hareket patlamaları gibi örüntüleri tespit etmeyi öğrenir. Öğrenci yorumları ve kısa yansımalar için bir dil modeli, tutum ve tonu kodlayan kompakt temsillere tüm cümleleri indirger. Video klipler içinse başka bir ağ her kareyi yamalara böler ve yüz ifadeleri, beden duruşu ile hareket kalıplarının zaman içinde nasıl geliştiğini öğrenir. Üç akışın her biri daha sonra modelin bunları etkili biçimde karşılaştırıp birleştirmesine olanak veren ortak bir sayısal uzaya dönüştürülür.

Model sinyalleri nasıl katılıma bağlar

Yaklaşımın özü, farklı veri akışlarının birbirine dikkat etmesine izin veren bir tekniktir. Önce model, kalp atışındaki eğilimler veya bir videodaki kilit anlar gibi iç yapıyı öğrenerek her akışı bireysel olarak güçlendirir. Ardından akışları birbirine bağlar; örneğin sensör verilerindeki hangi zaman dilimlerinin yorgunluktan söz eden yazılı beyanlarla eşleştiği veya hangi video bölümlerinin heyecanı çağrıştıran dil ile örtüştüğü sorularını sorar. Bu çapraz bağlantıları öğrenerek sistem, her öğrencide on dakikalık bir pencere sırasında neler olup bittiğine dair birleşik bir resim oluşturur. Son olarak bu birleşik resim, sürekli bir katılım puanı ve üç seviyeli bir kategori üreten basit bir çıktı katmanına beslenir.

Figure 2. Sensör, video ve metin sinyalleri katmanlı bloklar aracılığıyla akarak öğrencileri düşük, orta veya yüksek katılım olarak sınıflandırır.
Figure 2. Sensör, video ve metin sinyalleri katmanlı bloklar aracılığıyla akarak öğrencileri düşük, orta veya yüksek katılım olarak sınıflandırır.

Sistemin pratikte ne kadar iyi çalıştığı

Araştırmacılar çokmodlu modellerini yalnızca sensör, yalnızca video veya sadece iki veri türü kullanan mevcut yöntemlerle karşılaştırdıklarında belirgin kazanımlar görüyorlar. Yeni sistem, güçlü bir yalnız sensör temel çizgisine kıyasla tahmin hatasını beşte birden fazla azaltıyor ve katılım düzeylerini sınıflandırmada yüzde 90’ın üzerinde doğruluk sağlıyor. Önemli olarak, sınıf sırasında kullanılabilecek kadar hızlı çalışıyor; bir öğrenci için on dakika veriyi işlemek yaklaşık iki onda bir saniye sürüyor. Her seferinde bir veri türü çıkarılarak yapılan testler, üç kaynağın da değerli olduğunu; videonun en fazla katkıyı sağladığını, bunu metnin ve ardından sensörlerin izlediğini gösteriyor. Modelin içsel dikkat desenlerinin ek analizi, yükselen kalp atışı ile aktif hareket ve ardından yorgunluğun ilişkilendirilmesi gibi mantıklı ipuçlarına odaklandığını öne sürüyor.

Bu gelecekteki spor dersleri için ne anlama gelebilir

Yazarlar, dikkatle tasarlanmış bir çokmodlu sistemin beden eğitimi öğrencilerinin katılımına dair zamanında ve oldukça doğru görüntüler sağlayabileceğini; değerlendirmenin kaba izlenimlerden sürekli, veri odaklı içgörüye doğru kaymasını sağlayabileceğini sonucuna varıyor. Yaklaşım kameralar ve giyilebilir cihazlara bağlı olduğu ve gizlilik ile adalet sorularını gündeme getirdiği için kaygılar olsa da, öğretmenlerin öğrencilerin ne zaman odaklandığı, heyecanlandığı veya dikkatinin dağıldığı konusunda gerçek zamanlı geri bildirim alacağı ve etkinlikleri yerinde ayarlayabileceği bir geleceğe işaret ediyor.

Atıf: Li, J. Predictive analysis of student engagement in university physical education courses based on a multimodal transformer algorithm. Sci Rep 16, 15123 (2026). https://doi.org/10.1038/s41598-026-45928-w

Anahtar kelimeler: öğrenci katılımı, beden eğitimi, çokmodlu öğrenme, dönüştürücü model, giyilebilir sensörler