Clear Sky Science · zh
使用模糊与深度学习技术评估高校教学效果的影响因素
为什么更好的教学测量很重要
凡是既上过出色课程又上过一般课程的人都知道,教学质量可以成就或毁掉大学体验。然而,大多数大学仍依赖诸如考试成绩和学期期末调查等粗糙工具来判断教学效果。本文探讨了一种更智能的教学效果衡量方法,将两种基于计算的方法结合起来——一种擅长处理模糊、基于人的数据,另一种擅长发现隐藏模式。二者合用,有望为改进课程和支持学生提供更可靠的指导。
重新思考如何评判“好课堂”
大学教学受许多因素影响:课堂人数、教师经验、课程难度、课堂氛围以及技术使用等。传统评估体系常将这一切简化为单一的考试分数或课程评分。这种过度简化忽略了重要的背景,也无视学习中混乱且具有主观性的部分。作者认为,如果我们想理解为何有些课堂能让学生茁壮成长而另一些课堂却力不从心,就需要能够同时处理多重因素并应对不完美、基于意见的信息的工具。

一种“类人”与“模式发现”相结合的混合方法
研究提出了一种名为模糊与深度学习(FDL)的混合模型。“模糊”部分模拟人类以灰度思维而非严格二分法思考的方式——例如,用“低”“中”“高”并带有平滑过渡来描述学生表现,而不是硬性的界限。它将教学经验、师生比、课程难度等模糊输入转化为灵活的类别,然后使用诸如“如果学生表现高且班级小,则教学有效性高”之类的简单规则。与此同时,深度学习部分为多层网络,处理大量清洗和标准化的数据,发掘人类评审可能难以察觉的复杂关联。
从原始调查到有意义的信号
为检验该方法,研究者使用了来自国家学生参与调查(National Survey of Student Engagement)的数据,这是一份由北美高校大一与应届毕业生大量填写的广泛问卷。他们调整了若干问题以更聚焦教师履职情况,并检验了修订后问卷的可靠性。随后,他们实施了详尽的数据预处理流程:清理错误、填补缺失值、合并学生与教师侧的信息,并将所有数据缩放到统一范围。研究者还创建了复合指标,例如基于考试成绩、作业完成情况和出勤率的加权总评分,并使用主成分分析这一标准技术降低数据复杂度。经过处理的数据既输入到处理不精确类别的模糊逻辑模块,也输入到处理高维数值模式的深度学习网络。

新模型的表现如何?
FDL 模型在训练和测试时使用了数据的不同部分,以避免对熟悉样本产生自欺性评估。其表现与若干强基线方法进行了比较,包括标准神经网络和更先进的深度模型。在关键度量——总体准确率、精确率、召回率和 F1 分数上,该混合方法在多数情况下等同或优于对比方法,达到约 98% 的准确率且错误率略高于 10%。同样重要的是,模糊规则使其决策比黑箱模型更具可解释性。系统能够指出哪些因素组合——例如大班且教学经验不足,或苛刻课程但有强有力反馈——与较好或较差的教学结果联系最强。
这对学生与高校意味着什么
通俗地说,这项研究表明现在可以构建一个既高度准确又相对可解释的自动化“教学晴雨表”。高校不必主要依赖粗略的平均值和一次性调查,而可以使用此类系统及早发现薄弱的教学环境,识别需要针对性支持的教师或课程,并检验新政策是否真正提高了学生的学习效果。作者强调该模型并非完美——它依赖数据质量、计算开销可能较大,并不可避免地简化了教育中丰富的人文成分。但如果谨慎使用,它为使大学课堂更有效、公平并更能回应学生需求提供了一个有力的新视角。
引用: He, Z., Zhang, X., Zhang, Z. et al. Assessment of influencing factors of college and universities’ teaching effects using fuzzy and deep learning techniques. Sci Rep 16, 5168 (2026). https://doi.org/10.1038/s41598-026-35940-5
关键词: 教学有效性, 高等教育, 学生表现, 模糊逻辑, 深度学习