Clear Sky Science · zh

使用经改进的Kepler优化算法修正的双向循环神经网络进行大学行政服务意图分类

· 返回目录

为日常校园问题提供更智能的数字帮助

大学生现在期望无论何时都能获得快速、准确的答案——无论是在申请录取、选课登记,还是询问助学金时。本文探讨了一种专为大学行政服务设计的新型人工智能聊天机器人,重点处理英语和希腊语。通过让单一系统更好地理解学生的意图和关键细节,作者旨在让数字服务台更快速、更可靠且更易于维护。

Figure 1
Figure 1.

为何现有聊天机器人仍会困惑

大多数现代聊天机器人依赖一个称为自然语言理解的领域,它将学生的问题分解为两部分。首先是意图:学生想要做什么,例如“注册课程”或“询问截止日期”。其次是实体:问题中具体的信息片段,如课程代码、学期或专业名称。传统系统对这两项任务使用独立的模型。这种分离浪费了内存和计算资源,并可能导致不一致的回答——例如,正确识别出课程代码却未能将其与正确的操作关联。在多语种环境中,这些问题会变得更加严重,因为同一含义可以在不同语言中以多种形式表达。

一个大脑替代两个

作者提出了一个联合模型,能够同时学习识别意图和实体,使用共享的“脑”而非两个独立的模块。其核心结合了两种强大的技术。第一种是BERT,它一次性查看整个句子以捕捉整体含义。第二种是双向LSTM网络,它同时关注从左到右和从右到左的词序,有助于跟踪临近关系,例如哪个课程对应哪个学期。在这种共享理解之上,系统分为两条分支:一条预测学生的意图,另一条为每个词标注其是否为实体及其类型。

让任务彼此对话

为了充分利用这一共享“大脑”,模型包含一个“协同交互Transformer”层,使两项任务能够实时相互提供信息。当系统在判断意图时,可以参考它认为存在的实体;在标注实体时,又可以依赖看起来最可能的意图。这种交互有助于消除歧义,例如“drop”是指退课还是取消申请,且在希腊语中尤为有价值,因为希腊语的词形和词序比英语更灵活。通过共享表示和注意力,这种方法相比分别运行两个大型模型将参数数量减少近一半,使其对大学信息技术部门更具实用性。

Figure 2
Figure 2.

一种受宇宙启发的模型训练方式

训练如此复杂的模型很困难:标准优化方法可能速度慢且对超参数敏感。作者引入了发展型Kepler优化(Developed Kepler Optimization,DKO)算法,其灵感来自行星绕太阳的轨道运动。在这个类比中,不同版本的模型像行星一样在可能的参数空间中探索,同时被性能最优的“太阳”所吸引。DKO以比通常更分散的初始候选集开始,然后根据其表现不断调整它们的“轨道”。与一种流行方法Adam相比,这种方法将学习速度提高了约42%,同时使训练更稳定,尤其是在复杂的多语种数据上。

与学生的真实世界测试

研究团队在多个数据集上评估了他们的系统,包括UniWay(涵盖有关大学服务的英语和希腊语问题集合)和xSID(一项用于理解简短指令的知名基准)。在所有数据集上,联合模型持续优于基于规则的系统、较老的神经网络乃至强大的Transformer基线。在两所高校的实地试验中——一所仅用英语,另一所为双语——聊天机器人正确识别学生的意图和实体约有九成,学生满意度评分约为4.5(满分5)。即便在训练数据减少的情况下,性能仍然强劲,表明该方法在资源较少的语言和领域中也具有鲁棒性。

这对学生和大学意味着什么

对普通读者而言,关键结论是作者设计了一个更高效、更准确的大学聊天机器人“倾听引擎”。通过统一意图检测与细节提取,并采用一种受轨道启发的训练方法,他们的系统能够更好地把握学生的提问,同时使用更少的内存和训练时间。这可能转化为更快的回应、更少的误解以及全天候的多语种支持而不至于过度依赖人工。尽管仍有挑战——如适应新的政策、更多语言以及长期使用模式——该工作指向了更具响应性、公平性和可扩展性的校园帮助系统。

引用: Yang, Z., Lu, M. & Huang, S. Intent classification for university administrative services using a bidirectional recurrent neural network modified by a developed Kepler optimization algorithm. Sci Rep 16, 6263 (2026). https://doi.org/10.1038/s41598-026-35504-7

关键词: 大学聊天机器人, 意图分类, 命名实体识别, 多语种人工智能, 优化算法