Clear Sky Science · ru

Классификация намерений для университетских административных сервисов с использованием двунаправленной рекуррентной нейронной сети, модифицированной разработанным алгоритмом оптимизации Kepler

· Назад к списку

Более умная цифровая помощь для повседневных вопросов кампуса

Студенты университетов сегодня ожидают быстрых и точных ответов в любое время суток — будь то подача заявления на поступление, регистрация на курсы или вопросы о финансовой помощи. В этой статье исследуется новый тип чат-бота на базе ИИ, разработанный специально для университетских административных сервисов с акцентом на работу на английском и греческом языках. Обучая одну систему лучше понимать, что имеют в виду студенты и какие детали важны, авторы стремятся сделать цифровые справочные службы быстрее, надежнее и проще в эксплуатации.

Figure 1
Figure 1.

Почему современные чат-боты все еще путаются

Большинство современных чат-ботов опираются на область, называемую пониманием естественного языка, которая разбивает вопрос студента на две основные части. Первая — намерение: что студент хочет сделать, например «записаться на курс» или «узнать о дедлайне». Вторая — сущности: конкретные фрагменты информации внутри вопроса, такие как код курса, семестр или название программы. Традиционные системы используют отдельные модели для этих двух задач. Такое разделение расходует память и вычислительные ресурсы и может приводить к несогласованным ответам — например, корректно выявляя код курса, но не связывая его с нужным действием. Эти проблемы усугубляются в многоязычных условиях, где одна и та же мысль может выражаться разными способами на разных языках.

Один «мозг» вместо двух

Авторы предлагают совместную модель, которая учится распознавать и намерения, и сущности одновременно, используя общий «мозг» вместо двух отдельных. В её основе — сочетание двух мощных подходов. Первый, BERT, рассматривает всё предложение целиком, чтобы уловить его общее значение. Второй, двунаправленная LSTM-сеть, внимательно отслеживает порядок слов слева направо и справа налево, что помогает фиксировать локальные связи, например какой курс относится к какому семестру. На базе этого общего представления система разделяется на два «головных» блока: один предсказывает намерение студента, другой помечает каждое слово как сущность или нет.

Позволяя задачам взаимодействовать

Чтобы максимально использовать общий «мозг», модель включает слой «ко-интерактивного трансформера», который позволяет двум задачам информировать друг друга в реальном времени. Когда система принимает решение о намерении, она может посмотреть на сущности, которые, по её мнению, присутствуют; при пометке сущностей она может опираться на наиболее вероятное намерение. Такое перекрестное взаимодействие помогает разрешать двусмысленности, например относится ли «отчислиться» к выходу из курса или к отмене заявки, и особенно важно для греческого языка, где формы слов и порядок слов более гибки, чем в английском. Благодаря совместному использованию представлений и внимания модель сокращает количество параметров почти вдвое по сравнению с запуском двух больших моделей по отдельности, что делает её более практичной для университетских ИТ-служб.

Figure 2
Figure 2.

Космически вдохновленный способ обучения модели

Обучение такой богатой модели затруднено: стандартные методы оптимизации могут работать медленно и требовательны к тонкой настройке. Авторы представляют алгоритм Developed Kepler Optimization (DKO), вдохновлённый движением планет вокруг солнца. В этой аналогии разные версии модели подобны планетам, исследующим пространство возможных настроек параметров и притягиваемым к наилучшей «звезде». DKO стартует с более разнообразного распределения кандидатов, чем обычно, а затем непрерывно корректирует их «орбиты» в зависимости от их производительности. Такой подход ускоряет обучение примерно на 42% по сравнению с популярным методом Adam, одновременно делая процесс тренировки более стабильным, особенно при работе со сложными многоязычными данными.

Полевые испытания со студентами

Команда оценивала свою систему на нескольких наборах данных, включая UniWay — коллекцию английских и греческих вопросов по университетским услугам, и xSID — известный бенчмарк для понимания коротких команд. Во всех случаях совместная модель последовательно превосходила системы на основе правил, более старые нейронные сети и даже сильные трансформерные базовые модели. В полевых испытаниях в двух университетах — одном англоязычном и одном двуязычном — чат-бот правильно идентифицировал намерения и сущности студентов примерно в девяти случаях из десяти, а студенты оценивали удовлетворённость примерно в 4.5 из 5. Производительность оставалась высокой даже при сокращении обучающих данных, что указывает на устойчивость метода в условиях ограниченных ресурсов и в новых предметных областях.

Что это значит для студентов и университетов

Для непрофессионала ключевая мысль в том, что авторы разработали более эффективный и точный «движок восприятия» для университетских чат-ботов. Объединив обнаружение намерений и извлечение деталей, а также применив орбитально-вдохновлённый метод обучения, их система способна лучше улавливать, что спрашивают студенты, при этом требуя меньше памяти и времени на обучение. Это может означать более быстрые ответы, меньше недопониманий и круглосуточную многоязычную поддержку без излишней нагрузки на персонал. Хотя остаются вызовы — адаптация к новым политикам, большему количеству языков и долгосрочным моделям использования — работа указывает путь к справочным системам кампуса, которые кажутся более отзывчивыми, справедливыми и масштабируемыми.

Цитирование: Yang, Z., Lu, M. & Huang, S. Intent classification for university administrative services using a bidirectional recurrent neural network modified by a developed Kepler optimization algorithm. Sci Rep 16, 6263 (2026). https://doi.org/10.1038/s41598-026-35504-7

Ключевые слова: университетские чат-боты, классификация намерений, распознавание именованных сущностей, многоязычный ИИ, алгоритмы оптимизации