Clear Sky Science · pt

Classificação de intenção para serviços administrativos universitários usando uma rede neural recorrente bidirecional modificada por um algoritmo de otimização Kepler desenvolvido

· Voltar ao índice

Ajuda digital mais inteligente para perguntas cotidianas no campus

Estudantes universitários hoje esperam respostas rápidas e precisas a qualquer hora — seja ao se candidatar à matrícula, ao se inscrever em disciplinas ou ao perguntar sobre auxílio financeiro. Este artigo explora um novo tipo de chatbot com IA projetado especificamente para serviços administrativos universitários, com foco no atendimento em inglês e grego. Ao treinar um único sistema para entender melhor o que os estudantes querem dizer e quais detalhes importam, os autores visam tornar as centrais de ajuda digitais mais rápidas, confiáveis e fáceis de operar.

Figure 1
Figura 1.

Por que os chatbots atuais ainda se confundem

A maioria dos chatbots modernos depende de um campo chamado compreensão de linguagem natural, que divide a pergunta do estudante em duas partes principais. A primeira é a intenção: o que o estudante quer fazer, como “matricular-se em uma disciplina” ou “perguntar sobre um prazo”. A segunda são as entidades: os pedaços concretos de informação dentro da pergunta, como um código de disciplina, semestre ou nome de programa. Sistemas tradicionais usam modelos separados para essas duas tarefas. Essa separação desperdiça memória e poder de processamento e pode levar a respostas inconsistentes — por exemplo, identificar corretamente um código de disciplina, mas não ligá-lo à ação certa. Esses problemas se agravam em contextos multilíngues, onde a mesma ideia pode ser expressa de muitas formas entre línguas.

Um cérebro em vez de dois

Os autores propõem um modelo conjunto que aprende a reconhecer intenções e entidades ao mesmo tempo, usando um “cérebro” compartilhado em vez de dois separados. No núcleo está a combinação de duas técnicas poderosas. A primeira, BERT, analisa a frase inteira de uma vez para capturar seu sentido global. A segunda, uma rede LSTM bidirecional, presta atenção à ordem das palavras tanto da esquerda para a direita quanto da direita para a esquerda, o que ajuda a acompanhar relações próximas, como qual disciplina corresponde a qual semestre. Sobre essa compreensão compartilhada, o sistema se ramifica em duas cabeças: uma prevê a intenção do estudante e a outra rotula cada palavra quanto ao seu papel como entidade ou não.

Deixando as tarefas conversarem entre si

Para aproveitar ao máximo esse cérebro compartilhado, o modelo inclui uma camada “transformer co-interativo” que permite que as duas tarefas se informem em tempo real. Quando o sistema decide uma intenção, ele pode observar as entidades que acredita estar presentes; quando rotula entidades, pode apoiar-se na intenção que parece mais provável. Essa comunicação mútua ajuda a resolver ambiguidades, como se “trancar” se refere a sair de uma disciplina ou cancelar uma inscrição, e é especialmente valiosa em grego, onde formas e ordem das palavras são mais flexíveis que em inglês. Ao compartilhar representações e atenção dessa forma, o modelo reduz o número de parâmetros em quase metade comparado a executar dois grandes modelos separadamente, tornando-o mais prático para os departamentos de TI universitários.

Figure 2
Figura 2.

Uma maneira inspirada no cosmos de treinar o modelo

Treinar um modelo tão rico é difícil: métodos padrão de otimização podem ser lentos e sensíveis a ajustes finos. Os autores introduzem o algoritmo Developed Kepler Optimization (DKO), inspirado na maneira como os planetas orbitam o sol. Nessa analogia, diferentes versões do modelo são como planetas explorando o espaço de possíveis configurações de parâmetros enquanto são atraídos para o “sol” de melhor desempenho. O DKO inicia esses candidatos com uma distribuição mais diversificada do que o habitual e então ajusta continuamente suas “órbitas” com base em quão bem eles performam. Essa abordagem acelera o aprendizado em cerca de 42% em comparação com um método popular chamado Adam, além de tornar o treinamento mais estável, especialmente em dados complexos e multilíngues.

Testes no mundo real com estudantes

A equipe avaliou seu sistema em vários conjuntos de dados, incluindo o UniWay, uma coleção de perguntas em inglês e grego sobre serviços universitários, e o xSID, um benchmark conhecido para compreensão de comandos curtos. Em todos eles, o modelo conjunto superou consistentemente sistemas baseados em regras, redes neurais mais antigas e até fortes baselines transformer. Em testes de campo em duas universidades — uma apenas em inglês e outra bilíngue — o chatbot identificou corretamente intenções e entidades dos estudantes em cerca de nove em cada dez casos, e os estudantes avaliaram sua satisfação em cerca de 4,5 de 5. O desempenho permaneceu robusto mesmo quando os dados de treinamento foram reduzidos, sugerindo que o método é resiliente em línguas e domínios com menos recursos.

O que isso significa para estudantes e universidades

Para um leitor não especializado, a conclusão principal é que os autores projetaram um “motor de escuta” mais eficiente e preciso para chatbots universitários. Ao unificar a detecção de intenção e a extração de detalhes, e ao usar um método de treinamento inspirado em órbitas, seu sistema pode compreender melhor o que os estudantes perguntam usando menos memória e tempo de treinamento. Isso pode se traduzir em respostas mais rápidas, menos mal-entendidos e suporte multilíngue 24 horas sem sobrecarregar a equipe humana. Embora desafios permaneçam — como adaptação a novas políticas, mais idiomas e padrões de uso de longo prazo — o trabalho aponta para sistemas de atendimento no campus que parecem mais responsivos, justos e escaláveis.

Citação: Yang, Z., Lu, M. & Huang, S. Intent classification for university administrative services using a bidirectional recurrent neural network modified by a developed Kepler optimization algorithm. Sci Rep 16, 6263 (2026). https://doi.org/10.1038/s41598-026-35504-7

Palavras-chave: chatbots universitários, classificação de intenção, reconhecimento de entidades nomeadas, IA multilíngue, algoritmos de otimização