Clear Sky Science · pt

Análise de sentimento de avaliações de hotéis entre idiomas via aprendizado federado multiagente com redes de atenção em grafos heterogêneos

· Voltar ao índice

Por que as avaliações online de hotéis importam

Escolher um hotel cada vez mais começa por rolar os comentários de outros viajantes. Essas avaliações vêm em muitos idiomas e de muitos sites, e podem fazer ou destruir a reputação e a receita de um hotel. Este artigo descreve um novo sistema que lê avaliações de hotéis em várias línguas ao mesmo tempo, identifica se são positivas ou negativas e alerta os gestores hoteleiros cedo quando a reputação está prestes a mudar—tudo isso mantendo os dados dos hóspedes armazenados com segurança no local onde foram escritos.

Figure 1
Figura 1.

Muitos idiomas, muitas plataformas, um problema

Hoje, os viajantes publicam avaliações em inglês, chinês, francês, alemão e estilos linguísticos mistos em sites de reserva como Booking.com, TripAdvisor, Agoda e Ctrip. Ferramentas existentes frequentemente traduzem tudo para um idioma e então analisam, o que pode distorcer o significado, especialmente em línguas menores ou culturalmente específicas. Outras ferramentas enviam todo o texto da avaliação para um único servidor central, levantando preocupações de privacidade e colidindo com leis rigorosas de proteção de dados. O resultado é que os hotéis podem perder mudanças sutis na satisfação dos hóspedes ou não perceber ataques coordenados de avaliações falsas a tempo de reagir.

Trabalhando juntos sem compartilhar dados brutos

Os autores propõem uma configuração “federada” na qual cada par site–idioma participante executa seu próprio agente de software local. Esses agentes aprendem a partir de suas próprias avaliações, mas em vez de enviar o texto bruto para um hub central, compartilham apenas atualizações matemáticas de um modelo compartilhado. Uma camada de coordenação combina essas atualizações e envia de volta um modelo aprimorado a todos os parceiros. Salvaguardas extras, como adicionar ruído cuidadosamente calibrado e criptografar as atualizações, tornam muito difícil para qualquer um reconstruir o que um hóspede individual realmente escreveu. Esse desenho permite que o sistema aprenda com 154.680 avaliações em quatro idiomas enquanto permanece dentro das regulamentações modernas de privacidade.

Vendo as avaliações como uma rede viva

Em vez de tratar cada avaliação como um bloco isolado de texto, o sistema transforma todo o universo de avaliações em uma rede rica. Nessa rede, nós representam hóspedes, hotéis, avaliações, idiomas e pontos no tempo, e ligações capturam quem ficou onde, quando escreveu e em que idioma. Um tipo especial de rede neural então “olha” através dessa teia, dando mais atenção às conexões mais informativas, como avaliadores confiáveis ou padrões recorrentes em um idioma específico. Essa abordagem permite que o modelo capte sinais universais (“excelente localização”, “quarto sujo”) e frases ou hábitos específicos de idioma que modelos multilíngues comuns frequentemente perdem.

Figure 2
Figura 2.

De pontuações de sentimento a alertas de reputação em tempo real e avaliações falsas

Sobre esse motor multilíngue, os autores constroem um monitor de reputação que acompanha como a posição de um hotel muda ao longo do tempo. O sistema procura por aumentos bruscos em comentários negativos, melhorias lentas e constantes após upgrades de serviço e surtos incomuns de atividade que podem sinalizar manipulação organizada. Ele analisa estilo de escrita, cronologia e comportamento do avaliador para filtrar avaliações falsas ou suspeitas, e atualiza a pontuação de reputação do hotel em quase tempo real. Em testes, o sistema identificou avaliações falsas com mais de 93% de precisão e pôde sinalizar grandes mudanças de reputação, em média, pouco mais de três dias antes de se tornarem óbvias nas páginas públicas de avaliação.

O que isso significa para viajantes e hotéis

Para um leitor geral, a mensagem principal é que agora é possível combinar avaliações de vários idiomas e plataformas em um único quadro de qualidade do hotel que respeita a privacidade. O sistema proposto classifica o sentimento das avaliações com mais precisão do que modelos de linguagem líderes, trata os dados com mais cuidado do que serviços centralizados e detecta tanto problemas reais quanto padrões suspeitos de avaliação mais cedo do que ferramentas tradicionais. Na prática, isso significa que os viajantes podem confiar em classificações e resumos mais confiáveis, enquanto os hotéis ganham um painel de alerta antecipado que os incentiva a consertar problemas rapidamente e responder aos hóspedes de forma mais eficaz—tudo sem expor dados pessoais de avaliações além do local onde foram originalmente publicados.

Citação: Han, X. Cross-language hotel review sentiment analysis via multi-agent federated learning with heterogeneous graph attention networks. Sci Rep 16, 12681 (2026). https://doi.org/10.1038/s41598-026-41500-8

Palavras-chave: avaliações de hotéis, análise de sentimento, aprendizado federado, detecção de avaliações falsas, reputação online