Clear Sky Science · zh
通过多智能体联邦学习和异构图注意力网络进行跨语言酒店评论情感分析
在线酒店评论为何重要
选酒店越来越依赖浏览其他旅客的点评。这些评论来自多种语言和不同网站,能够成就或毁掉一家酒店的声誉和收入。本文介绍了一种新系统,能同时读取多种语言的酒店评论,判断其正负情感,并在酒店声誉即将发生变化时及早提醒管理者——同时将客人数据安全地保留在其原始写入位置。

多语言、多平台、同一难题
如今旅客在 Booking.com、TripAdvisor、Agoda 和 携程 等预订网站上用英语、中文、法语、德语以及混合语言风格发布评论。现有工具常常把所有内容翻译成一种语言再进行分析,这会破坏原意,尤其对规模较小或具有文化特性的语言影响更大。还有的工具将所有评论文本发送到单一中央服务器,引发隐私担忧并与严格的数据保护法规相冲突。结果是酒店可能错过宾客满意度的微妙变化,或未能及时发现有组织的虚假评论攻击并做出回应。
在不共享原始数据的前提下协同工作
作者提出一种“联邦”方案,每个参与的网站-语言对运行各自的本地软件代理。这些代理从本地评论中学习,但不是将原始文本发送到中央集线器,而只共享对共享模型的数学更新。一个协调层将这些更新汇总并向所有合作方返回改进后的模型。额外的保障措施,例如加入经过校准的噪声和对更新进行加密,使得任何人都很难重建出单个客人实际写了什么。这种设计使系统能够在遵守现代隐私法规的前提下,从四种语言的154,680条评论中学习。
将评论视为一个动态网络
系统不将每条评论作为孤立的文本块处理,而是把整个评论世界转换为一个丰富的网络。在这个网络中,节点代表宾客、酒店、评论、语言和时间点,连边则捕捉谁在哪住过、何时写的以及使用了哪种语言。一种特殊类型的神经网络在该网络上“巡视”,对最有信息量的连接给予更多关注,例如可信评审者或在特定语言中反复出现的模式。这种方法使模型能够捕捉到通用信号(“位置优越”、“房间不干净”)以及普通多语种模型常漏掉的语言特有短语或习惯用法。

从情感评分到实时声誉与虚假评论预警
在这个多语种引擎之上,作者构建了一个声誉监测器,跟踪酒店地位随时间的变化。系统会寻找负面评论的急剧上升、服务升级后缓慢但持续的改善,以及可能表明有组织操纵的不寻常活动激增。它分析写作风格、时间和评审者行为以过滤虚假或可疑评论,并以近实时方式更新酒店的声誉分。在测试中,该系统对虚假评论的识别准确率超过93%,并且平均能在公众评分页面明显变化之前大约三天发现重大声誉波动。
这对旅客和酒店意味着什么
对普通读者而言,结论是现在可以将来自多种语言和平台的评论汇聚为一幅兼顾隐私的酒店质量图景。所提系统比领先的语言模型更准确地分类评论情感,比集中式服务更谨慎地处理数据,并比传统工具更早发现真实问题和可疑评论模式。实践中,这意味着旅客可以依赖更可信的评分和摘要,而酒店则获得一个早期预警仪表盘,促使其更快修复问题并更有效地回应客人——所有这些都不需将个人评论数据暴露到最初发布地点之外。
引用: Han, X. Cross-language hotel review sentiment analysis via multi-agent federated learning with heterogeneous graph attention networks. Sci Rep 16, 12681 (2026). https://doi.org/10.1038/s41598-026-41500-8
关键词: 酒店评论, 情感分析, 联邦学习, 虚假评论检测, 在线声誉