Clear Sky Science · ru
Анализ тональности отзывов о гостиницах на разных языках с помощью многоагентного федеративного обучения и гетерогенных графовых сетей внимания
Почему важны онлайн‑отзывы о гостиницах
Выбор гостиницы всё чаще начинается с пролистывания комментариев других путешественников. Эти отзывы написаны на многих языках и размещены на разных сайтах — они могут как поднять, так и подорвать репутацию и доходы отеля. В статье описана новая система, которая одновременно обрабатывает отзывы на нескольких языках, определяет их положительную или отрицательную тональность и заранее предупреждает менеджеров отеля о приближающемся изменении репутации — при этом данные гостей остаются безопасно хранимыми там, где они были оставлены.

Множество языков, множество платформ, одна проблема
Путешественники сегодня публикуют отзывы на английском, китайском, французском, немецком и в смешанных языковых вариантах на сайтах бронирования вроде Booking.com, TripAdvisor, Agoda и Ctrip. Существующие инструменты часто переводят всё в один язык, а затем анализируют текст, что может искажать смысл, особенно для менее распространённых или культурно специфичных языков. Другие решения отправляют все тексты отзывов на единый центральный сервер, что вызывает опасения по поводу конфиденциальности и конфликтует с жёсткими законами о защите данных. В результате отели могут не заметить тонкие изменения в удовлетворённости гостей или не успеть вовремя распознать скоординированные атаки фальшивых отзывов.
Работа вместе без передачи необработанных данных
Авторы предлагают «федеративную» архитектуру, в которой каждая пара сайт–язык запускает собственного локального программного агента. Эти агенты обучаются на собственных отзывах, но вместо отправки исходного текста в центральный узел они передают лишь математические обновления общей модели. Слой координации объединяет эти обновления и рассылает улучшенную модель всем участникам. Дополнительные меры защиты, такие как внесение точно рассчитанного шума и шифрование обновлений, сильно затрудняют восстановление того, что именно написал отдельный гость. Такая конструкция позволяет системе учиться на 154 680 отзывах на четырёх языках, оставаясь в рамках современных правил конфиденциальности.
Рассмотрение отзывов как динамической сети
Вместо того чтобы рассматривать каждый отзыв как отдельный фрагмент текста, система превращает весь мир отзывов в насыщенную сеть. В этой сети узлы представляют гостей, гостиницы, отзывы, языки и временные точки, а связи фиксируют, кто где останавливался, когда написал отзыв и на каком языке. Особый тип нейросети «смотрит» через эту сеть, уделяя больше внимания наиболее информативным связям — например, проверенным рецензентам или повторяющимся шаблонам в конкретном языке. Такой подход позволяет модели улавливать как универсальные сигналы («отличное расположение», «грязный номер»), так и языково‑специфичные фразы или привычки, которые обычные многоязычные модели часто пропускают.

От оценок тональности — к мониторингу репутации и предупреждениям о фальшивых отзывах
Поверх этого многоязычного механизма авторы создают монитор репутации, который отслеживает, как меняется положение отеля со временем. Система ищет резкие всплески негативных комментариев, медленные но устойчивые улучшения после повышения качества сервиса и необычные всплески активности, которые могут указывать на организованные манипуляции. Она анализирует стиль письма, сроки и поведение рецензентов, чтобы отфильтровывать фальшивые или подозрительные отзывы, и обновляет репутационный балл отеля практически в режиме реального времени. В тестах система выявляла фальшивые отзывы с точностью более 93% и могла зафиксировать серьёзные сдвиги репутации в среднем чуть более чем за три дня до того, как они становились заметны на публичных рейтинговых страницах.
Что это значит для путешественников и отелей
Для широкого читателя основной вывод таков: теперь можно объединять отзывы с разных языков и платформ в единое, учитывающее конфиденциальность представление о качестве отеля. Предложенная система точнее классифицирует тональность отзывов, чем ведущие языковые модели, обращается с данными более осторожно, чем централизованные сервисы, и раньше обнаруживает как реальные проблемы, так и подозрительные шаблоны отзывов, чем традиционные инструменты. На практике это значит, что путешественники могут опираться на более надёжные рейтинги и сводки, а отели получают панель раннего предупреждения, которая стимулирует их оперативно устранять проблемы и эффективнее реагировать на гостей — и всё это без раскрытия персональных данных отзывов за пределами места их первоначальной публикации.
Цитирование: Han, X. Cross-language hotel review sentiment analysis via multi-agent federated learning with heterogeneous graph attention networks. Sci Rep 16, 12681 (2026). https://doi.org/10.1038/s41598-026-41500-8
Ключевые слова: отзывы о гостиницах, анализ тональности, федеративное обучение, обнаружение фальшивых отзывов, онлайн-репутация