Clear Sky Science · nl

Meertalige sentimentanalyse van hotelbeoordelingen via multi-agent Federated Learning met heterogene graph-attentienetwerken

· Terug naar het overzicht

Waarom online hotelbeoordelingen ertoe doen

Het kiezen van een hotel begint steeds vaker met het doorlezen van opmerkingen van andere reizigers. Die beoordelingen zijn in meerdere talen en van verschillende websites afkomstig en kunnen de reputatie en omzet van een hotel maken of breken. Dit artikel beschrijft een nieuw systeem dat hotelbeoordelingen in meerdere talen tegelijk leest, vaststelt of ze positief of negatief zijn, en hotelmanagers vroegtijdig waarschuwt wanneer hun reputatie op het punt staat te veranderen — en dat alles terwijl de gegevens van gasten veilig blijven opgeslagen op de plek waar ze zijn geschreven.

Figure 1
Figuur 1.

Veel talen, veel platforms, één probleem

Reizigers plaatsen tegenwoordig beoordelingen in het Engels, Chinees, Frans, Duits en in gemengde taalstijlen op boekingssites zoals Booking.com, TripAdvisor, Agoda en Ctrip. Bestaande tools vertalen vaak alles naar één taal en analyseren dat vervolgens, wat de betekenis kan vertekenen, vooral bij kleinere of cultuurgebonden talen. Andere tools sturen alle beoordelingstekst naar een centrale server, wat privacyzorgen oproept en kan botsen met strikte gegevensbeschermingswetten. Als gevolg daarvan kunnen hotels subtiele veranderingen in gasttevredenheid mislopen of te laat reageren op gecoördineerde aanvallen met valse beoordelingen.

Samenwerken zonder ruwe data te delen

De auteurs stellen een "federated" opzet voor waarbij elk deelnemend site–taal koppel zijn eigen lokale software-agent draait. Deze agenten leren van hun eigen beoordelingen, maar in plaats van de ruwe tekst naar een centraal punt te sturen, delen ze alleen wiskundige updates naar een gedeeld model. Een coördinatielaag combineert die updates en stuurt een verbeterd model terug naar alle partners. Extra waarborgen, zoals het toevoegen van zorgvuldig gekalibreerde ruis en het versleutelen van de updates, maken het zeer lastig voor iemand om te reconstrueren wat een individuele gast daadwerkelijk heeft geschreven. Dit ontwerp maakt het mogelijk om te leren van 154.680 beoordelingen in vier talen, terwijl voldaan wordt aan moderne privacyregels.

Beoordelingen zien als een levend netwerk

In plaats van elke beoordeling als een geïsoleerd tekstblok te behandelen, verandert het systeem het hele beoordelingsuniversum in een rijk netwerk. In dit netwerk vertegenwoordigen knooppunten gasten, hotels, beoordelingen, talen en tijdstippen, en verbindingen leggen vast wie waar verbleef, wanneer ze schreven en in welke taal. Een speciaal soort neuraal netwerk "kijkt" vervolgens over dit web heen en besteedt meer aandacht aan de meest informatieve verbindingen, zoals vertrouwde beoordelaars of terugkerende patronen in een specifieke taal. Deze aanpak stelt het model in staat zowel universele signalen ("uitstekende locatie", "onhygiënische kamer") als taalspecifieke uitdrukkingen of gewoonten op te pikken die gewone meertalige modellen vaak missen.

Figure 2
Figuur 2.

Van sentimentscores naar live reputatie- en waarschuwingen voor valse beoordelingen

Bovenop deze meertalige motor bouwen de auteurs een reputatiemonitor die bijhoudt hoe de positie van een hotel in de loop van de tijd verandert. Het systeem zoekt naar sterke stijgingen in negatieve opmerkingen, geleidelijke maar aanhoudende verbeteringen na service-upgrades en ongebruikelijke uitbarstingen van activiteit die op georganiseerde manipulatie kunnen wijzen. Het analyseert schrijfstijl, timing en beoordelaarsgedrag om valse of verdachte beoordelingen eruit te filteren, en werkt de reputatiescore van een hotel vrijwel in realtime bij. In tests identificeerde het systeem valse beoordelingen met meer dan 93% nauwkeurigheid en kon het grote reputatieverschuivingen gemiddeld iets meer dan drie dagen signaleren voordat die duidelijk werden op openbare beoordelingspagina's.

Wat dit betekent voor reizigers en hotels

Voor een algemeen publiek is de kernboodschap dat het nu mogelijk is om beoordelingen uit meerdere talen en platforms te combineren tot één privacybewust beeld van hotelkwaliteit. Het voorgestelde systeem classificeert sentiment in beoordelingen nauwkeuriger dan toonaangevende taalmodellen, gaat zorgvuldiger met data om dan gecentraliseerde diensten en signaleert zowel echte problemen als verdachte beoordelingspatronen eerder dan traditionele tools. In de praktijk betekent dit dat reizigers kunnen vertrouwen op betrouwbaardere waarderingen en samenvattingen, terwijl hotels een vroegtijdig waarschuwingsdashboard krijgen dat hen aanspoort problemen snel op te lossen en effectiever op gasten te reageren — en dat alles zonder persoonlijke beoordelingsgegevens buiten de plaats van oorsprong bloot te geven.

Bronvermelding: Han, X. Cross-language hotel review sentiment analysis via multi-agent federated learning with heterogeneous graph attention networks. Sci Rep 16, 12681 (2026). https://doi.org/10.1038/s41598-026-41500-8

Trefwoorden: hotelbeoordelingen, sentimentanalyse, federated learning, detectie van valse beoordelingen, online reputatie