Clear Sky Science · fr

Un ensemble de données sur les réseaux de mobilité touristique en Chine dérivé de blogs de voyage en ligne

· Retour à l’index

Pourquoi vos récits de vacances comptent

Chaque fois que quelqu’un partage une histoire de voyage en ligne, il laisse derrière lui plus que de belles photos et des souvenirs. Ces publications contiennent des indices sur les lieux visités, les déplacements entre sites et ce qui rend certaines destinations mieux connectées que d’autres. Cette étude exploite des milliers de blogs de voyage chinois pour établir une image détaillée de la façon dont les touristes se déplacent effectivement entre les attractions à travers la Chine, offrant de nouvelles perspectives aux lecteurs curieux, aux planificateurs et à tous ceux qui s’interrogent sur la manière dont les traces numériques peuvent renouveler notre compréhension du voyage.

Figure 1
Figure 1.

Des voyages personnels à une carte nationale des déplacements

Les chercheurs se sont concentrés sur Qunar.com, une grande plateforme de voyage chinoise dont l’outil de blog incite doucement les utilisateurs à consigner leurs trajets jour après jour et attraction après attraction. Contrairement aux publications libres des réseaux sociaux, ces blogs sont organisés de façon structurée et chronologique et sont liés à une base de données intégrée d’attractions touristiques. Ce choix de conception a transformé d’innombrables journaux de vacances en une riche source d’informations structurées. En collectant des blogs rédigés sur des voyages en Chine sur une période de dix ans, l’équipe a pu lire non pas les récits eux‑mêmes, mais les listes ordonnées de lieux que les blogueurs disaient avoir visités.

Transformer des récits en réseaux de lieux

Dans l’ensemble de données construit par l’équipe, chaque attraction touristique devient un point d’un vaste réseau, et chaque déplacement d’une attraction à la suivante devient un lien entre deux points. Si de nombreux blogueurs rapportent être allés d’un parc au bord d’un lac à une vieille ville voisine, cette connexion apparaît comme un lien très fréquenté dans le réseau. En enchaînant la liste des visites de chaque blogueur dans l’ordre, les chercheurs ont reconstitué des dizaines de milliers d’itinéraires puis les ont combinés en « réseaux de mobilité » nationaux. Ces réseaux diffèrent des statistiques de voyage habituelles : au lieu de montrer comment les gens se rendent de leur ville d’origine à une destination, ils révèlent comment les visiteurs se déplacent de site en site une fois arrivés.

Figure 2
Figure 2.

Un aperçu des choix faits pour collecter les données

Pour établir une image propre et fiable, l’équipe a dû faire des choix prudents. Ils ont filtré les blogs qui décrivaient principalement des voyages hors de Chine, supprimé les copies en double d’un même blog et ignoré les publications ne mentionnant qu’une seule attraction, car celles‑ci n’apportent aucune information sur les déplacements. Lorsque les blogueurs listaient la même attraction plusieurs fois de suite, ces répétitions ont été fusionnées en une seule entrée, car aucun déplacement réel n’avait lieu. Pour chaque attraction mentionnée, les chercheurs ont récupéré sa localisation approximative, la ville d’accueil et les noms en chinois et en anglais, en s’appuyant sur des services de cartographie et de traduction. Il est important de noter qu’ils n’ont pas conservé de contenu expressif tel que le texte narratif ou les photos ; seules des informations factuelles comme les dates, les emplacements et des identifiants anonymes de blogs ont été conservées pour respecter à la fois les règles de la plateforme et la vie privée des utilisateurs.

Des voyages différents, des modèles différents

Parce que chaque blog sur Qunar.com inclut des détails de contexte simples, l’ensemble de données peut être découpé de plusieurs façons révélatrices. L’équipe a regroupé les trajets par saison — printemps, été, automne et hiver — et aussi par compagnons de voyage, distinguant les voyages en solo des déplacements avec des amis ou en famille. Pour chacun de ces groupes, ils ont construit un réseau séparé, afin que de futurs chercheurs puissent comparer, par exemple, comment les visites hivernales relient des stations de ski versus la manière dont les voyages d’été lient plages et villes historiques. Lorsqu’ils ont examiné la structure globale de ces réseaux, ils ont trouvé des motifs familiers à partir d’autres grandes études sur les déplacements : quelques attractions très populaires dominent de nombreuses routes, tandis que la plupart des lieux reçoivent bien moins de transitions. Ils ont également montré que les grappes du réseau correspondent bien aux frontières provinciales de la Chine, ce qui suggère que les touristes ont tendance à se déplacer au sein de circuits régionaux reconnaissables.

Forces, limites et usages futurs

Les auteurs soulignent avec prudence que les blogueurs ne reflètent pas parfaitement l’ensemble des touristes. Les personnes qui écrivent des blogs de voyage ont tendance à être des voyageurs enthousiastes et familiarisés avec Internet, effectuant souvent des voyages de loisir ou de découverte plutôt que des déplacements professionnels ou des visites familiales. Le nombre de blogs sur Qunar.com a aussi fluctué au fil des ans, notamment après une importante fusion d’entreprises qui a probablement modifié la façon dont la plateforme était promue. En conséquence, l’ensemble de données est mieux adapté à l’exploration de motifs relatifs — tels que quelles attractions sont fortement liées ou comment les itinéraires saisonniers diffèrent — plutôt qu’à des décomptes précis de visiteurs. Néanmoins, en publiant à la fois les réseaux nettoyés et les séquences de visites sous‑jacentes comme données ouvertes, ainsi que le code pour reconstruire et ajuster les réseaux, l’étude offre un nouvel instrument puissant pour quiconque s’intéresse au tourisme, à l’aménagement urbain, aux transports ou à la question plus large de la manière dont nos traces en ligne peuvent éclairer nos déplacements dans le monde.

Ce que cela signifie pour le voyage au quotidien

Pour un lecteur non spécialiste, la conclusion est simple : l’acte apparemment anodin de consigner un voyage en ligne peut, combiné à des milliers d’autres enregistrements, révéler le squelette caché du système touristique d’un pays. Ce travail montre que les carnets de voyage personnels, traités avec soin et dépourvus d’éléments identifiants, peuvent aider à cartographier quelles attractions se regroupent naturellement en itinéraires, quelles villes servent de nœuds et comment les saisons et les compagnons influent sur nos parcours. Ce faisant, il ouvre la voie à une planification des destinations plus intelligente, à une promotion plus équilibrée des sites moins connus et à des comparaisons enrichies entre les expériences des « touristes en ligne » et le public voyageur plus large.

Citation: Zheng, Y., Wang, J., Zhang, Y. et al. A dataset of tourist mobility networks across China derived from online travel blogs. Sci Data 13, 443 (2026). https://doi.org/10.1038/s41597-026-06780-9

Mots-clés: mobilité touristique, données de voyage générées par les utilisateurs, tourisme en Chine, analyse de réseau, blogs de voyage en ligne