Clear Sky Science · ru
Набор данных о туристических сетях мобильности по Китаю, полученный из онлайн‑тревел‑блогов
Почему важны ваши рассказы о поездках
Каждый раз, когда кто‑то выкладывает рассказ о путешествии в интернете, он оставляет больше, чем красивые фотографии и воспоминания. В этих постах скрыты подсказки о том, куда люди ездят, как перемещаются между местами и что делает одни достопримечательности более связанными с другими. В этом исследовании проанализированы тысячи китайских тревел‑блогов, чтобы построить детальную картину того, как туристы действительно перемещаются между достопримечательностями по всему Китаю, предложив новые инсайты для любознательных читателей, планировщиков и всех, кто интересуется тем, как цифровые следы могут изменить наше представление о путешествиях.

От личных поездок — к национальной карте перемещений
Исследователи сосредоточились на Qunar.com, крупной китайской туристической платформе, чей инструмент блогов ненавязчиво побуждает пользователей фиксировать свои маршруты день за днем и по посещённым объектам. В отличие от свободных записей в социальных сетях, эти блоги организованы в структурированном хронологическом порядке и привязаны к встроенной базе данных туристических объектов. Такое проектное решение превратило бесчисленные дневники отпусков в богатый источник структурированной информации. Собрав блоги о поездках внутри Китая за десятилетний период, команда смогла не столько читать тексты, сколько извлекать упорядоченные списки мест, которые авторы указали в своих маршрутах.
Преобразование рассказов в сети мест
В собранном наборе данных каждая достопримечательность становится узлом в огромной сети, а каждое перемещение от одной достопримечательности к другой — связью между узлами. Если многие авторы указывали путь от приозёрного парка до близкого старого города, эта связь отображается как интенсивно используемое ребро сети. Объединяя в хронологическом порядке списки посещений каждого блогера, исследователи восстановили десятки тысяч маршрутов и затем объединили их в общенациональные «сети мобильности». Эти сети отличаются от обычной статистики поездок: вместо того чтобы показывать, как люди едут из родного города в пункт назначения, они раскрывают, как посетители перемещаются между достопримечательностями уже после прибытия.

Заглядывая за кулисы сбора данных
Чтобы получить чистую и надёжную картину, команда приняла ряд взвешенных решений. Они отфильтровали блоги, которые в основном описывали поездки за пределы Китая, удалили дублирующиеся копии одних и тех же записей и не учитывали посты, где упоминалась только одна достопримечательность, поскольку такие записи не дают информации о перемещениях. Когда в блогах одно и то же место упоминалось подряд несколько раз, эти повторы сводились в одно, так как реального перемещения не происходило. Для каждой упомянутой достопримечательности исследователи получили её приблизительную геолокацию, город‑хозяин и названия на китайском и английском, используя картографические и переводческие сервисы. Важно, что они не сохраняли выразительное содержимое — повествовательный текст или фотографии; оставлялись только фактические элементы, такие как даты, местоположения и анонимные идентификаторы блогов, в уважение к правилам платформы и приватности пользователей.
Разные поездки — разные шаблоны
Поскольку каждый блог на Qunar.com содержит простые служебные данные, набор данных можно нарезать по нескольким информативным признакам. Команда сгруппировала поездки по сезонам — весна, лето, осень и зима — а также по попутчикам, выделив одиночные поездки, поездки с друзьями и с семьёй. Для каждой из этих групп они построили отдельную сеть, чтобы будущие исследователи могли сравнивать, например, как зимние визиты связывают горнолыжные курорты, в отличие от летних маршрутов, соединяющих пляжи и исторические города. При изучении общей структуры этих сетей выявились закономерности, знакомые по другим крупномасштабным исследованиям туризма: несколько чрезвычайно популярных объектов доминируют во множестве маршрутов, тогда как большинство мест получают значительно меньше переходов. Также оказалось, что кластеры в сети хорошо соотносятся с провинциальными границами Китая, что говорит о склонности туристов перемещаться в рамках узнаваемых региональных кругов.
Сильные стороны, ограничения и будущие применения
Авторы осторожно подчеркивают, что блоггеры не являются совершенным отражением всех туристов. Люди, пишущие тревел‑блоги, как правило, активные, продвинутые в интернете путешественники, часто совершающие досуговые или экскурсионные поездки, а не деловые командировки или семейные визиты. Количество блогов на Qunar.com также менялось со временем, особенно после крупного корпоративного слияния, которое, вероятно, повлияло на способы продвижения платформы. В результате набор данных лучше подходит для изучения относительных закономерностей — например, какие объекты тесно связаны или как сезонные маршруты различаются — а не для точного подсчёта числа посетителей. Тем не менее, опубликовав как очищенные сети, так и исходные последовательности посещений в открытом доступе вместе с кодом для реконструкции и корректировки сетей, исследование предлагает мощную новую оптику для специалистов по туризму, градостроению, транспорту или для всех, кого интересует, каким образом наши онлайн‑следы освещают пути передвижения по миру.
Что это значит для обычных путешественников
Для непрофессионального читателя главный вывод прост: простая привычка фиксировать поездку онлайн может в сочетании с тысячами других записей выявить скрытый каркас туристической системы страны. Эта работа показывает, что личные путевые дневники, при аккуратной обработке и удалении идентифицирующих деталей, помогают картировать, какие достопримечательности естественно группируются в маршруты, какие города служат узлами, и как сезоны и попутчики формируют наши пути. Тем самым создаются предпосылки для более разумного планирования направлений, более сбалансированного продвижения менее известных мест и для более глубокого сравнения опыта «онлайн‑туристов» и широкой аудитории путешествующих.
Цитирование: Zheng, Y., Wang, J., Zhang, Y. et al. A dataset of tourist mobility networks across China derived from online travel blogs. Sci Data 13, 443 (2026). https://doi.org/10.1038/s41597-026-06780-9
Ключевые слова: туристическая мобильность, данные, созданные пользователями, туризм в Китае, сетевой анализ, онлайн‑путевые блоги