Clear Sky Science · zh
基于动态时段—年龄功能区的个人出行目的推断
你的出行比你想的更重要
每天,数以百万计的出行被智能手机和公共交通系统悄然记录,显示了人们的移动路线,却看不到背后的原因。他们是在上班、回家、会友还是购物?这项研究展示了如何通过细致解读城市街区随时间和不同年龄群体变化的特征,从大量匿名的移动数据中推断出这些看不见的“为什么”。其成果是一种强大的工具,能帮助城市在不必频繁开展昂贵调查的情况下,规划更公平、更高效的交通系统。

从地图上的点到现实生活中的活动
现代城市从手机、交通一卡通和 GPS 轨迹等来源收集大量位置数据。这些记录在出发地和目的地方面信息丰富,但几乎从不包含出行目的。传统上,研究人员依赖详尽的家庭出行调查——人们报告出行原因——来构建可应用于更大数据集的规则或机器学习模型。然而,以往大多数工作把目的地的土地使用视为静态:某地被简单标注为“住宅”“工作”或“购物”,不考虑一天中的时间或来访者的身份。
捕捉街区随时间的变化
作者认为城市区域在不同小时和年龄群体间的表现差异很大。靠近大学的街区可能早晨主要服务学生,中午接待上班族,夜间则成为用餐或夜生活场所。公园、学校、教堂和办公楼在不同时间也会吸引不同年龄群的人。为此,研究为首尔的每个小行政区构建了“动态时段—年龄功能区”。团队将超过77万条兴趣点记录(如住宅、工作场所、学校、商店、医疗设施和休闲场所)与 Yelp 开放数据集的签到数据及韩国国家家庭与个人出行调查的年龄分布相结合。研究把一天划分为六个时段、将人口分为四个年龄组,并根据某类地点在何时被何人群常访为其赋予不同权重。由此形成了在不同条件下每个街区主要用途的时段—年龄敏感型画像。

教会机器推测人们出行的原因
以这些动态功能区作为关键输入,连同出行者的年龄、性别、出行时间、距离和交通可达性,研究人员训练了两类模型来推断出行目的:极端梯度提升(XGBoost)模型和长短期记忆(LSTM)神经网络。两者均以近40.1万次包含已知目的的调查出行为训练样本,这些目的被归入五大类:回家、上班、就学、购物或就餐,以及其他原因。测试中,XGBoost 的表现略优于 LSTM,出行目的识别准确率约为84%,而神经网络约为78%。当作者去掉时段—年龄动态,仅使用静态街区功能时,准确率最多下降3个百分点,证明地点的时变特性确实有助于模型识别人们出行的原因。
将方法应用于真实手机数据
随后,团队将训练好的模型应用到一套来自首尔的海量“日常生活移动”数据集,该数据集由匿名化的手机信号构建,涵盖数百万次出行,但只粗略地将出发地和目的地标为住宅、工作或“其他”,未提供明确目的。模型对一个月内近四百万次出行进行了目的推断。超过一半被归类为与家庭相关,约三分之一为与工作相关,教育与购物或就餐占比更小。在运动标签明确的情形下——如从家到工作的出行或从工作到家的出行,推断出的目的与手机派生类型分别约有68%和74%的吻合度。随时间与年龄呈现的模式也符合预期:清晨和傍晚的出行偏向通勤,青少年的出行常与教育相关,夜间出行更多倾向回家。
对日常出行的意义
简而言之,本研究表明,通过将街区提供的详尽要素与这些地点在何时被何人使用结合起来,城市可以在大多数情况下可靠地推断出出行背后的理由,即便人们从未回答调查问题。这为利用现有的电话与交通数据来理解通勤、接送学生、购物和休闲等出行类型提供了可能,且可达较细的空间与时间尺度。规划者例如可据此发现哪些从商务区到高密度住宅区的夜间出行需要增设公交,或哪些与学校相关的出行提示应改善步行和骑行安全。尽管该方法在处理罕见或混合目的出行时仍有困难,但它展示了将匿名移动轨迹转化为有关人们如何以及为何在城市中移动的有意义叙事的可行途径。
引用: Lee, J., Park, S. Personal trip purpose inference based on dynamic time–age functional zones. Sci Rep 16, 14608 (2026). https://doi.org/10.1038/s41598-026-45683-y
关键词: 出行目的, 城市出行, 功能区, 交通规划, 手机数据