Clear Sky Science · zh
使用堆叠集成学习和SHAP分析的可解释出港滑行时间预测
为什么停机坪时间很重要
任何在飞机上等着起飞的人都知道地面上多出的那些分钟有多令人恼火。除了令人不便之外,起飞前的长时间等待会浪费燃油、排放更多二氧化碳,并在当天的航班计划中产生连锁影响。该研究旨在更准确地预测“滑行出港”时间,更重要的是以机场工作人员在实时决策时能够理解并信任的方式来预测。

离开登机口到起飞之间发生了什么
滑行出港时间是指飞机从登机口推出到最终起飞之间的时段。它取决于两大类因素:机场的物理布局和当时的繁忙程度。作者将滑行出港时间拆分为“无阻”部分——即在没有拥堵时飞机合理达到的最快通过机场的时间——以及“动态”部分,用来捕捉由排队和与其他飞机冲突引起的额外延误。这一划分使他们能够提出一个简单的问题:哪些因素与机场本身的布局有关,哪些又与跑道和滑行道上的拥堵有关?
将机场运行转化为数据
研究团队使用了中国深圳宝安国际机场的详细记录,覆盖14个繁忙日和超过1.2万班次。他们从机场的决策支持系统中提取了登机口离场、着陆、推出和起飞的时间,并清洗数据以去除异常值。他们将复杂的地面飞机运动转换为一组数值特征:在某架飞机滑行期间有多少架飞机起飞或降落、过去半小时内航班平均滑行所需时间、飞机从停机位到跑道的滑行距离,以及历史上停机位、航空公司和机型的典型行为模式。综合来看,这些因素既描绘了机场固定的布局,也反映了不断变化的交通态势。
分层学习的预测方法
研究并不依赖单一预测方法,而是使用一种称为堆叠(stacking)的技术,它将若干机器学习模型像蛋糕层一样组合在一起。每个基础模型分别对滑行出港时间给出预测;最终的“元”模型学习如何最好地融合这些预测。经严格交叉验证训练和测试后,这一分层方法达到了先进的精度:约41%的航班预测误差在一分钟内,超过96%的航班在五分钟内。作者还将一次性预测总体滑行出港时间与将无阻时间和额外延误分别预测的分阶段方法进行了比较。前者在精度上略占优势,但分阶段方法更清晰地表明了不同因素如何影响滑行的不同部分。

用清晰解释打开黑箱
当安全与通行能力的决策相关时,单有高精度是不够的;管制人员需要知道模型为何做出特定预测。为此,作者应用了名为SHAP的工具,它为每个输入因素分配对特定航班预测滑行出港时间的贡献值。这揭示了与拥堵相关的因素——例如出港和到达队列中的飞机数量以及近期滑行所需时间——主导了额外延误部分。相比之下,基础的无阻时间主要由基础设施相关特征决定,如停机位位置、航空公司习惯和滑行距离。通过将相关性检查与SHAP分数结合,团队还剔除了作用不大的输入,从而在不牺牲性能的前提下简化了模型。
这对乘客和地球意味着什么
简单来说,研究表明我们可以高精度地预测飞机从推出登机口到起飞所需的时间,并能够以符合机场实际运作方式的方式解释这些预测。该模型不仅能预测某航班何时可能起飞,还能突出哪些因素——例如增长的到达队列或同时大量推出——在推动额外延误。这样的洞见为机场提供了切实可行的手段来调整推出时间、管理队列并减少空转燃油消耗。对旅客而言,这可能意味着在停机坪上的神秘等待减少;对航空公司和机场而言,则有助于实现更平稳的运行和更低的排放。
引用: Wu, T., Mao, Y., Huang, J. et al. Interpretable Taxi-Out Time Prediction of Departure Flights Using Stacking Ensemble Learning and SHAP Analysis. Sci Rep 16, 10066 (2026). https://doi.org/10.1038/s41598-026-40898-5
关键词: 滑行出港时间预测, 机场地面运行, 航空领域的机器学习, 航班延误管理, 空中交通拥堵