Clear Sky Science · ru

Интерпретируемое предсказание времени руления перед взлётом с использованием стекинга ансамблевых моделей и анализа SHAP

· Назад к списку

Почему время на взлётно-посадочной полосе имеет значение

Тот, кто когда-либо сидел в самолёте и ждал взлёта, знает, насколько раздражительны эти дополнительные минуты на земле. Помимо неудобства, долгие ожидания перед взлётом расходуют топливо, увеличивают выбросы углекислого газа и оказывают каскадное влияние на расписание рейсов на весь оставшийся день. В этом исследовании рассматривается, как точнее прогнозировать время руления перед взлётом и, не менее важно, как делать это так, чтобы персонал аэропорта мог понять и доверять прогнозам при принятии решений в реальном времени.

Figure 1
Figure 1.

Что происходит между выходом от гейта и взлётом

Время руления — это интервал между тем моментом, когда самолёт отталкивается от гейта, и тем, когда он наконец набирает высоту. На него влияют два основных фактора: конструкция аэропорта и его загруженность в данный момент. Авторы разделяют время руления на «неограниченную» часть — насколько быстро самолёт мог бы теоретически проехать по аэродрому без задержек — и «динамическую» часть, которая отражает дополнительные задержки из‑за очередей и конфликтов с другими самолётами. Такое разделение позволяет задать простой вопрос: какие факторы связаны с планировкой аэропорта, а какие — с загруженностью взлётно-посадочных полос и рулёжных дорожек?

Преобразование операций аэропорта в данные

Команда использовала подробные записи из Международного аэропорта Шэньчжэнь Баоань в Китае, охватывающие 14 загруженных дней и более 12 000 рейсов. Из системы поддержки принятия решений аэропорта они извлекли времена вылета от гейта, посадки, отталкивания и взлёта, затем очистили данные от аномалий. Они преобразовали сложную «поверхностную» динамику самолётов в набор числовых признаков: сколько самолётов взлетало или садилось в период руления данного борта, как долго в среднем длились руления за последние полчаса, какое расстояние нужно было пройти от стоянки до полосы, а также как складывались исторические шаблоны поведения стоянок, авиакомпаний и типов воздушных судов. В совокупности эти факторы описывают как фиксированную конфигурацию аэродрома, так и постоянно меняющуюся картину трафика.

Многоуровневый подход к предсказанию

Вместо того чтобы полагаться на единственную модель предсказания, исследование использует технику, называемую стекингом, которая объединяет несколько моделей машинного обучения как слои в торте. Каждая базовая модель даёт свою оценку времени руления; затем финальная «мета»-модель учится оптимально комбинировать эти оценки. Этот многоуровневый подход, обученный и протестированный с жёсткой кросс‑валидацией, показал передовую точность: примерно 41 процент рейсов был предсказан с погрешностью до одной минуты, и более 96 процентов — в пределах пяти минут. Авторы также сравнили разовый прогноз общего времени руления с поэтапным подходом, который отдельно предсказывает неограниченную часть и дополнительную задержку. Метод «всё сразу» оказался немного точнее, но двухфазный подход яснее показал, какие факторы влияют на разные составляющие времени руления.

Figure 2
Figure 2.

Открывая «чёрный ящик» понятными объяснениями

Высокая точность сама по себе недостаточна, когда на кону стоят решения по безопасности и пропускной способности; диспетчеры должны понимать, почему модель даёт то или иное предсказание. Чтобы решить эту задачу, авторы применяют инструмент SHAP, который для каждого входного фактора оценивает его вклад в предсказанное время руления для конкретного рейса. Это показывает, что факторы, связанные с загруженностью — сколько самолётов в очередях на вылет и прилёт и как долго длились недавние руления — доминируют в дополнительной задержке. Напротив, инфраструктурные признаки, такие как расположение стоянки, привычки авиакомпаний и расстояние руления, в основном определяют базовое неограниченное время. Объединив проверки корреляций с SHAP‑оценками, команда также устраняет менее полезные входы, упрощая модель без потери качества прогнозов.

Что это значит для пассажиров и планеты

Проще говоря, исследование демонстрирует, что можно с высокой точностью прогнозировать, сколько времени самолёт проведёт между отталкиванием от гейта и взлётом, и при этом объяснять эти прогнозы в терминах, соответствующих реальной работе аэропорта. Модель не только предсказывает, когда рейс, скорее всего, взлетит, но и показывает, какие факторы — например растущая очередь на прилёт или всплеск одновременных отталкиваний — вызывают дополнительные задержки. Эти знания дают аэропортам практические инструменты для корректировки времени отталкивания, управления очередями и сокращения холостого расхода топлива. Для путешественников это может означать меньше туманных ожиданий на полосе; для авиакомпаний и аэропортов — путь к более плавной работе и снижению выбросов.

Цитирование: Wu, T., Mao, Y., Huang, J. et al. Interpretable Taxi-Out Time Prediction of Departure Flights Using Stacking Ensemble Learning and SHAP Analysis. Sci Rep 16, 10066 (2026). https://doi.org/10.1038/s41598-026-40898-5

Ключевые слова: прогноз времени руления, операции на поверхности аэропорта, машинное обучение в авиации, управление задержками рейсов, скопление воздушного движения