Clear Sky Science · fr

Prédiction interprétable du temps de roulage au décollage des vols de départ utilisant un empilement d'apprentissage automatique et une analyse SHAP

2026-02-20 · Retour à l’index

Pourquoi le temps passé sur le tarmac compte

Toute personne qui est restée dans un avion en attente de décollage sait à quel point ces minutes supplémentaires au sol peuvent être frustrantes. Au-delà de l'irritation, de longues attentes avant le décollage gaspillent du carburant, émettent plus de dioxyde de carbone et entraînent des répercussions sur l’ensemble du planning des vols pour le reste de la journée. Cette étude examine comment prévoir ce « temps de roulage » plus précisément et, tout aussi important, d'une manière que le personnel aéroportuaire peut réellement comprendre et approuver lors de prises de décision en temps réel.

Ce qui se passe entre le départ de la porte et le décollage

Le temps de roulage couvre la période entre le repoussage de l’avion depuis la porte et son décollage effectif. Il dépend de deux grands volets : la configuration de l’aéroport et son niveau d’activité à ce moment-là. Les auteurs divisent le temps de roulage en une composante « sans entrave » — la vitesse la plus rapide que l’avion pourrait raisonnablement atteindre sur le tarmac en l’absence de congestion — et une composante « dynamique » qui capte le retard supplémentaire dû aux files d’attente et aux conflits avec d’autres aéronefs. Cette séparation leur permet de poser une question simple : quels facteurs sont liés à la configuration physique de l’aérodrome, et lesquels résultent de l’encombrement des pistes et taxiways ?

Transformer les opérations aéroportuaires en données

L’équipe a utilisé des enregistrements détaillés de l’aéroport international Shenzhen Bao’an en Chine, couvrant 14 jours chargés et plus de 12 000 vols. À partir du système d’aide à la décision de l’aéroport, ils ont extrait les heures de départ de la porte, d’atterrissage, de repoussage et de décollage, puis nettoyé les données pour éliminer les valeurs anormales. Ils ont converti la chorégraphie complexe des mouvements au sol en un ensemble de variables numériques : combien d’avions décollaient ou atterrissaient pendant le roulage d’un appareil donné, quelle était la durée moyenne des roulages au cours de la demi-heure précédente, quelle distance l’avion devait parcourir depuis son emplacement jusqu’à la piste, et comment les postes, compagnies aériennes et types d’appareils se comportaient historiquement. Ensemble, ces facteurs décrivent à la fois la configuration fixe de l’aérodrome et le tableau de trafic en constante évolution.

Une approche d’apprentissage par couches pour la prédiction

Plutôt que de s’appuyer sur une seule méthode de prédiction, l’étude utilise une technique appelée empilement (stacking), qui combine plusieurs modèles d’apprentissage automatique comme les couches d’un gâteau. Chaque modèle de base produit sa propre estimation du temps de roulage ; un modèle « métal » final apprend ensuite la meilleure manière d’agréger ces estimations. Cette approche en couches, entraînée et testée avec une validation croisée rigoureuse, a atteint une précision à la pointe de l’état de l’art : environ 41 % des vols ont été prédits à une minute près, et plus de 96 % à cinq minutes près. Les auteurs ont également comparé la prédiction en une seule étape du temps de roulage total avec une approche en phases qui prédit séparément le temps sans entrave et le retard supplémentaire. La méthode globale était légèrement plus précise, mais la méthode en deux phases rendait plus claire l’influence des différents facteurs sur les parties distinctes du roulage.

Ouvrir la boîte noire avec des explications claires

Une grande précision ne suffit pas lorsque la sécurité et la capacité sont en jeu ; les contrôleurs doivent comprendre pourquoi un modèle produit une prédiction donnée. Pour répondre à cela, les auteurs appliquent un outil appelé SHAP, qui attribue à chaque facteur d’entrée une contribution à la prédiction du temps de roulage pour un vol spécifique. Cela révèle que les facteurs liés à l’encombrement — combien d’avions se trouvent dans les files de départ et d’arrivée, et combien de temps ont pris les roulages récents — dominent la composante de retard supplémentaire. En revanche, les caractéristiques liées à l’infrastructure, telles que l’emplacement des postes, les habitudes des compagnies et la distance de roulage, déterminent principalement le temps de base sans entrave. En combinant des vérifications de corrélation avec les scores SHAP, l’équipe élimine aussi les entrées moins utiles, simplifiant le modèle sans sacrifier les performances.

Ce que cela signifie pour les passagers et la planète

En termes simples, l’étude montre que l’on peut prévoir avec une grande précision combien de temps un avion restera entre le repoussage et le décollage, et expliquer ces prévisions d’une manière cohérente avec le fonctionnement réel des aéroports. Le modèle ne se contente pas de prédire quand un vol devrait décoller : il met aussi en évidence les facteurs — comme une file d’arrivée croissante ou une vague de repoussages simultanés — qui provoquent du retard supplémentaire. Cette compréhension donne aux aéroports des leviers pratiques pour ajuster les horaires de repoussage, gérer les files et réduire la consommation de carburant en attente. Pour les voyageurs, cela peut signifier moins d’attentes inexplicables sur le tarmac ; pour les compagnies et les aéroports, c’est une voie vers des opérations plus fluides et des émissions réduites.

Citation: Wu, T., Mao, Y., Huang, J. et al. Interpretable Taxi-Out Time Prediction of Departure Flights Using Stacking Ensemble Learning and SHAP Analysis. Sci Rep 16, 10066 (2026). https://doi.org/10.1038/s41598-026-40898-5

Mots-clés: prédiction du temps de roulage, opérations de surface aéroportuaires, apprentissage automatique en aviation, gestion des retards de vol, congestion du trafic aérien