Clear Sky Science · it

Predizione interpretabile del tempo di taxi-out dei voli in partenza usando stacking ensemble learning e analisi SHAP

· Torna all'indice

Perché il tempo sulla pista conta

Chiunque sia rimasto seduto su un aereo in attesa della partenza sa quanto possano essere frustranti quei minuti extra a terra. Oltre all’irritazione, le lunghe attese prima del decollo consumano carburante, emettono più anidride carbonica e si ripercuotono sul programma dei voli per il resto della giornata. Questo studio esamina come prevedere con maggiore accuratezza il tempo di "taxi-out" e, altrettanto importante, in modo che il personale aeroportuale possa davvero comprendere e fidarsi delle previsioni nel prendere decisioni in tempo reale.

Figure 1
Figura 1.

Cosa succede tra l'abbandono del gate e il decollo

Il tempo di taxi-out è l’intervallo tra il momento in cui un aeromobile effettua il pushback dal gate e il momento in cui finalmente decolla. Dipende da due aspetti principali: come è strutturato l’aeroporto e quanto è affollato in quel momento. Gli autori suddividono il tempo di taxi-out in una porzione "non ostacolata"—la velocità più rapida con cui l’aereo potrebbe ragionevolmente muoversi sull’area di manovra senza congestione—e una porzione "dinamica" che cattura il ritardo aggiuntivo dovuto a code e conflitti con altri velivoli. Questa separazione consente di porre una domanda semplice: quali fattori sono legati alla configurazione fisica dell’aeroporto e quali sono legati all’affollamento di piste e vie di rullaggio?

Trasformare le operazioni aeroportuali in dati

Il team ha utilizzato registrazioni dettagliate dell’Aeroporto Internazionale Shenzhen Bao’an in Cina, coprendo 14 giorni intensi e oltre 12.000 voli. Dal sistema di supporto decisionale dell’aeroporto hanno estratto gli orari di partenza dal gate, atterraggio, pushback e decollo, quindi hanno ripulito i dati per rimuovere valori anomali. Hanno trasformato la complessa danza a terra degli aeromobili in un insieme di caratteristiche numeriche: quanti aerei stavano decollando o atterrando durante il taxi di un determinato aeromobile, quanto tempo in media impiegavano i voli nell’ultima mezz’ora, quanto era lunga la distanza da percorrere dallo stand alla pista e come stand, compagnie aeree e tipi di aeromobile tendevano a comportarsi in base a pattern storici. Insieme, questi fattori descrivono sia la configurazione fissa dell’area di manovra sia il quadro del traffico in continuo cambiamento.

Un approccio a più livelli per la predizione

Invece di affidarsi a un singolo metodo predittivo, lo studio utilizza una tecnica chiamata stacking, che combina diversi modelli di machine learning come fossero strati di una torta. Ogni modello base formula la propria stima del tempo di taxi-out; un modello finale "meta" impara poi come combinare al meglio quelle stime. Questo approccio stratificato, addestrato e testato con rigorosa validazione incrociata, ha raggiunto un’accuratezza all’avanguardia: circa il 41 percento dei voli è stato previsto entro un minuto e oltre il 96 percento entro cinque minuti. Gli autori hanno anche confrontato la predizione in un’unica fase del tempo di taxi-out totale con un approccio in fasi che prevede separatamente il tempo non ostacolato e il ritardo extra. Il metodo "tutto in una volta" è risultato leggermente più accurato, ma il metodo in due fasi ha reso più chiaro come diversi fattori influenzano le diverse parti del taxi.

Figure 2
Figura 2.

Aprire la scatola nera con spiegazioni chiare

Un’elevata accuratezza da sola non basta quando in gioco ci sono decisioni di sicurezza e capacità; i controllori hanno bisogno di sapere perché un modello fornisce una certa previsione. Per affrontare questo, gli autori applicano uno strumento chiamato SHAP, che assegna a ciascun fattore di input un contributo alla predizione del tempo di taxi-out per un volo specifico. Questo rivela che i fattori legati all’affollamento—quanti aeromobili sono nelle code di decollo e di arrivo e quanto sono durati i taxi recenti—dominano la porzione di ritardo aggiuntivo. Al contrario, le caratteristiche legate all’infrastruttura come la posizione dello stand, le abitudini delle compagnie e la distanza di rullaggio modellano principalmente il tempo base non ostacolato. Combinando controlli di correlazione con i punteggi SHAP, il team elimina anche input meno utili, mantenendo il modello più semplice senza sacrificare le prestazioni.

Cosa significa per i passeggeri e per il pianeta

In termini chiari, lo studio dimostra che possiamo prevedere con elevata precisione quanto tempo un aereo passerà tra il pushback dal gate e il decollo, e possiamo spiegare quelle previsioni in modo coerente con il funzionamento reale degli aeroporti. Il modello non solo predice quando è probabile che un volo decolli, ma mette anche in evidenza quali fattori—come una coda di arrivi in aumento o un picco simultaneo di pushback—stanno causando ritardi aggiuntivi. Questa intuizione offre agli aeroporti un modo pratico per regolare gli orari di pushback, gestire le code e ridurre il consumo di carburante a motore al minimo. Per i viaggiatori, ciò potrebbe significare meno attese misteriose sulla pista; per compagnie e aeroporti, apre la strada a operazioni più fluide e a minori emissioni.

Citazione: Wu, T., Mao, Y., Huang, J. et al. Interpretable Taxi-Out Time Prediction of Departure Flights Using Stacking Ensemble Learning and SHAP Analysis. Sci Rep 16, 10066 (2026). https://doi.org/10.1038/s41598-026-40898-5

Parole chiave: predizione del tempo di taxi-out, operazioni di superficie aeroportuale, machine learning nell'aviazione, gestione dei ritardi dei voli, congestione del traffico aereo