L’analisi dei Big Data per la previsione dei ritardi aerei

Ogni anno circa il 20% dei voli arriva in ritardo o viene cancellato a causa di cattive condizioni meteo, di guasti meccanici o di problemi tecnici/organizzativi negli aeroporti. Tutto questo produce, oltre ai numerosi disagi ai viaggiatori, anche un aggravio dei costi per diverse decine di miliardi di euro l’anno.

airport catania fontanarossa etna italia italy travel creative commons cc gnuckx news panoramio flickr googleearth high quality photo picture map googlemaps geotag wiki wikipedia

Si stima, ad esempio, che nei soli Stati Uniti, l’impatto negativo sull’economia dei ritardi aerei sia di oltre 30 miliardi di dollari l’anno, metà dei quali a carico dei passeggeri.
Per queste ragioni, la previsione dei ritardi aerei assume una notevole importanza per le compagnie aeree, per le autorità nazionali del volo e per i viaggiatori.

Lo scopo della ricerca condotta da un gruppo di ricercatori del DIMES dell’Università della Calabria e da DtoK Lab, è stato quello di realizzare un modello di analisi basato su avanzate tecniche di intelligenza artificiale per la predizione del ritardo di arrivo dei voli a causa delle condizioni meteorologiche.

Tra le diverse cause di ritardo, infatti, le condizioni meteorologiche incidono in media su 1/3 dei voli in ritardo. Avere un modello capace di predire se un volo sarà o no in ritardo partendo dalle previsioni meteo, quindi, può risultare uno strumento estremamente utile in diversi ambiti: le compagnie aeree e gli aeroporti potrebbero adottare delle strategie mirate a contenere l’impatto negativo di condizioni meteo avverse (ad es., attraverso la modifica dei piani di volo, la riduzione del tasso di accettazione voli dell’aeroporto, la deviazione dei voli su altri scali), i passeggeri in fase di prenotazione potrebbero scegliere il volo con meno rischi di ritardo, le agenzie di viaggio potrebbero offrire delle soluzioni di viaggio multi-tratta più sicure.

flight-delay-causes

Il sistema di predizione realizzato da DtoK Lab sfrutta le informazioni del volo (aeroporto di origine, aeroporto di destinazione, ora e data di partenza, ora e data di arrivo) e le previsioni meteorologiche all’aeroporto di partenza e di destinazione negli orari previsti dalla tabella di volo. L’analisi è stata condotta su una grande mole di dati costituita da oltre 260 milioni di record, forniti dal Bureau of Transportation Statistics e dal National Climatic Data Center americani, relativi a oltre 30 milioni di voli e ai dati meteorologici degli aeroporti americani, nel periodo compreso tra gennaio 2009 e dicembre 2013. Sono state utilizzate, inoltre, moderne tecniche di calcolo parallelo e sistemi di Cloud computing per analizzare in tempi rapidi l’enorme mole di dati raccolti.

L’algoritmo usato è basato su una tecnica di intelligenza artificiale distribuita, detta random forest, che ha permesso di costruire un insieme molto grande di classificatori dei dati che “lavorano” in parallelo e che insieme cooperano per trovare la migliore soluzione attraverso un comportamento di apprendimento collettivo (collective machine learning). All’algoritmo sono stati fornite le partizioni dei dati storici sui voli e sulle condizioni atmosferiche (training set) ed esso ha costruito (“appreso”) un modello di ritardo dei voli che permette di predire con elevata accuratezza i possibili ritardi su qualsiasi                                                                                                                                                                                        insieme di voli se sono note/previste le condizioni atmosferiche.

flight-delay-workflow

 

Nel corso degli anni, a causa del forte impatto economico del problema, decine di milioni di dollari sono stati spesi dal governo americano per finanziare la ricerca in questo settore. Alcune di queste ricerche hanno tentato di modellare il fenomeno della propagazione del ritardo all’interno di una rete di aeroporti, allo scopo di stimare il livello di congestione della rete e/o il ritardo medio dei voli in un aeroporto. Altri lavori si sono occupati di stimare il ritardo di un volo a partire dalla conoscenza di variabili che sono disponibili soltanto al momento del volo (ad es., livello di congestione della rete al momento della partenza del volo). Tra questi ultimi, citiamo un recente lavoro dei ricercatori del MIT di Boston, che ha riguardato predizione del ritardo aereo medio su una determinata tratta aerea all’interno di una finestra temporale tra le 2-24 ore.

Nei test effettuati, il sistema realizzato da DtoK Lab ha mostrato la migliore accuratezza tra quelli realizzati finora, incluso un modello sviluppato di recente dal gruppo del MIT (Rebollo e Balakrishnan) e un’affidabilità di previsione superiore all’85%. In particolare, la ricerca realizzata al MIT si concentra sulla previsione dei ritardi aerei soltanto nelle 24 ore e in uno specifico aeroporto, mentre la ricerca dell’Università della Calabria e di DtoK Lab è capace di prevedere i ritardi di qualsiasi volo in qualsiasi aeroporto con un anticipo più ampio che può arrivare fino a cinque giorni precedenti.

La tabella seguente mostra il confronto della precisione della previsione tra i tre sistemi più accurati tra quelli realizzati (considerando la previsione dei ritardi fino a 60 minuti). Come si può notare, il sistema sviluppato da DtoK Lab mostra i migliori risultati.

flight-delay-related-work

 

Infine, un ulteriore risultato interessante della soluzione proposta da DtoK Lab è che, anche quando il modello realizzato non prende in considerazione le condizioni atmosferiche, la sua accuratezza della previsione è del 70%. Questo indica chiaramente che la metodologia realizzata è capace di identificare con una buona accuratezza i ritardi aerei anche indipendenti dalle condizioni climatiche e questo aspetto potrebbe essere opportunamente sfruttato dalle compagnie aeree per migliorare la schedulazione di tutti i loro voli e così abbattere i ritardi.

I risultati della ricerca svolta sono stati pubblicati sul numero di Ottobre 2016 della rivista americana  ACM Transactions on Intelligent Systems and Technology    acm-tist-jr-header-logo-new (http://dl.acm.org/citation.cfm?id=2888402).

 

News:

layer_1 Articolo su Repubblica.it

 fon Articolo su flyorbitnews.com

italyJournal  Articolo su italyjournal.it.