Divisão de Engenharia Civil Ano: 2022

(Turma 2022, TGs 2022)

Predição das rotas da Azul Linhas Aéreas usando algoritmos de aprendizado de máquina (pdf 1,78 MB)

Autor: Jonathans Schaffer Torres

Orientador(es): Alessandro Vinícius Marques de Oliveira

Relator(es): Evandro José da silva

Ano: 2022

Resumo:

As consequências das entradas em novas rotas e o que leva as companhias aéreas a optarem pela adição de novos destinos são aspectos importantes e de extremo interesse da indústria, sendo considerado um dos elementos cruciais no planejamento estratégico das empresas. O presente trabalho tem como objetivo desenvolver modelagens baseadas em aprendizado de máquina para realizar a predição de rotas da Azul Linhas Aéreas, tendo como referência os dados de passageiros e de tráfego no período de 2008 a 2018. A base de dados utilizada possui um desequilíbrio de classes, evidenciando a necessidade da utilização de métodos de pré-processamento de dados, que foram implementados, majoritariamente, através da reamostragem do conjunto. Aplicando as técnicas subamostragem, sobreamostragem e a combinação destas aliadas às estratégias de análise de correlações e significância, seleção de variáveis e validação da modelagem com K-fold cross validation, comparam-se os métodos de redes neurais, regressão logística, KNN e árvore de decisão para o modelo preditivo, chegando a um melhor desempenho para as redes neurais artificiais. Como métricas de desempenho, consideram-se a acurácia, sensibilidade, especificidade, precisão, F1-score, G-Mean e tempo de treinamento do modelo. Para o modelo de redes neurais, realizam-se predições de rotas por ano, por região do território brasileiro e por proporção de balanceamento do conjunto após a reamostragem. Compara-se ainda o método de sobreamostragem e a abordagem híbrida na previsão de rotas de 2018 em todo o território nacional, concluindo com um melhor desempenho da abordagem híbrida em todas as métricas.

Abstract:

The consequences of entering new routes and what leads airlines to choose to add new destinations are important aspects and are part of the interest of the industry, being considered one of the crucial elements in the strategic planning of companies. The present work aims to develop models based on machine learning to predict routes for Azul Linhas Aéreas, using passenger and traffic data from 2008 to 2018 as a reference. The database used has a class imbalance, highlighting the need to use data pre-processing methods, which were mostly implemented through resampling of the set. Applying undersampling, oversampling and combination techniques, together with correlation and significance analysis strategies, variable selection and modeling validation with K-fold cross validation, the methods of neural networks, logistic regression, KNN and decision tree methods are compared for the predictive model, reaching a better performance for the artificial neural networks. As performance metrics, accuracy, sensitivity, specificity, precision, F1-score, G-Mean and model training time are considered. For the neural network model, route predictions are made per year, by region of the brazilian territory and by balancing proportion of the set after resampling. It also compares the oversampling method and the hybrid approach in the 2018 route forecast across the national territory, concluding with a better performance of the hybrid approach in all metrics.