Divisão de Engenharia Civil Ano: 2021
(Turma 2021, TGs 2021)
Análise preditiva de atraso nos principais aeroportos brasileiros (pdf 2,01 MB)
Autor: Ícaro de Almeida Varão
Orientador(es): Marcelo Xavier Guterres
Relator(es): Alessandro Vinícius Marques de Oliveira
Ano: 2021
Resumo:
A pesquisa tem como objetivo a análise preditiva de atrasos nos 29 principais aeroportos brasileiros, utilizando uma árvore de decisão. No cenário de crise gerada pela pandemia de Sars-Cov-19, foi avaliado o impacto no setor aeroportuário e a influência na pontualidade dos voos. Desse modo, era esperado que as medidas sanitárias, dentro dos aeroportos em análise, impactassem negativamente na pontualidade desses voos. Foram utilizadas bases de dados com registros dos horários da movimentação das aeronaves durante o percurso de pouso e decolagem, foram utilizadas bases com registros horários das condições climáticas em cada um dos aeroportos da pesquisa e foram utilizadas bases que possuíam as características de demanda de todos os voos que ocorreram nesses aeroportos. Com essas, foram definidas variáveis classificatórias para a aplicação como input no algoritmo da árvore de decisão. Para a realização da análise por meio da árvore de decisão, foi utilizada a biblioteca scikit do python a fim de agilizar a pesquisa e possuir boas ferramentas de avaliação da árvore final. Para evitar overfitting ao longo do treinamento da árvore de decisão, foram feitas análises para o processo de poda dessa, utilizando o algoritmo de poda por custo de complexidade, em que se usou o parâmetro Alpha para determinar os elos mais frágeis da árvore obtida inicialmente, e qual o comportamento dela quando aplicada para as bases de treino e de teste vaiando o valor do parâmetro Alpha. Abstract:
The research aims at the predictive analysis of delays in the 29 main Brazilian airports, using a decision tree. In the crisis scenario generated by the Sars-Cov-19 pandemic, the impact on the airport sector and the influence on the punctuality of flights were evaluated. Thus, it was expected that sanitary measures within the airports under analysis would negatively impact the punctuality of these flights. Databases with records of aircraft movement times during the landing and take-off route were used, bases were used with hourly records of weather conditions at each of the airports in the study, and bases that had the demand characteristics of all flights that took place at these airports were used. With these, classification variables were defined for the application as input in the decision tree algorithm. To perform the analysis through the decision tree, python's scikit library was used in order to streamline the search and have good tools of evaluation of the final tree. To avoid overfitting during the decision tree training, analyzes were performed for its pruning process, using the complexity cost pruning algorithm, in which the Alpha parameter was used to determine the weakest links of the tree initially obtained, and what is its behavior when applied to the training and test bases by using the value of the Alpha parameter.