Divisão de Engenharia Civil Ano: 2021

(Turma 2021, TGs 2021)

Uma abordagem da precificação de passagens aéreas no Brasil utilizando algoritmos de aprendizado de máquina (pdf 4,23 MB)

Autor: João Vitor Fontenele Lustosa

Orientador(es): Alessandro Vinícius Marques de Oliveira

Relator(es): Giovanna Miceli Ronzani Borille

Ano: 2021

Resumo:

O preço das passagens aéreas são determinados por inúmeros fatores, como tempo de voo, concentração de mercado, atividade econômica, preço de combustível, entre outros. Cada companhia aérea utiliza algoritmos especí?cos de gerenciamento de receita, que leva em consideração fatores que são uma incógnita para os consumidores. Este trabalho aborda a preci?cação do mercado aéreo nacional, buscando prever o preço de passagens aéreas e encontrar variáveis determinantes, utilizando uma base de dados compilada pelo laboratório de transporte aéreo do ITA (LABTAR) contendo variáveis macroeconômicas e dados de voos em trechos nacionais no período entre 2010 a 2018. No desenvolvimento deste trabalho, foi possível treinar seis algoritmos de aprendizado de máquina, utilizando variáveis pré-selecionadas da base de dados. Entre os modelos, o modelo Random Forest obteve a maior precisão preditiva acima de 85%. Em números absolutos, isto representa um erro médio de R$ 50,00 na determinação de preços que ?utuam em torno de uma média de R$ 470,00. Além disso, esse modelo indicou que os fatores de maior importância preditiva são: tempo agendado de voo, média de quilos de bagagem transportada por passageiro e tamanho da aeronave.

Abstract:

The price of airline tickets is determined by numerous factors, such as ?ight time, market concentration, GDP, fuel price, among others. Each airline uses speci?c revenue manage-ment algorithms, which take into account factors that are unknown to consumers. This work addresses the pricing of the national air market, seeking to predict the price of air tickets and ?nd determining variables, using a database compiled by the ITA air transport laboratory (LABTAR) containing macroeconomic variables and ?ight data on national air sections between the period from 2010 to 2018. In the development of this work, it was possible to train six di?erent machine learning algorithms using selected features from the database. Among the models, the Random Forest model had the highest predictive accuracy above 85%, in absolute numbers, this is an average error of R$ 50.00 in the determination of prices that ?uctuate around an average price of R$ 470.00. In addition, this model indicated that the factors of greatest predictive importance are: scheduled ?ight time, average kilograms of baggage per passenger and aircraft size.