Divisão de Engenharia Civil Ano: 2025

(Turma 2025, TGs 2025)

Análise de perfis socioeconômicos e predição da satisfação de passageiros em aeroporto utilizando machine learning (pdf 1,0 MB)

Autor: Hermiro da Cruz Pessoa Junior

Orientador(es): Prof. Alessandro Vinícius Marques de Oliveira

Relator(es): Cláudio Jorge Pinto Alves

Ano: 2025

Resumo:

Este trabalho apresenta uma análise aprofundada dos perfis socioeconômicos dos passageiros e o desenvolvimento de um modelo robusto de Machine Learning (ML) para predição de sua satisfação. A pesquisa foi conduzida utilizando uma pesquisa de satisfação de passageiros do Aeroporto Internacional de Guarulhos(GRU) e do Aeroporto Internacional de Brasília(BSB) entre os anos de 2018 e 2021, abrangendo variáveis como gênero, frequência de voo, escolaridade. A metodologia envolveu um pré-processamento de dados, uma clusterização com K-Means, seguida da implementação do algoritmo de Random Forest para ML. Os resultados demonstraram que o gênero, a forma de acesso ao aeroporto e a presença ou não de conexão são fatores importantes para o agrupamento de passageiros aéreos. O modelo de ML final, baseado em Random Forest, atingiu uma precisão de 80.6% (86.1% de F1-Score) na predição da satisfação. Além disso, concluiu-se que o embarque é um básico de qualidade. No entanto, para diferenciar e alcançar alta satisfação acima da média,se observou que aspectos como Locomoção Interna e conforto ambiental se tornam diferenciais.

Abstract:

This study presents an in-depth analysis of passenger socioeconomic profiles and the development of a robust Machine Learning (ML) model for predicting their satisfaction. The research utilized a passenger satisfaction survey conducted at Guarulhos International Airport (GRU) and Brasília International Airport (BSB) between 2018 and 2021, covering variables such as gender, flight frequency, and education level. The methodology involved data pre-processing, followed by K-Means clustering, and the implementation of the Random Forest algorithm for ML prediction. The results demonstrated that gender, means of access to the airport, and the presence of a connection are important factors for grouping air passengers. The final ML model, based on Random Forest, achieved an accuracy of 80.6% (F1-Score of 86.1%) in predicting satisfaction. Furthermore, it was concluded that the boarding process is a basic quality requirement. However, to differentiate and achieve above-average high satisfaction, aspects such as internal locomotion and environmental comfort become key differentiators.