Abstract
Objetivo do estudo: O objetivo deste artigo é comparar a regressão logística clássica e dois métodos de machine learning para credit scoring, o random forest e o XGBoost, visando identificar qual apresenta melhor desempenho na previsão de inadimplência.Metodologia/abordagem: O desempenho dos modelos estimados foi comparado com base em acurácia, estatística Kolmogorov-Smirnov, além de curva ROC.Originalidade/Relevância: Foi utilizada uma base de dados exclusiva com informações de 3.844 pequenas e médias empresas, clientes de uma locadora de automóveis com atuação em todo o Brasil.Principais resultados: Os resultados sugerem que os métodos de machine learning apresentam capacidade preditiva maior quando comparados com a regressão logística. O XGBoost teve o melhor desempenho, entre os métodos analisados.Contribuições teóricas/metodológicas: Este artigo corrobora a utilização de variáveis não financeiras para a previsão de inadimplência e a superioridade dos métodos estatísticos mais modernos frente à abordagem clássica.
Publisher
Fundacao Pedro Leopoldo - Revista Gestao and Tecnologia