Abstract
Transações fraudulentas em operações com cartão de crédito geram perdas financeiras expressivas, incentivando o desenvolvimento de algoritmos capazes de detectá-las. Nesta linha, propõem-se neste artigo novas técnicas de aprendizado de máquina para a solução de problemas de detecção binária com classes desbalanceadas, ou seja, para os quais uma das classes (e.g., ocorrência de uma fraude) é bem menos frequente que a outra. As técnicas propostas combinam classificadores de formulações distintas, treinados com conjuntos de dados obtidos através de diferentes formas de amostragem. A combinação de classificadores é realizada através de voto majoritário ou do novo esquema de voto singelo, que visa aumentar a taxa de detecção de fraude. Os algoritmos propostos tiveram os seus desempenhos avaliados através de simulações numéricas utilizando dados de transações financeiras reais. Os resultados das simulações indicaram que os novos algoritmos exibem métricas de detecção vantajosas em relação a técnicas do estado-da-arte.
Publisher
Universidade Tecnologica Federal do Parana (UTFPR)
Subject
General Earth and Planetary Sciences,General Environmental Science