Ensemble Learning through Rashomon Sets-Reference-Cited by-同舟云学术

Ensemble Learning through Rashomon Sets

Published:2024-07-21 Issue: Volume: Page:1-10
ISSN:
Container-title:Anais do XXXVII Concurso de Teses e Dissertações (CTD 2024)
language:
Short-container-title:

Author:

Zuin Gianlucca,Veloso Adriano

Abstract

Criar modelos a partir de observações e garantir sua eficácia em novos dados é a essencia do aprendizado de máquina. No entanto, selecionar modelos que generalizem bem para dados futuros continua sendo uma tarefa desafiadora. Neste trabalho, investigamos como os modelos se comportam em conjuntos de dados com funções de geração de dados distintas mas ainda correlacionadas. A motivação é estudar o Efeito Rashomon, que ocorre quando um problema admite a existência de vários modelos distintos com desempenho semelhante. Problemas do mundo real frequentemente exibem múltiplas estruturas locais nos dados, resultando em múltiplos modelos de alto desempenho sujeitos ao Efeito Rashomon. Propomos estratificar durante treino o espaço de soluções em grupos de modelos coerentes ou contrastantes. A partir desses grupos de Rashomon, contruimos um comitê onde cada constituinte cobre uma região distinta do espaço. Validamos nossa abordagem em conjuntos de dados abertos e reais. Nossa abordagem supera o estado-da-arte, melhorando a AUROC em até 0,20+ nos cenários onde a razão de Rashomon é alta.

Publisher

Sociedade Brasileira de Computação - SBC

Reference21 articles.

1. Asuncion, A. and Newman, D. (2007). Uci machine learning repository. [Bischl et al. 2017] Bischl, B., Casalicchio, G., Feurer, M., Hutter, F., Lang, M., Mantovani, R. G., van Rijn, J. N., and Vanschoren, J. (2017). Openml benchmarking suites and the openml100. stat, 1050:11.

2. Breiman, L. (2001). Statistical modeling: the two cultures. Statistical Science. A Review Journal of the Institute of Mathematical Statistics, 16(3):199–231.

3. Chen, C., Yuan, J., Lu, Y., Liu, Y., Su, H., Yuan, S., and Liu, S. (2021). Oodanalyzer: Interactive analysis of out-of-distribution samples. IEEE Trans. Vis. Comput. Graph., 27(7):3335–3349.

4. Endres, D. M. and Schindelin, J. E. (2003). A new metric for probability distributions. IEEE Transactions on Information theory, 49(7).

5. Fisher, A., Rudin, C., and Dominici, F. (2019). All models are wrong, but many are useful: Learning a variable’s importance by studying an entire class of prediction models simultaneously. J. Mach. Learn. Res., 20:177:1–177:81.