Author:
Carvalho Mônica Canaan,França Luciano Cavalcante de Jesus,Leite e Lopes Isaira,Araújo Laís Almeida,Mello José Márcio de,Gomide Lucas Rezende
Abstract
O estudo teve como objetivo avaliar três métodos de aprendizagem de máquina (árvore de decisão-J48, random forest e redes neurais artificias), na modelagem da distribuição de dez espécies arbóreas mais abundantes em uma sub-bacia do rio São Francisco (MG). Utilizaram-se dados provenientes do Inventário Florestal de Minas, com total de 77 fragmentos amostrados e 2.234 parcelas, nas quais foram computadas a presença/ausência de cada espécie. Empregaram-se 12 variáveis ambientais categóricas procedentes do Zoneamento Ecológico Econômico de Minas Gerais (ZEE/MG), além de variáveis relacionadas ao balanço hídrico do solo (evapotranspiração atual e potencial, aridez e índice alpha). A parametrização dos três algoritmos para as dez espécies selecionadas foi feita com o auxílio do algoritmo cv parameter do software WEKA. Os resultados mostram que os algoritmos testados apresentaram desempenhos estatisticamente iguais em 60% das espécies arbóreas. Os algoritmos random forest e multilayer perceptron foram estatisticamente iguais para a espécie Eugenia dysenterica, sendo superiores ao algoritmo J48. Contudo, o algoritmo random forest foi superior aos demais para as três espécies do gênero Qualea. Conclui-se que o algoritmo random forest apresentou-se como o mais robusto para a modelagem da distribuição potencial de habitat de espécies arbóreas.Palavras-chave: inteligência artificial; árvore de decisão; random forest; redes neurais artificiais. MACHINE LEARNING ALGORITHMS FOR MODELING THE POTENTIAL DISTRIBUTION HABITAT OF TREE SPECIES ABSTRACT: The aim of the present study was to evaluate three methods of machine learning (decision tree-J48, random forest and artificial neural networks) to model the potential habitat distribution of the ten most abundant tree species of the São Francisco river watershed. The presence/absence tree species data were from 77 fragments sampled with 2,234 plots. We used 12 categorical environmental variables from the Economic Ecological Zoning of Minas Gerais (ZEE/MG), as well as variables related to soil water balance (current and potential evapotranspiration, aridity and alpha index). The parameterization of the three algorithms was done with cv parameter algorithm of the WEKA software. The results showed the applied algorithms were statistically similar for 60% of the tree species. The random forest and multilayer perceptron algorithms were statistically similar considering the Eugenia dysenterica and superior to J48 algorithm. However, the random forest algorithm was superior to the other for the three species of Qualea genera. The conclusion is the random forest was the most robust model for the potential distribution habitat of tree species.Keywords: artificial intelligence; decision trees; random forest; artificial neural networks.
Cited by
3 articles.
订阅此论文施引文献
订阅此论文施引文献,注册后可以免费订阅5篇论文的施引文献,订阅后可以查看论文全部施引文献