Avaliação da performance do algoritmo J48 para construção de modelos baseados em árvores de decisão-Reference-Cited by-同舟云学术

Avaliação da performance do algoritmo J48 para construção de modelos baseados em árvores de decisão

Published:2018-07-17 Issue:2 Volume:10 Page:80-90
ISSN:2176-6649
Container-title:Revista Brasileira de Computação Aplicada
language:
Short-container-title:RBCA

Author:

Araujo Vieira Elamara Marama de,Neves Nívea Trindade de A. T.,De Oliveira Ana Carolina C.,De Moraes Ronei Marcos,Do Nascimento João Agnaldo

Abstract

As árvores de decisão são modelos hierárquicos utilizados em várias áreas do conhecimento por sua capacidade preditiva e de resolução de problemas de maneira simples e objetiva. Entretanto, apresentam algumas limitações relacionadas à sua adequação à base de dados e ao se atentar quanto aos procedimentos para seleção dos parâmetros de crescimento e poda a serem adotados. Desta forma, têm-se como objetivo avaliar e discutir a performance do algoritmo J48 para construção de modelos de tomada de decisão em árvore em base de dados com atributos de diferentes tipos. Para tanto, realizaram-se experimentos em 10 bases de dados disponíveis em repositório internacional, considerando como variantes os métodos de treinamento, teste e poda, aplicados em toda base de dados e com o uso dos métodos Wrapper e CFS (Correlation-based Feature Selection) para seleção de atributos. Identificou-se que na presença de dados contínuos, os únicos modelos que apresentaram boa capacidade preditiva estiveram presentes em situações em que a grande quantidade de exemplos puderam compensar tal deficiência. Os modos de treinamento "validação cruzada" e "divisão por porcentagem" mostraram-se similares em suas predições quando ajustados a 10 folds e 75%, respectivamente. Ademais, a seleção de atributos não foi capaz de gerar melhores predições denotando que tal método de forma isolada não compensa possíveis inadequações nas bases de dados. Pode-se constatar que os resultados referentes à capacidade preditiva dos modelos são fortemente direcionados pelo quantitativo de exemplos pertencentes à base, presença de dados contínuos e de dados com ruído.

Publisher

UPF Editora

Cited by 5 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Application of artificial intelligence for tree risk assessment optimization in Itanhaém – São Paulo, Brazil;Urban Forestry & Urban Greening;2023-03

2. Information Gain applied to reduce model-building time in decision-tree-based intrusion detection system;2022 17th Iberian Conference on Information Systems and Technologies (CISTI);2022-06-22

3. Application of Artificial Intelligence for Tree Risk Assessment Optimization in Itanhaém – São Paulo, Brazil;SSRN Electronic Journal;2022

4. Decision Trees for Predicting the Physiological Responses of Rabbits;Animals;2019-11-18

5. The sustainability awareness of Brazilian consumers of cotton clothing;Journal of Cleaner Production;2019-04