Abstract
A evasão é um problema que assola instituições de ensino superior públicas e privadas em todo o mundo e estratégias para análise dos motivos para o fenômeno abundam em publicações científicas. Muitos trabalhos que objetivam encontrar as técnicas e práticas mais apropriadas e efetivas para a identificação dos indutores de desistência no aluno acabam por se alicerçar no uso de tecnologias para aprimorar a análise dos dados e atingir um maior volume de informação processada. O presente estudo visa identificar boas práticas para o uso de mineração de dados para informações de cunho educacional. Para tanto, investigou-se práticas já existentes na literatura para a estruturação de uma pesquisa com dados de uma universidade pública no interior do estado do Rio Grande do Sul. O estudo conta com testes práticos com os algoritmos Árvore de Decisão C4.5, Random Forest e Redes Neurais em diferentes conjuntos de dados. O trabalho demonstra que o algoritmo Random Forest conseguiu ter maior precisão na identificação dos alunos em risco de evasão. A partir desta experiência outras instituições poderão basear-se para a definição de suas melhores práticas.