Author:
Carvalho Adrian Moagne Nery,Rocha Marcelo Lisboa
Abstract
A clusterização de documentos jurídicos com tópicos similares é uma tarefa desafiadora que pode trazer benefícios ao sistema judiciário ao facilitar a análise e a tomada de decisões. Neste artigo, aplicamos algoritmos de clusterização para agrupar um conjunto de dados de processos judiciais utilizando o método de vetorização TF-IDF. Avaliamos a qualidade dos clusters utilizando o Coeficiente de Silhueta e o Índice de Davies-Bouldin. Os resultados destacam o significativo potencial de melhoria na mineração de textos legais e na recuperação de informações, contribuindo para um gerenciamento e análise mais eficientes de extensos conjuntos de processos judiciais.
Publisher
South Florida Publishing LLC
Reference20 articles.
1. ALLAHYARI, M. et al. A brief survey of text mining: Classification, clustering and extraction techniques. arXiv preprint arXiv:1707.02919, 2017.
2. BALABANTARAY, R. C.; SARMA, C.; JHA, M. Document clustering using k-means and k-medoids. arXiv preprint arXiv:1502.07938, 2015.
3. CHENG, Y. Mean shift, mode seeking, and clustering. IEEE transactions on pattern analysis and machine intelligence, IEEE, v. 17, n. 8, p. 790–799, 1995.
4. CHOWDHARY, K.; CHOWDHARY, K. Natural language processing. Fundamentals of artificial intelligence, Springer, p. 603–649, 2020.
5. Conselho Nacional de Justiça. Justiça em Números 2022. 2022. .