Author:
Cardoso Brenda,Santos Fantiny,Amador Angela,Andrade Marisa de,Torres Renato,Neto Nelson
Abstract
O tratamento e a classificação de dados não estruturados são desafios na era da informação. Na segurança pública, a falta de estruturação textual das narrativas presentes nos boletins de ocorrência policial (BOs) torna ainda mais complexa a categorização precisa dos crimes e a identificação do público-alvo. Assim, este artigo propõe um método para agilizar a classificação de contexto em BOs por meio do aprendizado de máquina. A meta inicial é categorizar crimes de injúria direcionados ou não à comunidade LGBTQIA+ com base em relatos oriundos da Polícia Civil do Estado do Pará. Os resultados obtidos destacam a potencial aplicabilidade da abordagem proposta em cenários reais e contextualizados, contribuindo para o trabalho das autoridades policiais.
Publisher
Sociedade Brasileira de Computação - SBC
Reference15 articles.
1. Albrecht, J., Ramachandran, S., and Winkler, C. (2020). Blueprints for Text Analytics Using Python.
2. Birks, D., Coleman, A., and Jackson, D. (2020). Unsupervised identification of crime problems from police free-text data. Crime Science, 9(1):18.
3. George, L. E. and Birla, L. (2018). A study of topic modeling methods. In 2018 second international conference on intelligent computing and control systems (iciccs), pages 109–113. IEEE.
4. Gusmão, C., Figueiredo, K., and Brito, W. A. (2021). Técnicas de processamento de linguagem natural em denúncias criminais: Automatizaçao e classificaçao de texto em português coloquial. In Anais do XLVIII Seminário Integrado de Software e Hardware, pages 172–182. SBC.
5. Hotz, N. (2023). What is CRISP DM? Data Science Process Alliance — datascience-pm.com. [link]. [Accessed 31-01-2024].