Author:
Muftie Fuad,Yafi Kamal Muftie,Addina Qinthara Muftie
Abstract
Peningkatan aktivitas browsing terutama di situs media sosial mengakibatkan rawannya terjadi cyberbullying (perundungan dunia maya). Telah banyak dilakukan penelitian untuk melakukan pendeteksian cyberbullying, baik dengan metode machine learning maupun deep learning. Dalam penelitian ini dilakukan perbandingan performa pengklasifikasian data teks apakah termasuk cyberbullying atau bukan, dengan menggunakan algoritma Transformer. Kemudian dilakukan perbandingan performa metode transformer dengan metode deep learning lain (RNN, LSTM, dan GRU) serta dengan metode machine learning (Naïve Bayes, Logistic Regression, SVM, dan Decision Tree). Hasil terbaik untuk model deep learning adalah dataset Youtube dengan model Transformer yang mendapat akurasi 98.49%. Kemudian hasil terbaik model machine learning adalah dataset Youtube dengan model SVM dan menggunakan feature Tf-Idf yang mendapat akurasi 97.82%.
Reference19 articles.
1. Birjali, M., Kasri, M., & Beni-Hssane, A. (2021). A comprehensive survey on sentiment analysis: Approaches, challenges and trends. Knowledge-Based Systems, 226, 107134. https://doi.org/https://doi.org/10.1016/j.knosys.2021.107134
2. Caselli, T., Basile, V., Mitrović, J., & Granitzer, M. (2021). HateBERT: Retraining BERT for abusive language detection in English. Proceedings of the 5th Workshop on Online Abuse and Harms (WOAH 2021), 17–25. https://doi.org/10.18653/v1/2021.woah-1.3
3. Chugh, D., Anjum, A., & Katarya, R. (2021). Automated news summarization using transformers.
4. Dadvar, M., & Eckert, K. (2020). Cyberbullying detection in social networks using deep learning based models. In Big Data Analytics and Knowledge Discovery: 22nd International Conference, DaWaK 2020, Bratislava, Slovakia, September 14–17, 2020, Proceedings 22 (pp. 245-255). Springer International Publishing.
5. Elsafoury, F. (2020). Cyberbullying datasets. Mendeley Data. https://doi.org/10.17632/jf4pzyvnpj.1