KI-Verfahren für die Hate Speech Erkennung: Die Gestaltung von Ressourcen für das maschinelle Lernen und ihre Zuverlässigkeit-Reference-Cited by-同舟云学术

KI-Verfahren für die Hate Speech Erkennung: Die Gestaltung von Ressourcen für das maschinelle Lernen und ihre Zuverlässigkeit

Published:2023 Issue: Volume: Page:111-130
ISSN:
Container-title:Digitale Hate Speech
language:
Short-container-title:

Author:

Mandl Thomas

Abstract

ZusammenfassungDie Erkennung von Hate Speech durch KI erfordert umfangreiche Trainingsdaten. Die Zusammenstellung dieser Trainingsmenge entscheidet über die Leistungsfähigkeit der Systeme, denn es können nur Hassbotschaften erkannt werden, die den Trainingsdaten ähnlich sind. Zunächst werden einige der bestehenden Benchmarks und die Entwicklungen bei deren Aufbau besprochen. Anschließend diskutiert der Artikel mögliche Verzerrungen und die Ansätze für deren Messung. Auch der Vergleich über mehrere Kollektionen und das Schaffen von Transparenz können die Wirksamkeit von Trainingsdaten verdeutlichen.

Publisher

Springer Berlin Heidelberg

Link

https://link.springer.com/content/pdf/10.1007/978-3-662-65964-9_6

Reference49 articles.

1. Al Kuwatly, H., Wich, M., & Groh, G. (2020). Identifying and measuring annotator bias based on annotators’ demographic characteristics. In Proceedings of the fourth workshop on online abuse and harms (S. 184–190). https://doi.org/10.18653/v1/2020.alw-1.21.

2. Arango, A., Pérez, J., & Poblete, B. (2020). Hate speech detection is not as easy as you may think: A closer look at model validation (extended version). Information Systems, 101584.

3. Bevendorff, J., Chulvi, B., Peña Sarracén, G. L., Kestemont, M., Manjavacas, E., Markov, I., Mayerl, M., Potthast, M., Rangel, F., Rosso, P., Stamatatos, E., Stein, B., Wiegmann, M., Wolska , M., & Zangerle, E. (2021). Overview of PAN 2021: Authorship verification, profiling hate speech spreaders on twitter, and style change detection. International conference of the cross-language evaluation forum for European languages, 419–431. Springer, Cham. https://doi.org/10.1007/978-3-030-85251-1_26.

4. Bunde, E. (2021). AI-assisted and explainable hate speech detection for social media moderators–A design science approach. In Proceedings of the 54th Hawaii international conference on System Sciences (S. 1264).

5. De Smedt, T., & Jaki, S. (2018). Challenges of automatically detecting offensive language online: Participation paper for the germeval shared task 2018 (HaUA). 14th conference on natural language processing KONVENS. https://doi.org/10.1553/0x003a105d.