Abstract
ZusammenfassungDie Erkennung von Hate Speech durch KI erfordert umfangreiche Trainingsdaten. Die Zusammenstellung dieser Trainingsmenge entscheidet über die Leistungsfähigkeit der Systeme, denn es können nur Hassbotschaften erkannt werden, die den Trainingsdaten ähnlich sind. Zunächst werden einige der bestehenden Benchmarks und die Entwicklungen bei deren Aufbau besprochen. Anschließend diskutiert der Artikel mögliche Verzerrungen und die Ansätze für deren Messung. Auch der Vergleich über mehrere Kollektionen und das Schaffen von Transparenz können die Wirksamkeit von Trainingsdaten verdeutlichen.
Publisher
Springer Berlin Heidelberg