Kampf gegen Hate-Speech

Nie wieder “Du hässliche Fickfresse”

Wir von wafana versuchen mit unserer täglichen Arbeit Fake-News zu bekämpfen: wir coachen JournalistInnen, wie sie u.a. Bilder, Videos und Accounts auf Echtheit überprüfen können.

Dabei stoßen wir oft auf ein weiteres Phänomen: Hate-Speech. Es passiert fast täglich, dass wir  ein Social-Bot-Netwerk entdecken, in dem menschenverachtende Inhalte in die Welt posaunt werden. Und eben nicht nur in die digitale Welt – die hetzerischen Nachrichten zerstören auch reale Leben.

Quelle: dignitymemorial.com

Welche dramatische Wirkung Hass im Netz entfalten kann, lässt sich anhand der Cyber-Mobbing-Opfer zeigen. Der 13-Jährige US-Amerikaner Daniel Fitzpatrick litt so sehr unter Mobbing im Netz, dass er sich am 11. August 2016 erhängte. Der Niederländer Tim Ribberink nahm sich nach jahrelangem Leiden unter Hass und Spott, der insbeondere im Internet auf ihn einprasselte, mit 20 Jahren das Leben.

Cybermobbing und Hatespeech

Cybermobbing und Hatespeech sind nicht das selbe, aber eng verwandt. Eine allgemeingültige Definition von Hatespeech gibt es nicht. Sprachwissenschaftler nutzen gerne die Definition des Ministerkomitees des Europarats vom Oktober 1997: Unter Hassrede fallen »alle Ausdrucksformen, die Rassismus, Fremdenfeindlichkeit, Antisemitismus oder andere Formen auf Intoleranz beruhendem Hass verbreiten, dazu anstiften, sie fördern oder rechtfertigen; einschließlich von Intoleranz, die sich in aggressivem Nationalismus und Ethnozentrismus, der Diskriminierung und Feindseligkeit gegenüber Minderheiten, Migrant/innen und Menschen mit Migrationshintergrund äußert«

Nur eine Minderheit der deutschen Facebook User (5%) ist verantwortlich für den größten Teil der Hatespeech

Diese wenigen User verbreiten aber den Eindruck, dass sich extrem viele Menschen mit Themenverknüpfungen wie “Einwanderer und Kriminalität” beschäftigen. Das sagen Silvia Jaki von der Universität Hildesheim und Tom De Smedt von der Universität Antwerpen.

Die beiden stellten sich die Frage: Wie ist es möglich, Hasspostings automatisch zu erkennen – um sie dann zum Beispiel im nächsten Schritt auch automatisch löschen zu können? Die Wissenschaftler machten sich ans Werk und entwickelten mit Hilfe von Machine Learning einen Algorithmus, der nach eigenen Aussagen der beiden mit über 80 % Genauigkeit deutschsprachige Hassrede auf Twitter erkennt. Und er lernt ständig dazu. Die Wissenschaftler “fütterten” anfangs den Algorithmus mit Wörtern, die besonders oft im Zusammenhang mit diffamierenden Äußerungen auftauchen. Etwa die Wörter “Horden” oder “Gutmenschen”. Insgesamt sammelten sie von August 2017 bis April 2018 55,000 Hasserfüllte Tweets von über 100 Usern und 50,000 “safe” Tweets. Also Tweets von Usern, die keinen Hass verbreiteten.

Über 4.500 Hate-Speech-Wörter entschlüsselt

Jaki und De Smedt entdeckten daraufhin über 4.500 Wörter, die besonders häufig im Zusammenhang mit Hatespeech stehen.

Quelle: Tom de Smedt

Weil aber einzelne Worte nicht unbedingt auch Hassbotschaften transportieren, ist es wichtig die einzelnen Worte in einen Zusammenhang zu stellen. Auch dies macht der Algoritmus, veranschaulicht in diesem Wörter-Baum.

 

Quelle: Tom de Smedt

Die beiden Wissenschaftler haben ihr Paper vor rund 3 Monaten eingereicht, noch ist es nicht veröffentlicht. Wir von wafana machen bereits jetzt auf ihre Arbeit aufmerksam, auch weil die Wissenschaftler Unterstützung brauchen: Jaki und De Smedt müssen in absehbarer Zeit Drittmittel einwerben, “weil wir einfach mehr Man- bzw. Womanpower brauchen”, so Jaki gegenüber wafana. “Gerade nehmen wir an einer Shared Task zur automatischen Erkennung deutschsprachiger Hate Speech auf Twitter teil, d.h. das ist so eine Art Wettebewerb von 19 Teams, wer mit welcher Methodik wie weit kommt. Im September gibt es dann dazu einen Workshop in Wien.” Wenn Sie konkrete Fragen zum Projekt haben oder Jaki und De Smedt  unterstützen wollen: Wir stellen gerne den Kontakt her!