Olsen Bandens forskningsbidrag
De kulørte skældsord fra Egon Olsen – som her ses i “Olsen Banden på sporet” – har fået ny forskningsmæssig interesse. © Foto: Cinetext Bildarchiv/Ritzau Scanpix
ITU-forskere har benyttet filmfiguren Egon Olsens raserianfald som grundlag for et digitalt værktøj, der skal opfange hadefuld tale i digitale debatter. Udbyttet var dog begrænset.
En pjalt, et pjok, en pudseklud, en skidespræller …
Der er ikke et øje tørt, når vaneforbryderen Egon Olsen kammer over i et af sine raserianfald med en gloserigdom af Kaptajn Haddockske dimensioner.
Det koleriske geni har gennem årtier trukket smilene frem hos unge og gamle. Men ikke nok med det. Nu er Egon Olsens skældsord også blevet et forskningsmæssigt aktiv.
ITU-forskeren Leon Derczynski har med flere kolleger arbejdet med udvikling af et digitalt værktøj, der kan opspore grim og hadefuld tale eksempelvis på sociale medier. I den forbindelse har forskerne indsamlet eksempler på hadefuld tale fra brugere på det sociale medie Reddit og skabt et “Danish Hate Speech Lexicon”, som en maskinlæringsmodel kan bruge til at udpege potentielle problemer.
Og her kan man altså stifte fornøjeligt gensyn med det meste af Egon Olsens blomstrende vokabularium: bidesild, bløddyr, hundehoveder, hængerøve, elendige socialdemokrater og så videre.
Leon Derczynski har dog efterfølgende kunnet konstatere, at Egon Olsens kraftudtryk er og bliver kuriøse. Reelt bliver de ikke brugt i almindelig tale.
“Vi var super glade for at få listen med. Vores tanke var, at der måske en sjælden gang – i et ud af tusinde tilfælde – ville være nogen, der brugte et af ordene. Men vi må bare konstatere, at det er der simpelthen ikke. Og det er også o.k.”, siger han.
Den samlede liste tæller naturligvis klassiske fornærmelser som “røvhul” og “fæhoved”, men også umiddelbart neutrale udtryk som “hvid”, “sort” og “kristen”.
“Nøgleordene skal bruges til at finde tekst, der kan være krænkende, og efterfølgende kan en person så manuelt vurdere, om det reelt er det. Når ord som “sort” og “hvid” er med, er det, fordi der ofte kan være generaliseringer i spil, når man skriver for eksempel om en sort mand. Så de ord kan indikere, at der kan være problemer”.
Bruttolisten af krænkende ord bruges af detektorprogrammet til at udpege tekster med potentielt hadefuld tale. Men det er en levende person, der manuelt sidder og vurderer, om der er tale om et verbalt angreb eller en uskyldig sjov bemærkning. Leon Derczynski ser derfor ingen problemer i, at listen tæller Egon Olsen-sprog og en række andre udtryk, der formentlig vil få flere til at trække på smilebåndet end at fare i flint.
“Vi vil gerne sikre os det bredest mulige udvalg af tekster. Hvis vi kun koncentrerer os om ord som “fuck” eller “neger”, får vi ikke et bredt billede af data”, siger han.
Ideen med det digitale værktøj er ifølge Leon Derczynski ikke at bruge det direkte til at redigere indhold på sociale medier, men at identificere og måle omfanget af hadefuld tale, for eksempel i digitale debatfora.