Offensiveness ratings

How to calculate text offensiveness

Source: Dolińska, A. (Unpublished MA thesis). Machine Translation vs cunt: Translation of swear words in literature

Text offensiveness rating is a comparative metric designed to evaluate how different translation methods handle profanity. It offers a structured, data-driven approach that can be used in translation studies, natural language processing (NLP) and publishing. 

Each text is assessed based on three variables: 

  1. Word count – total number of words in the text 
  1. Profanity count – total number of swear words in the text 
  1. Offensiveness rating – calculated as the proportion of swear words relative to the overall word count (profanity count ÷ word count) x100 

This rating standardises the comparison of profane content across texts and translations. It reveals the strategies and preferences of translators in rendering emotionally charged or culturally sensitive language, highlighting differences between professional and student approaches. 

Example:

ORIGINAL TEXT PROFESSIONAL TRANSLATION MACHINE TRANSLATION STUDENT TRANSLATION 
They call urn Sick Boy because he’s just one sick cunt. – Let’s fuckin go, he snapped desperately. – Haud oan a second. Ah wanted tae see Jean–Claude smash up this arrogant fucker. If we went now, ah wouldnae git tae watch it. Ah’d be too fucked by the time we goat back, and in any case it wid probably be a few days later. That meant ah’d git hit fir fuckin back charges fi the shoap oan a video ah hudnae even goat a deck at. – Ah’ve goat tae fuckin move man! he shouts, standing up. Mówią na niego Sick Boy przez to, że jest jedną chorą kurwom. –  Chodźmy do chuja – warczy rozeźlony. – Poczekaj chwile. Chce popatrzeć, jak Jean-Claude rozpierdala tego kutasa. Jak teraz z nim pójdę, nigdy tego nie obejrze. Bede napierdolony, zanim wrócimy, kto wie, po ilu dniach, a poza tym w wypożyczalni każą mi płacić za zwłoke. I to za kasete, której nawet nie obejrzałem! – Musze się kurwa ruszyć, człowieku! – wrzeszczy, wstając. Nazywają go Sick Boy, bo jest po prostu chorą pizdą. – Spierdalajmy – warknął desperacko. – Chwileczkę. Chciałem zobaczyć, jak Jean-Claude rozwala tego aroganckiego skurwiela. Gdybyśmy poszli teraz, nie mógłbym na to patrzeć. Byłbym zbyt najebany, zanim byśmy wrócili, a i tak pewnie byłoby to kilka dni później. Oznaczało to, że musiałbym zapłacić pierdoloną opłatę zwrotną za film, którego nawet nie zdążyłbym obejrzeć. – Muszę się, kurwa, ruszyć! – krzyczy, wstając. Mówią na niego Sick Boy, bo jest chorą pizdą. – Lecimy, kurwa – warknął z desperacją. – Chwila chwila. Chcę zobaczyć jak Jean–Claude spuszcza manto temu aroganckiemu chujkowi. Jak pójdziemy teraz to nic nie zobaczę. Jak wrócimy będę zbyt porobiony, a tak w ogóle to pewnie będzie i tak dopiero za kilka dni. Czyli znowu naliczą mi te jebane odsetki w wypożyczalni za film, którego nawet nie obejrzałem. – Kurwa, muszę lecieć, stary! – krzyknął, wstając. 
  ORIGINAL TEXT PROFESSIONAL TRANSLATION MACHINE TRANSLATION STUDENT TRANSLATION 
Word count 95 69 67 71 
Profanity count 
Text Offensiveness7.4% 10.1% 10.4% 8.5% 

Applications 

  • Translator training: The metric may be integrated into translator education as a feedback tool, supporting curriculum design and professional development. 
  • Machine/AI translation evaluation: It can assess the degree to which MT systems replicate human decision-making regarding the retention, mitigation or omission of offensive language, contributing to research on AI sensitivity to cultural and contextual cues. 
  • Publishing and content management: Publishers may use the offensiveness rating to address audience expectations, inform editorial policy and provide content warnings. This mirrors practices used in film and gaming industries to promote transparency and informed choice. 

How to calculate word offensiveness

Source: Sawicka, A. (unpublished MA thesis). Foreign language effect vs. intercultural competence: Are translators sensitised to the offensiveness of foreign swear words?

Word offensiveness rating (WOR) is a metric, which shows how offensive a given swear word is on a scale from 1 (inoffensive) to 5 (highly offensive). It serves as a tool which not only exhibits the offensiveness of swear words in a measurable way but it also enables systematic comparison of the offensiveness of swear words across languages.

Polish swear wordexample WOREnglish swear wordexampleWOR
czarnuchPatrz jaki czarnuch stoi na przystanku.4.7niggerThis nigger should go back where he came from.4.8
kurwaŁatwo uwierzę, że wydawał pieniądze na kurwy.4.1cuntJessica is just an old jealous cunt.4.1
cipaTy głupia cipo! Oddawaj mi torebkę!4cuntYou can see her cunt through her bikini.3.9
pierdolićOna jedzie do Włoch. Tam będzie ją pierdolił jakiś Włoch z Florencji.3.9whoreSome whore stopped me on the street and offered sexual favours.3.7
skurwysynTo kawał skurwysyna.3.7bitchHow can anyone be expected to deal with a bitch like that?3.5
sukaTa suka już na niego poluje, żeby go znowu zabrać do siebie.3.7motherfuckerYou’d better watch out, motherfucker!3.4
chujPowiedz temu chujowi, żeby więcej tu nie przychodził.3.7assSharon is one fine little ass, don’t you think?3.1
chujEkshibicjonista wyciągnął chuja w autobusie na oczach tłumu.3.5dickThat guy is such a dick, I can’t stand him.2.9
dupaPoznałem niezłą dupę na imprezie w klubie.3.1motherfuckerI jammed my finger in the door yesterday. It hurt like a motherfucker.2.8
robić w chujaNie rób mnie w chuja, dobrze?3fuckDid you two sneak off somewhere to fuck?2.6
skurwysynNakradli śliwek jak skurwysyn.2.9dick someoneYou are dicking me again! How dumb do you think I am?2.6
cipaZ oburzeniem wyznała przyjaciółce, że jej ginekolog używa słowa „cipa”.2.9dickAs his towel dropped, one hand darted down to conceal his dick.2.1
kurwaKurwa, cały portfel mam mokry od tego deszczu.2.6fuckOh fuck, I forgot to pay my phone bill!2
cholernyJego siostra to cholerna dziewucha!2.3shitThis stuff looks like cow shit or something similar.2
gównoZrób w końcu porządek z tymi krowimi gównami na polu.1.8shitOh shit! I almost dropped my phone!1.7
gównoCo za gówno, znowu prąd wyłączyli.1.8damnWhat a damn guy you are!1.6
dupaWojtek dostał zastrzyk w dupę i od razu poczuł się lepiej.1.7assMy ass did not fit into those jeans.1.5
choleraCholera! Co za śliczna dziewczyna!1.5damnDamn, we’re late! Hurry up!1.4
głowaMocka rozbolała głowa.1pickWhich coin do you pick?1

Applications

  • Research tool: the 5-point WOR scale can be used as a standardised metric across languages
  • Educational tool: WOR metric can be used as an educational tool to increase awareness of the differences in perceived offensiveness of native and foreign swear words
  • Reference tool: Bodies regulating the use of profane language on public media, such as the Polish National Broadcasting Council, may use the WOR scale to categorise swear words by their severity (e.g. low, mild, high), depending on their offensiveness rating