How to calculate text offensiveness
Source: Dolińska, A. (Unpublished MA thesis). Machine Translation vs cunt: Translation of swear words in literature.
Text offensiveness rating is a comparative metric designed to evaluate how different translation methods handle profanity. It offers a structured, data-driven approach that can be used in translation studies, natural language processing (NLP) and publishing.
Each text is assessed based on three variables:
- Word count – total number of words in the text
- Profanity count – total number of swear words in the text
- Offensiveness rating – calculated as the proportion of swear words relative to the overall word count (profanity count ÷ word count) x100
This rating standardises the comparison of profane content across texts and translations. It reveals the strategies and preferences of translators in rendering emotionally charged or culturally sensitive language, highlighting differences between professional and student approaches.
Example:
ORIGINAL TEXT | PROFESSIONAL TRANSLATION | MACHINE TRANSLATION | STUDENT TRANSLATION |
They call urn Sick Boy because he’s just one sick cunt. – Let’s fuckin go, he snapped desperately. – Haud oan a second. Ah wanted tae see Jean–Claude smash up this arrogant fucker. If we went now, ah wouldnae git tae watch it. Ah’d be too fucked by the time we goat back, and in any case it wid probably be a few days later. That meant ah’d git hit fir fuckin back charges fi the shoap oan a video ah hudnae even goat a deck at. – Ah’ve goat tae fuckin move man! he shouts, standing up. | Mówią na niego Sick Boy przez to, że jest jedną chorą kurwom. – Chodźmy do chuja – warczy rozeźlony. – Poczekaj chwile. Chce popatrzeć, jak Jean-Claude rozpierdala tego kutasa. Jak teraz z nim pójdę, nigdy tego nie obejrze. Bede napierdolony, zanim wrócimy, kto wie, po ilu dniach, a poza tym w wypożyczalni każą mi płacić za zwłoke. I to za kasete, której nawet nie obejrzałem! – Musze się kurwa ruszyć, człowieku! – wrzeszczy, wstając. | Nazywają go Sick Boy, bo jest po prostu chorą pizdą. – Spierdalajmy – warknął desperacko. – Chwileczkę. Chciałem zobaczyć, jak Jean-Claude rozwala tego aroganckiego skurwiela. Gdybyśmy poszli teraz, nie mógłbym na to patrzeć. Byłbym zbyt najebany, zanim byśmy wrócili, a i tak pewnie byłoby to kilka dni później. Oznaczało to, że musiałbym zapłacić pierdoloną opłatę zwrotną za film, którego nawet nie zdążyłbym obejrzeć. – Muszę się, kurwa, ruszyć! – krzyczy, wstając. | Mówią na niego Sick Boy, bo jest chorą pizdą. – Lecimy, kurwa – warknął z desperacją. – Chwila chwila. Chcę zobaczyć jak Jean–Claude spuszcza manto temu aroganckiemu chujkowi. Jak pójdziemy teraz to nic nie zobaczę. Jak wrócimy będę zbyt porobiony, a tak w ogóle to pewnie będzie i tak dopiero za kilka dni. Czyli znowu naliczą mi te jebane odsetki w wypożyczalni za film, którego nawet nie obejrzałem. – Kurwa, muszę lecieć, stary! – krzyknął, wstając. |
ORIGINAL TEXT | PROFESSIONAL TRANSLATION | MACHINE TRANSLATION | STUDENT TRANSLATION | |
Word count | 95 | 69 | 67 | 71 |
Profanity count | 7 | 7 | 7 | 6 |
Text Offensiveness | 7.4% | 10.1% | 10.4% | 8.5% |
Applications
- Translator training: The metric may be integrated into translator education as a feedback tool, supporting curriculum design and professional development.
- Machine/AI translation evaluation: It can assess the degree to which MT systems replicate human decision-making regarding the retention, mitigation or omission of offensive language, contributing to research on AI sensitivity to cultural and contextual cues.
- Publishing and content management: Publishers may use the offensiveness rating to address audience expectations, inform editorial policy and provide content warnings. This mirrors practices used in film and gaming industries to promote transparency and informed choice.
How to calculate word offensiveness
Source: Sawicka, A. (unpublished MA thesis). Foreign language effect vs. intercultural competence: Are translators sensitised to the offensiveness of foreign swear words?
Word offensiveness rating (WOR) is a metric, which shows how offensive a given swear word is on a scale from 1 (inoffensive) to 5 (highly offensive). It serves as a tool which not only exhibits the offensiveness of swear words in a measurable way but it also enables systematic comparison of the offensiveness of swear words across languages.
Polish swear word | example | WOR | English swear word | example | WOR |
czarnuch | Patrz jaki czarnuch stoi na przystanku. | 4.7 | nigger | This nigger should go back where he came from. | 4.8 |
kurwa | Łatwo uwierzę, że wydawał pieniądze na kurwy. | 4.1 | cunt | Jessica is just an old jealous cunt. | 4.1 |
cipa | Ty głupia cipo! Oddawaj mi torebkę! | 4 | cunt | You can see her cunt through her bikini. | 3.9 |
pierdolić | Ona jedzie do Włoch. Tam będzie ją pierdolił jakiś Włoch z Florencji. | 3.9 | whore | Some whore stopped me on the street and offered sexual favours. | 3.7 |
skurwysyn | To kawał skurwysyna. | 3.7 | bitch | How can anyone be expected to deal with a bitch like that? | 3.5 |
suka | Ta suka już na niego poluje, żeby go znowu zabrać do siebie. | 3.7 | motherfucker | You’d better watch out, motherfucker! | 3.4 |
chuj | Powiedz temu chujowi, żeby więcej tu nie przychodził. | 3.7 | ass | Sharon is one fine little ass, don’t you think? | 3.1 |
chuj | Ekshibicjonista wyciągnął chuja w autobusie na oczach tłumu. | 3.5 | dick | That guy is such a dick, I can’t stand him. | 2.9 |
dupa | Poznałem niezłą dupę na imprezie w klubie. | 3.1 | motherfucker | I jammed my finger in the door yesterday. It hurt like a motherfucker. | 2.8 |
robić w chuja | Nie rób mnie w chuja, dobrze? | 3 | fuck | Did you two sneak off somewhere to fuck? | 2.6 |
skurwysyn | Nakradli śliwek jak skurwysyn. | 2.9 | dick someone | You are dicking me again! How dumb do you think I am? | 2.6 |
cipa | Z oburzeniem wyznała przyjaciółce, że jej ginekolog używa słowa „cipa”. | 2.9 | dick | As his towel dropped, one hand darted down to conceal his dick. | 2.1 |
kurwa | Kurwa, cały portfel mam mokry od tego deszczu. | 2.6 | fuck | Oh fuck, I forgot to pay my phone bill! | 2 |
cholerny | Jego siostra to cholerna dziewucha! | 2.3 | shit | This stuff looks like cow shit or something similar. | 2 |
gówno | Zrób w końcu porządek z tymi krowimi gównami na polu. | 1.8 | shit | Oh shit! I almost dropped my phone! | 1.7 |
gówno | Co za gówno, znowu prąd wyłączyli. | 1.8 | damn | What a damn guy you are! | 1.6 |
dupa | Wojtek dostał zastrzyk w dupę i od razu poczuł się lepiej. | 1.7 | ass | My ass did not fit into those jeans. | 1.5 |
cholera | Cholera! Co za śliczna dziewczyna! | 1.5 | damn | Damn, we’re late! Hurry up! | 1.4 |
głowa | Mocka rozbolała głowa. | 1 | pick | Which coin do you pick? | 1 |
Applications
- Research tool: the 5-point WOR scale can be used as a standardised metric across languages
- Educational tool: WOR metric can be used as an educational tool to increase awareness of the differences in perceived offensiveness of native and foreign swear words
- Reference tool: Bodies regulating the use of profane language on public media, such as the Polish National Broadcasting Council, may use the WOR scale to categorise swear words by their severity (e.g. low, mild, high), depending on their offensiveness rating