Kilder og data til sprogforskning forbinder man ofte med aviser, litteratur eller måske sociale medier, interviews og selvoptagelser. Men kan man bruge tv-data som kilder til sprogforskning, og endda data fra en realityserie hvor folk mest har alkohol og sex i hovedet?
Korpusset
I Dansk Sprognævn har vi udarbejdet et korpus af talesprogsdata og tilhørende transskription af dialogen fra tv-serien Ex on the beach. Der er tale om en realityserie hvor 8 unge mødes i en luksusvilla forskellige eksotiske steder i verden, fx på Mauritius. Her skal de så være sammen i ca. en måned, hvor de risikerer at få deres ekskærester ind i programmet med intriger og sex og masser af alkohol til følge. Programmet består indtil videre af 5 sæsoner, hvor vi i Sprognævnet har valgt at begrænse vores korpus til de første 3 sæsoner.
I hver sæson er der 24 afsnit a ca. 45 minutters varighed, dvs. i alt ca. 54 timers tv. De tre sæsoner er blevet sendt på Discovery+/Dplay i 2018-2019 og generøst stillet til rådighed som lyd- og videofiler af produktionsselskabet Metronome, så vi har adgang til lyd- og billedsiden. Desuden har vores studentermedhjælpere transskriberet dialogen i alle tre sæsoner, hvilket er blevet til et skriftligt korpus på omkring 530.000 ord.
”Autentisk” sprogbrug blandt unge
Som kilde giver Ex on the beach-korpusset os adgang til at undersøge unges sprog som det bruges nu. Man kan diskutere hvor autentisk sproget er i en realityserie sendt på tv – der er jo tale om en tv-produktion der er klippet i, og vi ved ikke hvilke kriterier der er udvalgt efter når programmet er sat sammen. Desuden repræsenterer de unge fra serien jo i hvert fald en gruppe som har lyst til at deltage i et realityprogram, og dermed måske en bestemt personlighedstype. Til det første kan man sige at deltagerne selv i medierne gentagne gange har bedyret at de ikke tænker på deres sprog når de bliver optaget 24 timer i døgnet (fx DR’s Klog på sprog, 31.7.20), og til det andet kan det bemærkes at vi ikke ved om deltagerne er repræsentative for den danske ungdom. Uanset hvad må vi selvfølgelig tage forbehold for autenticiteten af data, men vi betragter alligevel korpusset som en værdifuld kilde til at oplyse os om danskernes sprogbrug lige nu og som et glimrende supplement til vores øvrige datakilder som fx vores aviskorpus. Især er det nyttigt for os at supplere vores hidtidige skriftsproglige dataindsamling med talesprogskilder, fx fordi sproglige forandringer ofte starter i det mundtlige sprog.
Hvad kan vi bruge Ex on the beach-korpusset til?
Ex on the beach-korpusset kan Sprognævnet bruge til forskellige kerne- og forskningsopgaver. Først og fremmest er det en af Sprognævnets kerneopgaver at følge det danske sprogs udvikling. Da vi ved at sprogfornyelser ofte starter i ikke bare det mundtlige sprog, men også i unges sprog, er det en stor fordel at inddrage Ex on the beach-korpusset i vores arbejde med ordbogen Nye ord i dansk (https://dsn.dk/ordboeger/nye-ord-i-dansk/). Gennem programmet er vi således blevet opmærksomme på flere nye ord som kunne fortjene at blive indlemmet i ordbogen. Hvis yderligere undersøgelser har kunnet bekræfte at der er tale om udbredte ord, er disse nyordskandidater kommet med i ordbogen. Det gælder eksempelvis ordene buff (’veltrænet’), hakket (’veltrænet/muskuløs’) og shady (’lyssky/anløben’), der alle er kommet med i Nye ord i dansk i 2020. Derudover er vi pga. korpusset også blevet opmærksomme på helt almindelige ord og udtryk som har manglet i ordbogen, fx atv og at grine sin røv i laser/grine røven i laser. Korpusset er dermed en værdifuld kilde i jagten på nye ord.
Med Ex on the beach-korpusset kan vi også sige noget om den grammatiske udvikling i dansk. Fx er det udbredt blandt de unge i serien at bruge nominativ (fx jeg) hvor man ville forvente akkusativ (fx mig), som i dette eksempel fra serien: ”Jeg er lidt trist efter samtalen mellem Mikkel og jeg”. At vi har et talesprogkorpus, gør at vi kan studere hvor ofte og hvordan denne konstruktion forekommer. En anden grammatisk undersøgelse vi er i gang med i Ex on the beach-korpusset, er brugen af ligge og lægge. I vores foreløbige optællinger (de 5 første afsnit) siger deltagerne ligge hvor det grammatisk set skulle være lægge, i hele 77 procent af tilfældene, fx »Jeg ligger allerførst mærke til hende i den hvide badedragt med de store flotte bryster« og »det er som om du ikke ligger den samme kærlighed i det her«. På den måde kan vi altså også i korpusset nærstudere grammatiske fænomener som tegn på igangværende sproglig udvikling.
Et af Sprognævnets mangeårige forskningsområder er brugen af engelske lån i dansk, og her har vi også gjort god brug af data fra Ex on the beach. Her er det bl.a. blevet undersøgt hvilke engelske lån de unge bruger, og der er to ord der dominerer listen. Det første er bandeordet fucking, der er så frekvent at det udgør hele 25 % af samtlige eksempler på engelske lån i Ex on the Beach (1. sæson). Fucking bruges næsten dobbelt så mange gange som det næste ord på listen, der også er et bandeord, nemlig fuck. I en tidligere undersøgelse af unges bandeord (Rathje 2010) var de mest frekvente bandeord blandt unge sgu, efterfulgt af skide/ikke en skid og fandeme/hvad eller hvordan fanden, så noget har altså ændret sig på de næsten 15-16 år der er gået fra dataindsamlingen i den første undersøgelse til Ex on the beach-korpusset:
Rathje 2010 (data fra 2002/2003; 70 antal forekomster af bandeord i alt) | Heidemann Andersen under udgivelse (data fra 2018; 3040 antal forekomster af bandeord i alt) |
Sgu 30 % | fucking 23,2 % |
skide-/ikke en skid 22,9 % | sgu 18,6 % |
fandeme/hvad el hvordan fanden 17,1 % | fuck 12,5 % |
Det skal dog nævnes at dataene fra Rathje (2010) stammer fra arrangerede møder mellem unge der ikke kender hinanden, på en cafe i København, og at det derfor ikke kan udelukkes at selve setuppet har haft betydning for resultaterne (selvom de fleste af deltagerne i Ex on the beach heller ikke kender hinanden i forvejen). I hvert fald viser en sammenlignelig undersøgelse, hvor unge der kender hinanden godt, er blevet optaget mens de spiller et brætspil, at fuck hører til blandt de allerhyppigste engelske lån (Heidemann Andersen 2007).
I fremtiden har vi bl.a. planer om at undersøge bandeord og i det hele taget groft sprog i hele Ex on the beach-korpusset. Indtil videre har korpusset i hvert fald vist sig nyttigt i Sprognævnets forsknings- og formidlingsarbejde, og vi regner med at der er mange flere kommende undersøgelser der vil inddrage dialogen fra babes og fuckbois i den kendte realityserie.
Referencer
Heidemann Andersen, Margrethe (2007): ”Come on let’s play some matador! En undersøgelse af kodeveksling hos unge. Margrethe Heidemann Andersen et al. (udg.). Ved lejlighed. Festskrift til Niels Davidsen-Nielsen i anledning af 70-års-dagen. Dansk Sprognævns skrifter 39: 51-61.
Heidemann Andersen, Margrethe (under udgivelse): ”Fucking nice. Engelske lån i Ex on the Beach. Yonatan Goldshtein, Inger Schoonderbeek Hansen & Tina Thode Hougaard (udg.): 18. Møde om Udforskningen af Dansk Sprog. Århus: Aarhus Universitet.
Klog på sprog, radioprogram på DR, 31.7.2020 (https://www.dr.dk/radio/p1/klog-pa-sprog/klog-pa-sprog-2020-06-12).
Rathje, Marianne (2010): Generationssprog. Dansk Sprognævns skrifter 43.
Marianne Rathje og Margrethe Heidemann Andersen er begge seniorforskere i Dansk Sprognævn. Marianne Rathje forsker i aggressiv sprogbrug, sprogbrug på sociale medier og skriftsprog i uddannelsessystemet. Margrethe Heidemann Andersen forsker især i brugen af engelske lån i dansk og er derudover også redaktør af Retskrivningsordbogen.