Mit hjerte, mit sind, mit 心; holisme og maskinlæring på klassisk kinesisk

Var de klassiske kinesere holister? Det vil sige: tænkte man på krop og sind som to aspekter af samme helhed eller ligesom i klassisk Europæisk filosofi som grundlæggende forskellige bestanddele af universet? Det er der noget uenighed om, og folk af begge slags meninger bruger et væld af forskellige metoder til at begrunde, hvorfor det skulle være på den ene måde eller den anden. I 2018 udgav Edward Slingerland en bog ’Mind and Body in Ancient China: Beyond Orientalism and the Myth of Holism’, hvor han brugte sproglige og kvantitative metoder til at argumentere for, at kineserne i sidste ende må have været dualister – altså tænkt på krop og ånd som adskilt. Dette blogindlæg beskriver arbejde, vi har gjort for at uddybe Slingerland’s undersøgelse, for det viser sig at en mere nuanceret analyse peger i den modsatte retning – og at man skal være forsigtig med, hvordan man bruger sine kvantitative værktøjer.

Hvad skulle maskinlæring og sproganalyse kunne sige om klassisk kinesisk filosofi?

Maskinlæring lyder måske ikke som en metode, der kan kaste lys over diskussioner om 2000 år gammel kinesisk filosofi men de mønstre i sprogbruget, man kan finde med maskinlæring kan bruges til at sige noget om, hvordan man har tænkt. Det har den fordel, at man kan sige noget om større mængder tekst end en forsker ellers ville være i stand til at læse grundigt, og at man får kvantitative resultater, som er reproducerbare uafhængig af den enkelte forsker. Prisen er dog, at maskinlæringsalgoritmerne ofte antager en forsimplet sproglig virkelighed, og at man mister den detaljerede kontekst, hvilket betyder, at man kan ende med skæve konklusioner, hvis man ikke er forsigtig.

Indenfor kinesisk filosofi er der stor debat om, hvordan forskellige ord præcist har skullet forstås, og her kan maskinlæring bruges til at undersøge de kvantitative mønstre i de enkelte ords brug. Særligt fokus har der været på ordet xin 心, som ofte oversættes til ’hjerte’, men også kan betyde ’sind’ eller ’følelse’. Oprindeligt var xin 心 faktisk et billede af et blødende hjerte, og det ses tydeligere, hvis man kigger på tidligere versioner af tegnet.

kin 1 — Udviklingen af *xin* 心 igennem tid. Modificeret fra Nakaya (2019)

Samtidig indgår xin 心 også ofte i tegn med betydninger relateret til følelser og tanker, som f.eks. si 思, og som radikalformen 忄i qing 情, som henholdsvis betyder netop ”tanke/tænke” og ”følelse/føle”. Det er denne dobbelthed mellem de fysiske og mentale betydninger af xin 心, som ligger til grund for den holistisk-dualistiske diskussion.

I den holistiske tankegang har xin 心 både hentydet til hjertet som fysisk organ, og til sindet, uden egentlig at distingvere mellem de to. Klassisk kinesisk adskilte heller ikke substantiver tydeligt fra verber. De fleste tegn er gerundiver, således at de både hentyder til en proces eller handling og til en genstand. Holistisk skal xin 心 derfor forstås både som hjertet som organ, sindet og følelser, men også det at tænke og føle, og det at ’hjerte’ som en samlet helhed. Derfor er xin 心 ofte blevet oversat til engelsk som ’heart-minding’. Det er den påstand Slingerland forsøgte at modvise ved at bruge maskinlæring; han ville påvise, at xin 心 hovedsageligt klassisk blev brugt om ’sind’ og ’følelse’, og kun sekundært, hovedsageligt i medicinske tekster, om hjertet som organ.

Xin 心: hvad betyder det så ?

I vores arbejde brugte vi en metode, som er meget brugt i maskinlæringsbaseret tekstanalyse: word embeddings. Når man laver word embeddings, så undersøger man grundlæggende, hvor meget forskellige ord minder om hinanden, og her forstået som hvor ofte de optræder i samme sproglige kontekster. For eksempel minder ’hund’ og ’kat’ meget om hinanden fordi de oftest optræder i de samme slags sætninger mens de er forskellige fra et ord som ’ja’, som normalt optræder i andre kontekster. Vi brugte metoden på korpusset ctext, som indeholder samtlige klassiske kinesiske tekster, som omhandler både filosofi, matematik, medicin og historie fra Kinas klassiske periode (før Han 汉 dynastiet). På den måde ville vi se, hvad vi kunne sige om måden, de klassiske kinesere brugte xin 心, og hvad det kunne afsløre, om hvorvidt tegnet havde en holistisk betydning.

Det første, vi gjorde, var at bruge word embeddings til at undersøge hvilke ord, der mindede mest om xin 心 i måden, de blev brugt på. Det blev hurtigt tydeligt, at dette var domineret af ord om tanker og følelser f.eks. kuai 快 (glæde eller at være glad), og så af organet ’hjertesækken’ xinbao 心包 fra klassisk kinesisk medicin. Xinbao 心包 er det ord som er tættest på xin 心, men effekten er sandsynligvis drevet af, at xin 心 indgår i xinbao 心包. Desuden kunne man se, at næsten alle ordene indeholdt xin 心 som radikal ligesom qing 情. En radikal på kinesisk er en komponent af et tegn, som ofte indikerer, hvilken betydning tegnet, som de er en del af, har. Det er derfor ikke underligt, at xin 心 findes som radikal i mange af de ord, der bliver brugt på samme måde som xin 心, og dét, at analysen giver de resultater, vi forventer, indikerer, at den faktisk kan sige noget, om hvordan ordene bruges.

kin 2 — De ord, der ifølge modellen mest ligner *xin* 心.

Slingerlands overordnede pointe var, at xin 心 ikke blev brugt på samme måde som andre kropsorganer som for eksempel leveren og nyren. Desuden fandt han at, af alle kropsorganerne, så var det xin 心, som mindede mest om de tre ord på krop på kinesisk, shen 身, ti 体 (på traditionelt kinesisk 體) og xing 形. Konklusionen var, at xin 心 mindede meget om kropsordene, fordi det ofte blev kontrasteret med dem, netop fordi det ikke var kropsligt, men betød ’sind’, og at de andre organer ikke blev brugt i samme kontekst som kropsordene, fordi det var underforstået, at de var en del af kroppen. Dette ville vi nuancere, så derfor lavede vi et dendrogram, som grupperer en række ord efter hvor meget, de minder om hinanden. Her ligger xin 心 sammen med ordene for øje mu 目og øre er 耳 og derefter med de tre kropsord. Kropsorganerne er tydeligvis grupperet sammen, mens mund kou 口 er sammen med mave wei 胃, og hånd shou 手er grupperet med fod zu 足, måske ikke så overraskende. Dette kunne se ud som om, det passede med Slingerlands konklusion, for xin 心 ligger jo langt væk fra kropsorganerne og tæt på kropsordene. Men det er tvetydigt, netop fordi word embeddings ikke gør forskel på ord, som minder om hinanden, fordi de næsten betyder det samme – eller ord, der minder om hinanden, fordi de ofte bliver kontrasteret med hinanden, og derfor optræder i de samme kontekster. Desuden er øje mu 目 og øre er 耳 lige så tæt på kropsordene som xin 心 – men det er mindre sandsynligt, at ordene for øje og øre skal ses som ikke-kropslige ord, der bliver kontrasteret med kroppen.

kin 3 — Dendrogram over ordgrupperinger.

For at få et overblik over relationerne mellem de respektive ord lavede vi et plot, hvor vi brugte en type analyse, som hedder principal component analysis (PCA) til at visualisere vores word embeddings, og her dannede der sig pludseligt et nyt billede. Plottet er værd at beskrive lidt i detaljer. Længst til højre kan vi se en gruppe af ord for de indre organer i lilla, som tydeligt er grupperet sammen. Over og til venstre for dem har vi en række ord, som relaterer sig til det brede kosmos; ord som yin 陰 og yang 陽, de fem faser wuxing 五行, himmel tian 天 og jord di 地, osv. I den modsatte ende under og til venstre for organordene ser vi forskellige kropsord som øje mu 目, øre er 耳 og hånd shou 手. Til venstre for dem igen i den modsatte ende fra organerne, ser vi en lang række moralske ord. Både alle de konfucianske dyder men også termerne for de typer mennesker der lever op til dem som den eksemplariske person junzi 君子, eller vismanden shengren 圣人.

Confucius scaled — Den kinesiske embedsmand og filosof Konfucius 孔子 (ca. 551-479 f.Kr.).

Desuden ligger der herunder forskellige ord for følelser og tanker. Der er forskellige pointer at tage ud af dette plot. Den vigtigste af dem er nok, at xin 心 ligger lige præcis imellem kropsordene og sinds- og følelsesordene, og på den måde danner grænsen mellem de to semantiske domæner. For de andet er det interessant hvad akserne her ender med at indeholde af information. x-aksen lader til at bevæge sig fra moralskladede ord i venstre side mod kropslige ord til højre. y-aksen peger så på kosmiske eller generelle ord øverst og konkrete ord nederst. Vi ser også, at de organer, som er tættest på de kosmiske ord, er organer, som hovedsageligt bliver brugt i kinesisk medicin. I traditionel kinesisk medicin er kroppen en spejling af universet; et mikrokosmos der afspejler det omgivende makrokosmos. Derfor bruges nogle af de samme termer til at beskrive kroppen, som bruges til at beskrive kosmos generelt, f.eks. beskrev man kroppens energi kredsløb som ordnet efter yin 陰, yang 陽 og de fem faser wuxing 五行. Vi ser også, at der blandt de forskellige persontyper er en udvikling med shi 士, personen, som begynder sin moralske udvikling – fjernest fra de kosmiske ord – og ord, som vismand shengren 圣人 eller kejser huang 黄 og di 蒂 lige ved grænsen til de kosmosorienterede ord. Det er alt sammen spændende, for plottet reflekterer tydeligvis, hvordan de forskellige ord forstås rent filosofisk. Men en ting, der er overraskende og afgørende, når det kommer til fortolkningen af xin 心, er, at de tre ord for krop alle tre ligger inden for det moralske domæne. Man har brugt ord som shen 身 eller xing 形, ikke til at beskrive kroppen, som fysisk entitet, men for at beskrive den handlende og moralske krop. Det er måske ikke så underligt, når nu hoveddelen af de gamle tekster handlede om, hvordan man skal leve moralsk. At det netop er xin 心, og kropsdele som øje mu 目, øre er 耳 og hånd shou 手, som ligger tæt på de tre ord for krop, kan nu også forklares med, at de er kropsdele, der faciliterer moralsk handling. Det gør Slingerlands (og vores) resultater helt forlignelige med en holistisk fortolkning af xin 心, for hjertet, som hjerte-og-sind spænder jo præcis mellem det moralske og det kropslige.

kin 4 — Principal Component Analysis-baseret visualisering af word embeddings.

Man skal være varsom med maskinlæring

Vores analyse siger noget om sprogbruget i de klassiske kinesiske tekster, og om at xin 心, sammen med nogle andre organer, er stærkt moralske. Vi kan også se, at analysen tydeligvist fanger ting i sprogbruget, som reflekterer, hvad vi forstår ved de filosofiske begreber. Men vores analyse er også et godt eksempel på, hvorfor man skal være forsigtig med de konklusioner, man laver, baseret på maskinlæringsmetoder. Det bliver nemlig tydeligt, hvordan man kan få resultater, som tilsyneladende påviser en bestemt måde at forstå et ord ligesom Slingerland gjorde det, men som ved nærmere undersøgelse viser sig at kunne betyde noget meget anderledes. Det er prisen for at bruge kvantitative metoder på store mængder af tekstdata: man kommer mere på afstand af teksten, og det kan dermed være sværere at se præcist, hvad der foregår. Desuden er der mange små komponenter i at stykke en maskinlæringsbaseret analyse sammen – det er en kompliceret kunst at bygge de værktøjer, som man bruger, og selv som bruger er der mange ting at tage stilling til. For eksempel fjerner man ofte ord fra analysen man vurderer er irrelevante, eller man vælger bestemte måder at visualisere sine resultater på, og kan på den måde påvirke sine resultater – nogle gange ret kraftigt. Og så er der selvfølgelig en masse simplificeringer. Er hvor meget ord minder om hinanden virkelig helt tydeligt bare ud fra hvilke slags kontekster, de optræder i? Man kan se på en analyse som vores, at metoder som word embeddings godt kan fange noget af betydningen i ord, men der kan være måder, den gør det anderledes på, som er utydelige nok til, at vi ikke nødvendigvis opdager det. Ofte er det også et spørgsmål om hvor meget, og hvilken kvalitet data man har, og selvom hele ctext korpusset kan virke stort, så er det faktisk en relativt lille mængde data i forhold til de steder, man normalt bruger metoder som word embeddings. Med alt det i mente, så er det dog spændende at se, at man kan generere et plot, der så tydeligt indeholder både moralske og kosmiske dimensioner i et sæt ord som, vi synes, er spændende med en metode, som ellers ikke som udgangspunkt ved noget om kinesisk filosofi – og at det potentielt kan bruges til at bistå mere traditionelle lingvistiske og filosofiske metoder i bedre at forstå, hvordan man tænkte, talte og skrev i det klassiske Kina.

Nakaya, T. (2019). The Japanese concept KOKORO and its axiological aspects in the discourse of moral education. Adeptus, (13), 1-22.

Peter Thestrup Waade er PhD-studerende på Aarhus Universitet med en baggrund i kognitionsvidenskab. Han arbejder tværfagligt og er både teknisk og filosofisk bredt interesseret. Martin Ito er kandidatstuderende på AU og er interesseret i sprog, og hvordan man kan behandle sprog kvantitativt. De har begge to boet i Kina, taler og skriver kinesisk og holder af at arbejde med både kinesisk sprog og kultur.

Skriv en kommentar Annuller svar