Benjamin Lyngfelt

Språkliga nätverk, inom och mellan språk

Projektet ska med hjälp av konstruktionsgrammatik utveckla ett nätverk som (a) beskriver svenska språkliga konstruktioner och (b) länkar dem till konstruktioner i andra språk.

Språk brukar analyseras i nivåer: lexikon för sig, meningsbyggnad för sig osv. En nackdel med det är att samspelet mellan nivåerna ofta glöms bort. Ett exempel är det produktiva mönstret ”i minsta/senaste/dyraste/osv. laget”, som har både lexikala och grammatiska drag och inte riktigt passar in i vare sig ordböcker eller grammatikor. Sådana strukturer är besvärliga för såväl andraspråksinlärning som språkteknologi och översättning. I Google translate översätts t.ex. ”Vi kom dit i senaste laget” felaktigt till ”We arrived there in the last team”.

Konstruktionsgrammatik, däremot, behandlar språket som ett nätverk. Alla språkliga mönster – oavsett nivå – beskrivs som konstruktioner, dvs. konventionaliserade förbindelser av form och innehåll. En konstruktion kan kombinera egenskaper från flera nivåer, vilket främjar beskrivningen av t.ex. ”i ADJEKTIV-aste laget” ovan. På så vis kan vi också fånga samband mellan strukturellt olika konstruktioner i olika språk och bl.a. bidra till bättre maskinöversättningar.

Vi har tidigare utvecklat en konstruktionsdatabas för svenska. Nu ska vi bygga ut databasen till ett mer heltäckande nätverk av konstruktioner och med språktypologiska verktyg koppla ihop konstruktionsnätverk för flera olika språk. Dessa båda delprojekt är tätt integrerade och ömsesidigt samverkande.
Slutredovisning
Projektet bygger på den konstruktionsgrammatiska idén om hela språket som ett enda flerdimensionellt nätverk. Vi har utvecklat en sådan nätverksmodell för svenska, som omfattar språkliga konstruktioner av olika slag, nätverksrelationer mellan dem samt ett system för hur konstruktionerna kombineras till större enheter, t.ex. satser och meningar. I anslutning till detta har vi, i ett internationellt samarbete, utvecklat en språkneutral nätverksmodell för att länka och jämföra konstruktioner i olika språk. Båda modellerna implementeras i fritt tillgängliga språkresurser: Svenskt konstruktikon respektive MoCCA (Model of Comparative Concepts for Constructicon Alignment).

En stor fördel med konstruktionsperspektivet är förmågan att fånga samspelet mellan språkliga strukturer som annars brukar betraktas som separata nivåer. Traditionellt brukar språk analyseras i nivåer: lexikon för sig, meningsbyggnad för sig osv. En nackdel med det är att samspelet mellan nivåerna ofta glöms bort. Ett exempel är det produktiva mönstret ”i minsta/senaste /dyraste/osv. laget”, som har både lexikala och grammatiska drag och inte riktigt passar in i vare sig ordböcker eller grammatikor. Sådana strukturer är besvärliga för såväl andraspråksinlärning som språkteknologi och översättning. I Google translate översattes t.ex. ”Vi kom dit i senaste laget” felaktigt till ”We arrived there in the last team” (2021-04-19). Konstruktionsgrammatik, däremot, behandlar språket som ett nätverk. Alla språkliga mönster – oavsett nivå – beskrivs som konstruktioner, dvs. konventionaliserade förbindelser av form och innehåll. En konstruktion kan kombinera egenskaper från flera nivåer, vilket främjar beskrivningen av t.ex. ”i ADJEKTIV-aste laget” ovan.
Projektet hade tre frågeställningar:

1) How can the grammar of a language, Swedish, be fruitfully accounted for as a network of constructions
2) How can constructions be connected across languages through a linking system of shared features?
3) How can the somewhat conflicting demands of describing a language on its own terms and capturing cross-linguistically relevant properties in language-neutral terms be conciliated in a constructionist approach?

Som svar på den första frågeställningen har vi för det första utvecklat en nätverksmodell för svenska, där språkliga konstruktioner associeras med varandra via gemensamma egenskaper (Blensenius & Lyngfelt 2025). Konstruktioner taggas för såväl formegenskaper (t.ex. samordning, sammansättning, nominalfras) som funktionella egenskaper (t.ex. jämförelse, resultativ, interaktion). Därigenom länkas de till andra konstruktioner med samma egenskaper och etablerar på så vis ett flerdimensionellt konstruktionsnätverk. För det andra har vi utvecklat en syntaxmodell för hur konstruktioner kombineras till större enheter och i det sammanhanget etablerat beskrivningar av centrala syntaktiska konstruktioner som t.ex. olika satstyper (Andréasson & Lyngfelt, under utgivning). Tillsammans bygger nätverksmodellen och syntaxmodellen upp en sammanhängande svensk konstruktionsgrammatik, den första i sitt slag. Den erbjuder därmed en plattform för fortsatt konstruktionsinriktad forskning om och beskrivning av svenska. Den kan också ses som ett praktiskt test – med positivt utfall – av idén om språket som ett nätverk av konstruktioner.

Den andra frågeställningen anlägger samma nätverkstänkande på tvärspråklig analys av konstruktioner. Vi har i ett internationellt samarbete byggt en modell för att relatera konstruktioner i olika språk via gemensamma egenskaper, ungefär som i ovannämnda nätverksmodell fast med skillnaden att egenskaperna definieras språkneutralt istället för med utgångspunkt från svenska (Lyngfelt m.fl. 2022). Modellen bygger på språkneutrala s.k. jämförelsebegrepp (comparative concepts) av det slag som används inom språktypologi och har därför fått benämningen MoCCA: Model of Comparative Concepts for Constructicon Alignment (Lorenzi m.fl. 2024). Mer specifikt bygger modellen på en uppsättning jämförelsebegrepp som sammanställts av typologen Bill Croft, som också har varit direkt delaktig i utvecklingen av MoCCA. Modellen syftar till att stödja mer rättvisande språkjämförelser. Det är ett välkänt problem att det sällan råder full överensstämmelse mellan konstruktioner i olika språk, vilket i praktiken innebär att jämförelser mellan språk tenderar att ske på källspråkets villkor. För mer rättvisande jämförelser är det därför önskvärt med en språkneutral jämförelsebas, och detta är vad MoCCA erbjuder. Dessutom går MoCCA bortom direkta jämförelser mellan konstruktioner i enskilda språk genom att jämförelsebegreppen är tillämpliga på alla språk. I och med att en konstruktion i ett visst språk länkas till ett jämförelsebegrepp associeras den därmed med alla konstruktioner, oavsett språk, som länkas till samma begrepp. Följaktligen blir modellen mer kraftfull ju fler språk och ju fler konstruktioner som länkas till den.

Den tredjefrågeställningen avser relationen mellan dessa båda modeller, det svenska konstruktionsnätverket och det tvärspråkliga nätverket via MoCCA, och hur man kan kombinera det språkspecifika och det språkneutrala. Vår lösning är att beskriva svenska konstruktioner på svenskans villkor och i efterhand länka till MoCCA där så är tillämpligt. Det har medfört vissa smärre diskrepanser, t.ex. att vissa svenska reflexiva konstruktioner inte är reflexiva enligt MoCCA:s språkneutrala definition, eftersom de strängt taget inte har reflexiv betydelse (ex. skynda sig, förbarma sig), men så länge skillnaderna noteras innebär de inga större problem. Riktlinjerna för MoCCA har modifierats för att kunna fånga upp sådana skillnader, vilket ytterligare stärker dess potential för tvärspråkliga jämförelser.
Sammantaget får projektet sägas ha uppfyllt sitt syfte: att å ena sidan utveckla ett svenskt konstruktionsverk och å andra sidan ta fram en modell för att enligt motsvarande principer relatera konstruktioner i olika språk. Den svenska nätverksmodellen är implementerad i webbresursen Svenskt konstruktikon, där vi också har börjat länka svenska konstruktioner till MoCCA. Syntaxmodellen är dock inte implementerad än. Vidare finns det många fler svenska konstruktioner att beskriva och fler nätverksrelationer att etablera såväl inomspråkligt som tvärspråkligt. Inte minst är morfologin underbeskriven jämfört med syntaxen, och integreringen mellan produktiva konstruktioner och specifika lexikala enheter kan och bör belysas tydligare. Det system som nu har etablerats sätter i sig sökljuset på besläktade konstruktioner som ännu inte är beskrivna och erbjuder både ett sammanhang och ett format för sådan fortsatt utveckling.

Resultaten från projektet har presenterats fortlöpande vid olika vetenskapliga konferenser, både internationellt och inom Sverige, och redovisats i ett flertal vetenskapliga publikationer, företrädesvis med Open Access. Projektgruppen samverkar kontinuerligt med konstruktikonprojekt för andra språk och med intressenter som tillämpar materialet inom språkteknologi och språkundervisning.
Bidragsförvaltare
Göteborgs universitet
Diarienummer
P21-0473
Summa
SEK 6 966 000
Stödform
RJ Projekt
Ämne
Språkstudier
År
2021