Om prosjektet

Språknett – det norske konstruktikonet

Introduksjon

Velkommen til Språknett – det norske konstruktikonet, en stor, søkbar database over grammatiske konstruksjoner i norsk. Vi bruker ordet «konstruksjon» for å referere til språkmønstre som er idiomatiske og som vanskelig lar seg oversette direkte. Dermed er de også ofte vanskelige å forstå og bruke riktig for innlærere. Konstruksjoner kan bestå av flere ord med én eller flere «åpne plasser», som i X og X, fru Blom (1), X belønne Y framfor Z (2), og X passe inn med Y (3). Vi regner også høyfrekvente ordkombinasjoner som fort gjort (4) som konstruksjoner, fordi de er ikke-komposisjonelle.

  1. Puben er irsk… skjønt [«er»] X og [«er»] X, fru Blom. (NoWaC)
  2. [Publiseringssystemet] X belønner [kvantitet] Y framfor [kvalitet] Z. (Khrono)
  3. [Alt som ikke] X passer inn med [deres ideologi] Y, skal ut. (Khrono)
  4. Det er fort gjort å trykke på feil tast. (NoWaC)

Alle disse konstruksjonene er svært vanlige i norsk, men de faller mellom to stoler i den forstand at de i liten eller ingen grad er representert i grammatikk- eller ordbøker. Språknett er ment å kompensere for denne mangelen i eksisterende språkressurser.

Det beste fra leksikografi og grammatikk

Leksikografi, eller ordkunnskap og utarbeiding av ordbøker, er et empirisk fag som baserer seg på store mengder korpusdata for å beskrive ordenes betydning og bruk – også flerordsuttrykk. Samtidig er relasjonene mellom ordene og hvordan de kombineres et underutviklet område innen leksikografi. Tradisjonell grammatikk på sin side fokuserer på hvordan språkformer danner et helhetlig system, men tar bare for seg en liten del av språket og bygger som regel ikke på autentiske eksempler. Dette betyr at det oppstår blindsoner i språket som er lite beskrevet.

Vi kan illustrere dette med konstruksjonene drive og V (5), sitte og V (6), ligge og V (7), stå og V (8), og gå og V (9), der V står for et verb:

  1. Min venninne og jeg driver og planlegger tur til Mount Everest. (NoWaC)
  2. Jeg sitter og leser i et blad nå. (NoWaC)
  3. Det pipes mot Vidar Riseth når han ligger og vrir seg i «smerte». (NoWaC)
  4. Vi ble stående og diskutere gårdsprodusert øl fra Midt-Norge. (NoWaC)
  5. Nå orker jeg ikke gå og ha det slik lenger. (NoWaC)

Disse konstruksjonene er mangelfullt beskrevet i ordbøkene. For eksempel er sitte og V oppført i Norsk Akademis Ordbok (naob.no), men ikke i bokmåls- og nynorskordboka (ordbokene.no); drive og V er oppført i nynorskordboka, men ikke i NAOB eller bokmålsordboka. Dessuten peker uttrykkene, i den grad de er representert, sjelden til hverandre. Dermed blir systemet for å uttrykke pågående handling usynlig.

I en innføringsbok i norsk grammatikk blir alle konstruksjonene riktignok nevnt samlet: «Norwegian uses separate expressions to compensate for the lack of progressive tense» (Mac Donald & MacDonald 2013: 76). Men eksemplene som oppgis viser i liten grad forskjellene mellom uttrykkene.

Språknett bygger på autentiske eksempler og kvantitativ korpusanalyse. Dermed fanger vi opp at drive og V kan uttrykke både handlinger som pågår akkurat nå, men også prosesser over uker, måneder eller år (typiske verb: vedlikeholde, utvikle, bygge). Til sammenligning brukes sitte og V gjerne med verb som vente, lese, skrive, for å uttrykke handlinger med kortere utstrekning, typisk minutter eller timer. Vi kan også skille mellom subjekter: personer ligger og sover/vrir seg, mens søppel og rot ligger og slenger.

Konstruksjonene i (5–9) inngår dessuten i en mer abstrakt konstruksjon – eller familie av konstruksjoner – som vi kaller V og V (pseudokoordinasjon). Her fanger vi opp både semantiske og formelle fellestrekk: de uttrykker en pågående handling og består av to verbaler som kongruerer i tempus og knyttes sammen med og.

Ved å kombinere solide empiriske undersøkelser i god leksikografisk ånd med grammatikkens søken etter systematiske relasjoner, kombinerer Språknett det beste av to verdener. Samtidig går vi lenger enn begge disiplinene når vi representerer språket som et nettverk av konstruksjoner.

Et dynamisk nettverk av konstruksjoner

Alle konstruksjoner i Språknett blir gruppert i familier basert på semantiske og syntaktiske tagger. Dette gjør det enklere å se hvordan konstruksjonene henger sammen, hva de har til felles og hvordan de skiller seg fra hverandre. For eksempel har vi sett at konstruksjonene i (5–9) bruker pseudokoordinering for å uttrykke en pågående handling. Disse skiller seg fra konstruksjonene i (10–13) på flere interessante måter.

Konstruksjonen ta og V (10) er også et eksempel på pseudokoordinasjon, men markerer at handlingen er i begynnelsesfasen (ingressivt aspekt). Også gå og V kan ha en slik betydning (11). Konstruksjonen V og V (reduplisering, altså at verbet er det samme på begge plasser) (12) uttrykker at handlingen foregår ved gjentatte anledninger. Konstruksjonen holde på å V (13) kan uttrykke en pågående handling med utstrekning i tid, men er ikke en pseudokoordinasjon fordi verbet ikke kongruerer (*de holdt på å laget). Dessuten kan holde på å V også bety at en handling var nær ved å skje, men ikke ble fullført (14).

  1. Tusen takk, mamma, sier Maha og tar og legger matpakken i skolesekken. (NoWaC)
  2. Nå skal jeg gå og dusje. (NoWaC)
  3. Jeg har prøvd og prøvd, men jeg fordrar ikke dataspill. (NoWaC)
  4. Mozilla melder at de holder på å lage en Firefox-variant for mobiltelefoner. (NoWaC)
  5. Jeg holdt på å dø i brann i 2002. (NoWaC)

Disse eksemplene viser at faktisk språkbruk er langt fra den idealiserte forestillingen der én form har én funksjon og kategorier enkelt kan overføres fra et språk til et annet (eksempel (5), (6), (7), (8), (9) og (13) kan alle oversettes til engelsk med «present continuous», men ingen av dem brukes nøyaktig som den engelske formen). Snarere kan vi snakke om et lappeteppe av delvis overlappende former, der vår oppgave er å vise hvordan de ulike lappene er sydd sammen. Konstruksjonene vi har diskutert her kan representeres grafisk som i figuren under, der noen konstruksjoner har lignende form og funksjon, mens andre bare deler form eller bare funksjon.

Network illustration
Figur 1: Delvis overlappende konstruksjoner (form + funksjon)

Et slikt lokalt nettverk av konstruksjoner kan utvides til å inkludere hele språket, og termen «konstruktikon» brukes derfor både for å referere til databaser som Språknett, men også for å referere til det mentale nettverket som sies å utgjøre vår språkevne (se Teorien bak prosjektet under). Språknett utgjør dermed en kognitivt plausibel modell av språket som et nettverk av mentale assosiasjoner mellom språklige former og funksjoner. Derfor er vårt mål at Språknett skal dekke så mye av språket som mulig.

Pedagogiske fordeler

I innledningen nevnte vi at flerordsuttrykk er et lite utforsket område av språket. For innlærere er det vanskelig å oppdage og mestre disse strukturene uten eksplisitt undervisning på grunn av deres uregelmessige syntaks og ikke-komposisjonelle betydning. Dermed er det strategisk å fokusere på frekvente konstruksjoner når man underviser i fremmedspråk.

Ved å flytte fokus fra tradisjonell grammatikk til språkstrukturer som er frekvente i faktisk språkbruk flyttes også fokus fra å bruke språket på en måte som er grammatikalsk korrekt til en måte som er idiomatisk (les: slik folk faktisk bruker språket). Det er ikke grammatikalsk feil å si en fugl er i treet, men folk med norsk som morsmål vil allikevel foretrekke Det sitter en fugl i treet (15). Denne presenterings-konstruksjonen er et eksempel på idiomatisk språk, altså slik vi pleier å si ting på norsk. Et godt idiomatisk språk er veien til språklig integrering og Språknett tilbyr strukturert oversikt over idiomatiske strukturer som er annotert for språknivå i henhold til Europarådets nivåskala (A1 til C2).

  1. Det sitter [en fugl] NOE(N) [i treet utenfor vinduet] STED. (NoWaC)

Språknett fokuserer også på språkets generative kraft: hvordan man kan kombinere ulike konstruksjoner for å skape stadig mer komplekse strukturer. For eksempel kan sitte og V-konstruksjonen (6) og presenterings-konstruksjonen (15) kombineres til en ny struktur (16), som både presenterer en ny referent og beskriver at handlingen som utføres er pågående og har utstrekning i tid.

  1. Det sitter [en statsråd] NOE(N) [i Oslo] STED og [overkjører lokaldemokratiet] HANDLING. (Facebook)

I denne fremstillingen har vi brukt fagtermer for å beskrive hvordan konstruksjonene brukes, men én av fordelene med konstruksjonsbasert læring er at man kan unnslippe «ordklasseveldet» og den gresk-latinske terminologien som følger med på lasset. Klassisk grammatikkundervisning tar utgangspunkt i språklige former, som f.eks. presens perfektum. Vi kan tenke på konstruksjoner som et språklig mønster med en språklig funksjon og heller ta utgangspunkt i funksjonen.

For eksempel kan vi bruke konstruksjonen ha (ikke) V siden TIDSPUNKT for å uttrykke at en situasjon (ikke) gjelder siden et tidspunkt i fortiden og også i fremtiden. Konstruksjonen brukes altså både positivt (17) og negativt (18), mens varianten ha ikke V på ANTALL TID (19) bare kan brukes negativt og ha V i ANTALL TID (20) bare kan brukes positivt.

  1. Koret vårt har [eksistert] HANDLING siden [96] TIDSPUNKT. (NoWaC)
  2. Jeg må så innmari tisse, jeg har ikke [tissa] HANDLING siden [i dag tidlig] TIDSPUNKT. (NoWaC)
  3. Jeg har ikke [trent] HANDLING på [flere år] ANTALL TID. (NoWaC)
  4. Han har [arbeidet] HANDLING i Aftenposten i [åtte år] ANTALL TID. (NoWaC)

Fordelen med en slik tilnærming er at man slipper å lære om alle de ulike bruksområdene til en kategori (f.eks. presens perfektum) på én gang og heller kan fokusere på den relevante kommunikative funksjonen som trengs for å uttrykke en idé. Dessuten kan man også unngå terminologi som presens perfektum. Fordelen for studenter uten skolegang burde være åpenbar, men også for høyt utdannede kan dette være en fordel fordi slike kategorier oppfører seg ulikt på tvers av språk: for eksempel er det mange språk som ikke bruker presens perfektum for å uttrykke at en situasjon fortsatt (ikke) gjelder.

Teorien bak prosjektet

Dette prosjektet tar utgangspunkt i konstruksjonsgrammatikken, en språkteori som anser hele vår språkevne som evnen til å beherske og kombinere grammatiske konstruksjoner. En konstruksjon defineres som et konvensjonalisert form-funksjon-par, og kan være alt fra et morfem til et komplekst syntaktisk mønster. Konstruksjonsgrammatikk analyserer språk som et strukturert nettverk av grammatiske konstruksjoner, kalt et konstruktikon.

Termen konstruktikon refererer både til språkevnen som et nettverk av mentale assosiasjoner mellom lingvistiske former og funksjoner, og til digitale databaser som Språknett, som skal representere hvordan denne kunnskapen er organisert. Språknett er inspirert av lignende prosjekter i andre språk, inkludert svensk, tysk, engelsk, russisk, brasiliansk portugisisk og japansk.

Språknett bidrar til et nytt fremvoksende forskningsfelt innen kognitiv lingvistikk som heter konstruktikografi, altså bygging av konstruktikoner. Dette feltet ligger i grenselandet mellom konstruksjonsgrammatikk, leksikografi, språkteknologi, og bruksbaserte tilnærminger til språksystemet.

Det norske konstruktikonet er et stort gruppeprosjekt der språkvitere og undervisere i norsk fra både Norge og utlandet kan delta. Hvis du er interessert i å samarbeide med oss, vennligst send en e-post til anna.endresen@uit.no eller olaf.a.mikkelsen@uit.no

Prosjektmedlemmer

Det norske konstruktikonet er et stort gruppeprosjekt der språkvitere og undervisere i norsk fra både Norge og utlandet kan delta. Hvis du er interessert i å samarbeide med oss, vennligst send en e-post til anna.endresen@uit.no eller olaf.a.mikkelsen@uit.no.

Hvordan sitere ressursen

På norsk:
Språknett 2024 – Det norske konstruktikonet. Et digitalt nettverk av norske konstruksjoner. Tilgjengelig på www.spraknett.no

In English:
Språknett 2024 – The Norwegian Constructicon. A digital network of Norwegian constructions. Available at www.spraknett.no

Publikasjoner og foredrag

  • Endresen, Anna & Olaf Mikkelsen. 2024. Ten good reasons to build the Norwegian ConstructiCon, a dictionary of grammar. Lexicographica – International Annual for Lexicography, 40(1), 121-145. https://doi.org/10.1515/lex-2024-0007 (open access).

Foredrag om prosjektet:

Mikkelsen, Olaf & Anna Endresen. 2025. “The Norwegian Dream: a ConstructiCon representing two written varieties with flexible norms.” Internasjonal workshop “Pedagogical Applications of Constructicography” (PAC 2025, 14.–15. mai 2025, https://www.globalframenet.org/pac-2025), Universitetet i Gøteborg, Sverige.

Mikkelsen, Olaf & Endresen, Anna. 2025. “Det Norske KonstruktiKonet (NorKon): erfaringer og utfordringer ved å bygge en digital database over konstruksjoner i norsk”, presentert digitalt på det månedlige møtet til forskningsgruppen BLAU (Bruksbasert lingvistikk, andrespråklæring og -undervisning) ved Universitetet i Bergen, Norge, 19. mars 2025.

Finansiering

Ulike deler av prosjektet er finansiert av:

  • Forskningsfond ved UiT Norges arktiske universitet
  • Direktoratet for høyere utdanning og kompetanse (HK-dir): NORKUN-2025-sommer/10027. Internasjonalt fagseminar for språkforskere og språkundervisere i norsk “Norsk grammatikk som et konstruktikon (NoKo): språkbruk og språkundervisning”, 25.–27. august 2025, Sommarøy. https://uit.no/noko
  • Direktoratet for høyere utdanning og kompetanse (HK-dir): SNU-2024/10241. Et seminar “Konstruksjonslæring og konstruktikoner i undervisning i skandinaviske språk”, arrangert ved Institutt for Skandinaviske Språk i Adam Mickiewicz Universitetet i Poznań, Polen, 28. mai 2024.