Kontakt oss

Ansvarlig redaktør
TORE OKSHOLEN
tore.oksholen@
universitetsavisa.no
Mobil 918 97 876

Journalist
MARI RIAN HANGER
mari.r.hanger@
universitetsavisa.no
Mobil 995 86 297

Redaksjonssjef
BENEDIKT ERIKSTAD JAVOROVIC
benedikt.e.javorovic@
universitetsavisa.no
Mobil 472 38 560

Journalist
SYNNE MÆLE
synne.male@
universitetsavisa.no
Mobil 924 62 475

Journalist
MARTHE BJERVA
marthe.bjerva@
universitetsavisa.no
Mobil 911 01 680

Om oss

Universitetsavisa utgis av NTNU og redigeres etter Redaktørplakaten og pressens Vær Varsom-plakat. Avisen er medlem av Den norske fagpresses forening. Dette er avisas retningslinjer og redaksjon. Alt innhold er opphavsrettslig beskyttet © Universitetsavisa.

digitaliseringsstrategi

NorGPT kan bli redningen for det norske språket

En norsk språkmodell har ligget i hardtrening i NTNUs supercomputer Idun i vinter. Mye står på spill. På sikt: Det norske språks overlevelse.

- For en del offentlige virksomheter brenner det en hel del. Vi må ha alternativer til de store amerikanske modellene for å lage sine tjenester på toppen av sine systemer, sier Sven Størmer Thaulow, her på scenen under Medielederkonferansen.

Foto: Tore Oksholen

Tore Oksholen Ansvarlig redaktør

Publisert 06.06.2023 - 06:00 Sist oppdatert 06.06.2023 - 10:36

I dag tirsdag besøker statsminister Jonas Gahr Støre NTNU for å lansere regjeringens digitale initiativ. De siste månedene har landets kraftigste computer tygget seg gjennom enorme mengder norske ord for å sette sammen den første operative språkmodellen. Det er ingen tid å miste, om norsk språk skal sikres et liv utenfor museene.

Midt på høsten i fjor dukket et nytt ord opp på alles lepper: Chat GPT. I dag, trekvart år senere, har en forståelse bredt seg om at vi er i ferd med å oppleve et nytt «Iphone-øyeblikk», for ikke å si Internett-øyeblikk. Noen vil ha det til at Chat GPT får samme betydning som elektrisiteten.

Fakta

Regjeringens strategi for digitalisering

Statsminister Jonas Gahr Støre lanserer regjeringens nye nasjonale digitaliseringsstrategi på NTNU tirsdag formiddag.

En rekke forskere og ledere vil holde innlegg om tema som kunstig intelligens, beskyttelse mot digitale trusler og hvordan næringsliv og offentlig sektor kan utnytte verdien av data.

Fra NTNU deltar rektor Anne Borg og forsker Inga Strümke. Ordstyrer er dekan Ingrid Schjølberg fra Fakultet for informasjonsteknologi og elektroteknikk (IE).

Fordi:

Under Chat GPT ligger en språkmodell. Denne er i ferd med å bli en ny plattform for tjenester, på linje med App Store, SoMe og mer til. Språkmodeller er selve motoren i skapende kunstig intelligens.

- En chatboot er ingen kunnskapsmodell, formaner Gulla. - Den gjetter ord.

Ny, digital infrastruktur

Professor Jon Atle Gulla ved NorwAI – Norwegian research Center for AI Innovation:

- Språkmodellen vil utgjøre en ny, digital infrastruktur på internett, et nytt digitalt grensesnitt for alle mulige tjenester. Den åpner for nye former for arbeid. Språkmodellen kan bli din nye, digitale assistent, som ikke bare svarer på enkle spørsmål men som inngår i en dialog, gir råd og kommer med innspill.

Derfor trengs en norsk språkmodell. Denne modellen har vært under hardtrening i NTNUs sumpercomputer Idun i vinter. 23 milliarder parameter har lagt beslag på samtlige store GPU-er i 76 dager. Dermed er den første norske språkmodellen i ferd med å se dagens lys.

Men hva skal vi med en egen norsk versjon?

Kulturelle verdier

- Det er tre årsaker til at man behøver en norsk språkmodell, argumenterer Sven Størmer Thaulow. Thaulow er data- og teknologidirektør i Schibsted. Han er også styreleder i NorwAI. UA intervjuet ham da han besøkte Medielederkonferansen i Bergen.

- For det første tror vi ytelsen på norsk blir bedre enn ved store internasjonale modeller. For det andre samsvarer det med vår kulturelle verdier. For det tredje handler det å få kontroll med egen infrastruktur.

De nye chatbootene endrer folk og samfunn slik smarttelefonen og internettet gjorde, tror ekspertisen.

Gulla og Thaulow er begge opptatte av at meningsbærende strukturer ikke må være basert på strukturer utviklet i Silicon Valley eller tilsvarende steder. De understreker begge også behovet for transparens i måten språkmodellen blir trent på. UA nevner for dem begge eksemplet med at Chat GPT ble bedt om å komme med en Jesus-vits, og straks fikk flere på løpende bånd, men da den så ble bedt om å komme med en Muhammed-vits ga chatbooten beskjed om at det ikke passet seg.

For å forstå hvordan noe slikt kan skje, forklarer Gulla hva en språkmodell er for noe.

Ingen kunskapsmodell

- Aller først: Det er ikke en kunskapsmodell. En språkmodell gjetter neste ord i en setning den presenteres for. Oftest er flere alternative svar mulige, og både sannsynligheter i språkmodellen og andre teknikker brukes til å vurdere i hvilken grad svaret er godt eller riktig.

Slik bygges svært komplekse språklige strukturer. Det neste er «alignment» hvor språkmodellen formanes om hva som ikke passer seg. Dette er en svært arbeidsintensiv fase, som krever mye personell. I Chat GPTs tilfelle ble jobben satt ut til en stor gruppe kenyanere. Man antar at det var i denne fasen at språkmodellen fikk beskjed om at Muhammed-vitser var uaktuelt.

Man antar, man vet ikke. Fordi treningsdataene og detaljene omkring alignment ikke er åpent tilgjengelige.

Betyr det at man kan legge inn en skjult form for tankekontroll?

- Det er denne alignment-fasen som legger premissene, svarer Thaulow. Han nevner mulighetene for politisk sensur som illustrasjon. Hva om man legger inn at det ikke var Russland som angrep Ukraina, men motsatt?

Kontroll på n-ord og andre ord

I denne fasen kan språkmodellen få beskjed om at n-ordet ikke skal brukes. Den kan også få lagt inn begrensninger som utarter til politisk motivert sensur.

- Her er det viktig for oss at alt som skjer omkring treningen av den norske språkmodellen skal være transparent, understreker Gulla.

- Det innebærer å gjøre treningsdataene søkbare, samt å være helt åpen om hvordan vi «aligner» modellen.

Språkmodellen presenteres under Arendalsuka i august. Hva skjer videre?

Først skal kapasiteten – antall parameter – fordobles, fra 23 til om lag 50 milliarder. Siden skal modellen konsolideres. Og forventningene til den konsolideres.

- Utfordringen framover blir å beskrive modellens begrensninger. Å se på den som en kunnskapsmodell vil være uheldig, mener jeg. En språkmodell i og for seg finner på tekst.

Kunstige, smale tekster

NorwAI-lederen mener å se et mønster i at tekster generert av en språkmodell er 'smal' i formen. Bråe kast i en tekst, grensesprengende tankesprang, ligger utenfor dens kapasitet i dag. Det ligger i modellens struktur – den gjetter på det mest sannsynlige ordet som følger.

- Det har vært gjort forsøk med å generere vitenskapelige artikler, som ved første syn virker tilforlatelige på alle vis: En kan oppdage nye sammenhenger på denne måten, men ofte er det språklig plausible tekster uten ny vitenskapelig innsikt.

- Kan dette endre seg, ettersom modellene utvikler seg?

- Jeg ser ikke bort fra det, svarer Gulla.

Fra Thaulows presentasjon i Medielederkonferansen.

NorwAIs forskningsleder framholder at det viktige nå uansett er å få denne modellen opp og gå. Utviklingen går i en forrykende fart. Det handler om det norske språkets framtid, sa Sven Størmer Thaulow på scenen i Bergen.

Om det brenner

På spørsmål fra UA om det brenner nå, svarte han slik:

- For en del offentlige virksomheter brenner det en hel del. Vi må ha alternativer til de store amerikanske modellene for å lage sine tjenester på toppen av sine systemer. Det er for eksempel ikke gitt at NAV kan putte sine data inn i en modell utviklet i en modell utviklet i California, og det er heller ikke gitt at det som kommer ut av den i form av beslutninger som omfatter en bruker, er god nok, sier Thaulow.

- Vi snakker om en ny infrastruktur på internett, på lik linje med skybaserte tjenester. Er det snakk om det norske språks overlevelse?

- Ja, på lang sikt kan det være det, dersom dette blir den infrastrukturen vi tror med en svært stor distribusjon i mange tjenester på nettet. Om dette er det verktøyet som blir brukt av våre barn, av våre borgere i stort, til å tilegne seg kunnskap, eller generere tjenester så må disse modellene basere seg på vårt perspektiv i Norge.

Nyhetsbrev

Tips oss og delta i debatten

Kontakt oss

Om oss

NorGPT kan bli redningen for det norske språket

En norsk språkmodell har ligget i hardtrening i NTNUs supercomputer Idun i vinter. Mye står på spill. På sikt: Det norske språks overlevelse.

Regjeringens strategi for digitalisering

Ny, digital infrastruktur

Kulturelle verdier

Ingen kunskapsmodell

Kontroll på n-ord og andre ord

Kunstige, smale tekster

Om det brenner

Trump krever unnskyldning fra Harvard-universitetet

NTNU-studenter gikk nesten helt til topps i konkurranse

Dobling av KI-bruk i staten på halvannet år

I dag er fristen for å søke høyere utdanning

Mest lest:

Foreslår å gjøre det tre ganger så dyrt å parkere

NTNU-studenter gikk nesten helt til topps i konkurranse

Da jeg sluttet å være morsom

Tavle til besvær

Fikk høre at arbeidet ikke var «banebrytende nok», endelig nådde han opp

Trump-administrasjonen fryser rundt 2,3 milliarder dollar i støtte til Harvard-universitetet

Dommer: Palestina-aktivist i USA kan utvises

Foreslår å gjøre det tre ganger så dyrt å parkere

NTNU-studenter får flest tildelinger

Amerikansk universitet brøt kjønnsforskningssamarbeid med UiB

Ytring:

Tavle til besvær

Ikke velg en kortsiktig plan for bibliotek på Kalvskinnet

Da jeg sluttet å være morsom

NTNUs nye strategi kan ikke tviholde på myten om bærekraftig vekst

Engasjer deg - nå nærmer vi oss sluttspurten på universitetsstrategien

Samfunnsnytten av statlige byggeprosjekter kommer ikke av seg selv

Veien videre for Universitetsbiblioteket

Bevar Musikkbiblioteket ved NTNU!

Stem på nye NTNU-styremedlemmer!

NTNUs fremtid er avhengig av handlekraft og fellesskap

Flere studenter har for god råd for fullt stipend

Fikk høre at arbeidet ikke var «banebrytende nok», endelig nådde han opp

Regjeringen dropper egenbetaling på eksamen

Nå har de fylt alle lederstillingene

Disse vant styrevalget ved NTNU

Fikk ansatt ledere i seks av åtte stillinger

Nå er dette bygget trygt å ta i bruk igjen

Studentene protesterer mot at inspirerende lærer tvangsflyttes

Får fortsette som leder her i fire år til

Her heiser de dette flagget for første gang

Flere opplever at sommerjobben avlyses på kort varsel: – Vanskelig

Hun slo ut dagens leder i kampen om sjefsjobben

Snart 102 år og aktuell med ny forskningsartikkel

Ragnhild Hennum blir ny rektor ved Universitetet i Oslo

- NTNU må legge til rette så stipendiatene blir ferdig på tiden

Moserne signerer opprop mot Trumps angrep på forskinga

Dette er de nye studentene i NTNU-styret

Varsler om mobbing og seksuell trakassering

Går fra toppjobb i NTNU til Helse Midt-Norge

Jørn Ove var den eneste som ble tvangsflyttet: - Skuffende og vondt

- NTNU utøver toppledelsen feil

ILU: Én tvangsflyttet til Matematikksenteret - to gikk frivillig

Mener Institutt for lærerutdanning bryter med varslingsrutiner

Mener NTNU er for toppstyrt

Følg debatten før styrevalget her

Dette blir Norges øverste studentrepresentant

112 millioner kroner til forskerskoler

Aasland tilbake 25 år etter hun gikk av: - Håper hun ikke har glemt sine kampsaker

Hvem mener du bør være med og styre NTNU? Kjør debatt!

Ny leder og studentberedskap på helgens agenda

- Vi med små barn taper når parkeringen forsvinner

Sittende rektor vant ny periode

Avgått minister og avgått dekan vil ha ansvar for Nidarosdomen

Trump krever at forskere verden rundt fyller ut spørreskjema om DEI, kjønn og klima

Oddmund Hoel: - Målet var ikke å bli populær i sektoren

Abelprisen går til visjonær matematiker

Den nasjonale vendinga i kunnskaps­politikken står fast

Rektor-støtte splitter UiO-studentene

Dommer i USA stanser deportasjonen av koreansk student

Få kjenner ordningen som gjør det lettere å være nyansatt

Den nasjonale vendinga i kunnskapspolitikken står fast