Mener KI kan erstatte 155.000 folk i staten, men fikk tallet fra KI

Tallet har sirkulert siden 2023, men kritikere mener det er "høyst usikkert og spekulativt", melder Aftenposten. For tallet kommer fra GPT-4.

Blant annet skolevesenet skal kunne spare enorme mengder tid og penger på KI, ifølge tallet, som KI har regnet seg fram til.
Publisert

I september 2024 ga Riksrevisjonen en rapport til Stortinget, "Bruk av kunstig intelligens i staten", hvor det blant annet stod: 

"Ved full utnyttelse av dagens teknologi for kunstig intelligens, kan offentlig sektor effektivisere arbeidsoppgaver som årlig vil tilsvare 155 000 årsverk, ifølge rapporten."

Tallet 155.000 har senere kommet opp i mange sammenhenger. Men tallet kom altså fra en annen rapport, notatet "KI: Betydning for arbeidsstyrken" fra selskapet Menon Economics i 2023, hvor det står: 

"Ved fullstendig utnyttelse av KI slik som teknologien står i dag, kan offentlig sektor effektivisere arbeidsoppgaver som årlig vil tilsvare 155 000 årsverk i sektorer som helse, undervisning og offentlig administrasjon".

Aftenposten skriver at det i en artikkel i tidsskriftet Stat & Styring kommer fram hvor dette tallet stammer fra: 

Verktøyene fra den største KI-tilbyderen av dem alle. 

Fant tallet med GPT-4

"Fordi dette konkrete tallet er så hyppig gjengitt i offentligheten, blir vi nysgjerrig på hvor det stammer fra" skriver forfatterne av artikkelen i Stat & Styring, Ståle Grut, Alexander Moltubakk Kempton og Hilde Reinertsen.

Svaret fant de i notatet selv, som er åpen om metoden: 

  • Kort fortalt brukte økonomene GPT-4-språkmodellen fra OpenAI
  • Selv om det for kode24 er noe uklart nøyaktig hvordan de brukte språkmodellen, er GPT-4 den samme språkmodellen som i 2023 ble sluppet i OpenAIs ChatGPT, så for alle praktiske formål brukte de dermed ChatGPT. 
  • Økonomene brukte også OpenAIs metoder for å finne ut hvor mye mer effektiv staten kunne jobbe ved å bruke KI, ved å bruke KI. 

Forfatterne av artikkelen i Stat & Styring har gjenskapt arbeidet gjennom et Python-skript og OpenAIs språkmodeller kommet fram til samme tall: 155.000. 

Men de har i arbeidet også sett mange problemer med metoden, og overfor Aftenposten kaller medforfatter Ståle Grut tallet "høyst usikkert og spekulativt tall".

Problemer med metoden

Kritikerne av 155.000-tallet skriver blant annet om tre hovedproblemer med Menon Economics: 

  1. "Den første observasjonen er at det er stor variasjon i hvilke tall GPT-4-språkmodellen produserer. (...)  Resultatene varierte mellom 20 % og 33 %. Hadde vi spurt flere ganger, ville vi trolig fått et større spenn i tallene. Det bør heller ikke overraske. En språkmodell som GPT-4 er stokastisk."
  2. "Statistisk sentralbyrås tall og klassifiseringer bruker en annen standard enn den amerikanske O*NET-databasen over oppgavebeskrivelser, som er den OpenAI-arbeidsnotatet er basert på."
  3. "Den tredje observasjonen er at det utgjør en stor forskjell om man spør GPT-4 om hver arbeidsoppgave hver for seg, eller om man samler arbeidsoppgavene i et langt prompt."

"Avslutningsvis vil vi peke på implikasjonene av at staten på denne måten potensielt fatter store beslutninger på et sviktende kunnskapsgrunnlag uten å vite at det er dette de gjør. Det er et påfallende fravær av problematisering omkring hva vi egentlig vet om potensialet for KI-bruk" skriver forfatterne.

"En illustrasjon"

"Vi står fast ved at tallgrunnlaget har verdi, men kan ikke kontrollere hvordan alle våre kunnskapsgrunnlag benyttes videre" skriver Menon Economics i et tilsvar til Stat & Styring, kalt "Usikker kunnskap er bedre enn ingen". 

– Tallet 155.000 er først og fremst ment som en illustrasjon på effektiviseringspotensialet som ligger i å ta i bruk kunstig intelligens i staten, skriver Annette Gohn-Hellum, ansvarlig ekspedisjonssjef i Riksrevisjonen,  til Aftenposten, men legger til: 

– Vi ser nå at vi burde forklart tallet bedre, blant annet at KI var brukt for å komme frem til tallet.

Powered by Labrador CMS