«Token»-lengsel går viralt: Her får de så mange de vil
Mens folk verden rundt klager over begrenset KI-kreditt, får Stø-utviklere eksperimentere fritt. – Har økt forbruksgrensene fremfor å strupe innovasjonen.
– Jeg har nådd min Claude-grense for tredje gang i dag, klager Chiara Antonucci på TikTok, X og Instagram.
Videoen har gått viralt den siste tiden. Flere klager over det samme, mens andre poster tips for å bruke tokens i Claude på en smartere måte.
Mens for eksempel vibbekode-programmer som Replit snakker om mengde kreditter, kjøper man tilgang på tokens i Claude-sammenheng.
Se videoen her:
@chiaraonai Is there an anonymous AI limit group I can join? 🥹 #claude #ai #claudecowork #aiworkflow #humor ♬ Unwritten x Midnight City by Altégo - ALTÉGO
Maksplan på 200 dollar
Hjemme i Norge har KI-ekspert Alexander Haneng i Digital Norway kjent på det samme: å gå tom for tokens i Claude-verktøy.
– Jeg er absolutt en av dem som opplever det, sier han til kode24.
– Når Claude sier du har brukt opp kvota for nå, kan man oppgradere til en maks-plan, som jeg er på nå. Da har du mer å gå på.
Men det kan fort bli dyrt, både som privatperson og for bedriften din, om alle ansatte skal på maksplanen.
Haneng peker på at et standardabonnement kan koste rundt 250 kroner per bruker i måneden å ha fullt opp på ChatGPT, Copilot eller Claude.
– De er ganske likt priset og ligger på mellom 2500-4000 kroner i året per bruker. Jeg tenker det er lite i forhold til tiden man sparer, sier Haneng.
Men vedgår at det kan bli en stor sum i året om bedriften har mange ansatte. Ikke minst om man må makse abonnementet for å få flere tokens.
Claudes maksplan koster 200 dollar i måneden.
Vil ikke røpe pengesummen
Midt i Postgirobygget i Oslo sitter utviklerne til Stø og knar på sikkerhet og funksjoner i BankID og BankAxept.
Flere har ikke håndkodet på et halvt år, men bruker KI-verktøy til programmeringen, som kode24 skrev denne uken.
CTO Christoffer Hernæs vil ikke røpe hvor mye penger Stø bruker på å la utviklerne leke seg i KI-programmene.
Men forteller at de ikke har satt noen begrensning på tokens.
– Vi tillater eventuelt høyt forbruk i den fasen vi er i nå da vi ønsker at de ansatte skal få lov til å utforske, lære og finne sin vei, sier CTO-en.
Øker forbruksgrensene
Han forteller at de har gått tom for tokens et par ganger, selv om de enda ikke er så «modne innen agentisk koding at de ansatte klarer å forbruke tokens på et nivå» som kanskje andre selskap gjør.
– Men da har vi økt forbruksgrensene fremfor å strupe innovasjonen. Vi ser likevel at tokenbruken skyter fart i organisasjonen, og at vi vi bruker en god del tokens for å oppnå kvalitet siden agentene gjør mye egenreview i vårt oppsett, Hernæs.
Videre ser de en trend der agentene som selv orkestrerer andre agenter begynner å konsumere en del tokens.
– Har dere blitt mer effektive ved bruk av KI-verktøy?
– Det har vi ikke gjort målinger på. For oss handler ikke dette om å spare penger, men å utvikle og forbedre oss i takt med teknologiutviklingen, sier CTO-en.
– Tek sjekken av koden meir tid enn ved håndkoding?
– Vi opplever at koden som genereres ikke avviker langt fra det vi kunne forventet fra en utvikler på teamet.
Tips og triks
For privatpersoner og bedrifter som ikke har samme budsjettene til token-bruk, har han følgende tips:
– Velg rett modell for oppgaven som skal løses, gjøre iterasjoner på deler av koden fremfor helheten, gjenbruk av maler, oppsett og strukturer, unngå gjentakende forklaringer og forespørsler, og utarbeide presise prompter fremfor generelle forespørsler, sier Hernæs i Stø.
Alexander Haneng i Digital Norway har følgende tips:
- Velg en enklere modell enn Opus 4.7, som kom denne uka. Sonnet er veldig kapabel på tekst, og Haiku bruker en tiendedel av token som Opus. Bare der kan du kutte token-bruk med 90 prosent, gitt at den kan det du skal gjøre, sier Haneng.
- Send inn mindre data og kontekst for hver prompt. Du kan tweeke på markdown-filer (litt formaterte tekstfiler for å gi instruksjoner) og sette opp Claude slik at den ikke sender hele historikken for dagen eller måneden. Jobb i prosjekter og legg ved md.-filer med det viktigste.
– Det viktigste bedrifter kan gjøre nå, er å begynne å bruke og lære hva modellene kan og ikke kan gjøre. Bygg kompetanse. For utviklere kan det bli å jobbe mer med orkestrering, sette i gang agenter, få tilbake data og evaluere. Det blir en annen måte å tenke på, sier Haneng.
Her er flere tips til å spare på tokens i Claude:
Gratisprogrammer
Hva med dem som ikke har penger til de dyreste abonnementene?
Haneng peker på at det også fins kildekodeprogrammer som LM Studio som fungerer på PC, Mac og Linux.
– Der kan du laste inn åpne språkmodeller og kjøre dem gratis offline. Sikkerheten er større, sier Haneng.
Blant modellene peker han på Google DeepMinds Gemma 3.
– Den leverer kraft tilsvarende åtte ganger så store modeller, har null kostnad og er mye tryggere. Men den er ikke like brukervennlig og integrert som Claude og Claude Cowork, sier Haneng.
– Hva med dem som er skeptiske til å bruke KI-verktøy i det hele tatt?
– Jeg skjønner at folk ikke liker å endre seg. Det er menneskelig. Jeg vil oppfordre til å ha et åpent sinn og teste og prøve. Skal man være konkurransedyktig, må vi også ta det i bruk. Man kan ikke trykke tannpastaen tilbake i tuben.