Anthropic hevder Claude 4 er verdens beste til koding

Anthropic har lansert sin neste generasjon med Claude-modeller, Claude Opus 4 og Claude Sonnet 4, og hevder modellene setter nye standarder for koding.

Produktsjef Mike Krieger annonserte de nye Claude 4-modellene under selskapets første utviklerkonferanse i San Francisco den 22. mai. 📸: Anthropic / YouTube
Produktsjef Mike Krieger annonserte de nye Claude 4-modellene under selskapets første utviklerkonferanse i San Francisco den 22. mai. 📸: Anthropic / YouTube Vis mer

Under sin første utviklerkonferanse torsdag, "Code with Claude", lanserte AI-selskapet Antropic to nye AI-modeller som selskapet ikke ubeskjedent hevder er blant de beste i bransjen.

Modellene går under samlebetegnelsen "Claude 4" og består av:

  • Claude Opus 4
  • Claude Sonnet 4

– Claude Opus 4 er verdens beste kodemodell, med jevn ytelse på komplekse, langvarige oppgaver og agentarbeidsflyter, skriver selskapet i lanserings-bloggposten.

Begge modellene kan jobbe i to ulike moduser: Enten svare nesten umiddelbart, eller bruke mer tid på å resonnere seg frem til et svar.

Opus 4 kodet 7 timer i strekk

Anthropic skriver at Claude Opus 4 er selskapets kraftigste modell til nå.

Påstanden om at den er verdens beste til koding, underbygger de med resultater fra testene SWE-bench (72,5 %) og Terminal-bench (43,2 %).

Claude 4-modellene gjør det godt i tester, ifølge Anthropic. 📸: Anthropic
Claude 4-modellene gjør det godt i tester, ifølge Anthropic. 📸: Anthropic Vis mer

Opus 4 skal ifølge Anthropic levere stabil ytelse på langvarige oppgaver som krever fokusert innsats og tusenvis av steg. Den skal kunne jobbe flere timer i strekk, og "overgå Sonnet-modellene dramatisk".

Opus 4 er spesielt godt egnet til koding og kompleks problemløsing. Anthropic viser til eksempler fra noen av selskapene som har prøvd den nye AI-modellen. Blant annet skal det japanske selskapet Rakuten ha prøvd å bruke Opus 4 på en krevende refaktorering.

– Når teamet vårt brukte det på et komplekst open source-prosjekt, kodet den selvstendig i nesten sju timer, sier AI-sjef i Rakuten, Yusuke Kaji.

Sonnet 4 blir standard i Copilot

Den nye Claude Sonnet 4-modellen bygger videre på Sonnet 3.7, en modell som har vist seg å være veldig god til koding.

Sonnet 4 er ikke like avansert som Opus 4, men skal ifølge Anthropic balansere ytelse og effektivitet.

– Vi er veldig imponert over Sonnet 4s evne til å kode. Den er mye enklere å veilede enn 3.7 og gjør en utmerket jobb med å forstå kodebaser, skriver Eric Zakariasson i Cursor.

GitHub har ifølge Anthropic bestemt seg for å gjøre Claude Sonnet 4 til standard AI-modell for den nye kodeagenten i GitHub Copilot.

Du finner mer informasjon om Claude 4 her, og video fra lanseringen her.

Theo Browne har laget en gjennomgang av Sonnet 4 og Opus 4 her: