Mange av de mest kjente store språkmodellene (LLM-er) er basert på lukket kildekode – og felles for de fleste er at de er sensurert og finjustert på ulike måter for å gi de svarene selskapene bak ønsker at de skal gi.
Det siste kan være fornuftig hvis du skal bygge en AI-basert løsning som andre skal bruke, og du ikke vil risikere at AI-en spyr ut rasistiske utsagn eller gir brukerne dine bombeoppskrifter.
Det finnes imidlertid usensurerte språkmodeller: Det franske AI-selskapet Mistral AI lager en slik usensurert åpen kildekodebasert språkmodell som er mulig å kjøre på din egen maskin.
Ytelsen skal ifølge Jeff Delaney på YouTube-kanalen Fireship nærme seg GPT 4, selv om den ikke er helt på høyde ennå.
Kraftig LLM uten sikkerheten
– Den er veldig kraftig, men enda viktigere så har den en skikkelig åpen kildekode-lisens, nemlig Apache 2.0, sier Fireship i en ny video.
I videoen viser han til en bloggpost fra Eric Hartford som forklarer hvorfor det i enkelte tilfeller vil være nyttig å ha en usensurert språkmodell. Hartford skriver at det for de fleste generelle formål er fint med sensurerte – eller "aligned" – modeller for å hindre den i å gi farlige eller kontroversielle råd.
Men det er ikke sikkert at det er riktig at alle språkmodeller skal være sensurert i henhold til for eksempel amerikanske etiske standarder. Eller kanskje man har behov for å trene en språkmodell til helt spesielle formål.
Sjekk videoen fra Fireship: