author_is_elon og andre interessante funn i Twitter-koden

Twitter bjudar på algoritmen sin, og langt smartere folk enn oss har dykka ned i den.

Blant annet denne "author_is_elon" har vekket interesse i Twitters algoritme. 📸: Ole Petter Baugerød Stokke
Blant annet denne "author_is_elon" har vekket interesse i Twitters algoritme. 📸: Ole Petter Baugerød Stokke Vis mer

Som lova slapp Elon Musk nylig deler av kildekoden til Twitter.

I GitHub-repoet "the-algorithm" kan alle nå få et innblikk i hvordan et sosialt medium faktisk jobber for å gi deg det mest relevante innholdet - eller hvordan de tvert i mot motarbeider innhold de mener du bør spares for.

Vår favoritt-Youtube-er Fireship, eller Jeff Delaney som han egentlig heter, har nå tatt seg et dypdykk:

- Alle vet mer eller mindre hvordan sånt fungerer, men det er interessant å se den faktiske implementasjonen i ekte kode, sier han i gjennomgangen.

Tre steg

Koden, som visstnok er ute i produksjon, skal for det meste være skrevet i Scala, etter at Twitter dumpa Ruby on Rails for en stund tilbake.

Kort fortalt skal algoritmen fungere sånn her, ifølge Fireship:

  1. Det blir henta ut 1.500 tweets som kan være interessante for deg.
  2. Disse blir så rangert av et nevralt nettverk, som du finner mer om i repoet "the-algorithm-ml".
  3. Til slutt filtreres "søppelet" bort, som tweets fra folk du har blokkert.
Slik forklarer Twitter algoritmen sin. 📸: github.com/twitter
Slik forklarer Twitter algoritmen sin. 📸: github.com/twitter Vis mer

Boost-systemet

Koden gir også detaljert innsikt i hvordan anbefalingsalgoritmene jobber for å rangere innholdet sitt, gjennom et poengsystem i "getLinearRankingParams"-funksjonen:

  • Retweets gir en 20-ganger boost, mens likerklikk gir en 30-ganger boost

  • Bilder eller video i tweeten gir en 2-ganger boost.

  • De som betaler for Twitter Blue får også en boost.

  • På samme måte får en tweet minuspoeng om den blant annet mottar blokkeringer eller blir flagga av brukerne, og visstnok også om den innholder stavefeil.

"author_is_elon"

De mest kontroversielle delene av koden er noen sjekker som ved første øyekast virker snodige.

Blant annet “author_is_elon” og “author_is_democrat” - altså sjekker om tweeten kommer fra Musk sjælv eller en demokrat.

Musk ble selv overraska over førstnevnte, da han visstnok hørte om den for første gang:

- Men disse er visst bare brukt til målinger, og er allerede fjerna, sier Fireship i videoen, som du også kan høre utviklerne selv fortelle i tweeten over.

Sjekk den ut

Elon Musk har visjoner om at Twitter skal være et motstykke til massemedia, og en del av denne visjonen er åpenhet rundt hvordan de jobber - gjennom å for eksempel dele slik kode.

Men det settes spørsmålstegn ved hvorvidt det som er gitt ut faktisk er alt. Blant annet spekuleres det i om enkelte kontoer får en ekstra boost.

- Uansett er koden veldig interessant, så jeg anbefaler at du sjekker den ut, sier Fireship i videoen.