Einar forsker på brystkreft med R

- RStudio er helt klart arbeidshesten, forteller postdoktor og Ukas Koder Einar Holsbø.

Einar Holsbø har en postdoktor-stilling ved Universitetet i Tromsø. Selv om forskningen er medisinsk, må han så absolutt kode. 📸: Privat
Einar Holsbø har en postdoktor-stilling ved Universitetet i Tromsø. Selv om forskningen er medisinsk, må han så absolutt kode. 📸: Privat Vis mer

Hvordan begynte du med koding? 👶

Jeg hadde egentlig ikke noe særlig forhold til programmering da jeg startet på en bachelor i fysikk i 2009, eller når det var.

Hadde laget noen enkle websider med HTML og CSS i løpet av tenårene, men det var ganske begrenset.

Bestemte meg for å skifte over til en bachelor i informatikk, da det viste seg at jeg syntes det var interessant å programmere.

Jeg har vært på universitetet siden, nå som forsker, men interessene mine har skiftet litt underveis. Jeg endret blant annet studieprogram til datasikkerhet etter en stund, og i dag jobber jeg mest mest med analyse av biomedisinske data.

Hva jobber du med akkurat nå? 🛠️

For tiden bygger jeg Bayesianske modeller for genekspresjonsdata, samlet inn i en stor kohortestudie for brystkreft.

Disse er hierarkiske modeller som jeg skriver i Stan, som implementerer effektiv Monte-Carlo sampling i C++. Stan har forskjellige interfaces, slik at jeg kan bruke mitt favorittmiljø RStudio til å gjøre selve kodingen.

«Når man jobber med analyse av biologiske data er det R som gjelder.»

Når man jobber med analyse av biologiske data er det R som gjelder, siden det finnes et rikt økosystem både av tradisjonell statistikk på CRAN og bioinformatikk-rettede verktøy på Bioconductor. I tillegg finnes det veldig gode verktøy for å håndtere data frames og for å visualisere data i tidyverse-pakkene, kanskje spesielt dplyr, tidyr, og ggplot2.

Våre data kommer fra blodprøver prosessert på mikromatriser (som biologene vet hva er...). Dette gir omtrent 20.000 målinger per prøve, hvor hver måling sier noe om hvor aktivt et gen er i blodet. Siden de fleste aktive celler i blodet er immunceller, tenker man at dette sier noe om immunsystemets aktivtet.

Vi håper at våre data og modeller kan hjelpe oss å lære om immunsystemets rolle i spredning av brystkreft til andre deler av kroppen.

Einar Holsbø kaller dette bildet av pulten sin for "pultie.jpg". Pultie. Det begrepet skal vi søren meg begynne å bruke. 📸: Privat
Einar Holsbø kaller dette bildet av pulten sin for "pultie.jpg". Pultie. Det begrepet skal vi søren meg begynne å bruke. 📸: Privat Vis mer

Hvordan ser en typisk arbeidsdag ut for deg? ☕

Kommer inn et sted mellom 8 og 9, og tar den første kaffekoppen mens jeg sjekker Twitter og andre likegyldige informasjonskanaler.

Som forsker styrer jeg tiden min i stor grad selv, men hovedsaklig gjør jeg enten analyser av data eller så skriver jeg om analyser jeg har gjort.

Jeg jobber med en del forskjellige folk på forskjellige steder, så det går med en del tid på synkronisering av dette. Jeg er med i noe som heter Health Data Lab, i forbindelse med dette har jeg to faste møter i løpet av en uke: et for alle lab-medlemer og et veiledningsmøte med leder av laben.

Vi har i tillegg innført one-on-one møter annenhver uke, hvor man møter de andre og forklarer hverandre hva man gjør på tomannshånd (slik at alle har snakket med alle i løpet av et semester).

Hva har du lyst til å lære mer om framover? 📚

Håper å lære mer om tidsrekke-data, men har ikke funnet en god unnskyldning til å begynne å se på det så langt.

Hvilke konkrete verktøy klarer du deg ikke uten? 😻

RStudio er helt klart arbeidshesten i min verktøykasse. Herfra gjør jeg analyser, skriver rapporter i form av notebooks, bygger kanskje noen verktøy som R-pakker, og så videre.

R har også et interface til Stan, som jeg bruker mye. Dette er et slags probabilistisk programmeringsspråk for å jobbe med Bayesianske metoder. Bruker Vim bindings i RStudio, men disse kunne tålt å være bedre.

Vil også fremhve Stack Exchange-nettverket som et sentralt verktøy: Stack Overflow for programmering, Cross Validated for statistikk og liknende.

«RStudio er helt klart arbeidshesten i min verktøykasse.»

Hva er det verste du kan bli spurt om på jobben? 🔥

Lange møter uten klar agenda.

Å skrive matematikk i noe annet enn LaTex.

Fylle ut reiseregninger.

Braastad - hunden til Einar Holsbø. 📸: Privat
Braastad - hunden til Einar Holsbø. 📸: Privat Vis mer

Hva synes du norske utviklere bør bli flinkere på? 🙋

Nå er jeg i den merkelige situasjonen at jeg ikke møter så mange utviklere. Kan være norske utviklere er gode på det meste?

Likevel sier jeg: Matematikk og kvantitativ tenking. Først synes jeg som de gamle grekere, at de fleste har godt av å praktisere litt matematikk.

For det andre bør det være en samfunnsplikt i fake news 2020 å kunne ta et kritisk blikk på tall og figurer.

Hva liker du å gjøre når du ikke jobber? 🕹️

Jeg orker ikke skrive noe særlig kode på fritida, og er egentlig ganske kjedelig.

Liker å lese bøker og å spille TV-spill (var salg på Civ6 til Nintendo Switch nettopp).

Liker også å rase med hunden vår, Braastad, se bilde.