Frustrert over hyppig nedetid hos Elhub: «Systemet kneler!»

Hyppig nedetid på flere timer eller dager skaper utfordringer for utviklere som integrerer mot Elhub.

Mye nedetid hos Elhub skaper utfordringer for utviklere som må mellomlagre meldinger mens de venter på at systemene skal komme opp igjen. 📸: Skjermbilde fra elhub.no
Mye nedetid hos Elhub skaper utfordringer for utviklere som må mellomlagre meldinger mens de venter på at systemene skal komme opp igjen. 📸: Skjermbilde fra elhub.no Vis mer

– Elhub har kostet norske skattebetalere hundrevis av millioner kroner, men har stadig nedetid på flere timer, ofte flere dager.

Det sier en utvikler som ønsker å være anonym til kode24. Han sier hans team lager løsninger som integrerer mot Elhub, og at nedetiden skaper veldig mye ekstraarbeid.

– Nedetiden begrunnes ofte med "teknisk vedlikehold", sier utvikleren.

Da kode24 sjekker driftsmeldinger på elhub.no får vi bekreftet at det er mye nedetid, både tidligere nedetid og kommende nedetid.

Ofte er flere dager i løpet av én uke rammet av nedetid – riktignok varslet på forhånd.

"Alt" går via Elhub

Elhub er en løsning for å digitalisere strømmarkedet, og eies av Statnett:

  • Kort fortalt blir all produksjon av kraft i Norge målt hver time og sendt inn til Elhub.
  • Det samme skjer med måledata fra automatiske strømmålere hos forbrukere.
  • Så analyserer Elhub dataene slik at kraftleverandører og strømselskaper kan bruke det som underlag for fakturering av strøm og nettleie til sluttkunder.

«Gjennom standardiserte grensesnitt og sikker meldingsutveksling gir vi markedet mulighet til å utvikle automatiserte tjenester som kan bidra til videre digitalisering og smarte løsninger», opplyser Elhub på sine nettsider.

Det er disse standardiserte grensesnittene og løsningene for meldingsutveksling som vår tipser benytter og er avhengig av – men altså ofte får problemer med på grunn av all nedetiden.

"Legger ansvaret over på oss"

Tipseren forklarer at de som brukere av Elhub er ansvarlige for å lagre meldinger i mellomtiden hvis Elhub er nede.

Så snart systemet er oppe og kjøre igjen, må meldingene sendes på nytt.

– Ikke bare skaper det ekstraarbeid, det hender også ofte at Elhub ikke klarer å ta imot meldinger fort nok når alle meldingene skal resendes. Systemet kneler og returnerer timeout-feil.

Utvikleren hevder nedetiden har blitt enda verre etter at Elhub tidligere i år gikk over til sky. Det synes han er rart, tatt i betraktning de enorme ressursene som er investert i prosjektet.

«...totalt sett for markedet er viktigere med kvalitet, integritet og kompletthet, enn 100% oppetid.»

Elhub beklager

Sigbjørn Høgne er direktør for Elhub, og sier til kode24 at de beklager at utviklere opplever nedetid på tjenester fra Elhub.

– Vi jobber hver dag for at forbedringer, sikkerhetsoppgraderinger og feilrettelser skal kunne implementeres med så liten påvirkning som mulig for våre kunder. Eksempelvis er dagens nedetid (22.11.) utsatt etter en ny vurdering, sier Høgne.

Han forklarer at de må prioritere at data i Elhub til enhver tid er så riktig og komplett som mulig, for å ivareta integriteten i det finansielle oppgjøret i kraftmarkedet.

– I tillegg må vi være sikre på at vi gjør det som skal til for å holde løsningen oppdatert med tanke på sikkerhet. Vi må da noen ganger prioritere å ta løsningen ned for å gjøre nødvendig vedlikehold.

– Elhubs natur og egenskap er at det totalt sett for markedet er viktigere med kvalitet, integritet og kompletthet enn 100 prosent oppetid. Likevel skal aktørene være trygge på at vi tilstreber så høy tilgjengelighet som mulig med de ressurser vi har til rådighet.

Ved nedetid må meldinger mellomlagres av klientene og sendes på nytt til Elhub så snart de er oppe igjen.
Ved nedetid må meldinger mellomlagres av klientene og sendes på nytt til Elhub så snart de er oppe igjen. Vis mer

Vurderer bufferløsning

Høgne sier det er gjort store investeringer i Elhub-løsningen i 2023. Den største endringen som er implementert til nå er overgang til finere tidsoppløsning (15 minutter). Overgang til sky i mars 2023 var en av forutsetningene for å få til det.

– Elhub er glad for at disse store endringene totalt sett har ført til lite nedetid sett i forhold til størrelsen på endringene og samarbeidet med våre markedspartnere har vært veldig bra. Etter overgangen til sky har Elhub langt mindre uplanlagt nedetid i systemet og er totalt sett en mer stabil og sikker løsning enn det som var tilfellet tidligere, sier Høgne.

Han forstår utfordringene kundene har med å ikke kunne sende meldinger når de er nede, og selv måtte lagre meldingene midlertidig i påvente av at systemene skal komme opp igjen.

– Elhub jobber nå med å se på mulighetene for en buffer-løsning som vil innebære at vi kan holde meldingsmottaket oppe under teknisk vedlikehold. Elhub jobber også med kontinuerlig forbedring av kjerneløsningen, der målet er å redusere direkte avhengigheter i arkitekturen, automasjon og reduksjon av bruk av lisensiert programvare.

«De gjør det vanskeligere for klienter enn de trenger.»

Burde ikke vært nødvendig

Vår tipser blir glad når vi forteller at Elhub ser på mulighet for en bufferløsning.

– Det er bra, og har vært ønsket av oss lenge. Men dette skulle vært på plass fra starten av. Det vil redusere problemet med nedetid for klienter betraktelig, sier utvikleren.

Han er imidlertid ikke helt fornøyd med at Elhub unnskylder nedetid med "integritet og kompletthet". Dette ansvaret legger de vel mye over på de som sender måleverdier til Elhub, mener han.

– At alle måleverdier må sendes inn i riktig rekkefølge burde ikke være påkrevd når arkitekturen er asynkron. Hvis en måleverdi-melding er ute av rekkefølge avvises den meldingen og alle meldinger som kommer etter for den måleverdiserien.

Han mener heller Elhub burde kunne vente litt og se om manglende måleverdier kommer inn litt senere og ikke avvise alle påfølgende meldinger. Som oftest vil manglende verdier komme inn rett etterpå og problemet vil løse seg selv, mener han.

– Dette problemet kan spesielt oppstå etter nedetid når mange måleverdier skal leveres på kort tid og en timeout betyr at alle påfølgende meldinger i serien blir avvist. De gjør det vanskeligere for klienter enn de trenger.