Moderne IT-drift handler i stadig større grad om å oppdage signaler før de utvikler seg til faktiske problemer. Gjennom overvåkning, automatisering og systematisk forbedringsarbeid kan potensielle feil fanges opp tidlig, ofte lenge før brukerne merker noe. Det er nettopp denne typen arbeid som preger hverdagen i IT-miljøet i Embriq. Her jobber fagpersoner med ulike spesialiseringer tett sammen for å sikre stabile tjenester for kundene og for å utvikle løsningene og driftsprosessene kontinuerlig.
Menneskene bak stabil drift
For å forstå hvordan dette arbeidet foregår i praksis, har vi snakket med flere av fagpersonene som jobber med drift i Embriq: Katrina Johansen-Dahl, Head of Service Desk, Tommy Thorstensen, Operational Developer, Jahn Martinsen, Head of Data Center og Alexander Wilhelmsen, Head of Next Generation Management.
De representerer ulike deler av driftsmiljøet, fra servicedesk og datasenter til utvikling og operasjonell drift, men jobber tett sammen for å sikre stabile IT-tjenester for kundene. Sammen utgjør de et fagmiljø som jobber tett på både teknologi og kunder, og som kontinuerlig utvikler måten tjenestene driftes og forbedres på.
– Det kan være lett å tenke at vi sitter stille i båten når alt virker som det skal og vi kun tar aksjon når noe feiler, men den viktigste og største jobben er den vi gjør hver dag for å nettopp hindre at feil oppstår, sier Tommy Thorstensen.
Når drift handler om å være i forkant av problemene
Når systemene fungerer stabilt, er det nettopp da mye av det viktigste arbeidet skjer. Driftsmiljøet følger kontinuerlig med på data fra overvåkingssystemer for å identifisere mønstre og trender i infrastrukturen. Det kan være alt fra kapasitetsbruk på servere til responstid i nettverk eller endringer i trafikkmønstre.
– Vi analyserer trender i systemene vi drifter. Hvis vi ser tegn til at noe kan utvikle seg til et problem, gjør vi tiltak før det påvirker kundene, forklarer Alexander Wilhelmsen.
Dette arbeidet handler også om kontinuerlig forbedring. Alarmer og hendelser gjennomgås jevnlig for å justere overvåkningen, forbedre rutiner og automatisere oppgaver der det er mulig.
Målet er både å oppdage reelle avvik tidligere og å redusere støy i overvåkingssystemene.

Små signaler kan forhindre større problemer
Mye av driftsarbeidet handler om å fange opp små avvik før de utvikler seg.
Et typisk eksempel er kapasitet på servere noe som kan utvikle seg til et problem hvis det ikke fanges opp i tide.
– Hvis en disk blir full, kan tjenester stoppe eller servere krasje. Derfor overvåker vi slike ting kontinuerlig og gjør tiltak lenge før det skjer, sier Jahn Martinsen.
Andre ganger handler det om små variasjoner som ved første øyekast kan se ut som helt normale verdier hvis man ikke har historikken som viser hvordan noe har utviklet seg over tid. For eksempel kan signalstyrken på fiberutstyr gradvis svekkes over tid. Ved å følge utviklingen i overvåkingen kan komponenter byttes før de faktisk slutter å fungere.
Slike tiltak skjer ofte uten at brukerne merker det. Mange av oppgavene som gjøres i det daglige er nettopp slike små justeringer som gjør at systemene fortsetter å fungere stabilt.
Når noe faktisk feiler
Selv med god overvåkning kan det oppstå hendelser. Da aktiveres etablerte prosesser for hendelseshåndtering.
Når en tjeneste påvirkes, samles relevante spesialister raskt for å identifisere problemet og få systemene tilbake i drift.
– Første prioritet er alltid å få tjenesten opp igjen så raskt som mulig. Å analysere hvorfor det skjedde kan vi gjøre etterpå, forklarer Tommy Thorstensen.
Ved større hendelser samles teamene i det som ofte omtales som et «war room», der de jobber tett sammen til problemet er løst. Samtidig håndteres kommunikasjonen med kunden. Når noe påvirker kundene, er informasjonsbehovet stort, og derfor finnes det egne roller som sørger for at kunden holdes oppdatert mens feilsøkingen pågår.
Samarbeid på tvers av fagområder
Driften i IT Managed Services involverer flere fagmiljøer – fra servicedesk og drift til nettverk og datasenter.
– Servicedesk er ofte første punkt som fanger opp signaler, enten fra overvåkingen eller fra kunden. Derfra jobber vi tett sammen med andre team for å analysere og løse saken, sier Katrina Johansen-Dahl.
Det tette samarbeidet er en viktig styrke i miljøet.
– Det er korte veier mellom folk, og man vet hvem som kan hva. Det gjør det enklere å få riktig kompetanse raskt inn i en sak, fortsetter Jahn Martinsen.
Det bidrar også til et fagmiljø der man lærer av hverandre i hverdagen og utvikler kompetansen sin gjennom samarbeid.

Drift av systemer som ikke kan stoppe
Når slike systemer påvirkes, kan konsekvensene bli store. Derfor er stabil drift og robuste løsninger avgjørende. For mange av kundene betyr det også at systemene må være tilgjengelige døgnet rundt. For Embriq betyr dette et særlig ansvar for å levere løsninger som er robuste, forutsigbare og bygget for kontinuerlig tilgjengelighet.
En viktig del av arbeidet starter allerede når infrastrukturen designes. Løsningene bygges ofte med redundans i alle ledd, slik at en komponent kan feile uten at tjenesten stopper. Målet er å unngå det som ofte omtales som single points of failure, der én komponent alene kan stoppe en tjeneste. Hvis én komponent går ned, skal en annen kunne ta over uten at brukerne merker det.
En arbeidshverdag i kontinuerlig utvikling
For dem som jobber i IT Managed Services betyr dette en arbeidshverdag med stor variasjon.
Teknologi, systemer og kundebehov er i stadig utvikling, og nye problemstillinger dukker opp hele tiden. Det betyr også at man kontinuerlig lærer nye ting og utvikler kompetansen sin i takt med teknologien.
– Ingen dager er helt like. Man må være nysgjerrig og villig til å lære nye ting hele tiden, sier Jahn Martinsen.
Samtidig er samarbeidet en viktig del av hverdagen.
– Det mest givende er å løse problemer sammen som et team og se at det faktisk hjelper kundene våre, avslutter Katrina Johansen-Dahl.
