Får aldri nok e-infrastruktur

Moderne forskning generer store mengder data og krever svært stor regne- og lagringskapasitet. Mange forskningsoppgaver hadde rett og slett ikke vært mulig uten tungregning, og behovet for e-infrastruktur er stadig økende.

I fjor vår ble den nasjonale e-infrastrukturen styrket da den nye infrastrukturen for datalagring, NIRD, ble satt i drift, og superdatamaskinen Fram ble installert ved UiT Norges arktiske universitet. Tilstrekkelig kapasitet for lagring av forskningsdata blir viktigere, og kravene til ytelse er betydelig økt for NIRD sammenlignet med forgjengeren NorStore. NIRD har en lagringskapasitet på cirka 12,6 PiB, fordelt mellom Trondheim og Tromsø.

Superdatamaskiner er kritisk for suksessen til forskere fra et bredt spekter av forskningsdisipliner i Norge. Fram har en regnekapasitet på totalt omtrent 260 millioner CPU-timer årlig, med 1,1 petaflop per sekund som maksimal teoretisk ytelse. Anskaffelsen og drift av Fram og NIRD er et samarbeid mellom Uninett Sigma2, UiB, UiT Norges arktiske universitet og NTNU.

Vil alltid be om mer e-infrastruktur

Det er i underkant av 110 forskningsprosjekter som benytter seg av Uninett Sigma2s lagringsfasiliteter, og for HPC-ressursene er antallet prosjekter over 300. Her finner vi et bredt spekter av forskningsdisipliner. Blant annet brukes ressursene til å forske på klima, Alzheimers og demens, marine økosystem, sola, DNA, kreft og nordiske språk.

Under den offisielle åpningen av Fram og NIRD i fjor vår Tromsø deltok flere av forskerne som benytter Uninett Sigma2s beregnings- og lagringsressurser. Blant dem var professor ved Universitetet i Bergen, Christoph Heinze. Han benytter NIRD i jordsystemmodellering av klimaendringer i den antroposene tidsalder.

Åpning av Fram og NIRD: Christoph Heinze snakket om bruk av NIRD i jordsystemmodellering. Foto: Andreas Bach

Den antroposene tidsalder viser til perioden hvor mennesket i betydelig grad har kunnet påvirke jordas miljø og klima. Jordsystemmodeller er det viktigste verktøyet for å fastslå hvilke klimaforandringer som har skjedd til nå, og hvordan vi kan forberede oss på endringer som kan komme. En jordsystemmodell er en matematisk modell som benytter de kraftigste regnemaskinene som finnes. Den er basert på kjente fysiske lover for jordas klimasystem, i tillegg til kjemiske og biologiske prosesser i jordas økosystem.

Heinze påpekte i sitt foredrag under åpningen i Tromsø nødvendigheten av e-infrastrukturen og ressursene som Uninett Sigma2 tilbyr.

– Beregnings- og lagringsfasilitetene har alltid vært en begrensende faktor i vår virksomhet. Vi vil alltid be om mer elektronisk infrastruktur, understreket Heinze.

Utfordringer knyttet til e-infrastruktur

Ifølge Heinze er jordsystemmodellering blant de mest komplekse datakodene som er blitt utviklet av mennesker. Det er også vanskelig å beregne nøyaktig hvor mye CPU-tid og lagringsplass de trenger, og disse behovene kan variere betydelig ut i fra hvilken fase forskningsprosjektet er i. Dette byr på utfordringer knyttet til e-infrastruktur og datalagring.

– Vi kan lett fylle enhver datamaskin, uansett størrelse, kun ved å øke kompleksiteten eller lengden på scenarioene vi studerer. Formålet med forskningen er å gi tidlige varsler til samfunnet om hva som kan skje under visse omstendigheter, da Heinze.

En unik løsning for storskala datalagring

Kavliinstituttet for nevrovitenskap og Senter for nevrale nettverk benytter også Uninett Sigma2s ressurser, da hovedsakelig til å lagre forskningsdata. Kavliinstituttet og Senter for nevrale nettverk ledes av nobelprisvinnerne i medisin, Edvard Moser og May-Britt Moser. I en søknad fra instituttet om bruk av lagringsressurser, heter det blant annet:

«Individuelle forskningsgrupper lagrer vanligvis mer enn 100 terabyte data hvert år, noe som krever løsninger utover de som er utviklet for klassiske elektrofysiologiske formål. NorStore (NIRDs forgjernger, red.anm.) tilbyr en unik løsning for den type storskala datalagring som vi trenger.».

En drivkraft i internasjonal forskning

For å kunne være internasjonalt konkurransedyktige, er det essensielt at norske forskere har tilgang til elektronisk infrastruktur på høyt internasjonalt nivå. Seniorrådgiver i Forskningsrådet, Ulrike Jaekel, understreket betydningen av Fram og NIRD for norsk forskning i internasjonal sammenheng under åpningen i Tromsø.

– Tilgangen til en slik beregningsressurs gjør det mulig for norske forskere å prosessere den stadig voksende og mer komplekse datastrømmen. Det bidrar også til at norske forskere blir en drivkraft i internasjonal vitenskapelig forskning.

Fra fire til to superdatamaskiner

Hittil har den nasjonale e-infrastrukturen bestått av fire superdatamaskiner, plassert ved universitetene i henholdsvis Bergen, Oslo, Trondheim og Tromsø, samt et lagringssystem for vitenskapelige data plassert i Trondheim og Oslo.

De fire superdatamaskinene ble installert i 2013 og har en levetid på fire år. I forbindelse med utskifting av de nåværende maskinene, er det planlagt en overgang fra fire til to nasjonale superdatamaskiner. Anskaffelsen av Fram i Tromsø er et skritt i retning av dette. Den andre nye superdatamaskinen skal plasseres i Trondheim i 2018.

Les mer:

Computerworlds artikkel om superdatamaskinen Fram

From numbers and sequences to personalised cancer treatment

Uninett Sigma2s blogg