Debatt ● vigdis kvalheim og frode arntsen
Et nasjonalt vitenarkiv fjerner dobbeltarbeid og fremmer åpen forskning
Noe av debatten rundt nytt vitenarkiv dreier seg om at løsningen blir for komplisert. Situasjonen er snarere motsatt. Sammenlignet med dagens løsninger blir det en enklere og mer helhetlig løsning, skriver to ledere hos Sikt.
Denne teksten er et debattinnlegg. Innholdet i teksten uttrykker forfatterens egen mening.
Resultater fra offentlig finansiert forskning skal være åpent tilgjengelig. Dette er en viktig målsetning i norsk forskningspolitikk. Unit (nå Sikt) fikk derfor i 2019 i oppdrag fra Kunnskapsdepartementet å utvikle tjenesten Nasjonalt vitenarkiv (NVA). I det siste har det pågått en debatt om NVA leverer på oppdraget fra Kunnskapsdepartementet, og om Sikt (tidligere Unit) treffer på behovene til sektoren. Vi ønsker å oppklare noen misforståelser som vi ser har festet seg, samtidig som vi vil understreke at vi forstår bekymringene og tar kritikken på alvor.
Med et felles Nasjonalt vitenarkiv som vil erstatte dagens Cristin-system og rundt 75 institusjonelle vitenarkiv, vil alle norske forskningsutøvende institusjoner ha et vitenarkiv der de kan arkivere og gjøre sine vitenskapelige resultater åpent tilgjengelig. Målet er at dagens Cris-funksjonalitet og vitenarkivfunksjonalitet integreres i en løsning. Det medfører at rapportering av vitenskapelige publikasjoner (som i dag håndteres i Cristin) og rettighetsklarering (som i dag håndteres av vitenarkivene) blir en integrert del av den nye Cris/NVA-løsningen. Løsningen vil også videreføre en forbedret versjon av import av publikasjonsdata (Sentralimport). Den nye Cris/NVA-løsningen som utvikles vil ikke bli nedskalert i forhold til hverken funksjonalitet i dagens systemer eller NVA-prosjektets opprinnelige plan.
Når institusjonene og deres brukere tar den nye Cris/NVA-løsningen i bruk, vil de få en IT-løsning som har et mer moderne brukergrensesnitt, og som legger til rette for en mer effektiv og rasjonell arbeidsflyt. De har tilgang til samme informasjon som tidligere, men informasjonen vil ha bedre kvalitet og importerte publikasjonsdata vil være raskere tilgjengelig for brukerne. I de tilfeller der et forskningsresultat må registreres manuelt, vil dette la seg gjøre raskere og enklere fordi man kan benytte lenker til det stedet resultatet er publisert, evt DOI-er som kan gi enda enklere registrering. Hovedtilnærmingen vil uansett være en så automatisert import av publikasjonsdata som mulig.
Samtidig vil brukerne også merke at det vil bli mindre dobbeltarbeid og enklere å sikre kvaliteten på metadata om den enkelte publikasjon. Man kan for eksempel vedlikeholde informasjon om én publikasjon ett sted, i stedet for et antall ganger, avhengig av hvor mange vitenarkiv som har publikasjonen lagret. Selv om dagens metadataposter ofte oppstår i Cristin og kopieres til de enkelte vitenarkivene, er det ingen mekanismer som sørger for at oppdatering i ett av systemene skrives til de andre systemene. Den nye Cris/NVA-løsningen vil gi en konsistent bedre kvalitet på metadata for publikasjoner og annet innhold i NVA.
Utredningen som ligger til grunn for etablering av NVA anbefaler nettopp en slik løsning der man går fra dagens situasjon – hvor for eksempel en vitenskapelig artikkel med forfatter fra flere institusjoner (sampublisering) er lagret i hver av institusjonenes vitenarkiv, med hver sin metadatapost og tilhørende fil og i tillegg en separat metadatapost i Cristin – til en løsning der en artikkel er lagret én gang med en tilhørende fil. Et annet område, som krever betydelig dobbeltarbeid i dagens løsning der det er sampublisering, er rettighetsklarering på den enkelte fil som publiseres. Kort sagt er dette arbeidet med å avklare hvilke rettigheter den enkelte institusjon har til å publisere hvilken versjon av fil i vitenarkivet og i tillegg angi hvilken lisens som skal tilknyttes filen. Med ny løsning vil dette skje en gang for hver publikasjon, uavhengig av sampublisering eller ikke, og derved medføre mindre tidsbruk totalt sett.
Samtidig er den tekniske løsningen for import av publikasjonsdata, også kjent som sentralimporten, betydelig forbedret i forhold til tidligere. Dette gir allerede en merkbar forbedring av hastigheten på import og en bedret kvalitet på de data som i dag kommer inn i Cristin. Denne funksjonaliteten vil videreføres i Cris/NVA-løsningen. I tillegg har vi startet arbeidet med å introdusere flere kilder for import av publikasjonsdata, for på denne måten å gi en bedre dekning og økt antall importerte publikasjoner til Cris/NVA sammenlignet med tidligere.
Mange har stilt spørsmål ved om den nye løsningen og prosjektert er for komplekst. Det er forståelig at spørsmålet stilles. En av fordelene ved å benytte moderne skyteknologi og de muligheter som ligger i dette, er at løsningen enkelt blir en åpen modulær løsning, som kan bygges videre ut og endres. Det tekniske fundamentet i den nye løsningen er utviklet slik at det også ligger til rette for å utvikle annen type forsknings- eller utdanningsrelatert funksjonalitet på samme fundament. Informasjonen som ligger i løsningen vil bli tilgjengelig via APIer på samme måte som fra dagens Cristin og dagens Cristin-API vil fortsatt fungere, men primært for å hente data fra Cris/NVA-løsningen.
Noen av bekymringene og kritikken av NVA i de to artiklene Khrono nylig har publisert (Ber departementet vurdere full stopp i nytt forskningssystem, og Dom over nytt vitenarkiv: Leverer ikke det sektoren trenger), delvis basert på brev fra UHR og FFA til Kunnskapsdepartementet, dreier seg om at løsningen blir for komplisert. Situasjonen er snarere motsatt. Sammenlignet med dagens løsninger blir det en enklere og mer helhetlig løsning for forskningsinformasjon og vitenarkiv. Norge har i motsetning til de fleste andre land allerede et felles system for forskningsinformasjon (Cristin). De fleste andre land har institusjonelle systemer, der det viser seg utfordrende å generere gode nasjonale oversikter. I tillegg har vi i Norge separate institusjonelle vitenarkiver, på samme måte som de fleste andre land, som i stor grad mottar metadata og dels tilhørende dokumentfiler via Cristin. De siste 6-8 årene er det i økende grad flere og flere internasjonalt som tar til orde for å integrere disse funksjonalitetene i en felles løsning. Ved å ha Cristin som et felles nasjonalt forskningsinformasjonssystem er Norge allerede bedre rustet til å ha en felles oversikt. Men vi har fortsatt en enveis, en-til-mange relasjon mellom Cristin og vitenarkivene.
Når vi nå utvikler den felles Cris/NVA-løsningen, og i disse dager inviterer mellom 20 og 30 små og mellomstore institusjoner til å ta den nye løsningen i bruk fra 1. april, vil Norge være tidlig ute med å ha én helhetlig oversikt over all norsk forskning med tilhørende publikasjoner og andre forskningsresultater ett sted.
Det å gå fra over 75 separate systemer (vitenarkiv og Cristin) til en skybasert løsning vil gi gevinster i drift, vedlikehold og brukerstøtte på tjenesten. Dette vil komme brukerne til gode. Samtidig vil den valgte utviklingsplattformen og driftsløsningen i sky, gi betydelig bedre sikkerhet og robusthet enn dagens løsninger.
Et felles nasjonalt vitenarkiv med tilhørende Cris-funksjonalitet vil også gi alle forskningsinstitusjoner tilgang til et vitenarkiv, også de som ikke har dette i dag. Dette betyr at de som har stått på venteliste for å kunne ta Cristin i bruk, nå vil få både tilgang til vitenarkiv og i tillegg gjennom Cris-funksjonaliteten bli en del av den helhetlige oversikten over norsk forskning.
Underveis i arbeidet har brukerne vært representert i brukergrupper/referansegrupper hvor de har deltatt i grunnlaget for hva som skal utvikles. Her har det også kommet uttalte ønsker og behov for endring av, og etablering av en ny og mer arbeidsbesparende arbeidsflyt i NVA sammenlignet med dagens løsninger.
Vi forstår at institusjonene og brukerne av dagens Cristin og vitenarkiv er usikker på utviklingen av NVA og stiller spørsmål både til funksjonalitet og fremdrift. Vi erkjenner at informasjon fra vår side, f.eks. om hvordan innspill fra sektoren har påvirket utviklingen av NVA, har vært mangelfull. Et eksempel på dette er hvordan forslaget om en forenklet NVI-rapportering, med særlig vekt på forenklede godkjenningsprosedyrer, og en forenkling av dagens (Cristin) funksjonalitet på området, ble forkastet etter innspill fra sektoren. Høringsinnspillene fra de 34 som ga tilbakemelding varierte relativt mye: Fra de som ga full oppslutning om forslaget til forenklet prosess, til de som ønsket å beholde dagens omfattende funksjonalitet (i Cristin) også i den nye Cris/NVA-løsningen.
Etter en diskusjon i prosjektets styringsgruppe ble det besluttet å utvikle funksjonalitet i Cris/NVA tilsvarende dagens funksjonalitet i Cristin, fremfor en forenklet funksjonalitet. Artikkelen i Khrono (Dom over nytt vitenarkiv: Leverer ikke det sektoren trenger) fremstiller det som at prosjektet ikke har vært lydhøre for de innspillene som er kommet. Vi var lydhøre i den forstand at de største institusjonene, med flest publikasjoner og flest forskere/ansatte, og dermed også mest tidsbruk til kontroll og godkjenning av de publikasjoner som er gjenstand for NVI-rapporteringen, fikk gehør for å videreføre dagens funksjonalitet.
De største institusjonene ønsket å avvente større endringer over mot mer brukervennlige prosesser inntil vi får bekreftet at importerte publikasjonsdata har en bedre kvalitet enn tidligere. De institusjonene som ikke ble hørt på sine innspill, var de som var enige i forslaget, og ønsket en mer effektiv og rasjonell arbeidsflyt allerede ved lansering av den nye Cris/NVA-løsningen. Når saksbehandlingen av disse høringsinnspillene blir oppfattet så forskjellig som uttalelser og innhold i Khronos artikkel den 24. februar indikerer, er det helt klart at vi ikke har evnet å kommunisere tydelig nok til alle interessenter.
Opprinnelig plan fra utredningen var å levere første versjon med vitenarkiv-funksjonalitet i 2021, og Cristin-funksjonalitet integrert innen sommeren 2022. Når vi nå er i februar 2022 så ser det ut til at vi blir forsinket i forhold til opprinnelig plan om å lansere sommeren 2022. Det er mangel på IT-utviklere og ikke prosjektets kompleksitet, som i hovedsak gir lavere fremdrift enn ønsket. I tillegg har vi måttet endre enkelte planforutsetninger som lå til grunn da prosjektet startet, og det har kommet fram flere ønsker om funksjonalitet underveis i prosessen. Dette er en naturlig og dels forventet konsekvens av å benytte en smidig og iterativ utviklingsprosess, der brukerne har løpende innflytelse på det som utvikles.
Når både UHR og FFA ber om at prosjektet stoppes er det uheldig, og slik vi leser brevet basert på flere misforståelser og feilinformasjon. Sikt er i dialog med UHR/FFA for å oppklare disse samt for å etablere et felles kunnskapsgrunnlag knyttet til den videre utviklingen av Nasjonalt vitenarkiv.
Når det er sagt har vi stor forståelse for at FFA og UHR er bekymret for forsinkelsene i prosjektet som skal levere virksomhetskritisk infrastruktur for sektorene. I FFA/UHR sitt brev sier de: Det er nå usikkerhet knyttet til om og i så fall hvordan vitenskapelig rapportering for 2022 vil kunne skje.
Når det tydeligvis er skapt usikkerhet ved hvorvidt det vil være mulig å gjennomføre den årlige rapporteringen av publikasjoner til Norsk vitenskapsindeks (NVI) for 2022 er dette svært beklagelig og stikk i strid med Sikt sin intensjon med å sette oppmerksomhet på dette punktet. Når rapporteringen våren 2023 også må foregå med dagens løsning har vi tydeliggjort de 3 alternativene vi mener er realistiske å forholde seg til. Disse er i prioritert rekkefølge:
- Samme som nåværende, med fortsatt bruk av den eldste Cristin-serveren – (Teknisk- og sikkerhetsrisiko).
- Bearbeide data direkte fra Cristins database med egnede dataanalyseverktøy (Uprøvd, usikkert presisjonsnivå, uavklarte kontrollmuligheter for institusjonene) – utredes i april 2022.
- Gjenbruke de tallene som ble rapportert for 2021 (dette anses kun som en nødløsning).
Det vil alltid være en risiko for at tekniske løsninger ikke fungerer etter hensikten. For gjennomføring av NVI-rapporteringen har det derfor alltid vært en reserveløsning at en kan gjenbruke tidligere års tall dersom den årlige rapporteringen ikke kan gjennomføres som planlagt. Dette har aldri skjedd. For den kommende rapporteringsperioden ultimo 2022 og primo 2023, der en skal rapportere NVI-tall for 2022, har vi valgt å gjøre brukerinstitusjonene oppmerksom på de risikoer som foreligger, fordi vi tar situasjonen på alvor. Vi forstår at gjenbruk av tidligere års tall er lite ønskelig og har derfor besluttet å utrede en alternativ måte for tilrettelegging av tall for NVI-rapporteringen. Vi har også vært i dialog med IT-avdelingen ved UiO som forsikrer oss om at de vil gjøre alt for at NVI rapportering for 2022 kan gjennomføres med fortsatt bruk av den eldste Cristin-serveren. Alternativ 2 utredes som en back-up-løsning.
Sikt jobber aktivt med å adressere flere av problemstillingene som omtales i sakene i Khrono, blant annet bedre kommunikasjon med og involvering av institusjonene som skal ta tjenesten i bruk. Vil vil også i nært samarbeid med brukerinstitusjonene og deres representanter, gjøre en ny gjennomgang av den funksjonaliteten som er realisert, og den som er planlagt frem mot full implementering. Hensikten er å dobbeltsjekke og sikre at vi leverer i tråd med bestillingen fra departementet og institusjonene, herunder brukernes behov.
Kunnskapsdepartementet har tildelt totalt 30 millioner for årene 2019, 2020 og 2021 til gjennomføring av NVA-prosjektet. Tildelingen var basert på NVA-utredningens anslag på behov for midler som ble gjennomført i 2018. Bevilgningen er fullt ut benyttet ved utløpet av 2021. En første versjon av NVA er i produksjon og benyttes i dag av 2 virksomheter. Det er behov for noe utvidelse av funksjonalitet før institusjonene med egne etablerte vitenarkiv kan ta det i bruk. Innen 1. april vil mellom 20 og 30 av de små institusjonene få tilbud om å ta NVA i bruk. Gjenstående utvikling frem til samtlige institusjoner tar den nye løsningen i bruk blir finansiert av Sikt sin ordinære bevilgningsramme.
Den nye Cris/NVA-løsningen blir en løsning som vil være i kontinuerlig utvikling gjennom hele sin levetid. Dette betyr at Sikt, basert på løpende tilbakemeldinger og innspill fra brukerne, både vil innføre ny og endre på eksisterende funksjonalitet til brukernes beste gjennom hele tjenestens levetid.