Framtiden för svensk forskningsinfrastruktur – utkast - Vetenskapsrådet

Framtiden för svensk forskningsinfrastruktur – utkast - Vetenskapsrådet Framtiden för svensk forskningsinfrastruktur – utkast - Vetenskapsrådet

01.09.2013 Views

utkast till långsiktig plan för infrastruktur, 9 maj 2006 • Under de tre år som SNIC existerat har Sveriges resurser inom storskaliga beräkningar kunnat koordineras och organiseras på ett bättre och effektivare sätt. • Vikten av beräkningsbaserade metoder och tekniker ökar snabbt inom de flesta vetenskapsområden och blir alltmer en nyckelteknologi för spetsforskning likväl som en nödvändighet för basforskning. • Många forskare i Sverige är idag helt beroende av SNICs resurser för sin forskargärning och förväntar sig att SNIC även i framtiden kommer att tillhandahålla beräkningsresurser som följer teknologiutvecklingen. • Resurser tilldelas efter ansökan som utvärderas av Swedish National Allocation Committee (SNAC), som är organiserad under SNIC. • Användarstudier har visat att forskarna prioriterar snabba processorer och hög tillgänglighet högst, följt av system med mycket minne och storskaliga system. • Flertalet av SNICs användare vill se beräkningsresurser som en service bestående av tillgång till applikationer (som kör på beräkningsresursen) snarare än bara tillgång till hårdvaran. • Grid-teknologin utvecklas allt mer och växer sig starkare internationellt. • Det finns långt gångna planer på etablering av gemensamma europeiska stordatorresurser. Dessa centra planeras bli tillgängliga även för andra länder än värdnationerna och de länderna får då bidra ekonomiskt. • I takt med att allt fler grupper ansöker om resurser och dessutom vissa gruppers resursbehov blivit mycket stort kommer det att krävas betydligt större investeringar inom beräkningsresurser. Framtidsplaner och rekommendationer • Samarbetet mellan SNIC och DISC bör uppmuntras. Det finns potential till rationaliseringsvinster, tillgänglighetsvinster och kvalitetsvinster för forskarsverige med ett sådant samarbete. • En omfattande utvärdering av SNIC bör ske om 2-3 år. • I takt med att allt fler forskningsområden blir beroende av tillgången till beräkningssystem med en hög kapacitet så bör SNICs budget ökas i motsvarande grad. • Behovet av att delta i samarbete kring en gemensam europeisk stordatorresurs bör utredas. Finansiering För högpresterande datorer finns 46 Mkr upptagna i KFIs budget både 2006 och 2007. I Vetenskapsrådets årsredovisning anges att SNIC lämnat s k driftsbidrag till datacentra med 46 Mkr år 2005. I denna summa ingår en stor andel investeringar. Högpresterande datorer som organiseras av SNIC finansieras inte bara av Vetenskapsrådet. I samråd med SNIC har Wallenbergstiftelsen ofta finansierat utrustning - enbart för Swegrid med 23 Mkr. Bidrag av denna typ kan alltså enstaka år tillsammans med medlen från VR/KFI ge ett tillskott till området högpresterande datorer i storleksordningen 70 Mkr, varav huvuddelen till investeringar (i hård- eller mjukvara). SNIC bedömer själv sitt medelsbehov (inklusive bidrag från andra källor än Vetenskapsrådet) till närmare 90 Mkr per år under den kommande 5-årsperioden. Sida 56 av 88

utkast till långsiktig plan för infrastruktur, 9 maj 2006 Nämnas kan att man för närvarande också utreder hur det behov av medel för lagringsresurser för LHC-projektet (uppskattat till 35 Mkr under 5 år) skall finansieras. Digitaliserade forskningsdatabaser Begreppet forskningsdatabas omfattar data från (storskaliga) observationsstudier och experiment, utdrag och sammanställningar från register som gjorts för forskningsändamål, forskningsbiobanker, samlingar av data avseende språk, kultur, klimat, natur, genom, miljö m.m. för forskningsändamål. Administrativa register hos myndigheter och institutioner, personal- eller marknadsdata hos företag m.m. faller utanför definitionen, utom när forskare samlar och ordnar sådana data för forskningsändamål. För att falla under e-science måste data digitaliseras. För att kvalificera som infrastruktur bör en forskningsdatabas vara brett nationellt förankrad och/eller internationellt konkurrenskraftig samt uppfylla krav på tillgänglighet, standarder, kvalitetskontroll, dokumentation och säkerhet. Vid initiering av ny datainsamling och i uppbyggnadsskedet av en ny databas kan denna till sitt omfång och tillgänglighet vara mera begränsad än vad som krävs av en fullskalig forskningsinfrastruktur. Dessa databaser jämställs då med ’dyrbar utrustning’. Vi redogör nedan för olika typer av digitala forskningsdatabaser som infrastruktur inom ett flertal forskningsområden. De databaser som diskuteras utgör inte en heltäckande inventering utan skall ses som typexempel. I och med tillsättandet av DISC, Database InfraStructure Committee, har KFI initialt lagt en tyngdpunkt på mikrodata inom samhällsvetenskap och medicin, dvs individdata som länkas med personnummer och därmed medför särskilda integritetshänsyn. Med tanke på den unika konkurrensfördel som fem av de europeiska länderna har (Norden) när det gäller registerepidemiologisk forskning skulle samordning av infrastruktur inom Norden och Europa ge stora forskningsmässiga vinster. Flera av de infrastrukturprojekt som är upptagna på European Strategy Forum on Research Infrastructures (ESFRI) Roadmap avser digitala databaser. Utvecklingen är tydlig inom humaniora, samhällsvetenskap och medicin men behovet av standarder och jämförbara databasstrukturer inom t.ex. biovetenskaperna, rymdforskningen och klimatforskningen framhålls också inom ESFRI. Speciellt står European Resources Observatory for Humanities and Social Sciences (EROHS), Biobanker, Bioinformatik samt Biodiversitet som prioriterade infrastrukturområden i ESFRI Roadmap. Dessa beskrivs nedan som centrala också för KFI e- Science strategiska plan. Database InfraStructure Committee, DISC Som ett resultat av VR:s utredningar ’Om forskningens infrastrukturer inom humaniora och samhällsvetenskap i Sverige’ samt ’Världsledande forskning med hjälp av svenska register’, har KFI under våren 2006 inrättat Database InfraStructure Committee (DISC). DISCs uppdrag omfattar i första hand samhällvetenskap och medicin med fokus på individbaserade s.k. mikrodata. Under DISC samordnas bl.a. infrastrukturfrågor genom anslag för insamlande av stora (t.ex. longitudinella) databaser som tidigare hanterats av VR-kommittén för longitudinella databaser, den verksamhet som sker vid Svensk Nationell Datatjänst (SND, tidigare Svensk samhällsvetenskaplig datatjänst) samt forskares användning av svenska administrativa register Sida 57 av 88

<strong>utkast</strong> till långsiktig plan <strong>för</strong> infrastruktur, 9 maj 2006<br />

Nämnas kan att man <strong>för</strong> närvarande också utreder hur det behov av medel <strong>för</strong> lagringsresurser<br />

<strong>för</strong> LHC-projektet (uppskattat till 35 Mkr under 5 år) skall finansieras.<br />

Digitaliserade forskningsdatabaser<br />

Begreppet forskningsdatabas omfattar data från (storskaliga) observationsstudier och<br />

experiment, utdrag och sammanställningar från register som gjorts <strong>för</strong> forskningsändamål,<br />

forskningsbiobanker, samlingar av data avseende språk, kultur, klimat, natur, genom, miljö<br />

m.m. <strong>för</strong> forskningsändamål. Administrativa register hos myndigheter och institutioner,<br />

personal- eller marknadsdata hos <strong>för</strong>etag m.m. faller utan<strong>för</strong> definitionen, utom när forskare<br />

samlar och ordnar sådana data <strong>för</strong> forskningsändamål. För att falla under e-science måste data<br />

digitaliseras. För att kvalificera som infrastruktur bör en forskningsdatabas vara brett<br />

nationellt <strong>för</strong>ankrad och/eller internationellt konkurrenskraftig samt uppfylla krav på<br />

tillgänglighet, standarder, kvalitetskontroll, dokumentation och säkerhet.<br />

Vid initiering av ny datainsamling och i uppbyggnadsskedet av en ny databas kan denna till<br />

sitt omfång och tillgänglighet vara mera begränsad än vad som krävs av en fullskalig<br />

<strong>forskningsinfrastruktur</strong>. Dessa databaser jämställs då med ’dyrbar utrustning’.<br />

Vi redogör nedan <strong>för</strong> olika typer av digitala forskningsdatabaser som infrastruktur inom ett<br />

flertal forskningsområden. De databaser som diskuteras utgör inte en heltäckande inventering<br />

utan skall ses som typexempel. I och med tillsättandet av DISC, Database InfraStructure<br />

Committee, har KFI initialt lagt en tyngdpunkt på mikrodata inom samhällsvetenskap och<br />

medicin, dvs individdata som länkas med personnummer och därmed med<strong>för</strong> särskilda<br />

integritetshänsyn. Med tanke på den unika konkurrens<strong>för</strong>del som fem av de europeiska<br />

länderna har (Norden) när det gäller registerepidemiologisk forskning skulle samordning av<br />

infrastruktur inom Norden och Europa ge stora forskningsmässiga vinster.<br />

Flera av de infrastrukturprojekt som är upptagna på European Strategy Forum on Research<br />

Infrastructures (ESFRI) Roadmap avser digitala databaser. Utvecklingen är tydlig inom<br />

humaniora, samhällsvetenskap och medicin men behovet av standarder och jäm<strong>för</strong>bara<br />

databasstrukturer inom t.ex. biovetenskaperna, rymdforskningen och klimatforskningen<br />

framhålls också inom ESFRI. Speciellt står European Resources Observatory for Humanities<br />

and Social Sciences (EROHS), Biobanker, Bioinformatik samt Biodiversitet som prioriterade<br />

infrastrukturområden i ESFRI Roadmap. Dessa beskrivs nedan som centrala också <strong>för</strong> KFI e-<br />

Science strategiska plan.<br />

Database InfraStructure Committee, DISC<br />

Som ett resultat av VR:s utredningar ’Om forskningens infrastrukturer inom humaniora och<br />

samhällsvetenskap i Sverige’ samt ’Världsledande forskning med hjälp av <strong>svensk</strong>a register’,<br />

har KFI under våren 2006 inrättat Database InfraStructure Committee (DISC). DISCs<br />

uppdrag omfattar i <strong>för</strong>sta hand samhällvetenskap och medicin med fokus på individbaserade<br />

s.k. mikrodata.<br />

Under DISC samordnas bl.a. infrastrukturfrågor genom anslag <strong>för</strong> insamlande av stora (t.ex.<br />

longitudinella) databaser som tidigare hanterats av VR-kommittén <strong>för</strong> longitudinella<br />

databaser, den verksamhet som sker vid Svensk Nationell Datatjänst (SND, tidigare Svensk<br />

samhällsvetenskaplig datatjänst) samt forskares användning av <strong>svensk</strong>a administrativa register<br />

Sida 57 av 88

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!