Lataa Arkistot, yhteiskunnan toimiva muisti -oppikirja - Arkistolaitos
Lataa Arkistot, yhteiskunnan toimiva muisti -oppikirja - Arkistolaitos
Lataa Arkistot, yhteiskunnan toimiva muisti -oppikirja - Arkistolaitos
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
ARKISTOT YHTEISKUNNAN TOIMIVA MUISTI<br />
Kuvatiedostojen formaatit<br />
Pitkään säilytettävien kuvatiedostojen formaateiksi suositellaan tällä hetkellä JPEG- (Joint Photographic<br />
Experts Group) ja TIFF- (Tagged Image File Format ver. 6, pakkaamaton) formaatteja.<br />
Parastaikaa (2006) kehitellään PDF-formaatin arkistoversiota (PDF-A), josta tullee ISO-standardi<br />
vielä kuluvan vuoden aikana. On mahdollista, että PDF-A -formaatista aikanaan tulee vallitseva<br />
kuvatiedostojen pitkäaikaissäilytyksen tallennusformaatti.<br />
Tietokantojen pitkäaikaissäilytys<br />
Edellä sanottu koskee ensisijaisesti dokumenttimuotoisen tiedon pitkäaikaissäilytystä. Tietokantojen<br />
ja erityisesti relaatiotietokantojen kohdalla säilytyksen ongelmat kasvavat edelleen. Tietokantojen<br />
standardointi on toistaiseksi edennyt vain hitaasti. Yleisenä menettelynä on tallentaa tietokanta<br />
pitkäaikaissäilytystä varten ASCII-merkistön (engl. character set) mukaisessa muodossa kaksiulotteiseksi<br />
peräkkäistiedostoksi. 48 Relaatiotietokantojen jokainen taulu tallennetaan omaksi tiedostokseen.<br />
Tällaisen “raakadataksi” muutetun ja ohjelmistoympäristöstään irrotetun tietokannan<br />
käytettävyys laskee jyrkästi. Tietokannan alkuperäinen rakenne, sisältö ja konteksti tulee dokumentoida<br />
riittävän tarkasti, niin että sen todistusvoimaisuus säilyy ja että järjestelmä voidaan tarvittaessa<br />
rakentaa uudelleen käytettävään muotoon.<br />
Edellä mainittua XML-merkintäkieltä on testattu relaatiotietokantojen pitkäaikaissäilytyksen menetelmänä,<br />
ja tulokset ovat lupaavia. Kysymys on ennen muuta – ainakin toistaiseksi – migraation<br />
eräästä sovelluksesta. Tosin jo nyt on olemassa tietokantoja, joissa tiedot ovat alusta lähtien XMLformaatin<br />
mukaisessa muodossa. 49<br />
XML:n etuna perinteiseen pitkäaikaissäilytyksen ratkaisuun eli tietojen ajamiseen ASCIImerkistön<br />
mukaiseen muotoon verrattuna on se, että XML tarjoaa standardoidun työkalun tiedostojen<br />
rakenteen määrittelyyn ja dokumentointiin. ASCII-ratkaisua käytettäessä tämä edellyttää<br />
erillistä metadataa.<br />
XML-merkintäkielelle siirrettyjen tietojen käyttöön saamisessa on kolme vaihtoehtoa:<br />
1) tiedot siirretään migraation avulla uuteen operatiiviseen tietokantaympäristöön,<br />
2) käytetään standardoituja XML-kyselytyökaluja,<br />
3) räätälöidään kyselyjä varten oma ohjelma.<br />
Lupaavuudestaan huolimatta XML-kielen käyttöön liittyy myös ongelmia, erityisesti sen laajuus ja<br />
monimutkaisuus.<br />
Sekä tietokantojen että muiden tietojärjestelmien ja niissä olevien tietojen säilymisen ja käytettävyyden<br />
kannalta asianmukainen dokumentaatio on oleellisen tärkeää. Dokumentaation laajuus ja<br />
syvyys riippuu järjestelmän ja tietojen käyttötarkoituksesta, merkityksestä ja säilytysajasta. Dokumentaation<br />
merkitys korostuu aikaulottuvuuden kasvaessa. Jos dokumentaatio on puutteellista tai<br />
sitä ei ole, tietojen myöhempi käyttö saattaa olla mahdotonta.<br />
Pitkään säilytettävien tietojärjestelmien ja tietojen dokumentaatio voidaan jakaa kolmeen osaan:<br />
kontekstuaaliseen, käsitteelliseen (loogiseen) ja tekniseen. Kontekstuaalisen dokumentaation<br />
48 UNICODE-merkistö on suuressa määrin syrjäyttämässä ASCII-merkistöä. Siirrettäessä tietokantoja arkistolaitokseen<br />
ratkaistaan tapauskohtaisesti kumpaa merkistöä käytetään.<br />
49 Mm. sähköisten potilasasiakirjojen pitkäaikaissäilytykseen kaavailtu CDA (Clinical Document Architecture)<br />
-formaatti.<br />
132