08.02.2015 Views

Siirtotiedoston koulutusmateriaali

Siirtotiedoston koulutusmateriaali

Siirtotiedoston koulutusmateriaali

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Siirtotiedoston</strong><br />

tekninen koulutus<br />

Mikko Eräkaski<br />

Markus Merenmies<br />

24.10.2012


Käsiteltäviä aihealueita<br />

• Siirron yleiskuva ja vastaanoton periaatteet<br />

• Sähke2-metatietomalli ja -skeema<br />

• Pitkäaikaissäilytettävien tiedostomuotojen käsittely ja<br />

laadunvarmistus<br />

• Varmenteiden käyttö (varmiste.sig)<br />

• Verkkoyhteydet ja tiedonsiirto<br />

• Siirtojen onnistumisen seuranta ja siirron paluukanavan<br />

hyödyntäminen<br />

• Aineiston VIRPA-käyttö: yleiskuvaus ja tekninen käyttötapa<br />

• Arkistolaitoksen tarjoamat siirtämisen tukipalvelut sekä ohjeistus


Siirron yleiskuva<br />

ja vastaanoton<br />

periaatteet


Siirron periaatteet<br />

1) ”Luottamuksen ehyt ketju”<br />

2) Siirrettävän aineiston poiminta järjestelmästä –<br />

mahdollisuus määrittää kriteerit<br />

3) Itse siirto ei edellytä merkittävää valmistelua<br />

4) Automaattinen tiedonsiirto järjestelmien välillä<br />

5) Automaattinen vastaanottoprosessi VAPAssa


• Asiakirjat<br />

– Tiedostot<br />

• SAHKE-metatiedot<br />

– sahke1.xml<br />

• Allekirjoitus<br />

– Varmiste.sig<br />

Mitä siirretään


Siirrettävän aineiston<br />

kriteerejä<br />

VÄHIMMÄISVAATIMUKSET:<br />

• Käsittelyprosessi / asia tulee olla päättynyt<br />

• Tehtävään liittyvät pysyvästi säilytettävät asiakirjat on merkitty<br />

”valmis”<br />

• Tiedostojen tulee olla hyväksyttyjä formaatteja<br />

• Pakolliset SÄHKE2-metatiedot<br />

• Aineistoa ei ole aikaisemmin siirretty<br />

• VAPA ”muistaa” aineiston yksilöivät tunnisteet<br />

MITÄ VOIDAAN SIIRTÄÄ:<br />

• Natiivimuodot tiedostoista<br />

• Muita metatietoja (custom –metadata)


Siirron toimintaperiaate<br />

• Tietojärjestelmien välinen tiedonsiirto<br />

• VAPA-palvelu mahdollistaa siirtojen automatisoinnin<br />

järjestelmien välillä<br />

Siirtävä tietojärjestelmä<br />

SIIRTO<br />

Vastaanotto<br />

Kuittaus siirrosta<br />

Paluuraportti<br />

• Siirtokokonaisuuden<br />

koko on vapaasti<br />

määriteltävissä<br />

• Pienin mahdollinen<br />

siirtokokonaisuus on yksi<br />

(1) asia<br />

VAPA-palvelu


Miten aineisto järjestäytyy<br />

VAPAssa<br />

VAPA<br />

TEHTÄVÄLUOKITUS<br />

PÄÄTEHTÄVÄ<br />

TEHTÄVÄ<br />

ALATEHTÄVÄ<br />

Asia 1<br />

Asia 2<br />

Asia 3<br />

ALATEHTÄVÄ<br />

Asia 1<br />

Asia 2<br />

Asia 3<br />

Asia 4<br />

PÄÄTEHTÄVÄ<br />

SIIRROT<br />

SIIRTO 1.<br />

ALATEHTÄVÄ<br />

Asia 1<br />

Asia 2<br />

ALATEHTÄVÄ<br />

Asia 1<br />

Asia 2<br />

SIIRTO 2.<br />

ALATEHTÄVÄ<br />

Asia 13<br />

ALATEHTÄVÄ<br />

Asia 3<br />

Asia 4<br />

Aineisto ei järjesty<br />

VAPAssa<br />

siirtokokonaisuuden<br />

mukaan, vaan<br />

tehtäväluokan mukaan<br />

Tehtäväluokalle voidaan<br />

siirtää aineistoa<br />

vaiheittain.<br />

Yksi asia on siirrettävä<br />

aina kerrallaan


Vastaanotto tarkistaa saapuvan<br />

aineiston<br />

• Tavoitteena automatisoitu ja luotettava siirtoprosessi.<br />

• VAPA suorittaa siirrettävälle aineistolle automaattisia teknisiä<br />

tarkistuksia<br />

– Virustarkistus<br />

– Allekirjoitus (varmiste.sig)<br />

– Pakolliset SÄHKE2-metatiedot<br />

– Tiedostojen ja kokonaisuuden eheys<br />

• Jos vastaanoton tarkistuksissa tapahtuu virhe, hylätään koko<br />

paketti


Siirron jälkeen<br />

• Siirtävälle taholle VAPA-raportointiliittymä<br />

– siirtojen seuranta<br />

– virheraportit<br />

– aineiston kertymäraportit<br />

• Siirron jälkeen:<br />

– alkuperäinen aineisto VAPAssa,<br />

– siirtävän organisaation järjestelmässä olevat asiakirjatiedot<br />

katsotaan kopioiksi<br />

– siirrettyjen asiakirjatietojen tilatiedoksi tulee<br />

tietojärjestelmässä ”siirretty”


Sähke2-<br />

metatietomalli


Metatietojen siirto<br />

• Sahke.xml -tietotiedostojen (=SÄHKE-metatietojen)<br />

yhteenlaskettu koko ei saa ylittää 100MB<br />

• XML-skeeman mukainen rakenne<br />

• Arvojoukot ja elementtien nimet sekä suhteet ja<br />

toisteellisuuden<br />

• Tukee organisaation omaa laadunvarmistusta<br />

http://www.arkisto.fi/skeemat/Sahke2_2011_12.xsd


SAHKE1.XML<br />

• ”Digitaalinen rahtikirja”<br />

• TransferInformation<br />

• Sopimustiedot<br />

• Todentaa osaltaan siirtävän osapuolen<br />

• ContactInformation<br />

• Siirtoon liittyviä yhteystietoja<br />

• CaseFile<br />

• Toistuva elementti, jossa alirakenteita<br />

• Siirrettävän aineiston metatiedot


Transfer information<br />

Elementti<br />

NativeID<br />

Title<br />

TransferContractId<br />

MetadataSchema<br />

Kuvaus ja käyttötarve<br />

Yksilöi siirtokokonaisuuden ja erottaa sen muista saman<br />

organisaation lähettämistä siirtokokonaisuuksista.<br />

Identifiointitunnuksen muodostamiseksi voidaan käyttää<br />

OID-tunnusta.(SÄHKE 6.1.1)<br />

Yksilöidään siirtävä järjestelmä. Tätä tunnusta käytetään<br />

siirtokokonaisuuden autenttisuuden todentamiseksi ja<br />

sen arvon tulee olla sama kuin mikä on ilmoitettu<br />

palvelun käyttöönottolomakkeessa.<br />

Tähän tallennetaan arkistolaitoksen kanssa laaditun<br />

siirto- ja säilytyssopimuksen numero. Sopimusnumero on<br />

aina tietojärjestelmäkohtainen ja sitä käytetään<br />

vastaanoton yhteydessä yhtenä tarkistettavana tekijänä.<br />

Informatiivinen, ei käytetä tarkistuksiin.


ContactInformation<br />

Elementti<br />

Organisation.Name<br />

ContactPerson.Name<br />

ContactPerson.Address<br />

ContactPerson.PhoneNumber<br />

ContactPerson.Email<br />

Kuvaus ja käyttötarve<br />

Kontaktitietoihin (SÄHKE 6.2) sisällytetään<br />

siirrosta vastaavan teknisen yhteyshenkilön<br />

tiedot. Arkistolaitoksen edustaja voi<br />

tarvittaessa ottaa yhteyttä tähän henkilöön, jos<br />

siirrossa on ongelmia.


CaseFile, eli itse aineisto<br />

• CaseFile: Käsittelyprosessi<br />

• Action: Prosessiin liittyvä toimenpide<br />

• Record: Asiakirja<br />

• Document: Asiakirjaan liittyvä tiedosto


CaseFile<br />

Elementti<br />

Created<br />

NativeId<br />

Language<br />

Restriction<br />

Title<br />

RetentionPeriod<br />

RetentionReason<br />

Status<br />

ClassificationScheme.<br />

MainFunction<br />

Function<br />

agent<br />

Action<br />

Kuvaus ja käyttötarve<br />

Avattu/laadittu<br />

Yksilöivä tunnus.<br />

Kieli (2.4) 2 merkkiä, SFS-ISO 639 -1 –standardi<br />

Rajoitus (myös julkinen)<br />

Nimeke<br />

-1 on pysyvä säilytys<br />

Määräys tai laki, johon pysyvä säilytys perustuu<br />

Tila (valmis)<br />

Tehtäväluokituksen päätehtävä<br />

Tehtävä<br />

Toimija<br />

Toimenpiteen metatiedot (oma kokonaisuus)


CaseFile - esimerkki<br />

Elementti<br />

esimerkki<br />

Created 2012-09-21<br />

NativeId<br />

Language<br />

Restriction<br />

Title<br />

urn:oid:1.2.246.10.2458859.07.01.05.02.2008.1<br />

Fi<br />

RetentionPeriod -1<br />

RetentionReason<br />

Status<br />

PublicityClass = julkinen<br />

PersonalData = sisältää henkilötietoja<br />

Henkilöstötilinpäätös<br />

AL/12345/07.01.01.03.01/2008<br />

Ratkaistu<br />

Function 07.01.05.02<br />

agent<br />

Role = Kirjaaja<br />

Name = Kalle


Action<br />

Elementti<br />

Created<br />

Title<br />

Agent.role<br />

Agent.name<br />

Type<br />

Record<br />

Kuvaus ja käyttötarve<br />

Laadittu. Pvm ei saa olla aiempi kuin CaseFile:n<br />

vastaava elementti.<br />

Nimeke<br />

Toimijan rooli (esim. kirjaaja)<br />

Toimijan nimi<br />

Toimenpiteen tyyppi (esim. valmistelu)<br />

Toimenpiteeseen liittyvät asiakirjat (ei pakollinen)


Record<br />

Elementti<br />

Kuvaus ja käyttötarve<br />

Created<br />

Avattu/laadittu<br />

NativeId<br />

Yksilöivä tunnus.<br />

Language<br />

Kieli (2.4) 2 merkkiä, SFS-ISO 639 -1 –standardi<br />

Restriction<br />

Rajoitus (myös julkinen)<br />

Title<br />

Nimeke<br />

RetentionPeriod -1 on pysyvä säilytys<br />

RetentionReason Määräys tai laki, johon pysyvä säilytys perustuu<br />

Status<br />

Tila (valmis)<br />

Function<br />

Tehtävä<br />

Type<br />

Asiakirjan tyyppi, esim. lausunto, päätös, hakemus<br />

Authenticity Asiakirjan alkuperäisyys ja eheys todettu (4.2)<br />

Document<br />

Tiedoston metatiedot (oma kokonaisuus)


Record - esimerkki<br />

Elementti<br />

Status<br />

Esimerkki<br />

Valmis<br />

Function 07.01.05.02<br />

Type<br />

Authenticity<br />

Päätös<br />

Checker = Kirjaamo<br />

Date = 2012-09-21<br />

Description = Todettu allekirjoituksesta


Document<br />

Elementti<br />

NativeId<br />

UseType<br />

File.name<br />

File.Path<br />

Format.name<br />

Format.version<br />

HashAlgoritm<br />

HashValue<br />

Kuvaus ja käyttötarve<br />

Yksilöivä tunnus.<br />

Käyttötarkoitus: Arkisto, Natiivi, Julkaisu<br />

Tiedoston nimi<br />

Tiedostopolku siirtopaketissa ilmaistaan suhteessa<br />

XML-siirtotiedoston sijaintiin.<br />

Informativinen<br />

Informativinen<br />

Eheystunnisteen algoritmi: md5, sha1, sha256<br />

Eheystunnisteen arvo


Document – esimerkki


Yksilöinti - NativeID<br />

• Prosessin, asiakirjan ja tiedoston yksilöinti<br />

• Yksiselitteinen ja ”globaalisti tunnistettavissa”<br />

• Käytännössä siirtäjäkohtaisesti uniikki yksilöinti<br />

• Yksilöinti hierarkian eri tasoille tarkentuen<br />

• Suositellaan OID:n käyttöä (JHS 159 ISO OIDyksilöintitunnuksen<br />

soveltaminen julkishallinnossa)<br />

• Tunnistetta käytetään aineiston noutamisen<br />

tukemiseksi. (VIRPA-käyttö)


Validointi


XML-validointi<br />

• Käyttökelpoisen XML-tiedoston täytyy olla joko oikein<br />

muodostettu (well-formed) tai oikeellinen eli validi<br />

(valid)<br />

• Oikein muodostettu täyttää XML-kielen<br />

muotomääritykset siten, että esimerkiksi jokaisella<br />

merkinnällä (tag) on vastaava loppumerkintä.<br />

• Oikeellisen dokumentin rakenne tarkastetaan<br />

dokumenttityypin mukaisesti. Dokumenttityyppi määrää<br />

mm. mitä elementtejä voi käyttää dokumentissa. Se<br />

määrää myös mitkä elementit saavat sijaita minkäkin<br />

elementin sisällä ja mitä attribuutteja kuuluu millekin<br />

elementille.


Validointi työkaluna<br />

• Tarkistaa, että pakolliset elementit ovat mukana<br />

• Arvoluettelot, kuten ”ei sisällä henkilötietoja” ja näiden<br />

tarkan kirjoitusasun<br />

• Ennakkovalidointi säästä työtä ja selvittelyn ongelmia<br />

kaikilta osapuolilta


Skeemaviittaukset<br />

<br />

…<br />

<br />

http://www.arkisto.fi/skeemat/Sahke2/2011/12/20<br />


Pitkäaikaissäilytettävien<br />

tiedostomuotojen<br />

käsittely ja<br />

laadunvarmistus


Asiakirjat siirtokuntoon<br />

• Konvertointi sp-muotoon mahdollisimman aikaisin<br />

• Tiedostojen nimeäminen ohjeiden mukaisesti<br />

• Natiivimuodot<br />

• Eivät yksin kelpaa säilytykseen<br />

• Pitkäaikaissäilytyksen muodot<br />

• PDF/A-1b, myös PDF/A-1a<br />

• UTF8 (XML)<br />

• TIFF (rev 5 ja rev6), säilyttävät hyvin ilmiasun<br />

• Ei saa olla linkkejä tai riippuvuutta ulkoisista<br />

elementeistä.<br />

• Fonttien yms. Käytettävyyden varmistaminen


Tiedostojen nimeäminen<br />

• VAPAan siirrettävien asiakirjatiedostojen nimissä on<br />

sallittu seuraavat merkit:<br />

a-z A-Z 0-9 - _ . ( ) # välilyönti<br />

• Tiedostonimen pituus on maksimissaan 256 merkkiä.<br />

• Yksittäisen asiakirjatiedoston koko ei saa ylittää 2GB


Siirrettävät asiakirjat<br />

• Arkistolaitoksen VAPA -palveluun siirretään vain<br />

pysyvästi säilytettävät asiakirjat ja näistä vain<br />

lopulliset versiot. Väliversioita samasta asiakirjasta ei<br />

siirretä.<br />

• Asiakirjatiedon yhteydessä siirtotiedossa tulee esittää<br />

tiedoston käyttötapa: ”Natiivi”, ”Julkaisu” tai ”Arkisto”.<br />

Arkisto<br />

<br />

F0010696.PDF<br />

00002614\PDF\F0010696.PDF<br />


Auditointointikriteerit<br />

Formaattien hallinta<br />

• Onko organisaatiossa ohjeistettu käyttämään<br />

käsittelyprosessissa vain sellaisia tiedostomuotoja, jotka<br />

voidaan konvertoida arkistolaitoksen edellyttämiin<br />

pitkäaikaissäilytyksen muotoihin<br />

• Ovatko siirrettävien pysyvästi säilytettävien asiakirjojen<br />

tiedostomuodot joko PDF/A tai TIFF


Formaattien hallinta<br />

• Formaattikirjasto (Pronom)<br />

• Tunnistaminen (droid)<br />

• Sisäisten tunnisteiden avulla selvittää mikä formaatti<br />

on kyseessä<br />

• Karakteristointi<br />

• Määrittää ne ominaisuudet, jotka halutaan säilyvän<br />

• ”Preservation Plan” (Plato)


DROID<br />

• DROID (Digital Record Object Identification) is a software tool to<br />

perform automated batch identification of file formats.<br />

• It is designed to meet the fundamental requirement of any<br />

digital repository to be able to identify the precise format of all<br />

stored digital objects, and to link that identification to a central<br />

registry of technical information about that format and its<br />

dependencies.<br />

• It uses internal and external signatures to identify and report the<br />

specific file format versions of digital files. These signatures are<br />

stored in an XML signature file, generated from information<br />

recorded in the PRONOM technical registry.<br />

• New and updated signatures are regularly added to PRONOM,<br />

and DROID can be configured to automatically download<br />

updated signature files from the PRONOM Web site via Web<br />

services


Eheystarkiste<br />

• Lasketaan asiakirjatiedostoista<br />

• Varmistaa tiedoston muuttumattomuuden<br />

• Laskenta järjestelmän tai siirto-osion toimesta<br />

Algoritmi<br />

MD5<br />

SHA-1<br />

SHA-256<br />

merkintä<br />

md5<br />

sha1<br />

sha256


Työkaluja<br />

• md5sum<br />

• Droid<br />

• Komentorivipohjainen työkalu<br />

• *xml > tiedostot.md5<br />

• Graafinen käyttöliittymä, myös<br />

komentorivi<br />

• Vain md5


1) Tiedostoista<br />

lasketaan<br />

eheystarkisteet<br />

2) Tiedostojen<br />

eheystarkiste<br />

tallennetaan aineiston<br />

metatietoihin<br />

3) Metatieto tiedostoista<br />

lasketaan myös<br />

eheystarkisteet, jotka<br />

tallennetaan<br />

varmiste.sig tiedostoon<br />

4) Varmiste.sig<br />

allekirjoitetaan<br />

sähköisesti


Varmenteiden käyttö<br />

(varmiste.sig)


Todistusvoimaisuuden synty<br />

• Digitaalisessa muodossa syntyneet asiakirjat on<br />

muodostettu hallitussa prosessissa siten, että prosessin<br />

vaiheet on todennettavissa.<br />

• Tietojärjestelmän ominaisuudet tukevat aineiston<br />

tietoturvallista käsittelyä ja estävät oikeudettoman<br />

tietojen muuttamisen tai poiston<br />

• Asiakirja-aineisto voidaan siirtää arkistoon siten, että<br />

siirron eheys ja siirtäjä voidaan todentaa


Siirtokokonaisuuden allekirjoitus<br />

• Varmistaa aineiston siirtäjän sekä eheyden<br />

• Allekirjoitetaan vain metatiedot<br />

• Asiakirjojen eheystarkiste on metatiedoissa<br />

mukana<br />

• Joko henkilö tai järjestelmävarmenne,<br />

sovittava VAPA-tuen kanssa<br />

• Paketin allekirjoittajana voi olla luonnollinen<br />

henkilö tai tietojärjestelmä, joka edustaa<br />

allekirjoittajaa.<br />

• Allekirjoitus tallentuu varmiste.sig tiedostoon


Allekirjoittaminen<br />

• Manuaalinen vaihe siirtopaketin kokoamisen jälkeen.<br />

• varmistutaan lähettäjästä<br />

• Luodaan varmiste.sig –tiedosto<br />

• Sisältää eheystarkisteet metatiedoista, eli<br />

SAHKE1.XML tiedosto, ei muista tiedostoista<br />

• Pkcs7 muotoinen allekirjoitus, joka varmistaa<br />

metatietojen eheystarkisteet


Varmenteen todentaminen<br />

• openssl x509 -in -text<br />

• Myöntäjä<br />

• Kenelle tehty<br />

• Itse sisältö<br />

• openssl x509 -in -purpose<br />

• käyttötarkoitukset<br />

• "Kyllä" oltava väh. seuraavissa:<br />

• S/MIME signing<br />

• Any Purpose<br />

• Any Purpose<br />

• CA OCSP Helper


Siirtävä järjestelmä<br />

meta<br />

doc<br />

1) Tiedostoista lasketaan<br />

eheystarkisteet<br />

Siirtokokonaisuus<br />

Sähke.xml<br />

<br />

<br />

Varmiste.sig<br />

mdsum (sähke.xml)<br />

Signature (PKCS#7)<br />

ref<br />

md5<br />

2) Tiedostojen eheystarkiste<br />

tallennetaan aineiston<br />

metatietoihin<br />

3) Metatieto tiedostoista<br />

lasketaan myös<br />

eheystarkisteet, jotka<br />

tallennetaan varmiste.sig<br />

tiedostoon<br />

4) Varmiste.sig<br />

allekirjoitetaan sähköisesti


Verkkoyhteydet ja<br />

SFTP-tiedonsiirto


Aineiston siirto<br />

• Suojattu tiedonsiirto palvelimelta toiselle<br />

• VAPA suorittaa siirrettävälle aineistolle automaattisia<br />

teknisiä tarkistuksia<br />

• Jos vastaanoton tarkistuksissa tapahtuu virhe, siirto<br />

keskeytyy ja se on aloitettava alusta<br />

• Siirtävälle taholle VAPA-extranetin raportointipalvelu<br />

• siirtojen seuranta<br />

• virheraportit<br />

• aineiston kertymäraportit<br />

• Siirron jälkeen:<br />

• alkuperäinen asiakirja VAPAssa,<br />

• siirtävän organisaation järjestelmässä olevat asiakirjat<br />

katsotaan kopioiksi<br />

• Siirrettyjen asiakirjojen ja käsittelyprosessien tilatiedoksi<br />

tulee tietojärjestelmässä ”siirretty”


Hallinnolliset toimet<br />

• Siirtotunnukset<br />

• 1 tunnus / ympäristö / org<br />

• Raportointikäyttäjien ilmoittaminen<br />

• Palomuuriavaukset<br />

• Testi ja tuotanto<br />

• Testiympäristön määräaikainen käyttö<br />

• Testauspalvelun käyttö osana sähköisen säilyttämisen<br />

lupaa


Siirron tekninen toteutus<br />

• SFTP yhteys tähän soveltuvalla clientillä<br />

• Kokonaisuuden siirto, joko kerralla tai osissa.<br />

• Tulee olla binääri-muodossa (ei tekstimuodossa)<br />

• Viimeisenä ”triggerinä” varmiste.sig


Siirron virheilmoitukset<br />

• Allekirjoitus tehtävä aina viimeisenä<br />

• jos tietosisältöä muutetaan allekirjoituksen jälkeen, niin<br />

pakettia ei hyväksytä<br />

• Samaa aineistoa voi luovuttaa vain kerran.<br />

• Jos aineisto on VAPA:ssa ja sinne yritetään tuoda samaa<br />

aineistoa uudelleen, tulee virheilmoitus dublikaatista.<br />

Tarkistus identifiointitunnuksesta.<br />

• Onnistuneesta tai epäonnistuneesta siirrosta tulee<br />

sähköpostiin ilmoitus


Palomuuriavaukset<br />

• VAPA-tuelta lomake, jolla kohdejärjestelmän IPosoitteet.<br />

• Tällä ilmoitetaan myös lähdejärjestelmän osoitteet<br />

• Käytetyt portit<br />

• SFTP 115, HTTP 80, FTP 20 ja 21<br />

• Liikennöintisuunta siten että yhteyden avaus aina<br />

siirtäjän suunnasta<br />

• Yhteydet pääsääntöisesti: testi-testi ja tuotantotuotanto<br />

• Teknisesti siirtävä ”järjestelmä” voi olla sellainen, joka<br />

kyetään verkkoteknisesti yksilöimään ja luomaan<br />

palomuuriyhteys<br />

• Yhteyksien luomiseen varattava aikaa noin 1-2 vko


SFTP –client sovelluksista<br />

• Tiedostojen siirtämiseen tarkoitettuja sovelluksia<br />

• Rajapinta mahdollista rakentaa myös operatiiviseen<br />

järjestelmään<br />

• Soveltuvia järjestelmiä mm.<br />

• Cyberduck http://cyberduck.ch/<br />

• WinScp http://winscp.net<br />

• FileZilla http://filezilla-project.org<br />

• Siirtotoiminto mahdollista osin automatisoida työkalun<br />

avulla<br />

• Edellytyksenä kyky binäärimuotoiseen siirtoon.


Siirtotapahtuma<br />

• Siirretään ensin aineistopaketti<br />

• metatiedot ja asiakirja tiedostot<br />

• Kun muu aineisto on siirtynyt, siirretään<br />

allekirjoitus (varmiste.sig) binäärisenä


Siirtohakemistot aineistossa<br />

• Koottu aineisto järjestetään<br />

siirtokokonaisuudeksi siten, että jokaiselle<br />

siirrettävälle asiakirjallisen tiedon<br />

käsittelyprosessille (asialle) luodaan oma<br />

alihakemistonsa.<br />

• Siirrettävät asiakirjatiedostot kootaan<br />

hakemistoon siten, että jokaista<br />

tiedostomuotoa varten luodaan oma<br />

hakemistonsa.<br />

• SÄHKE-metatiedot sisältävät XMLtiedostot<br />

(metatiedostot) sijoitetaan<br />

siirtokokonaisuuden juureen


Siirtohakemistot VAPA:ssa<br />

• Siirtokokonaisuus käsitellään yhtenä kokonaisuutena.<br />

• Jokaista siirtokokonaisuutta varten luodaan oma<br />

alihakemisto päätason alaisuuteen.<br />

• VAPA sulkee pääsyn siirtokokonaisuuteen siirron<br />

jälkeen sen käsittelyn ajaksi. Jos siirtokokonaisuuden<br />

käsittely päättyy virhetilanteeseen, niin alihakemistoa<br />

käytettäessä varmistetaan, että vain pääsy kyseiseen<br />

alihakemistoon estyy.<br />

• Alihakemiston nimeämisessä voidaan käyttää<br />

esimerkiksi järjestelmän tunnistetta ja päivämäärää,


Siirtokokonaisuuden paketointi<br />

• Hakemistorakenne, jossa<br />

metatiedoista on viittaukset asiakirja<br />

tiedostoihin.<br />

• Huom! Suhteellinen viittaus suhteessa<br />

metatietoihin<br />

EI: c:\siirto\aineistot\123\abc<br />

KYLLÄ: \123\abc


Aineiston tekninen siirto<br />

• Käyttäjätunnukset sopimuksen teon<br />

yhteydessä<br />

• Suojattu tiedonsiirto palvelimelta toiselle<br />

SFTP-protokollalla<br />

• Palomuuriavaukset tilattava etukäteen<br />

• SFTP-client sovelluksia vapaasti saatavilla


Siirtojen onnistumisen<br />

seuranta ja siirron<br />

paluukanavan<br />

hyödyntäminen


Aineiston vastaanotto<br />

• VAPA suorittaa siirrettävälle aineistolle<br />

automaattisia teknisiä tarkistuksia<br />

• Virustarkistus<br />

• Allekirjoitus (varmiste.sig)<br />

• Sopimustiedot<br />

• XML:n rakenteen oikeellisuus<br />

• Tiedostojen ja kokonaisuuden eheys<br />

• Arvojoukot<br />

• Jos vastaanoton tarkistuksissa tapahtuu<br />

virhe, hylätään koko paketti<br />

• Tavoitteena automatisoitu ja luotettava<br />

siirtoprosessi.


Siirron jälkeen<br />

• alkuperäinen asiakirja on tämän jälkeen<br />

VAPAssa<br />

• siirtävän organisaation järjestelmässä<br />

olevat asiakirjat katsotaan kopioiksi<br />

• Aineisto tulee merkitä siirretyksi<br />

• Hallintaoikeus ja velvollisuus säilyy vielä<br />

siirtäjällä, kunnes aineisto luovutetaan<br />

• Siirretyn oman aineiston käyttö mahdollista<br />

VIRPA-rajapinnan kautta


Siirron paluukanava<br />

• Kaikista siirtoyrityksistä tulee raportti<br />

siirtäjälle, joka kertoo siirron tilan<br />

• Paluukanavan avulla muodostetaan<br />

koneellisesti luettava siirtoraportti, joka<br />

mahdollistaa siirron jälkeisen tilatiedon<br />

automaattisen päivittymisen siirtävässä<br />

järjestelmässä<br />

• tukee parhaiten käyttötapaa, jossa siirtoja<br />

tapahtuu usein ja lyhyellä siirtosyklillä<br />

• Käytettävissä samoin kuin VIRPA-rajapinta


Paluusanoma<br />

• Paluuraportti on suoritetun siirron tilasta VAPAssa<br />

tuotettu XML-muotoinen raportti, jonka sisällön<br />

kutsuva järjestelmä tulkitsee.<br />

• Kutsu perustuu siirretyn aineiston tunnukseen<br />

• Sanomapohjainen tunnistaminen (käyttäjätunnus ja<br />

salasana)<br />

• https://[palvelun osoite].narc.fi/<br />

DeliveryService/ReportDownloadingestID=[s2:Transfe<br />

rInformation/s2:NativeId ]<br />

• Kutsun otsikkotiedoissa on esitettävä<br />

iPlanetDirectoryPro eväste ja sen arvona session<br />

luonnissa saatu token.id:n arvo.


Vastauksen tulkinta<br />

<br />

success<br />

122.123.123/rep:transferId><br />

Raportti sisältää vastaanoton työnkulun raporttitiedon XMLmuodossa,<br />

josta mahdolliset virheet on löydettävissä


Siirtotoiminnallisuuksien<br />

auditointi


• Onko järjestelmässä toiminnot, joiden avulla<br />

siirrettävät asiakirjatiedostot konvertoidaan<br />

arkistolaitoksen vaatimusten mukaisiin<br />

tiedostomuotoihin, kuten PDF/A ja TIFF<br />

• Vaatimus tulee todentaa pistokokein<br />

aineistosta, jossa on eri formaateissa olevaa<br />

aineistoa ja siirtokokonaisuuden<br />

lopputuloksesta tarkistetaan konvertoitujen<br />

asiakirjatiedostojen tyypit ja näiden<br />

konversioiden onnistuminen.


• Onko järjestelmässä toiminnot, joiden avulla<br />

siirtokokonaisuus muodostuu sellaiseen<br />

hakemistorakenteeseen, että se on siirrettävissä<br />

yhtenä yhtenäisenä kokonaisuutena VAPApalveluun.<br />

• Todennetaan arvioimalla muodostunutta<br />

hakemistorakennetta siten, että se ei sisällä<br />

siirtokokonaisuuteen kuulumattomia tiedostoja ja<br />

että siirrettävät tiedostot ovat helposti<br />

siirrettävissä.


• Onko järjestelmässä toiminnot, joiden avulla<br />

siirrettäväksi tarkoitettu aineisto voidaan poimia<br />

järjestelmästä, joko erinä tai käsittelyprosessi<br />

kerrallaan.<br />

• Onko järjestelmässä toiminnot, joiden avulla<br />

siirrettäväksi tarkoitettu aineisto merkitään poimituksi<br />

sen jälkeen kun aineisto on otettu osaksi siirrettävää<br />

kokonaisuutta’<br />

• Onko järjestelmässä toiminnot, joiden avulla<br />

epäonnistuneen siirron jälkeen siirrettäväksi poimittu<br />

aineisto voidaan palauttaa poimintaa edeltävään tilaan<br />

”ei poimittu”.


Aineiston VIRPA-käyttö:<br />

yleiskuvaus ja tekninen<br />

käyttötapa


Periaate<br />

• Aineiston suorakäyttörajapinta (VIRPA) tarjoaa<br />

organisaatiolle mahdollisuuden noutaa VAPAan<br />

siirtämiään aineistoja NativeID:n avulla


Palvelun kuvaus<br />

• aineiston nouto edellyttää, että aineiston aineiston<br />

identifiointitunnuksia<br />

• mahdollistaa vain aineiston noudon VAPA-järjestelmästä,<br />

ei aneiston palauttamista takaisin VAPAan tai aineiston<br />

muokkaamista.<br />

• VIRPA-rajapinta ei sisällä erillisiähakutoiminnallisuuksia<br />

tai näiden tukea.<br />

• haettavan aineiston käyttöoikeudet perustuvat kutsuvan<br />

järjestelmän omaan käyttäjä- ja käyttöoikeushallintaan.


Hakutavat<br />

• VIRPA-rajapinta noutaa pyydetyn aineiston kutsuvalle<br />

järjestelmälle ZIP-pakettina, joka sisältää sekä<br />

pyydetyn asiakirjatiedoston että siihen liittyvät<br />

metatiedot. Kutsuvan järjestelmän vastuulla on esittää<br />

nämä tiedot vastaanottajalle.<br />

• Aineistoa voidaan hakea joko sykronisesti tai<br />

asynkronisesti.<br />

• synkronisessa haussa paluusanoma sisältää<br />

suoraan pyydetyn aineiston<br />

• asynkronisessa haussa paluusanoma sisältää linkin<br />

osoitteeseen, josta aineisto on myöhemmin<br />

haettavissa.


Arkistolaitoksen<br />

tarjoamat siirtämisen<br />

tukipalvelut sekä<br />

ohjeistus


VAPA-tuki<br />

• Siirtoon liittyvät käytännön järjestelyt<br />

• Palomuuriavaukset<br />

• Siirtäjän alustukset VAPAssa<br />

• Tunnusten myöntäminen<br />

• Virheilmoitusten tulkinta ja ongelmien<br />

selvittäminen<br />

• On aina ensimmäinen yhteydenottopiste siirtoon<br />

liittyvissä teknisissä kysymyksissä<br />

• Kanavoi tukipyynnöt eteenpäin tarvittaessa<br />

• Vapa-tuki@narc.fi


VAPA-siirtotestaus<br />

• Varmistutaan siirtokokonaisuuden rakenteellisesta<br />

oikeellisuudesta<br />

• Nähdään siirtopaketin sisällöllinen oikeellisuus<br />

• Suoritetaan kun on uusi VAPA-palveluun liittyvä järjestelmä tai<br />

jos järjestelmän siirtotoiminnallisuuteen on tehty merkittäviä<br />

muutoksia.<br />

• Edellyttää organisaation itse tuottamaa testiaineistoa<br />

• Sovellusta tai järjestelmää, jonka avulla siirtokokonaisuus<br />

voidaan siirtää testijärjestelmään.<br />

• Sähköisen säilyttämisen luvan edellytys on testauksella<br />

todennettu siirtotoiminnallisuus


Testit<br />

• Automaattisesti<br />

• Metatietorakenteen XML-rakenne<br />

• Asiakirjatiedostojen formaattien<br />

määritystenmukaisuus<br />

• Eheystarkisteet ja allekirjoitus<br />

• Manuaalisesti<br />

• SÄHKE2-metatietojen käyttö<br />

• Konversioiden käytettävyys


Siirtotestauksen vaiheet 1/2<br />

nro. Kuvaus toimenpiteistä<br />

1. Siirtoyhteyden muodostaminen<br />

- Palomuuriavausten ja allekirjoittajan tietojen<br />

toimittaminen VAPA-tuelle<br />

- VAPA-tuki toimittaa siirtotunnukset<br />

2. Siirtoyhteyden testaus<br />

- Siirtäjä testaa yhteyden toimivuuden<br />

3. Testaus 1-vaihe: siirron läpimeno<br />

Siirtotestaus aloitetaan pienellä aineistolla, jotta<br />

mahdolliset virheet on helppo korjata (esim. yksi asia<br />

ja pari asiakirjaa).<br />

dokumentaatio / ohje<br />

Siirto-ohje<br />

Siirto-ohje<br />

Siirto-ohje<br />

Siirtotestauksen ohje<br />

Ensimmäinen versio siirtokokonaisuudesta voidaan<br />

lähettää myös s-postilla.


Siirtotestauksen vaiheet 2/2<br />

nro. Kuvaus toimenpiteistä dokumentaatio / ohje<br />

4. Testaus 2-vaihe: aineiston variaatiot<br />

Kun siirto on mennyt läpi voidaan vähitellen<br />

kasvattaa aineisto kokoa.<br />

Siirtotestauksen ohje<br />

Käytetään testiaineistoa, joka edustaa kattavasti<br />

siirrettävää aineistoa ja sen rakenteita<br />

5. Testaus 3-vaihe: aineiston sisällöllinen validointi<br />

Kansallisarkisto katselmoin vaiheessa 2. siirtrettyä<br />

aineistosta VAPA-järjestelmässä.<br />

Siirtotestauksen ohje<br />

6. Siirtotestauksen päättäminen<br />

Yhteinen käsitys testauksen riittävyydestä<br />

7. VIRPA-rajapinnan ja siirron paluuraportin rajapinnan<br />

testaus.<br />

VIRPA-ohje


Testauksessa käytettävä<br />

aineisto<br />

• Ei tule käyttää oikeaa aineistoa – etenkään jos<br />

sisältää arkaluonteisia tietoja<br />

• Aineisto, joka edustaa kattavasti niitä rakenteita<br />

ja muotoja, jotka ovat järjestelmän<br />

tuotantokäytössä tyypillisiä.<br />

• Huomioida myös aineistokohtaiset erityispiirteet<br />

• Asioiden ja asiakirjojen lukumäärää<br />

oleellisempaa on aineiston monipuolisuus ja<br />

kattavuus.


Testiaineisto<br />

Asiat:<br />

• Salassa pidettävä asia<br />

• Salassa pidettävä asiakirja (SP) + julkinen asiakirja (SP) samassa<br />

asiassa<br />

• Asia, joka sisältää määräajan ja pysyvästi säilytettäviä asiakirjoja<br />

• Päätetty, mutta uudelleenavattu asia tuleeko mukaan<br />

• Asia, josta on hävitetty jo määräajan säilytettäviä asiakirjoja<br />

• Asia, joka sisältää suhde- merkintöjä toiseen asiaan.<br />

Muita ominaisuuksia:<br />

• Asiakirja, josta on useita eri versioita tuleeko viimeinen versio<br />

• Saapunut sähköisesti allekirjoitettu asiakirja<br />

• Tiedostomuotoja: DOT, PPT, PPTX ja XLS, XLSX, DOC, DOCX, JPEG,<br />

HTML, ODF, PNG tms. – etupäässä niitä, joita ko. järjestelmässä<br />

käytetään.


Ohjeita testaajalle:<br />

• Varmista aluksi siirtoyhteyden toimivuus<br />

• Sovi VAPA-tuen kanssa testiajankohta<br />

• Aloita testaus pienillä aineistoilla<br />

• Validoi siirtokokonaisuus ensin itse<br />

– Sahke.xml<br />

– Varmiste.sig<br />

• Kuittaus siirroista siirtoja suorittavan<br />

tahon sähköpostiin


Lisätietoja<br />

VAPA-palvelusta ja sen<br />

käyttöönotosta<br />

Siirron tekninen tuki<br />

Mikko Eräkaski<br />

050 363 5769<br />

Vapa-tuki@narc.fi<br />

email. Etunimi.sukunimi@narc.fi

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!