11.07.2015 Views

Saatavana elektronisessa muodossa - Tietojenkäsittelytieteiden ...

Saatavana elektronisessa muodossa - Tietojenkäsittelytieteiden ...

Saatavana elektronisessa muodossa - Tietojenkäsittelytieteiden ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

42. Yleiskuvaus paperilomakkeiden digitalisointiprosessistaSeuraavaksi luodaan yleissilmäys paperilomakkeiden digitalisointiprosessiin.Tarkasteltavaksi otetaan prosessin kokonaisrakenne sekä erilaiset prosessin toteutuksessatarvittavat osa-alueet. Lisäksi selvitään, millä tavoin prosessi toimintaon toteutettavissa, ja lopuksi kuvataan varmistusmekanismeja, joilla varaudutaanprosessin aikana ilmeneviin ongelmiin.Paperilomakkeiden digitalisointiprosessi koostuu seuraavista vaiheista: paperilomakkeidenskannaaminen, lomakerakenteen määrittely, lomakemallinmäärittely, tekstintunnistus ja tietojen syöttäminen tietomalliin [Lam et al.,1993]. Nämä ovat prosessin kannalta selkeät päävaiheet, joista jokainen sisältäävähäisempiä alavaiheita kuten esim. kuvien esikäsittely skannauksen yhteydessä.Kuvassa 1 on nähtävissä yleiskuva järjestelmän rakenteesta.Prosessi on hyvin pitkälle automatisoitavissa, mutta käyttäjää tarvitaan kuitenkinaina vähintään syöttämään lomakkeita kuvanlukijaan. Tämä voi kuitenkinolla kertaluontoinen toimenpide, jos käytettävässä kuvanlukijassa on riittäväniso arkinsyöttölaite.Lomakerakenne on kuvaus lomakkeen fyysisestä rakenteesta sisältäen lisäksiloogisen jaottelun kuten ylä- ja alatunnisteet [Klink et al., 2000]. Tunnistamiseenvoidaan käyttää apuna lomakkeen sisältämää visuaalista sekä symbolistainformaatiota [Faure, 2000]. Rakenteessa tulisi olla kenttien osalta mukanavähintään kenttäkoodaus ja paikkainformaatio jokaisesta lomakkeen kentästä.Käyttäjä on yleensä hyvä ottaa mukaan lomakerakenteen määrittelyyn, ainakinoikeellisuuden tarkistamista varten, vaikka toimenpide muutoin automatisoitaisiintäysin. Tarkistustoimenpiteellä varmistetaan luodun lomakerakenteenoikeellisuus suhteessa todelliseen lomakkeeseen ennen varsinaista tiedon työstämistä.Lisäksi käyttäjälle on hyvä antaa mahdollisuus ottaa kantaa rakenteeseenmyös manuaalisesti [Antonacopoulos and Karatzas, 2004]. Lomakerakenteenluominen voi tapahtua manuaalisesti, puoliautomaattisesti tai automaattisesti[Sherkat et al., 2005].Lomakerakenne ei sisällä semantiikkaa liittyen kenttien kuvaamaan informaatioon.Tätä varten järjestelmä voi sisältää lomakemallin, joka tarkentaa lomakerakenteensisältämien kenttien tarkoitusta erilaisten attribuuttien avulla.Lomakemalli on käytännössä looginen lisäkerros lomakerakenteen päälle.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!