11.07.2015 Views

Saatavana elektronisessa muodossa - Tietojenkäsittelytieteiden ...

Saatavana elektronisessa muodossa - Tietojenkäsittelytieteiden ...

Saatavana elektronisessa muodossa - Tietojenkäsittelytieteiden ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

12mannessa ja viimeisessä vaiheessa hyödynnetään Houghin siirtymää ja lasketaanaiemmin saatujen tulosten perusteella tarkempi arvo vinoutumalle [Jianget al., 1997].Toisessa Houghin siirtymää käyttävässä menetelmässä kuva jaotellaanaluksi toisiinsa yhteydessä oleviin alueisiin. Jaottelun jälkeen alueet ryhmitelläänkokonaisuuksiksi koon ja sisällön perusteella. Jokaiselle ryhmällä arvioidaanseuraavaksi vinouma käyttäen Houghin siirtymää vain alueen osajoukkoon.Arvioinnin jälkeen lasketaan tarkempi vinouma ja viimeiseksi lasketaankoko kuvan vinouma käyttäen painotettuja ryhmien vinoumia. Menetelmä keventäälaskentaa, koska laskennalliset alueet ovat rajattuja [Amin and Fischer,2000].Edellä esitetyn Aminin ja Ficsherin ehdottaman lähestymistavan kaltaistamenetelmää on sovellettu myös eräässä BAG-esitystä käyttävässä menetelmässä.Erottava tekijä on kuitenkin lähtöalueiden määrittely, joka tapahtuu keräämälläkuvasta vain rajattu määrä alueita tunnistamista varten. Alueiden keräämisenjälkeen lasketaan summittainen vinouma kuvalla ennen viimeistävaihetta, jossa valittuun alueeseen sovelletaan Houghin siirtymää. Laskennallistaraskautta saadaan jälleen vähennettyä, koska alueen koko on rajattu[Kwag et al., 2002].Poikkeavia lähestymistapoja ongelman ratkaisemiseksi on myös tutkittu.Näistä voidaan ottaa esimerkkinä menetelmä, jossa vinouma lasketaan tekstiriveillekuuluvien vertikaalisten pikseleiden avulla [Gatos et al., 1997]. Menetelmänensimmäisessä vaiheessa kuva käsitellään siten, että kirjaimia ja sanoja sisältävätrivit mustataan. Pikseleiden mustaamisen jälkeen kuvasta valitaan vähintäänkaksi saraketta, joista kerätään jokaisen rivin vertikaalinen aloituspikseli.Kerättyjä pikseleitä käyttäen muodostetaan korrelaatiomatriisi, jolla saadaanlaskettua kuvan vinouma.3.2.2. Artefaktien poisto kuvastaSkannatussa kuvassa voi esiintyä erilaisia virheitä kuten taustan tummuutta,heikkolaatuista tekstiä tai roskia (ks. kuva 3). Todellisten artefaktien poistaminenkuvasta ei ole yksinkertaista. Poistaminen voi jopa sotkea dokumentin sisältöäja aiheuttaa näin odottamattomia vaikutuksia esim. tekstin tunnistukseen.Mitään täydellistä ratkaisua ongelmaan ei ole, mutta esimerkiksi tiiviysanalysointiaon tutkittu yhtenä ratkaisuna. Tässä menetelmässä kuvaalueillelasketaan tiiviysarvo, jonka perusteella tehdään päätelmä onko kysees-

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!