11.07.2015 Views

Saatavana elektronisessa muodossa - Tietojenkäsittelytieteiden ...

Saatavana elektronisessa muodossa - Tietojenkäsittelytieteiden ...

Saatavana elektronisessa muodossa - Tietojenkäsittelytieteiden ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

28generaation kohdalla, jolloin tarkkuus oli 0,27% parempi. Kummankin järjestelmänvirhemarginaali on kuitenkin huomattavasti pienempi kuin Tongin jaEvansin [1996] suorittamien testien kohdalla. Tähän vaikuttavat kehittyneempitekniikka, parantuneet ohjelmistoalgoritmit ja laskentakapasiteetin kasvaminen.On kuitenkin syytä ottaa huomioon, että testimateriaalit eivät ole samat,joten tulokset eivät ole suoraan verrannolliset.Korjaukseen löytyy myös kaupallisia sovelluksia, joista yksi esimerkki onPrimeOCR. Sovelluksen luvataan vähentävän virheiden määrää 65% perinteiseenOCR:n verrattun. Lisäksi saatavilla on optio parannetulla tarkkuudella,jolla virheiden määrän luvataan putoavan peräti 82%. Vertailukohta on kuitenkinnimeämätön, joten tuloksiin on syytä suhtautua varauksella [PrimeRecognition].Kirjaimissa esiintyvien virheiden määrää voidaan konkretisoida seuraavanlaskelman avulla, kun oletetaan keskimääräisen tarkkuuden olevan 98% luokkaaja yksittäisten virheiden osalta tunnistuksen olevan 40%:• 2500 merkkiä• 50 virhettä• 20 virhettä merkitty epäilyttäviksi• 30 virhettä tunnistamatta.Virheiden määrä ei vaikuta kovinkaan suurelta. Edellä mainittu tekstimäärämahtuu yhdelle A4-arkille, joten siihen nähden virheitä on paljon. Jos arkkejaon sata, on lopullisessa tuotoksessa jo 3000 merkkivirhettä.6.4.2. Manuaalinen korjausAutomaattisen korjauksen lisäksi järjestelmä voi helpottaa käyttäjää tarjoamallamanuaalista korjausta varten työkaluja. Virheiden korjausta ja tunnistusta helpottaa,jos ne ovat selkeästi tunnistettavissa ja erotettuja [Taghva et al., 1998].Työkalu voidaan toteuttaa tekstinkäsittelymäisellä lähestymisellä, jossa havaitutvirheellisiksi epäillyt merkit ja sanat korostetaan. Visuaalisuus nopeuttaamateriaalin läpikäyntiä, koska silmä havaitsee potentiaaliset virheet helpommin.Jos läpikäytävää materiaalia on paljon, voi käyttäjä lopulta turtua prosessiinja korjata vain näytetyt virheet. Tällöin ei-havaitut virheet jäävät osittain taikokoaan huomioimatta.Havaittujen virheiden yhteydessä voidaan esittää samalla myös mahdollisetkorjaukset, jos sellaisia on löytynyt. Käyttäjä voi valita niiden joukosta oikean,

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!