11.07.2015 Views

Saatavana elektronisessa muodossa - Tietojenkäsittelytieteiden ...

Saatavana elektronisessa muodossa - Tietojenkäsittelytieteiden ...

Saatavana elektronisessa muodossa - Tietojenkäsittelytieteiden ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

29mikä nopeuttaa korjausta. Kirjoitusvaihtoehtoa ei voi kuitenkaan unohtaa, koskaoikeaa vaihtoehtoa ei ole aina välttämättä automaattisesti saatavilla.Työkalu voi samalla toimia apuna tunnistuksen opettamisessa. Käyttäjänkorjatessa virheitä voi järjestelmä samalla opetella tunnistamaan samankaltaisiavirheitä ja luoda niistä itselleen oppimiskantaa. Jatkossa samankaltaiset virheetvoidaan automaattisesti tunnistaa sekä korjata. Virheet voivat kuitenkin ollatyypillisiä vain tarkistettavalle materiaalille, ja siksi luotu oppimiskanta ei välttämättäole käyttökelpoinen muiden materiaalien kohdalla.6.5. Käsinkirjoitettu tekstiTietokoneella tulostetun tekstin tunnistaminen on huomattavasti helpompaakuin käsinkirjoitetun. Tulostettu teksti on laadultaan tasaista ja huonolaatuistajälkeä voi aiheuttaa lähinnä mustevajaus, paperitukos tai huono paperilaatu.Tulostuksessa käytetyt fontit ovat yleisiä ja erot tulostimien välillä käytettäessäsamaa fonttia ovat hyvin pieniä. Erilaista käsinkirjoitettua tekstiä esiintyy sensijaan yhtä paljon kuin on ihmisiäkin. Jokaisella ihmisellä on hieman toisistaeroava kirjoitustyyli, joskin toisen ihmisen tyylin imitoiminen on mahdollista.Vaihtoehtoisia menetelmiä käsinkirjoitetun tekstin tunnistamiseen on paljon[Lecun et al., 1998; Roy et al., 2009].Ensimmäistä kertaa käsinkirjoitettuja dokumentteja tunnistettiin tietokoneellavuonna 1962 [AIM, 2000], jolloin tunnistaminen tekniikan kehittymisenmyötä tuli mahdolliseksi. Sittemmin menetelmät ja tekniikat ovat kehittyneet,mutta käsinkirjoitettu teksti on silti haaste. Käsinkirjoitettua tekstiä on edelleenpaljon, koska lomakkeet ovat pääsääntöisesti edelleen täytetty kynällä eikä tietokoneella.Perusprosessi käsinkirjoitettua tekstiä tunnistettaessa ei eroa tulostetuntekstin tunnistamisesta: ensin tunnistetaan kirjaimia ja sitten sanoja. Tekstintyylin variaatioiden määrä vain on paljon suurempi. Käsinkirjoitetun tekstintunnistusta varten tarvitaan huomattavasti suurempi sanasto kuin tulostetunmateriaalin ollessa kyseessä. Samoin tunnistusmoduulin opettamiseen tarvitaanenemmän materiaalia. Saatavilla on kuitenkin nykyään paljon pieniä mobiililaitteita,jotka sisältävät tekstintunnistusteknologiaa. Mobiililaitteet ovatkäytettävissä olevien resurssien osalta vielä varsin rajoittuneita, joten suurtensanastojen ylläpitäminen ei ole mahdollista. Tutkimusta on tehty käytettävänsanaston koon pienentämiseksi ja edistystä on myös tapahtunut [Roy et al.,2009].

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!