05.11.2014 Views

OMATOIMISEN KIRJASTONKÄYTÖN TUKEMINEN KEHITTYNEEN ...

OMATOIMISEN KIRJASTONKÄYTÖN TUKEMINEN KEHITTYNEEN ...

OMATOIMISEN KIRJASTONKÄYTÖN TUKEMINEN KEHITTYNEEN ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

tuntemia sanoja, joista käytetyt hakusanat tai niiden osat ovat osia.<br />

3) On luovuttu vaatimuksesta, että ohjelman pitäisi tunnistaa kaikki hakulausekkeen sanat.<br />

(Walker 1, 41)<br />

4) Yannakoudakisin menetelmässä käytetään sitä, että etsitty sana usein voidaan paikallistaa tiettyyn<br />

osaan sanastoa ja että kirjoitusvirheet yleensä noudattavat tiettyjä sääntöjä. Tässä menetelmässä pieni<br />

osa sanastoa käydään läpi sana sanalta. Jos käyttäjän syöttämässä sanassa ja sanastosta löydetyssä<br />

sanassa on yksi tai kaksi eroa ja jos ero noudattaa järjestelmän tunnistamia sääntöjä, sana lisätään<br />

mahdollisten sanojen listaan. Lopullinen valinta listan sanoista tehdään Bayesin tilastomenetelmällä.<br />

(Yannakoudakis)<br />

4.3 KÄYTTÄJÄN SYÖTTÄMÄN HAKULAUSEEN YMMÄRTÄMINEN<br />

4.3.1 Käyttäjän vaikeudet hakulauseen muodostamisessa<br />

Hyvin usein vaikeuksia aiheuttaa se seikka, että haun tekijä ei erota Boolean-logiikan and- ja oroperaattorien<br />

semanttista merkitystä toisistaan. Toisin sanoen hän yhdistää hakulauseessaan olevat<br />

hakutermit niiden avulla siten, että haun tulos ei vastaa hänen tarpeitaan. Tähän vaikuttaa suuresti se,<br />

että arkikielessä sekä 'ja' että 'tai' sanoja käytetään eri tavalla kuin Boolean-logiikassa. (Tenopir)<br />

Käyttäjän on monesti vaikea valita sopivat hakutermit. Hän voi esimerkiksi muodostaa hakulauseen<br />

'tietokone tai tietokoneavusteinen opetus' ymmärtämättä, että hakutulos on tässä tapauksessa<br />

ensimmäisen hakutermin mukainen. Käyttäjä voi myös katkaista termin siten, että hakutuloksesta<br />

tulee liian laaja. Monesti yritetään myös yhdistää hyvin monta hakusanaa yhdessä hakulauseessa.<br />

(Shaw)<br />

Erilaiset hakustrategiat ja erilainen terminologia systeemeissä ja tietokannoissa tuottavat<br />

hakuohjelmien käyttäjille paljon vaikeuksia. Käyttäjä yrittää turhaan toteuttaa hakuja samalla tavoin<br />

kuin toista hakuohjelmaa käyttäessään on tottunut. (Tenopir)<br />

4.3.2 Hakulauseen ymmärtämisen parantamiseen kehitettyjä ratkaisuja<br />

Katkaisu ja sanojen johtaminen mahdollistavat morfologisesti toisiinsa yhteydessä olevien eli<br />

samankantaisten sanojen löytämisen siinä toivossa, että niillä on semanttistakin yhtäläisyyttä. Nämä<br />

menetelmät eivät aina ole oleellisesti parantaneet hakutuloksia. (Walker 1, 21 )<br />

'Katso- viittaukset' järjestelmän käytössä olevaan hakusanaan ja 'katso myös- viittaukset' hakutermin<br />

sukulaistermeihin ovat tunnetuimmat viittaukset. Viittaustekniikoilla pyritään yhdyssana- ja<br />

homonyymi- kontrolliin, luonnollisen kielen sanojen ja käytössä olevien asiasanojen välisten<br />

yhteyksien tunnistamiseen ja semanttisten sukulaistermien taulukoiden muodostamiseen. (Walker 1,<br />

33)<br />

Automaattisen selailun avulla voidaan tuoda yhteen vaihtoehtoiset tai oikeat kirjoitustavat,<br />

synonyymit tai vaihtoehtoiset tavutukset. (Walker 1, 33)<br />

4.4 HAUN RELEVANSSIN PARANTAMINEN<br />

4.4.1 Relevantin hakutuloksen saamista vaikeuttavia tekijöitä

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!