13.01.2015 Views

NB-BibliothecaNova 0414nett

NB-BibliothecaNova 0414nett

NB-BibliothecaNova 0414nett

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Tesaurusen skal dekke alle fagområder, men detaljeringsgraden innen de<br />

ulike områdene vil påvirkes av litteraturbelegget ved institusjonene som<br />

bidrar med nye begreper, i første omgang UBO og <strong>NB</strong>.<br />

Tesaurusen skal inneholde generelle innholdsbeskrivende emneord. Geografiske<br />

emneord, formemneord og person-/korporasjonsnavn inngår ikke.<br />

Tesaurusen er tenkt til postkoordinert bruk, det skal derfor ikke etableres<br />

emnestrenger.<br />

Første versjon vil forekomme på bokmål, men den skal være forberedt for<br />

flerspråklighet fra første stund.<br />

Vi ser for oss at tesaurusen skal foreligge åpent tilgjengelig på nett, både<br />

som nedlastbare datasett og for søk gjennom et sluttbrukergrensesnitt.<br />

Emnetermene skal være tilgjengelige som åpne lenkede data.<br />

Valg av tesaurussystem og annen teknologi<br />

Det blir viktig å finne et tesaurussystem som støtter distribuert arbeid, som<br />

håndterer lenkede data generelt, og gjerne har spesiell støtte for SKOS. Så<br />

langt er seks systemer identifisert og under evaluering. De fleste må bedømmes<br />

ut fra dokumentasjon og eventuell prøvelisens. For piloten brukes<br />

VocBench 12 , et system med åpen kildekode som også brukes av AGROVOC<br />

og EUROVOC 13 . Foreløpig er det et åpent spørsmål om VocBench anbefales<br />

til et eventuelt hovedprosjekt.<br />

Det er ønskelig å bruke språkteknologi i utviklingsarbeidet. Denne teknologien<br />

kan, gjennom søk og analyse av tekst, bidra særlig til å foreslå kandidater<br />

til nye emneord, både nye begreper og alternative termer til eksisterende<br />

begreper. Bruk av språkteknologi kan i tillegg fungere som støtte for å strukturere<br />

ustrukturerte (flate) vokabularer som skal inngå i tesaurusen.<br />

Få av tesaurussystemene har innebygd språkteknologiske funksjoner. I<br />

miljøet rundt Språkbanken i <strong>NB</strong> foregår det imidlertid programvareutvikling<br />

som også kan være nyttig i tesaurussammenheng, se s. 64.<br />

12 http://vocbench.uniroma2.it/<br />

13 http://eurovoc.europa.eu/<br />

53

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!