13.01.2015 Views

NB-BibliothecaNova 0414nett

NB-BibliothecaNova 0414nett

NB-BibliothecaNova 0414nett

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

seg inn er det kun ord med frekvens over 20 innenfor koden som beregnes.<br />

Hvordan den vektede PMI fungerer, illustreres for DDK 641 i Tabell 2 og<br />

termen smør i Tabell 1 for de 5 med høyest score. Assosiasjonen sammenfaller<br />

med frekvensen i disse tilfellene bortsett fra pepper, som under DDK<br />

641 som har en lavere frekvens enn smør, men likevel plassert foran sortert<br />

etter assosiasjon, se tabell 2:<br />

Tabell 2 Smør<br />

Frekvens Assosiasjon DDK<br />

73794 1753 641 Mat og drikke<br />

13142 615 336 Offentlige finanser<br />

51251 479 948 Skandinavia og Finland<br />

1855 194 637 Framstilling av meieriprodukter<br />

og lignende<br />

1078 183 642 Måltider og servering<br />

Tabell 3 DDK 641<br />

Frekvens Assosiasjon Ord<br />

110528 2251 salt<br />

100485 2160 dl<br />

88474 1972 ss<br />

64096 1910 pepper<br />

73794 1753 smør<br />

Hvor god denne sorteringen er får vi vite først når vi sammenligner med<br />

emneordene for klassifikasjonskoden. Mens DDK-nummeret i seg selv ikke<br />

bærer noen semantisk informasjon – det bidrar kun som en gruppeindikator<br />

for PMI – vil emneordene kunne sammenlignes med innholdsordene på et<br />

semantisk nivå.<br />

EMNEORD FRA BIBSYS<br />

Emneordene er hentet ut fra BIBSYS. For et (ukontrollert) utvalg på 120 000<br />

titler over digitaliserte bøker er det registrert emneord for DDK fra MARC-<br />

69

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!