13.01.2015 Views

NB-BibliothecaNova 0414nett

NB-BibliothecaNova 0414nett

NB-BibliothecaNova 0414nett

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

postene. På samme måte som for innholdsordene, blir bare de tre første<br />

sifrene i DDK-nummeret med. Likeså blir koblingen mellom verk og emneord,<br />

og emneordenes innbyrdes samforekomst, koblet fra hverandre. Emneordene<br />

relateres kun gjennom felles DDK. Forekomster av emneord og DDK<br />

er registrert og telt opp. Tellingen generer et datasett illustrert i Tabell<br />

3, eksemplifisert for emneordene likestilling og kvinner (registrert både i<br />

kontrollert og ukontrollert vokabular):<br />

Tabell 4 likestilling og kvinner<br />

Frekvens DDK Tag Ord<br />

6 379 653 Likestilling<br />

6 612 653 Kvinner<br />

4 305 650 Likestilling<br />

10 305 650 kvinner<br />

Totalt er det ca. 620 000 forekomster av emneord fordelt på kontrollert<br />

vokabular (250 000) og fritt vokabular (370 000) 8 .<br />

Det er ikke foretatt noen analyse av emneordene utover opptelling. I evalueringen<br />

av innholdsord blir de vurdert sammen med de mest frekvente<br />

emneordene for en gitt DDK.<br />

EKSPERIMENT OG EVALUERING<br />

En gjennomgang av et sett emneord med et sett innholdsord, ett fra hver<br />

hundregruppe i DDK-serien viser at metoden for å velge ut innholdsord<br />

har noe for seg. Her skal vi vise et eksperiment med klassifikasjonskoden<br />

799 (fiske, jakt, skyttersport). Settet med innholdsord som foreslås av det<br />

statistiske målet for en gitt klassifikasjonskode sammenlignes med de mest<br />

frekvente emneordene for koden. Sammenligningen skjer ved at innholdsordene<br />

vurderes som relevant i de tilfeller der de er semantisk relatert til<br />

emneordene.<br />

Tabellen nedenfor illustrerer hvordan innholdsordene med høyest assosiasjonsscore<br />

for kode 799 er koblet til de mest frekvente emneordene for koden.<br />

Det er ikke skilt mellom kontrollert og ukontrollert vokabular, og det er valgt<br />

8 I MARC-postene benyttes tag 650 for kontrollert vokabular, og 653 for ukontrollert<br />

70

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!