17.11.2013 Views

Musik och indexering i folkbiblioteken - BADA - Högskolan i Borås

Musik och indexering i folkbiblioteken - BADA - Högskolan i Borås

Musik och indexering i folkbiblioteken - BADA - Högskolan i Borås

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

De flesta indexerare har en <strong>indexering</strong>spolicy att rätta sig efter. Den styr bland annat<br />

antalet termer som får indexeras, vilka delar av ett dokument som ska indexeras <strong>och</strong><br />

huruvida alla ämnen som behandlas i dokumentet ska täckas in eller endast de mest<br />

centrala. Med uttömmande <strong>indexering</strong> menas att fler termer används så att alla aspekter<br />

av dokumentet täcks, medan selektiv <strong>indexering</strong> medför att innehållet generaliseras i ett<br />

fåtal termer. (Lancaster 1998, s. 6-8) Exempelvis hade filmen ”Geronimo” indexerats i<br />

en katalog med termerna ”Geronimo” <strong>och</strong> ”Apache indianer”, vilket exemplifierar en<br />

selektiv <strong>indexering</strong>. Samma film indexerades i en filmdatabas med 17 termer, vilket<br />

förmodligen täckte in stora delar av filmens innehåll <strong>och</strong> får räknas som uttömmande<br />

<strong>indexering</strong>. (Lancaster 1998, s 196) Ju fler termer som tilldelas desto större blir<br />

möjligheterna att återvinna dokumentet (Lancaster 1998, s 6-8).<br />

2.1.2 Specificitetsprincipen<br />

Enligt Lancaster är specificitetsprincipen den viktigaste att ta hänsyn till i<br />

<strong>indexering</strong>sprocessen. Med det menar han att <strong>indexering</strong>stermerna bör vara så specifika<br />

som dokumentets ämne tillåter. Och att det oftast är bättre att använda flera specifika<br />

termer än en generell term. Till exempel ett dokument som behandlar citroner, limefrukt<br />

<strong>och</strong> grapefrukt bör indexeras under varje frukt separat istället för att använda den mer<br />

generella termen citrusfrukter eller frukt. Detta för att man ska kunna skilja på generella<br />

<strong>och</strong> specifika dokument. Ibland innehåller inte kontrollerade vokabulärer den mest<br />

specifika termen som dokumentets ämnesinnehåll kräver. Det vill säga vokabulären<br />

tillåter inte att resultatet av ämnesanalysen uttrycks till önskad nivå. I sådana situationer<br />

hänvisas indexeraren till att använda vokabulärens mest specifika term. Lancaster menar<br />

att indexeraren i sådana fall bör meddela de ansvariga för vokabulären så att nya termer<br />

inom berört ämnesområde kan tas fram <strong>och</strong> på så vis hålla vokabulären uppdaterad.<br />

(1998, s. 28-30)<br />

2.1.3 Recall <strong>och</strong> precision<br />

Den viktigaste uppgiften ett IR-system har är att återvinna så många relevanta dokument<br />

som möjligt <strong>och</strong> så få oanvändbara som möjligt. För att mäta systemets effektivitet<br />

använder man sig av två centrala begrepp: precision <strong>och</strong> recall. Med precision menas<br />

relationen mellan antalet relevanta dokument som återvunnits <strong>och</strong> antalet återvunna<br />

dokument totalt. Recall, eller återvinningsgrad, talar om hur många relevanta dokument<br />

man återvunnit i förhållande till antalet relevanta dokument i hela databasen. Det viktiga<br />

<strong>och</strong> kanske det svåraste när man bygger upp <strong>indexering</strong>ssystemet är att hitta en balans<br />

mellan dessa två begrepp, eftersom hög recall oftast ger en lägre precision <strong>och</strong> vice<br />

versa.(Benito 2001, s. 245-247)<br />

2.1.4 Post- <strong>och</strong> prekoordinering av termer<br />

Postkoordinering innebär att man använder ett antal <strong>indexering</strong>stermer vid sökningar i<br />

det indexerade materialet, eller att man kombinerar termerna till en ”sökprofil”.<br />

Prekoordinering innebär att termerna i ett register på förhand är ordnade i<br />

ordkombinationer – vanligtvis upp till fyra termer som täcker innehållet i dokumentet<br />

som hänvisas. (Benito 2001, s. 295)<br />

10

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!