Musik och indexering i folkbiblioteken - BADA - Högskolan i Borås
Musik och indexering i folkbiblioteken - BADA - Högskolan i Borås
Musik och indexering i folkbiblioteken - BADA - Högskolan i Borås
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
De flesta indexerare har en <strong>indexering</strong>spolicy att rätta sig efter. Den styr bland annat<br />
antalet termer som får indexeras, vilka delar av ett dokument som ska indexeras <strong>och</strong><br />
huruvida alla ämnen som behandlas i dokumentet ska täckas in eller endast de mest<br />
centrala. Med uttömmande <strong>indexering</strong> menas att fler termer används så att alla aspekter<br />
av dokumentet täcks, medan selektiv <strong>indexering</strong> medför att innehållet generaliseras i ett<br />
fåtal termer. (Lancaster 1998, s. 6-8) Exempelvis hade filmen ”Geronimo” indexerats i<br />
en katalog med termerna ”Geronimo” <strong>och</strong> ”Apache indianer”, vilket exemplifierar en<br />
selektiv <strong>indexering</strong>. Samma film indexerades i en filmdatabas med 17 termer, vilket<br />
förmodligen täckte in stora delar av filmens innehåll <strong>och</strong> får räknas som uttömmande<br />
<strong>indexering</strong>. (Lancaster 1998, s 196) Ju fler termer som tilldelas desto större blir<br />
möjligheterna att återvinna dokumentet (Lancaster 1998, s 6-8).<br />
2.1.2 Specificitetsprincipen<br />
Enligt Lancaster är specificitetsprincipen den viktigaste att ta hänsyn till i<br />
<strong>indexering</strong>sprocessen. Med det menar han att <strong>indexering</strong>stermerna bör vara så specifika<br />
som dokumentets ämne tillåter. Och att det oftast är bättre att använda flera specifika<br />
termer än en generell term. Till exempel ett dokument som behandlar citroner, limefrukt<br />
<strong>och</strong> grapefrukt bör indexeras under varje frukt separat istället för att använda den mer<br />
generella termen citrusfrukter eller frukt. Detta för att man ska kunna skilja på generella<br />
<strong>och</strong> specifika dokument. Ibland innehåller inte kontrollerade vokabulärer den mest<br />
specifika termen som dokumentets ämnesinnehåll kräver. Det vill säga vokabulären<br />
tillåter inte att resultatet av ämnesanalysen uttrycks till önskad nivå. I sådana situationer<br />
hänvisas indexeraren till att använda vokabulärens mest specifika term. Lancaster menar<br />
att indexeraren i sådana fall bör meddela de ansvariga för vokabulären så att nya termer<br />
inom berört ämnesområde kan tas fram <strong>och</strong> på så vis hålla vokabulären uppdaterad.<br />
(1998, s. 28-30)<br />
2.1.3 Recall <strong>och</strong> precision<br />
Den viktigaste uppgiften ett IR-system har är att återvinna så många relevanta dokument<br />
som möjligt <strong>och</strong> så få oanvändbara som möjligt. För att mäta systemets effektivitet<br />
använder man sig av två centrala begrepp: precision <strong>och</strong> recall. Med precision menas<br />
relationen mellan antalet relevanta dokument som återvunnits <strong>och</strong> antalet återvunna<br />
dokument totalt. Recall, eller återvinningsgrad, talar om hur många relevanta dokument<br />
man återvunnit i förhållande till antalet relevanta dokument i hela databasen. Det viktiga<br />
<strong>och</strong> kanske det svåraste när man bygger upp <strong>indexering</strong>ssystemet är att hitta en balans<br />
mellan dessa två begrepp, eftersom hög recall oftast ger en lägre precision <strong>och</strong> vice<br />
versa.(Benito 2001, s. 245-247)<br />
2.1.4 Post- <strong>och</strong> prekoordinering av termer<br />
Postkoordinering innebär att man använder ett antal <strong>indexering</strong>stermer vid sökningar i<br />
det indexerade materialet, eller att man kombinerar termerna till en ”sökprofil”.<br />
Prekoordinering innebär att termerna i ett register på förhand är ordnade i<br />
ordkombinationer – vanligtvis upp till fyra termer som täcker innehållet i dokumentet<br />
som hänvisas. (Benito 2001, s. 295)<br />
10