10.08.2013 Views

Taksonomikonstruktion - Strukturering af IDAs ... - Forskning

Taksonomikonstruktion - Strukturering af IDAs ... - Forskning

Taksonomikonstruktion - Strukturering af IDAs ... - Forskning

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Taksonomikonstruktion</strong><br />

- <strong>Strukturering</strong> <strong>af</strong> <strong>IDAs</strong> vidensunivers<br />

Det erhvervsrelaterede projekt<br />

Danmarks Biblioteksskole 2009<br />

Skrevet <strong>af</strong>:<br />

Hans Christian Kjær Hvillum & Leon Hetlevik<br />

Vejleder:<br />

Karen Birgitte Philipson<br />

Antal ord: 9.823<br />

Afleveringsdato: 5. januar 2009


Ud for de <strong>af</strong>snit som Leon Hetlevik har skrevet, står der (LH). Ud for de <strong>af</strong>snit som Hans Christian<br />

Kjær Hvillum har skrevet, står der (HCKH).<br />

ABSTRACT (HCKH OG LH) ......................................................................................................................................... 3<br />

INDLEDNING (HCKH OG LH) ..................................................................................................................................... 4<br />

PROBLEMFORMULERING (HCKH OG LH) ............................................................................................................ 5<br />

BEGREBSAFKLARING (HCKH OG LH) ................................................................................................................... 6<br />

METODE (LH) ................................................................................................................................................................. 7<br />

FORANALYSE .................................................................................................................................................................. 7<br />

KONSTRUKTION .............................................................................................................................................................. 7<br />

PROCESAFSNIT ............................................................................................................................................................. 9<br />

PLANLÆGNINGSFASEN (LH) ........................................................................................................................................... 9<br />

Enumerative og facetterede systemer ........................................................................................................................ 9<br />

Kontrollerede vokabularer ...................................................................................................................................... 10<br />

TERMINDSAMLING (HCKH) ......................................................................................................................................... 12<br />

Indsamling <strong>af</strong> termer fra IDA .................................................................................................................................. 13<br />

Interviews ................................................................................................................................................................ 13<br />

Ordoptælling ........................................................................................................................................................... 15<br />

DESIGN OG UDFORMNING AF TAKSONOMIEN (LH) ........................................................................................................ 16<br />

Taksonomiens opbygning ........................................................................................................................................ 16<br />

De ni nøglekriterier ................................................................................................................................................. 19<br />

IMPLEMENTERINGSFASEN (HCKH) ..................................................................................................................... 22<br />

1. REPRÆSENTATIONEN AF TAKSONOMIEN SKAL PLANLÆGGES: ............................................................................. 22<br />

2. TAKSONOMIEN SKAL INTEGRERES I DEN EKSISTERENDE INFRASTRUKTUR: ......................................................... 22<br />

3. STYRINGSPROCESSEN SKAL SIKRES: .................................................................................................................... 22<br />

Vedligeholdelse <strong>af</strong> taksonomien .............................................................................................................................. 22<br />

Tildeling <strong>af</strong> emneord ............................................................................................................................................... 23<br />

Card sorting ............................................................................................................................................................ 25<br />

KONKLUSION (HCKH OG LH) ................................................................................................................................. 26<br />

PERSPEKTIVERING (HCKH OG LH) ...................................................................................................................... 27<br />

LITTERATURLISTE .................................................................................................................................................... 28<br />

FASTFORMSDOKUMENTER ............................................................................................................................................ 28<br />

ELEKTRONISKE DOKUMENTER ...................................................................................................................................... 29<br />

BILAG 1 – TAKSONOMIEN ........................................................................................................................................ 30<br />

BILAG 2 – INTERVIEW ............................................................................................................................................... 35<br />

BILAG 3 – FOREDRAG ................................................................................................................................................ 36<br />

2


Abstract (HCKH og LH)<br />

I denne opgave beskrives processen med at konstruere en taksonomi til ingeniørforeningen i<br />

Danmark (IDA). Formålet med taksonomien er, at strukturere de dokumenter, der ligger på <strong>IDAs</strong><br />

fællesdrev.<br />

Hoveddelen <strong>af</strong> opgaven består <strong>af</strong> et proces<strong>af</strong>snit, der i tre <strong>af</strong>snit forklarer arbejdet.<br />

Første <strong>af</strong>snit omhandler planlægningsfasen. Der redegøres for overvejelser og valg <strong>af</strong> kontrolleret<br />

vokabular og taksonomi, og enumerative og facetterede systemer diskuteres.<br />

I andet <strong>af</strong>snit beskrives de metoder, der er valgt til termindsamling. Det drejer sig om indsamling <strong>af</strong><br />

termer fra <strong>IDAs</strong> allerede eksisterende vokabularer, interviews og ordoptælling. Arbejdet med<br />

metoderne beskrives, og deres anvendelighed vurderes.<br />

Tredje <strong>af</strong>snit beskriver de metoder, der er anvendt til design og udformning <strong>af</strong> taksonomien. Heri<br />

beskrives taksonomiens opbygning, der tager udgangspunkt i PMEST, og de nøglekriterier der er<br />

anvendt, for at sikre en robust struktur.<br />

I opgavens anden del redegøres der for, hvad man skal være opmærksom på under<br />

implementeringsfasen og brug <strong>af</strong> taksonomien. Herunder tildeling <strong>af</strong> emneord, vedligeholdelse <strong>af</strong><br />

taksonomien og brugertest i form <strong>af</strong> card sorting.<br />

Til sidst konkluderes det, hvilke metoder, der viste sig brugbare, og at det er vigtigt, at IDA<br />

etablerer en række foranstaltninger der sikrer, at taksonomien forbliver ”levende” og relevant.<br />

3


Indledning (HCKH og LH)<br />

Logisk håndtering <strong>af</strong> dokumenter og informationsrelationer i projekter og sager, er en voksende<br />

udfordring for de fleste viden- og servicebaserede virksomheder, store som små, hvor mange<br />

informationer, og meget viden dagligt skal håndteres.<br />

Der er et voksende behov for håndtering <strong>af</strong> den stadig stigende og ustrukturerede<br />

informationsmængde, og et behov for struktureret samarbejde på tværs <strong>af</strong> en organisation, og med<br />

eksterne brugere, kunder eller partnere. Samt at vital information ikke går tabt på lokale drev eller i<br />

mails, men er let tilgængelig i korrekt sammenhæng og version, overfor de rette personer.<br />

Alle data og informationer er i dag indeholdt i en ofte komplekst sammenkoblet it-infrastruktur. Det<br />

er disse data og informationer, der tilsammen udgør centrale byggesten i medarbejdernes viden.<br />

Men de gør ingen nytte, hvis medarbejderne ikke kan finde dem. Her er dokumenthåndtering en stor<br />

hjælp. Dokumenthåndtering dækker overordnet over procedurer og systemer, der sikrer, at<br />

dokumenter kan genfindes, så information ikke skal rekonstrueres og viden genopbygges. Det er<br />

nemlig både dyrt og spild <strong>af</strong> tid.<br />

Dokumenthåndtering er således et <strong>af</strong>gørende videndelingsværktøj, og den gode<br />

dokumenthåndtering åbner for kvalitetsmæssige forbedringer og effektiviserede arbejdsgange, når<br />

tiden ikke skal bruges til at genfinde dokumenter i virksomhedens it-arkitektur. Det giver overblik<br />

og dermed klare fordele for organisationen, såvel som for den enkelte medarbejder.<br />

Ingeniørforeningen i Danmark (IDA) er landets største interesseorganisation og fagforening for<br />

tekniske og naturvidenskabelige akademikere. De har ca. 200 ansatte fordelt mellem hovedkontoret<br />

i København, og regionskontorer i Aalborg, Århus og Odense. Foruden at være en fagforening for<br />

ingeniører, har IDA også en konferencevirksomhed, og de beskæftiger sig med påvirkning <strong>af</strong><br />

samfundet gennem lobbyvirksomhed.<br />

IDA har som en del <strong>af</strong> deres Vision IDA 2011, et ønske om at blive ”den førende akademiske<br />

faglige interesseorganisation” 1 . Med deres egne ord:<br />

"Ingeniørforeningen vil kæmpe for de bedst tænkelige<br />

vilkår i kompetenceudvikling, arbejdsliv og familieliv<br />

for sine medlemmer i en balancering <strong>af</strong> de<br />

individuelle, stands- og samfundsmæssige hensyn.” 2<br />

For at opnå denne vision, mener de, at det er vigtigt, at gøre <strong>IDAs</strong> vidensressourcer tilgængelige på<br />

en nem og overskuelig måde.<br />

I den forbindelse udbød IDA seks mulige opgaver for biblioteksskolens erhvervsrelaterede projekt<br />

på 7. semester. Det drejer sig om:<br />

Udarbejdelse <strong>af</strong> en taksonomi<br />

Forslag til etablering <strong>af</strong> søgemaskine<br />

1 Ingeniørforeningen, IDA. (2008).<br />

2 Ibid.<br />

4


Kortlægning <strong>af</strong> informationskilder<br />

Vidensportal på intranettet<br />

Automatisk indeksering og tildeling <strong>af</strong> metadata<br />

Formålet med nærværende opgave er, at konstruere et udkast til et kontrolleret vokabular i form <strong>af</strong><br />

en taksonomi til IDA, fordi vi ser det som værende udgangspunktet for de andre opgaver. Denne<br />

taksonomi skal bruges til at strukturere deres dokumenter, således at deres vidensunivers bliver<br />

mere overskueligt. Det er meningen, at taksonomien skal kunne benyttes <strong>af</strong> alle organisationens<br />

ansatte i deres daglige arbejde. Derfor er der et krav til, at den udover at være bredt dækkende, også<br />

skal kunne anvendes <strong>af</strong> folk, der ikke er informations- eller domænespecialister.<br />

Ordet taksonomi stammer fra de to græske ord: Taxis og nomos. Taxis betyder klassifikation eller<br />

orden, mens nomos betyder styring eller lov. 3 Så en taksonomi er en inddeling <strong>af</strong> fænomener<br />

(objekter eller begreber) i en hierarkisk klassifikation – eller principperne bag klassifikationen <strong>af</strong><br />

samme. 4<br />

Vi har i opgaven lagt vægten på selve konstruktionen <strong>af</strong> taksonomien, og ikke på de efterfølgende<br />

tests og vedligeholdelse. Vi vil dog i opgaven beskrive metoder til disse formål.<br />

Disse overvejelser munder ud i følgende problemformulering:<br />

Problemformulering (HCKH og LH)<br />

Hvordan konstruerer man bedst muligt en taksonomi, der kan bruges til at strukturere <strong>IDAs</strong><br />

vidensunivers?<br />

herunder<br />

Hvilke metoder egner sig bedst til formålet?<br />

Hvordan sikrer man sig at taksonomien forbliver relevant og ”levende”?<br />

3 Bitconomy. (2005, 13. december).<br />

4 Wikipedia, den frie encyklopædi. (2008, 10. december).<br />

5


Begrebs<strong>af</strong>klaring (HCKH og LH)<br />

Emneord/ termer: Vi bruger begrebet term for de ord eller begreber taksonomien består <strong>af</strong>, når de<br />

omtales i forbindelse med taksonomien. Når disse samme termer omtales i forbindelse med<br />

indeksering, kalder vi dem emneord.<br />

Over-/ underordnet term: Med disse begrebene mener vi termer der har en relation til hinanden. Den<br />

overordnede term står et niveau højere i taksonomiens hierarki end den underordnet term, som<br />

således står i underordnet relation til den overordnede. På engelsk bruges parent og child om denne<br />

relationen.<br />

Kategori: Dette begreb bruger vi som en samlebetegnelse for alle de termer der står i niveauet under<br />

en term i taksonomien. Eksempelvis er kategorien Uddannelse alle de uddannelser, der er listet op i<br />

det underordnede niveau.<br />

6


Metode (LH)<br />

Foranalyse<br />

Udgangspunktet for vores projekt var en løst formuleret tekst fra <strong>IDAs</strong> IT-<strong>af</strong>deling, hvor de<br />

efterlyste hjælp til at klassificere og kortlægge <strong>IDAs</strong> vidensressourcer, samt skabe sammenhæng<br />

mellem alle data i deres forretningssystemer. Opgaven var stor og uoverskuelig, og indledningsvis<br />

druknede vi nærmest i <strong>IDAs</strong> planer, visioner og drømme om en fremtid, hvor man nærmest ikke<br />

skulle lede efter noget, det skulle bare dukke op, når man havde brug for det.<br />

Da vi ikke havde noget forkundskab om IDA, var det derfor vigtigt for os, at forstå organisationens<br />

opbygning og hvad de laver, for at finde ud <strong>af</strong>, hvordan vi bedst kunne hjælpe. Denne forståelse fik<br />

vi, ved at konstruere et concept map over organisationen.<br />

Et Concept map er et diagram, der viser sammenhængene mellem koncepter 5 . Det er et gr<strong>af</strong>isk<br />

værktøj til at organisere og repræsentere viden. Idéen er, at disse koncepter er ”omgivet” <strong>af</strong> cirkler<br />

eller bokse, og relationerne mellem dem vises med streger eller pile, der forbinder dem. Disse pile<br />

kan man navngive. F.eks. ”Bliver varetaget <strong>af</strong>”, ”Består <strong>af</strong>”.<br />

Til at konstruere vores Concept map brugte vi programmet CMAP, et freeware-program der er<br />

beregnet til netop at konstruere Concept maps.<br />

Det, der virkelig var givtigt, var processen med at skabe et concept map. Den gav os en forståelse <strong>af</strong><br />

organisationen IDA, samt en masse gode termer.<br />

Med den nyerhvervede viden om <strong>IDAs</strong> opbygning, gik vi i gang med at interviewe personer fra de<br />

forskellige <strong>af</strong>delinger. Spørgsmålene drejede sig om, hvad de laver i <strong>af</strong>delingen, hvilke<br />

informationer de producerer, og hvilke <strong>af</strong> de andre <strong>af</strong>delinger de samarbejder med. Undervejs i<br />

interview-processen fik vi styrket vores forståelse <strong>af</strong> IDA, og de kommunikationsveje de ansatte<br />

bruger.<br />

Konstruktion<br />

Gennem dette indledende arbejde bestemte vi os for at organisere P-drevet, hvor de ansatte gemmer<br />

de fleste <strong>af</strong> deres dokumenter. Der findes ingen faste retningslinjer for, hvordan dokumenterne på Pdrevet<br />

skal organiseres, så hver enkelt medarbejder laver selv sin egen struktur. Denne struktur er<br />

ikke nødvendigvis dårlig, men der opstår problemer, når andre skal finde dokumenter de ikke selv<br />

har produceret. Efter at have gemt dokumenter på p-drevet uden retningslinjer i flere år, må man<br />

sige, at dette system har måttet vige pladsen for kaos.<br />

For at skabe et system i dette kaos, satte vi os for, at konstruere et kontrolleret vokabular, som skal<br />

bruges til at tildele dokumenterne emneord. Sammen med et dokumenthåndteringsprogram vil<br />

emneordene skabe en struktur i deres dokumenter, og deres vidensunivers bliver mere overskueligt.<br />

Det er meningen, at taksonomien skal kunne benyttes <strong>af</strong> alle organisationens ansatte i deres daglige<br />

5 White, H. (2007, 12 marts).<br />

7


arbejde. Derfor er der også et krav til, at den udover at være bredt dækkende, også skal kunne<br />

anvendes <strong>af</strong> folk, der ikke er informations- eller domænespecialister.<br />

Termindsamlingen består <strong>af</strong> både top-down- og bottom-up-metoden 6 . Top-down-metoden har vi<br />

brugt når vi har fundet termer fra allerede eksisterende vokabularer fra IDA. Det er f.eks. listen over<br />

kategorier for nyheder og arrangementer på ida.dk, og termer der blev brugt i det tidligere<br />

journalsystem Axapta. 7 Det anbefales også, at man kigger på eksisterende vokabularer når man skal<br />

konstruere et kontrolleret vokabular 8 .<br />

Bottom-up-metoden har vi brugt, når vi har kigget på dokumenter fra IDA, og udtrukket termer fra<br />

dem. Dokumenterne er hentet fra ida.dk, deres intranet og i mindre grad P-drevet.<br />

Disse to metoder komplimenterer hinanden godt 9 . De har på hver deres måde givet gode termer til<br />

taksonomien.<br />

Vi havde i udgangspunktet tænkt at indsamle termer til taksonomien hovedsageligt ved hjælp <strong>af</strong> et<br />

ordoptællingsprogram som textalyser.net. Ved hjælp <strong>af</strong> zipf’s lov 10 ville vi finde frem til de ”gode<br />

termerne” fra eksemplariske dokumenter taget fra P-drevet. Med eksemplariske dokumenter menes<br />

de dokumenter, der er mere repræsentative for samlingens intellektuelle struktur end andre 11 .<br />

Det viste sig dog, at disse ikke var mulige at skille fra hinanden i praksis, da P-drevet var for<br />

uoverskueligt et system. Vi havde ingen chance for at finde frem til de eksemplariske dokumenter,<br />

og frygtede derfor, at vi ville ende op med termer der ikke var repræsentative for IDA, eller i det<br />

mindste ikke ville dække bredt nok.<br />

I vores begrebsindsamling ledte vi efter opbygning og inddeling i kategorier og klasser. Det var ud<br />

fra disse informationer, vi konstruerede det Concept Map, der hjalp os med at få styr på<br />

organisationens opbygning.<br />

Vi interviewede også otte personer fra forskellige <strong>af</strong>delinger, der kommer til at benytte<br />

taksonomien. 12 Med interviewene ønskede vi at <strong>af</strong>dække respondenternes arbejdsopgaver og<br />

informationsbehov.<br />

Til udarbejdelsen <strong>af</strong> det kontrollerede vokabular, tog vi udgangspunkt i eksisterende teorier<br />

omkring indeksering, og opbygning <strong>af</strong> systemer til indeksering <strong>af</strong> viden. Primært bøgerne:<br />

Organising Knowledge: Taxonomies, Knowledge and Organisational Effectiveness og Building<br />

Enterprise Taxonomies. Valget faldt primært på disse to bøger, fordi de havde fået gode<br />

anmeldelser på diverse fora. Desuden var det svært, at finde anden litteratur, da<br />

”virksomhedstaksonomier” er et forholdsvist nyt emne.<br />

6<br />

Wikipedia, den frie encyklopædi. (2008, 26. december).down<br />

7<br />

Microsoft Dynamics Axapta er en integreret virksomheds og e-businessløsning. Axaptas hjemmeside:<br />

http://www.microsoft.com/danmark/dynamics/axapta/default.mspx<br />

8<br />

Lykke Nielsen, M. (2001), s. 9.<br />

9<br />

Lykke Nielsen, M. (2001), s. 9.<br />

10<br />

Kowalski, G. J., & Maybury, M. T. (2000), s. 14.<br />

11<br />

Blair, D. C., & Kimbrough, S. O. (2001), s. 366.<br />

12<br />

Det drejer sig om: IT-<strong>af</strong>delingen, Fællessekretariatet, Kommunikations<strong>af</strong>delingen, HR-<strong>af</strong>delingen, Rådgivning og<br />

Forhandling, Politisk interessevaretagelse.<br />

8


Proces<strong>af</strong>snit<br />

I dette <strong>af</strong>snit beskriver vi, hvilke overvejelser vi har gjort under udarbejdelsen <strong>af</strong> taksonomien, de<br />

valg vi har truffet, og hvilke teorier vi har anvendt. Afsnittet er tredelt. Første del omhandler<br />

planlægningsfasen, dvs. de tanker, der lå forud for selve konstruktionen <strong>af</strong> taksonomien, og de valg<br />

der skulle træffes i forbindelse med dem. Anden del omhandler de metoder vi har anvendt i<br />

forbindelse med termindsamlingen, og en vurdering <strong>af</strong>, hvor godt de fungerede. Tredje del<br />

omhandler design og udformning <strong>af</strong> taksonomien, taksonomiens opbygning, og de kriterier vi har<br />

anvendt til at konstruere taksonomien.<br />

Planlægningsfasen (LH)<br />

En taksonomi er et klassifikationssystem med en hierarkisk struktur. I dette <strong>af</strong>snit vil vi forklare de<br />

fordele, der er ved netop sådan et system.<br />

Enumerative og facetterede systemer<br />

Klassifikationssystemer kan opdeles i henholdsvis enumerative og facetterede systemer. Der er<br />

fordele og ulemper lige meget hvilket klassifikationssystem man vælger. I dette <strong>af</strong>snit vil vi kort<br />

beskrive forskellene på de to systemer, og hvorfor vi har valgt det ene frem for det andet.<br />

Et enumerativt system 13 , er et system, hvor alle tænkelige emner, både enkle og sammensatte, er<br />

udtrykt i klasser på forhånd. Det kan være et specielt system, der dækker et nærmere defineret<br />

område, som f.eks. økonomi, eller det kan være et universelt system, der forsøger at udtrykke<br />

klasser for alle emner overhovedet. Et eksempel på sidstnævnte er folkebibliotekernes DK5.<br />

Enumerative systemer har en kort og gennemskuelig notation, de er intuitivt lette at anvende, og<br />

strukturen er sædvanligvis let at gennemskue. Skal man konstruere et enumerativt system fra<br />

bunden, er dette imidlertid en noget omfattende og besværlig proces. Det er dog kun for<br />

konstruktøren, men det betyder, at det er økonomisk omkostningstungt. Det er svært at få alle<br />

nuancerne i emnerne med, samtidig med, at det kan være vanskeligt, at placere et emne i én og kun<br />

én klasse. Nye emner kan ikke tilføjes, hvilket betyder, at det ikke kan udbygges i takt med<br />

domænets eventuelle udvikling <strong>af</strong> nye begreber. Derfor vil jævnlige revisioner være nødvendige, og<br />

det kan være dyrt, hvis domænet er præget <strong>af</strong> hurtig udvikling <strong>af</strong> nye emner og begreber. Det er<br />

vores vurdering, at et enumerativt system vil kræve for omfattende opdateringer i et dynamisk miljø<br />

som <strong>IDAs</strong>, hvor nye begreber opstår regelmæssigt. Det vil ikke være fleksibelt nok.<br />

Vi har derfor valgt, at konstruere et facetteret klassifikationssystem 14 . Facetterede systemer er<br />

systemer, hvor strukturen er fleksibel. Med andre ord, er kun de enkle klasser udtrykt i systemet og<br />

de sammensatte klasser udtrykkes således i notationen. Disse opbygges ved at analysere det<br />

emneområde, der skal dækkes i det antal begrebskategorier (facetter), der er tilstrækkeligt til at<br />

beskrive emnerne. Sammensatte emner har således ikke en indbygget klasse, men udtrykkes ved at<br />

kombinere de pågældende facetters notationselementer. De facetterede systemer kan være mere<br />

eller mindre frie eller stramme <strong>af</strong>hængig <strong>af</strong> valget <strong>af</strong> regler og principper for konstruktionen.<br />

Et eksempel herpå er den Universelle DecimalKlassifikation (UDK), der bruges <strong>af</strong> mange<br />

forsknings- og firmabiblioteker, som har behov for en elastisk struktur, der passer til lige netop<br />

13<br />

Stewart, D. L. (2008), s. 59.<br />

14<br />

Ibid, s. 61.<br />

9


deres specifikke fagområde. UDK rummer dog enkelte elementer fra det enumerative system,<br />

hvilket gør, at det kun kan betegnes som et næsten facetteret system.<br />

Da vi i vores taksonomi har forsøgt, at dække alle aspekter <strong>af</strong> IDA, indeholder den også elementer<br />

fra det enumerative system.<br />

Facetterede systemer er forholdsvis lette at konstruere, og det er problemfrit, at oprette nye emner,<br />

idet notationen blot udbygges. Ligeledes er fleksibiliteten stor mht. nuancerede eller komplekse<br />

emner.<br />

Den største begrænsning eller ulempe (udfordring) ved det facetterede klassifikationssystem, er den<br />

udbyggede notation. Ligeså specifikt man kan udtrykke et emne, ligeså uoverskueligt kan det blive,<br />

særligt for dem, der ikke beskæftiger sig med informationssøgning på daglig basis. Dette forbehold<br />

gælder dog sædvanligvis kun for universelle facetterede klassifikationssystemer, der skal rumme<br />

mange områder og komplekse emner. Vi har forsøgt at tage højde for dette, ved at konstruere<br />

taksonomien ud fra ni kriterier, som bliver beskrevet senere i dette <strong>af</strong>snit.<br />

Kontrollerede vokabularer<br />

I dette <strong>af</strong>snit vil vi forklare, hvad kontrollerede vokabularer er, og nævne nogle eksempler på disse.<br />

Ved hjælp <strong>af</strong> dette vil vi komme frem til, hvorfor vi har valgt, at konstruere netop en taksonomi, og<br />

ikke en anden form for kontrolleret vokabular.<br />

Et kontrolleret vokabular består <strong>af</strong> nogle på forhånd udarbejdede, standardiserede termer, der kan<br />

bruges til at beskrive et emneområde eller informationsdomæne 15 . De sikrer en vis grad <strong>af</strong><br />

ensartethed og konsistens, hvilket er praktisk og hensigtsmæssigt, når der ikke er tilknyttet faste<br />

indeksører. Søgning bliver overskuelig, idet de på forhånd givne, standardiserede termer kan søges<br />

efter – disse kan scannes eller søges på listen i fysisk form.<br />

En <strong>af</strong> fordelene ved et kontrolleret vokabular er, at man derved samler dokumenterne under<br />

bestemte, på forhånd autoriserede termer. Hermed muliggør man en høj grad <strong>af</strong> præcision. Ved brug<br />

<strong>af</strong> ukontrollerede emneord (termer??) risikerer man, at få mange forskellige emnedefinitioner <strong>af</strong><br />

dokumenter, som sagtens kunne være samlet under ét. Dermed risikerer man, at skulle søge i flere<br />

forskellige kategorier, for at få et udtømmende søgesæt. Desuden vil man aldrig kunne være sikker<br />

på, at få et udtømmende søgeresultat, da ingen har overblik over, hvilke emneord der egentlig er<br />

tildelt.<br />

Bruges der udelukkende kontrolleret sprog, kan der naturligvis ikke søges på, eller tildeles ord<br />

udenfor hierarkiet 16 . Dette kan resultere i, at fleksibiliteten bliver mindre og søgningen stiv. Der<br />

forekommer evt. tab <strong>af</strong> specificitet, f.eks. hvis et særligt begreb fra dokumentet skal udtrykkes med<br />

et mere generelt begreb. Dette mener vi dog at tage hensyn til, ved at man kan kontakte<br />

administratoren, hvis der mangler et emneord (læs <strong>af</strong>snittet om brug <strong>af</strong> taksonomien).<br />

Der findes flere forskellige former for kontrollerede vokabularer, og de har varierende grad <strong>af</strong><br />

kontrol og kompleksitet 17 . Den simpleste type er en synonym-ring, der er en måde at associere alle<br />

15 Stewart, D. L. (2008), s. 51.<br />

16 Lancaster, F. W. (1998), s. 14.<br />

17 Stewart, D. L. (2008), s. 51.<br />

10


kendte variasioner <strong>af</strong> en term. Det være sig synonymer, akronymer eller kendte fejlstavelser. På den<br />

måde vil man, når man søger på en term, også søge på alle de termer, der er forbundet med<br />

søgetermen. Synonym-ringen hjælper således med at finde dokumenter, der omhandler ting der<br />

søges på, og kan give en god recall, men der er ikke en særlig høj grad <strong>af</strong> precision i søgningen. 18<br />

En måde at forbedre synonym-ringen på, er ved at identificere en foretrukken term (authority file)<br />

blandt de associerede termer. Hvis man så søger på en ikke-foretrukken term, vil man blive ledt hen<br />

til den foretrukne. Både synonym-ringe og foretrukne termer kan forbedre søgningen i forhold til<br />

fritekstsøgning, men de hjælper på ingen måde søgeren med at artikulere sine informationsbehov.<br />

Til at guide søgeren rundt i vidensuniverset, og hjælpe til at finde frem til informationsbehovet, er<br />

taksonomiens hierarkiske struktur en stor hjælp. Hierarkierne er bygget op <strong>af</strong> tre basisrelationer 19 :<br />

- er en type<br />

- er en del <strong>af</strong><br />

- er et tilfælde <strong>af</strong><br />

Det gode ved at stille termerne op i relationshierarkier er, at hvis søgeren ikke finder nok brugbar<br />

information, kan han bevæge sig op i hierarkiet, og søge på en bredere term. Modsat kan søgeren,<br />

hvis han får for meget støj, bevæge sig ned i hierarkiet til en mere specifik term.<br />

Problemer med en taksonomi kan opstå, hvis termerne ikke ligger der, hvor søgeren mener de burde<br />

ligge. Det er vigtigt for at taksonomien skal opnå og fastholde succes, at brugerne har tillid til den 20 .<br />

For at forhindre dette problem anbefales det, at en person bliver udvalgt til at have hovedansvaret<br />

for vedligeholdelse og opdatering <strong>af</strong> taksonomien 21 , så brugerne kan henvende sig, hvis der er<br />

termer der mangler, eller befinder sig på en forkert plads. 22<br />

Det mest komplekse kontrollerede vokabular er tesaurusen. Kernestrukturen her er også hierarkisk,<br />

men den strækker sig også videre til at medtage relaterede termer ud over taksonomiens<br />

basisrelationer 23 . Termerne kan derfor forbindes på tværs <strong>af</strong> hierarkier, ved at være relaterede ud<br />

over taksonomiens bredere/smallere relation. Flere relationer mellem termerne skaber en bedre<br />

kontrol over søgningen end nogle <strong>af</strong> de andre nævnte kontrollerede vokabulerer, men der er også en<br />

pris at betale. Tesauruser er svære at vedligeholde, og kræver flere ressourcer end f.eks. en<br />

taksonomi eftersom relationerne er mere komplekse.<br />

For at strukturere <strong>IDAs</strong> vidensunivers, har vi derfor som tidligere beskrevet valgt, at konstruere en<br />

taksonomi.<br />

Til at begynde med forestillede vi os, at taksonomien skulle bruges til at systematisere<br />

mappestrukturen på <strong>IDAs</strong> P-drev. Tanken var, at dette ville give et godt overblik over, hvor<br />

forskellige dokumenter lå, ved at man kunne kalde mappen for netop det indholdet omhandlede.<br />

Dette viste sig desværre at ikke holde i praksis, da denne metode ikke ville kunne opretholde en høj<br />

18<br />

Mere om precision og recall i <strong>af</strong>snitttet omhandlende tildeling <strong>af</strong> emneord.<br />

19<br />

Stewart, D. L. (2008), s. 54.<br />

20<br />

Lykke Nielsen, M. (1999), s 526.<br />

21<br />

Ibid.<br />

22<br />

Mere om dette i <strong>af</strong>snittet omhandlende… eller bare et sidetal…<br />

23<br />

Stewart, D. L. (2008), s. 57.<br />

11


genfinding, når systemet indeholdt et stort antal dokumenter. Kort fortalt vil systemet miste sin<br />

værdi så snart der kommer for mange dokumenter under en term i taksonomien, fordi man så skulle<br />

lede efter dokumenterne i lister <strong>af</strong> andre dokumenter med samme specifikationer. Det enkelte<br />

dokument vil således blive nærmest usynligt i mængden <strong>af</strong> andre lignende dokumenter, og man får<br />

en lav precision i søgningen. Desuden havde man allerede forsøgt det i en <strong>af</strong> <strong>af</strong>delingerne, og<br />

resultatet var, at den mappestruktur ikke blev brugt.<br />

Vi lagde os derefter fast på, at termerne i taksonomien skulle bruges som emneord. På denne måde<br />

vil man kunne tillægge flere emneord, hvorimod hvert dokument ville blive gemt under en enkelt<br />

term, hvis vi havde valgt, at bruge taksonomien til en mappestruktur. Ved brug <strong>af</strong> flere emneord vil<br />

vi få en højere precision i søgningen.<br />

Overvejelserne omkring, hvordan taksonomien skal fungere og se ud, bygger hovedsageligt på<br />

teorier omkring taksonomikonstruktion og, mere generelt, omkring konstruktion <strong>af</strong> kontrollerede<br />

vokabularer. Da der ikke findes nogen taksonomi-standard, er det mere anbefalede retningslinjer vi<br />

følger 24 . Hvor teorierne er modstridende, eller på anden måde åbner op for fortolkning, har vi taget<br />

udgangspunkt i hvad vi mener, vil være bedst i den konkrete situation - dvs. tildeling <strong>af</strong> emneord til<br />

<strong>IDAs</strong> dokumenter - ud fra den viden, vi har opnået gennem brug <strong>af</strong> metoderne.<br />

Termindsamling (HCKH)<br />

Det overordnede formål med at indeksere og/eller klassificere er, at kunne genfinde dokumenter ud<br />

fra deres emne. For at kunne genfinde et dokument ud fra forskellige kriterier (f.eks. forfatter, titel<br />

eller emne), må der udarbejdes en dokumentrepræsentation. Med andre ord en post, der beskriver<br />

dokumentets data og som kan hentes frem i stedet for hele dokumentet.<br />

Ved valg <strong>af</strong> begreber, bør det overordnede kriterium være et begrebs mulige værdi som indikator<br />

for et dokuments emne. Hvad angår emnets bestemmelse, hersker der en manglende konsensus i<br />

indekseringsteoretisk litteratur, og der findes således flere forskellige (videnskabsteoretiske) måder<br />

at gribe det an på. 25 Oftest vil indekseringsprocessen være en blanding <strong>af</strong> disse tilgange, dvs. at<br />

man mere eller mindre kan sammensætte de forskellige komponenter, så det passer til<br />

organisationens behov. Vi har således valgt, at anvende flere forskellige metoder til<br />

termindsamlingen. Disse bliver beskrevet senere i dette <strong>af</strong>snit.<br />

Når man vælger de begreber, der skal udtrykke et dokuments emne, må man holde sig formålet med<br />

databasen for øje. Begreberne ekshaustivitet 26 (indekseringsdybde) og specificitet 27<br />

(detaljeringsgrad) udtrykker, hvor omfattende og detaljeret, man ønsker at registrere et dokument,<br />

hvilket igen er knyttet til organisationens behov. Med andre ord, er man kun interesseret i bestemte<br />

facetter <strong>af</strong> et dokuments emne, eller ønsker man en fuldstændig registrering. Ligeledes kan man<br />

være mere eller mindre detaljeret i udtrykket <strong>af</strong> et emne. Indekseres et dokument om psykisk<br />

arbejdsmiljø under termen arbejdsmiljø, er det udtryk for lav specificitet, og indekseres det omvendt<br />

som psykisk arbejdsmiljø for statsansatte civilingeniører, er det udtryk for høj specificitet.<br />

24 Levy, T. (2004), s. 2.<br />

25 Jens-Erik Mai beskriver i artiklen Deconstructing the Indexing Process en række <strong>af</strong> disse måder, men det ligger uden<br />

for denne opgaves fokus, at beskrive dem nærmere her.<br />

26 Lancaster, F. W. (1998), s. 23.<br />

27 Ibid, s. 19.<br />

12


Stewart anbefaler, at man begynder at udforme taksonomien, når man har en pulje på 100-500<br />

termer. 28 I de følgende <strong>af</strong>snit vil vi beskrive og forklare de metoder vi har valgt at anvende til denne<br />

dataindsamling, samt hvad vi fik ud <strong>af</strong>, at anvende dem.<br />

Indsamling <strong>af</strong> termer fra IDA<br />

Det første vi gjorde i dataindsamlingsfasen var, at kigge på de eksisterende vokabularer, der<br />

allerede fandtes i IDA. Disse ressourcer <strong>af</strong>spejler, hvordan medarbejderne interagerer med<br />

informationsressourcerne indenfor IDA.<br />

Det er vigtigt, at anvende termer, som bliver brugt internt i organisationen. 29 De links og labels, der<br />

bliver brugt på intranettet og på hjemmesiden, repræsenterer et ”ad-hoc”-forsøg på en<br />

termstandardisering, selv om de selvfølgelig ofte udelukkende repræsenterer administratorens<br />

tanker. Det samme gør sig gældende for organisationens hjemmeside. Dette giver mulighed for, at<br />

finde frem til interne terminologier. Derfor er titler, navigationsknapper og pulldown-menupunkter,<br />

fra både interne og eksterne websider, gode ressourcer for termer.<br />

Vi fik adgang til <strong>IDAs</strong> intranet, medlemslogin til ida.dk og <strong>IDAs</strong> fællesdrev (P-drevet). Vi fik også<br />

udleveret lister over emneord de tidligere havde benyttet i deres journalsystem, samt de emneord de<br />

benytter på deres dokumenter omhandlende nyheder og arrangementer. 30<br />

Derudover har vi brugt søgefunktionen på <strong>IDAs</strong> hjemmeside til at lokalisere endnu flere termer. Var<br />

vi i tvivl om, hvad en term dækkede over, eller indeholdt <strong>af</strong> underemner, foretog vi en søgning.<br />

Denne metode gav en masse termer, som vi første omgang ikke havde fået øje på.<br />

Denne metode viste sig, at være den mest givtige, og gav os en masse ”gratis” termer. Samtidig gav<br />

disse allerede eksisterende vokabularer os en idé om den struktur, der er i organisationen, og gjorde,<br />

at vi kunne danne os et overblik over domænet. Dette hjalp os til at identificere, hvilke dokumenter,<br />

og klasser <strong>af</strong> dokumenter, der er vigtigst for brugerne.<br />

Interviews<br />

Det overordnede formål med vores interviews var, at få en idé om, hvad de arbejder med rundt om i<br />

de forskellige <strong>af</strong>delinger, og få sat nogle ord på det. Tanken var, at finde termer til vores concept<br />

map, og i sidste ende til selve taksonomien. Desuden mente vi, at interviewene kunne bruges som et<br />

testværktøj til taksonomien. At man ud fra interviewene kunne opstille nogle test-scenarier, så man<br />

kunne teste, om lige netop disse dokumenter kunne beskrives ved hjælp <strong>af</strong> taksonomien.<br />

Vi valgte at foretage individuelle interviews, fordi de gav os mulighed for, at komme i dybden med<br />

spørgsmålene, og fordi det med én respondent er nemmere at <strong>af</strong>læse, hvornår et emne er<br />

uddebatteret, og hvornår der er mulighed for, at komme et spadestik dybere. 31<br />

28 Stewart, D. L. (2008), s. 99.<br />

29 Lykke Nielsen, M. (2004), s. 15.<br />

30 Se metode<strong>af</strong>snittet.<br />

31 BAR-eva.dk. (2005b).<br />

13


Det overordnede kriterium for udvælgelse <strong>af</strong> respondenter til en kvalitativ undersøgelse er<br />

relevans. 32 Her støttede vi os meget til vores kontaktperson hos IDA, fordi hun havde kendskab til,<br />

hvem i de enkelte <strong>af</strong>delinger, det ville være relevant at interviewe.<br />

Vores interviewguide 33 består <strong>af</strong> 12 spørgsmål, som er rangeret så de kommer i en naturlig<br />

rækkefølge. Der er udelukkende tale om spørgsmål omhandlende konkrete arbejdsforhold. Hvert<br />

interview var sat til at vare 20-30 minutter, og denne tidsplan viste sig at holde. Interviewguiden<br />

hviler på en eksplorativ tilgang. Det vil sige, at guiden skal opfattes som en ramme, der skitserer<br />

interviewets forløb. Interviewguiden satte os derfor i stand til, på en gang at bevare formål og<br />

struktur, ved kritisk at forfølge svarene, samtidig med, at sikre en vis spontanitet og åbenhed under<br />

forløbet. Således, at vi kunne indhente uforudsete kommentarer fra brugerne. 34<br />

Vi var begge til stede under interviewene, og rent praktisk gjorde vi det, at den ene stillede<br />

spørgsmålene, mens den anden noterede svarene. 35 Dette gjorde, at intervieweren kunne<br />

koncentrere sig om interviewets <strong>af</strong>vikling. I stedet for at optage interviewene, valgte vi<br />

udelukkende, at skrive stikordsreferater <strong>af</strong> dem. Dette gjorde vi, for ikke at anvende for mange<br />

ressourcer til bearbejdningen <strong>af</strong> interviewene. Både fordi der ikke var behov for at gå så meget i<br />

dybden, og fordi vi ikke havde behov for at citere fra interviewene. 36<br />

Når det var muligt, blev interviewene foretaget på medarbejdernes egen arbejdsplads. Dette gjorde,<br />

at de kunne vise os eksempler fra deres arbejde, samtidig med, at de svarede på spørgsmålene. Dette<br />

gav os en god forståelse for deres arbejdssituation, og vi kunne se de problemer de havde med at<br />

finde information. 37 Når det ikke var muligt, blev interviewene foretaget på det kontor, vi havde fået<br />

stillet til rådighed. Inden hvert interview informerede vi respondenterne om formålet med, og emnet<br />

for interviewet. Vi stillede direkte spørgsmål, og hvis respondenterne kom ud <strong>af</strong> en tangent,<br />

forsøgte vi at få dem tilbage på sporet igen. Nogle gange gav disse tangenter dog gode resultater, og<br />

hvis respondenterne begyndte at svare på tidligere spørgsmål, <strong>af</strong>brød vi dem selvfølgelig heller<br />

ikke.<br />

Interviewene gav os nogle gode termer, og var også til hjælp, da vi skulle validere rigtigheden <strong>af</strong> de<br />

termer vi allerede havde valgt. Respondenternes svar fortalte os noget om, hvad man må kunne<br />

forvente, at dokumenterne der produceres rundt omkring i de forskellige <strong>af</strong>delinger omhandler. Ud<br />

fra dette kunne vi foretage prøveindeksering <strong>af</strong> fiktive dokumenter, og fik dermed et indblik i, om<br />

de kunne beskrives med taksonomien.<br />

En vigtig sidegevinst ved disse interviews var, at vi kom rundt i de forskellige <strong>af</strong>delinger, og<br />

præsenteret os selv og taksonomien, så de kommende brugere blev inddraget i processen med at<br />

skabe en taksonomi som de i sidste ende selv skal bruge.<br />

32<br />

BAR-eva.dk. (2005a).<br />

33<br />

Se bilag???<br />

34<br />

Interviewguiden er baseret på Steiner Kvales Interview – En introduktion til det kvalitative forskningsinterview, 1998<br />

– forbandet vrøvl!!!<br />

35<br />

Da der således udelukkende er tale om noter, er disse interviews ikke vedlagt opgaven.<br />

36 BAR-eva.dk. (2005a).<br />

37 BAR-eva.dk. (2005b).<br />

14


Ordoptælling<br />

Ikke alle metoder viste sig, at være brugbare. Vi ønskede, at foretage en ordoptælling på en række<br />

eksemplariske dokumenter. Resultaterne fra denne ordoptælling ville vi bruge som et supplement til<br />

de andre metoder.<br />

Eksemplariske dokumenter, er dokumenter, der beskriver eller viser den intellektuelle struktur<br />

indenfor et bestemt domæne. 38 Derved kan de fungere som udgangspunkt for et<br />

”indekseringsvokabular” for det område, og endnu vigtigere så giver de en narrativ kontekst i<br />

hvilken disse termer giver bedre mening. Derfor er det nemmere, at konstruere et indekseringssprog<br />

ud fra eksemplariske dokumenter, end det er, at gøre det fra bunden. I vores tilfælde ville et<br />

eksemplarisk dokument altså være et dokument, der viser strukturen og arbejdsgangene indenfor en<br />

bestemt <strong>af</strong>deling.<br />

Udfra en række kriterier vi havde formuleret, ville vi udvælge de eksemplariske dokumenter fra<br />

<strong>IDAs</strong> fællesdrev, det såkaldte P-drev. Disse dokumenter ville vi derefter samle efter <strong>af</strong>delinger, så<br />

vi nåede op på ca. 5000 ord pr. <strong>af</strong>deling. Fordelen ved at samle dokumenterne efter <strong>af</strong>deling var, at<br />

vi herved både kunne benytte korte såvel som lange dokumenter i ordoptællingen. Zipfs lov<br />

foreskriver, at korpusset <strong>af</strong> ord, skal bestå <strong>af</strong> min. 5000 ord, for at resultatet er brugbart. 39<br />

Dette tekstkorpus ville vi herefter køre gennem ordoptællingsprogrammet Textalyser 40 , der tæller<br />

forekomsten <strong>af</strong> ord. Programmet udstyrede vi med en stopordsliste, der indeholdt præpositioner,<br />

pronominer, adverbier og de mest frekvente verber. Denne skulle bruges til, at sortere højfrekvente<br />

ord som f.eks. ’og’, ’som’ og ’eller’ fra. Rent praktisk foregår denne ordoptælling ved, at<br />

programmet tæller ord- eller frasefrekvenser i dokumentet, og rangerer dem i forhold til deres<br />

forekomst. De ord der optræder flest gange, anses sædvanligvis som mest relevante og kommer til<br />

at optræde som emneord. Der kan også anvendes en ’stemmer’, dvs. en funktion der faciliterer<br />

søgning på ordstammerne.<br />

Ord eller fraser der optræder hyppigt i et dokument, optræder måske også hyppigt i hele basen og<br />

bliver derfor mindre signifikante at søge på. Man kan i denne forbindelse ’vægte’ ord eller fraser i<br />

forhold til, hvor signifikante de er. Dette kaldes relativ frekvens. Gode diskriminerende termer vil<br />

således være dem, der optræder forholdsvist sjældent i databasen.<br />

For at udpege disse eksemplariske dokumenter, prøvede vi først at danne os et overblik over<br />

mappestrukturen på P-drevet, ved at udfolde alle mapperne. Men det viste sig, at være et for stort og<br />

uoverskueligt projekt, da vi efter at have udfoldet Analyse-<strong>af</strong>delingens mapper fandt ud <strong>af</strong>, at den<br />

indeholder 1182 undermapper. Analyse-<strong>af</strong>delingen er kun den ene <strong>af</strong> 24 mapper inden for mappen<br />

Afdelinger, som igen er den ene <strong>af</strong> ni ”overmapper”. 41 Selvom alle disse mapper måske ikke er lige<br />

så store, ville det være et kæmpearbejde, alene at skabe sig et overblik. Derfor droppede vi den<br />

tanke. Men vores optælling illustrerer meget godt, hvor uoverskueligt og svært tilgængelige<br />

dokumenterne er hos IDA i dag.<br />

38 Blair, D. C., & Kimbrough, S. O. (2001), s. 366.<br />

39 Wyllys, R. E. (1981), s. 55-56.<br />

40 Textalysers hjemmeside: http://textalyser.net/<br />

41 Ganger man dette regnestykke op, giver det 255.312 mapper i alt! Om tallet så reelt er større eller mindre ved vi ikke,<br />

da vi ikke ved, om Analyse-<strong>af</strong>delingen har mange eller få mapper i forhold til de andre <strong>af</strong>delinger.<br />

15


I udgangspunktet virkede det til at være en god metode, og derfor har vi brugt en del tid på, at få<br />

den til at fungere. Men når informationerne er så ustruktureret lagret, og databasen er så stor (477<br />

GB), som det er tilfældet hos IDA, har vi ikke mulighed for at gennemgå samtlige dokumenter.<br />

Derfor bliver det for tilfældigt, hvilke dokumenter vi udvælger, og i sidste ende, hvilke ord vi<br />

kommer frem til ved ordoptællingen. Vi har således ikke nogen chance for at vurdere, i hvilken grad<br />

de er dækkende, eller hvor dybt ned i de enkelte <strong>af</strong>delinger vi egentlig kommer med de dokumenter<br />

vi udvælger. Dette er et godt eksempel på, at teori ikke altid let lader sig overføre til praksis.<br />

Det bedste havde været, hvis vi i samarbejde med de enkelte <strong>af</strong>delinger havde udvalgt de<br />

eksemplariske dokumenter. Det tillod tiden dog ikke, og desuden er det ikke sikkert, at de ville<br />

kunne udpege eksemplariske dokumenter, der fanger essensen <strong>af</strong>, hvad den pågældende <strong>af</strong>deling<br />

arbejder med.<br />

Design og udformning <strong>af</strong> taksonomien (LH)<br />

Efter således at have indsamlet termer, er næste fase selve udformningen og konstruktionen <strong>af</strong><br />

taksonomien. I dette <strong>af</strong>snit vil vi beskrive, hvordan vi har grebet denne fase an, dvs. hvordan vi har<br />

struktureret disse termer i grupper, og de tanker der ligger bag.<br />

Taksonomiens opbygning<br />

Det øverste niveau i taksonomien er det, vi har lagt mest vægt på. Dette er indgangen til<br />

taksonomien, og for at de underliggende niveauer skal fungere hensigtsmæssigt ser vi det som<br />

vigtigt, at termerne i det øverste niveau er præcist formuleret. Undervejs i arbejdet med<br />

taksonomien har vi ændret navn på termerne i det øverste niveau, efterhånden som vi har fået flere<br />

termer, og en større viden om IDA. Dette ser vi ikke på som noget problem, snarere tvært imod.<br />

Selve arbejdet med at sætte termerne ind i taksonomiens struktur har givet os værdifuld viden om<br />

domænet.<br />

I udarbejdelsen <strong>af</strong> det øverste niveau har vi baseret os løst på Ranganathan's fem klassiske facetter,<br />

kaldet PMEST. Det er tanken om at opdele et område i gensidigt udelukkende facetter vi ser som<br />

nyttige. Den grundlæggende pointe er, at identificere nogle få gensidigt udelukkende kategorier, og<br />

skabe et hierarki for hvert <strong>af</strong> dem 42 .<br />

Vi vurderede, at den klassiske PMEST (Personality, Matter, Energy, Space og Time) ikke ville<br />

fungere så godt i vores specifikke tilfælde 43 . Vi havde svært ved at få PMEST-facetten Time til at<br />

passe ind, og da denne ene facet faldt ud, kom vi frem til, at vi ville skabe vore egne termer udfra de<br />

termer, vi havde hentet fra IDA. Stewart siger også, at man ikke er bundet til at bruge PMESTfacettene,<br />

men at man finder de passende termer fra den information man er i færd med at<br />

organisere 44 . Derfor definerede vi fem termer udfra de termer, vi havde samlet ind, og den viden vi<br />

har oparbejdet om IDA.<br />

De termer vi er kommet frem til i det overordnede niveau, er:<br />

- Medlemmer<br />

42 Stewart, D. L. (2008), s. 61.<br />

43 Ibid, s. 62.<br />

44 Ibid.<br />

16


- Videndeling<br />

- Dokumenttype<br />

- IDA<br />

- Andre samarbejdspartnere.<br />

”Medlemmer” er den term, der optræder først, fordi det er medlemmerne der er det centrale for<br />

IDA. Herunder kommer de termer, der relaterer sig til <strong>IDAs</strong> medlemmer. Det er meningen, at<br />

dokumenter der omhandler medlemmer skal indekseres med emneord der forklarer, hvilken type<br />

medlemssager dokumentet hovedsagligt omhandler. Indeksøren 45 kan frit vælge udelukkende at<br />

bruge emneord fra denne kategori, på forskellige eller samme niveau, eller kombinere med termer<br />

fra andre overordnede kategorier. Medlemmer er den eneste term vi har beholdt gennem hele<br />

processen, da vi anser denne for at være den mest centrale.<br />

”Videndeling” er den kategori, hvor medarbejdere møder hinanden på en eller anden måde, og<br />

udveksler viden med hinanden. Det kan være et personalemøde, et seminar, eller rådgivning. Hvis<br />

et dokument omhandler videndeling på en eller anden måde mellem medarbejdere i IDA, kan<br />

indeksøren vælge at bruge en term fra denne kategori som emneord. Denne kategori blev tidligere<br />

kaldt Aktiviteter, men blev ændret, da denne term kunne misforstås.<br />

”Dokumenttype” blev tidligere kaldt for Materiale. Denne term definerer vi som værende typen <strong>af</strong><br />

materialer det gældende dokument er. Ved at bruge emneord fra denne kategorien, kan man således<br />

fortælle søgeren, hvad dokumentet er blevet brugt til. Er der tale om et brev, en personalehåndbog<br />

eller et direktiv? Vi forestiller os, at disse emneord typisk bliver brugt til at beskrive dokumenter,<br />

der hovedsagligt har en rolle som en bestemt materialetype.<br />

I kategorien ”IDA” har vi lagt termer for alle <strong>IDAs</strong> <strong>af</strong>delinger og regionale netværk. Hvis et<br />

dokument omhandler, eller på anden måde burde forbindes med en <strong>af</strong> <strong>IDAs</strong> <strong>af</strong>delinger eller<br />

kontorer rundt i landet, kan indeksøren vælge at indeksere med en term fra denne kategori.<br />

”Andre samarbejdspartnere” kan, sammen med kategorien IDA, sammenlignes med PMESTfacetten<br />

Space. Der er tale om et eksisterende sted eller en organisation, hvor en handling kan finde<br />

sted. Vi har valgt, at adskille disse for ikke at sammenblande <strong>IDAs</strong> interne <strong>af</strong>delinger og kontorer<br />

med de eksterne samarbejdspartnere.<br />

I de underliggende niveauer bliver termerne så mere og mere specialiserede. Tanken er, at de<br />

underordnede niveauer skal dække alle aspekter <strong>af</strong> de overordnede. F.eks. skal alle termer under<br />

”Medlemmer” dække alt, der har med medlemmer at gøre.<br />

Termerne i det øverste niveau er ikke opstillet alfabetisk, men efter hvor vigtige vi anser<br />

kategorierne for at være i forbindelse med indeksering. Det er vigtigt at påpege, at denne opstilling<br />

er vor egen, og godt kan ændres inden taksonomien er færdig til brug. For at verificere, at de termer<br />

vi har valgt er brugbare for IDA, må vi tage de ansatte med i udformningen. I <strong>af</strong>snittet<br />

”Kvalitetskontrol og testning <strong>af</strong> taksonomien” vil vi forklare nærmere om, hvilke metoder vi anser<br />

for at være de bedste til dette formål.<br />

45 Hvad enten dette er en person, eller processen bliver varetaget automatisk.<br />

17


For at lette genfindingen, er niveauerne under det øverste niveau er opstillet alfabetisk. Længere<br />

lister med ord bliver hurtigt uoverskuelige, og ved konsekvent at opstille termerne efter et system,<br />

man må antage at alle kender, håber vi at få brugeren <strong>af</strong> taksonomien til at føle sig «hjemme» i<br />

systemet. Alfabetisk rækkefølge må være den mest gennemskuelige systematiseringen <strong>af</strong> ord, og vil<br />

efter vores mening bidrage med øget intuitivitet i systemet. Igen vil vi påpege, at det er meningen<br />

brugerne skal være med til at bestemme udformningen.<br />

Vi har lagt vægt på, at termerne skal være gensidigt udelukkende, dvs. vi ønsker ikke at nogen term<br />

skal optræde mere end én gang. Dette er for at skabe konsistens i taksonomiens struktur, og dermed<br />

undgå forvirring. 46 Hvis det øverste niveau er grundigt gennemtænkt, burde det heller ikke være<br />

nødvendigt med gentagende termer, hvorfor vi har lagt så stor vægt på dette niveau.<br />

Det er meningen, at taksonomien skal være intuitiv for brugeren, og vi har derfor valgt at forsøge at<br />

holde hver termliste i en kategori på maksimalt 15 termer. Dette gør vi, for at brugeren skal kunne<br />

holde taksonomiens overordnede struktur, og samtidig finde frem til de detaljerede termer 47 . Det er<br />

vigtigt, at brugeren <strong>af</strong> taksonomien til hver en tid har nok forståelse for taksonomiens opbygning til<br />

at kunne træffe sit næste valg, og også finde tilbage uden problemer.<br />

Der er en grænse for, hvor mange ting man kan holde i hovedet. 48 Det er dette vi tager højde for, når<br />

vi konstruerer taksonomien ud fra et ønske om, at have maksimalt 15 termer i en termliste.<br />

Psykologen George Miller fandt gennem sine studier det ”magiske tal” 7 ± 2, som er det antal ting<br />

vi kan:<br />

- være opmærksomme på samtidig<br />

- holde i korttidshukommelsen<br />

- skille klart fra hinanden<br />

Miller fandt også ud, at hvis man holdt mere end 15 ting i hovedet samtidig, ville fejlmarginen blive<br />

for stor 49 . Der findes en strategi til at ”narre” hjernen til at huske flere ting, nemlig ved at gruppere<br />

dem sammen. Det er lige præcis denne strategi en taksonomis hiararkiske struktur benytter sig <strong>af</strong> 50 ;<br />

termerne er grupperet under sin forældreterm. Derfor vil det være muligt for en bruger <strong>af</strong><br />

taksonomien, at holde hele strukturen i hovedet så længe vi holder os indenfor grænsen på 15<br />

termer.<br />

Vi har holdt os til 5 termer i det øverste niveau, netop for at optimere brugerens interaktion med<br />

strukturen. De underliggende niveauer efterstræber vi at holde på maksimalt 15 termer. Nogle<br />

steder i taksonomien har vi desværre været nødt til at lave termlister på mere end 15. Dette er under<br />

”Uddannelse” og ”Fagtekniske netværk”, som vi må antage de ansatte i IDA har kenskab til. I lister<br />

med termer, som man må antage at brugerne <strong>af</strong> taksonomien har kendskab til, er det muligt at have<br />

flere end 15 termer, uden at det går ud over evnen til at navigere 51 .<br />

46 Lambe, P. (2007), s. 20.<br />

47 Lambe, P. (2007), s. 186.<br />

48 Ibid, s. 186.<br />

49 Ibid, s. 187.<br />

50 Ibid, s. 190.<br />

51 Ibid.<br />

18


Vores taksonomi består <strong>af</strong> 5 niveauer. Lambe anbefaler udfra Miller og Dunbars magiske tal, at<br />

man ikke har mere end 3 nivauer, da man herefter begynder at miste overblikket, og navigeringen<br />

kan bryde sammen 52 . Men dette er kun anbefalinger, og ikke fastlagte regler. Vi har valgt, at lade<br />

vores taksonomi strække sig over 5 niveauer, og mener dette vil fungere fint, eftersom <strong>IDAs</strong> ansatte<br />

må antages, at have et grundlæggende kendskab til termerne, og har brug for en vis specificitet.<br />

Såfremt termerne er opstillet i et godt system, vil brugerne <strong>af</strong> systemet ikke miste overblikket. En<br />

anden pointe er, at Lambe regner med, at listerne er fyldt op med 15 termer i hver, noget vores<br />

taksonomi ikke er. Selv om der er 5 niveauer, har vi holdt os godt under det antal termer, den<br />

menneskelige hjerne kan arbejde med i 3 niveauer (3.375) 53 .<br />

Under opbygningen <strong>af</strong> de fem niveauer har vi hele tiden holdt relationsforholdet i tankerne. Vi har<br />

brugt alle de tre typer relationer som en taksonomi kan indeholde 54 , men vi har lagt vægt på, at<br />

relationerne skal være de samme indenfor en kategori for at vedholde konsistens. Eftersom det kun<br />

er et udkast til en taksonomi vi har konstrueret, skal disse relationer revideres inden taksonomien<br />

kan tages i brug. Vi forestiller os, at det bedst gøres i samarbejde med dem som skal bruge<br />

taksonomien, eftersom det er dem, der har den mest indgående viden om IDA og hvilke relationer<br />

termerne burde have.<br />

De ni nøglekriterier<br />

Til konstruktionen <strong>af</strong> taksonomien, har vi anvendt ni nøglekriterier for udformningen <strong>af</strong> robuste<br />

taksonomistrukturer. 55 Disse kriterier komplementerer og forstærker hinanden, og skal sikre, at<br />

taksonomien er internt konsistent, meningsfuld for brugerne, nem at navigere i, og varetager sin<br />

vigtigste opgave: At opdele store mængder indhold i mindre dele, der er nemme at navigere rundt i.<br />

De ni nøglekriterier er, at taksonomien skal være:<br />

Intuitiv<br />

Entydig<br />

”Åben”<br />

Konsistent og forudsigelig<br />

Relevant<br />

Sparsommelig<br />

Meningsfuld<br />

Holdbar<br />

Balanceret<br />

Disse ni nøglekriterier, samt hvordan man sikrer sig, at taksonomien overholder dem, bliver<br />

beskrevet nedenfor. Nogle <strong>af</strong> disse kriterier kan man teste for, ved at lade testbrugere indeksere en<br />

række dokumenter vha. taksonomien, mens andre kan testes ud fra den daglige brug <strong>af</strong><br />

taksonomien.<br />

At taksonomien skal være intuitiv at anvende betyder, at den skal være nem at navigere i og bruge.<br />

Brugerne skal således kunne forudsige, i hvilke kategorier de kan finde de termer, de ønsker at<br />

52 Lambe, P. (2007), s, 190.<br />

53 Ibid, s. 191.<br />

54 Se Planlægningsfasen<br />

55 Ibid, s. 199-200.<br />

19


anvende. Om det er intuitivt for brugerne at anvende taksonomien kan man teste ved at observere,<br />

om de hurtigt navigerer frem til det, de søger, uden at gå i blindgyder.<br />

Med entydig menes der, at taksonomien ikke skal tilbyde alternativer. Brugeren må ikke være i tvivl<br />

om, hvilket ord, der er det rigtige. De enkelte termer må derfor ikke findes mere end ét sted i<br />

taksonomien. For at teste, om taksonomien er entydig, kan man se på, om brugerne med det samme<br />

kan identificere de termer de ønsker at bruge, uden først at overveje alternativer.<br />

Åben betyder, at taksonomien skal kunne supportere alt indhold. Taksonomien skal således kunne<br />

rumme nyt indhold, uden at det er nødvendigt med omfattende ekspansioner eller<br />

omstruktureringer. For at sikre sig, at taksonomien er åben, skal man sørge for, at der ikke er store<br />

samlekategorier med blandet indhold. Det er her vigtigt i fællesskab med domænespecialister at<br />

overveje, om fremtidigt indhold kan implementeres i de allerede eksisterende kategorier.<br />

At taksonomien skal være konsistent og forudsigelig betyder, at underkategorierne skal organiseres<br />

således, at det er nemt og logisk for brugerne, at navigere rundt. For at opnå dette, har vi valgt, at<br />

opstille alle termer, på nær dem på det øverste niveau alfabetisk. Dermed kan indeksøren forholde<br />

sig til et fast system. Om taksonomien er konsistent og forudsigelig kan man teste ved at observere,<br />

om brugerne indenfor de enkelte kategorier hurtigt kan navigere hen til den term eller underkategori<br />

de søger, uden først at skulle læse hele listen systematisk igennem.<br />

Med relevant menes der, at taksonomien ud fra et brugerperspektiv bør genspejle de måder, man<br />

normalt organiserer information og viden på i organisationen. For at teste, om taksonomien er<br />

relevant, kan man se på, om de søgetermer eller –fraser som brugerne anvender i deres søgninger,<br />

umiddelbart kan oversættes til en del <strong>af</strong> taksonomien. F.eks. ”referat fra Hovedbestyrelsesmøde<br />

omhandlende IDA Forsikring”. Dette kan man gøre, ved at undersøge log-filerne fra<br />

søgefunktionen.<br />

Sparsommelig betyder, at der ikke må være nogen gentagelser. Taksonomiens struktur skal hverken<br />

tilbyde mere eller mindre end påkrævet. Der kan her opstå et spændingsfelt med, at taksonomien<br />

samtidig skal være åben. For at taksonomien skal være sparsommelig, bør man sikre sig, at den ikke<br />

indeholder kategorier uden indhold. Desuden bør der ikke være kategorier, som er overfyldt med<br />

indhold.<br />

At taksonomien skal være meningsfuld betyder, at kategorier og underkategorier skal sætte<br />

brugeren i stand til, at kunne forudsige, hvad de indeholder. Man sikrer sig, at taksonomien er<br />

meningsfuld ved at sørge for, at brugerne ikke bliver overraskede eller direkte skuffede over det<br />

indhold, de finder i underkategorierne eller emnefolderne.<br />

Med holdbar menes der, at taksonomien skal konstrueres således, at den ikke behøver hyppige<br />

ændringer eller ekspansioner. En robust taksonomi kræver generelt kun en mindre revision en gang<br />

om året, medmindre der sker radikale og uforudsete ændringer i organisationen. Mere om dette<br />

senere under kapitlet om vedligeholdelse <strong>af</strong> taksonomien. Holdbarhed er noget, der testes over tid.<br />

For at taksonomien er holdbar eller robust, skal der ikke være nogen seriøse, eller gentagne klager<br />

fra brugerne, fordi de ikke kan tildele nyt indhold. Eller fordi de har svært ved at navigere.<br />

At taksonomien skal være balanceret betyder, at hvert niveau har en konsistent grad <strong>af</strong> generalitet<br />

og specificitet, når man sammenligner horisontalt gennem taksonomien. For at taksonomien er<br />

20


alanceret skal man sikre sig, at der ikke er områder i taksonomien, som er overbefolket med store<br />

mængder <strong>af</strong> udifferentieret indhold, mens andre områder er underbefolket. I forbindelse med<br />

balancen er det dog svært, at sikre sig, at termerne horisontalt er på samme niveau, for er<br />

arrangement eksempelvis på samme niveau som møde?<br />

21


Implementeringsfasen (HCKH)<br />

Men dette udkast til en taksonomi er kun begyndelsen. Der er stadig et stykke vej, før taksonomien<br />

kan understøtte mere effektiv vidensbrug og –”flow” i organisationen. Udover selve<br />

implementeringen, drejer det sig om, at sikre styringsprocessen og vedligeholdelsen <strong>af</strong><br />

taksonomien.<br />

Lambe beskriver således tre hovedstadier i implementeringsfasen. 56 De to første punkter vil kort<br />

blive præsenteret nedenfor og ikke uddybet, da vi på nuværende tidspunkt ikke ved, hvordan<br />

taksonomien skal anvendes i praksis. 57 Vi har dog valgt at nævne dem for at give IDA en idé om,<br />

hvordan de skal fortsætte arbejdet. Derimod bliver det sidste punkt omhandlende styringsprocessen<br />

uddybet i næste <strong>af</strong>snit, da vi godt på nuværende tidspunkt kan give et bud på dem.<br />

1. Repræsentationen <strong>af</strong> taksonomien skal planlægges:<br />

Det er vigtigt at overveje, hvordan taksonomien skal repræsenteres, hvilke værktøjer der<br />

skal bruges til at understøtte repræsentationen og hvilke usability-problemstillinger det er<br />

nødvendigt, at forudse og tage vare på.<br />

2. Taksonomien skal integreres i den eksisterende infrastruktur:<br />

Taksonomien er en udvidelse <strong>af</strong> den allerede eksisterende informations- og<br />

vidensinfrastruktur i organisationen, men den integrerer sig ikke automatisk. Derfor er det<br />

vigtigt at sørge for, at taksonomien bliver ”flettet ind” i det allerede eksisterende<br />

informationslandskab.<br />

3. Styringsprocessen skal sikres:<br />

En taksonomi er ikke en stationær størrelse, men noget der løbende udvikler sig. Nye<br />

begreber opstår, andre udgår, sproget ændrer sig etc. Alt dette må man tage højde for, og<br />

derfor skal taksonomien løbende vedligeholdes. Der bør derfor etablere en række at<br />

aktiviteter, der sikrer, at taksonomien forbliver ”levende” og relevant. Styringsprocessen<br />

omfatter også overvejelser omkring, hvordan selve emneordstildelingen skal foregå. Samt et<br />

bud på en metode som er egner sig til kvalitetskontrol <strong>af</strong> taksonomien.<br />

Vedligeholdelse <strong>af</strong> taksonomien<br />

Som tidligere nævnt, er det hensigtsmæssigt, at vedligeholdelsen <strong>af</strong> taksonomien foregår på centralt<br />

plan. Der bør udpeges en person eller en gruppe <strong>af</strong> personer, der som administratorer skal stå for<br />

vedligeholdelsen <strong>af</strong> taksonomien. Disse skal sikre, at den forbliver relevant og brugbar som<br />

beskrevet i det forudgående <strong>af</strong>snit.<br />

56 Lambe, P. (2007), s. 208.<br />

57 Se indledningen omhandlende Vision IDA 2011.<br />

22


En oplagt måde at gøre dette på, er ved at logge brugernes adfærd, når de søger information. Har en<br />

bruger forsøgt, at søge på et ord flere gange og til sidst givet op, skulle man måske overveje, at<br />

tilføje det pågældende ord til taksonomien. Metoden har den fordel, at den ikke direkte involverer<br />

brugerne.<br />

I etablerings- og implementeringsfasen er det en rigtig god idé at sørge for, at få tilbagemeldinger<br />

fra de ansatte/brugere, både dem, der ”blot” henter information, men også dem, der producerer den.<br />

Vi forestiller os, at der i en periode er en eller flere koordinatorer, der samler op på respons,<br />

spørgsmål, og løse ender.<br />

Det er en god idé, at foretage en systematisk gennemgang <strong>af</strong> taksonomien indenfor seks måneder<br />

efter implementeringen <strong>af</strong> taksonomien, og derefter årligt. 58 Denne gennemgang bør være styret <strong>af</strong><br />

de ni nøglekriterier som er omtalt tidligere i denne opgave.<br />

Derudover kan der implementeres en feed-back-funktion, der gør, at brugerne <strong>af</strong> taksonomien aktivt<br />

kan sende forslag til rettelser, ændringer og forbedringer videre til den medarbejder, der står for<br />

vedligeholdelsen <strong>af</strong> den. Således sikrer man, at ændringer implementeres i tide, og at taksonomien<br />

hele tiden giver mening for dem, der bruger den i deres daglige arbejde.<br />

Tildeling <strong>af</strong> emneord<br />

Det overordnede formål med tildeling <strong>af</strong> emnord er naturligvis genfinding. Dvs. at ressourcen skal<br />

dukke op i en søgning, hvor den er relevant. Her er det vigtigt at overveje, om brugerne selv skal<br />

have mulighed for at tildele emneord, når systemet er i brug, eller om denne proces skal foregå<br />

automatisk ved at et program tager sig <strong>af</strong> denne proces. Hvorvidt det er forfatterne selv der skal<br />

tildele disse emneord, eller denne proces skal foregå automatisk, er i sidste ende ikke op til os at<br />

vurdere. I dette <strong>af</strong>snit vil vi dog give nogle bud på, hvordan taksonomien kan anvendes. Dvs.<br />

hvordan vi forestiller os, at man kan tildele emneord til dokumenterne. Men lige meget, hvordan<br />

tildelingen <strong>af</strong> emneord skal foregå rent praktisk, er der nogle generelle retningslinjer samt features<br />

ved søgefunktionen som vi mener, bør gøre sig gældende.<br />

De mest brugte mål for kvaliteten <strong>af</strong> indekserings- eller søgesystemer, er RECALL og<br />

PRECISION. 59 RECALL angiver i hvor stor udstrækning de relevante dokumenter i hele basen er<br />

fundet, mens PRECISION angiver andelen <strong>af</strong> relevante dokumenter i søgesættet.<br />

Disse to mål indikerer hvor lidt, eller hvor meget et system fungerer efter hensigten, som er at<br />

tilvejebringe relevant materiale uden støj. Relevans er dog mere end et spørgsmål om statistik, idet<br />

ikke alle opfatter det samme som lige relevant. 60 Dette hænger i høj grad sammen med kontekst og<br />

verdensbillede. Der tales om flere typer <strong>af</strong> relevans, hvor disse to mål falder ind under betegnelsen<br />

systembaseret eller objektiv relevans. I modsat fald tales der om subjektiv relevans, herunder bl.a. at<br />

den eneste der kan bedømme et dokuments relevans er brugeren <strong>af</strong> dokumentet. Der er endnu ikke<br />

nogen entydigt formulerede og anerkendte mål for andre typer <strong>af</strong> relevans end den systembaserede,<br />

hvorfor vi ikke vil komme nærmere ind på det her.<br />

58 Lambe, P. (2007), s. 234.<br />

59 Lancaster, F. W. (1998), s. 3.<br />

60 Stewart, D. L. (2008), s. 9.<br />

23


Man kan foretage brugertests med mere eller mindre autentiske søgninger og derefter regne på de<br />

fremfundne resultater i forhold til ovennævnte performancemål. Som det antydes, er man i<br />

princippet bekendt med basens størrelse og indhold for at kunne måle præcist. Det er imidlertid et<br />

noget omfattende arbejde, hvis basen er stor. Man kan dog godt nøjes med at teste et udsnit <strong>af</strong><br />

basen.<br />

Efterhånden som databasen bliver større, vil antallet <strong>af</strong> dokumenter der er udstyret med det samme<br />

emneord også stige. Derfor er det nødvendigt, at indeksere dokumenterne, ved at tildele dem flere<br />

emneord (og gøre dem mere specifikke) således, at indekseringen er mere ”diskriminerende” og<br />

tillader søgninger i hvilke der opnås en tilfredsstillende grad <strong>af</strong> recall, samtidig med en acceptabel<br />

grad <strong>af</strong> precision. Men hvor mange emneord vil så være passende? Det er svært, at opstille regler<br />

for så forskellige dokumenter, både i størrelse og type, som der er tale om.<br />

Ifølge Lancaster 61 skal man tilstræbe, at tilfredsstille 80% <strong>af</strong> brugernes behov, da det vil kræve en<br />

meget højere grad <strong>af</strong> ekshaustivitet, at forøge dette til 90-95%. Men desværre giver han ikke nogen<br />

magisk formel for, hvor mange termer, der så skal til, for at tilfredsstille 80%. Dette må man i<br />

stedet bygge på viden om brugernes behov. Lancester foreslår bl.a., at man kan lave kontrollerede<br />

eksperimenter, hvor man sammenholder informationsbehov med en samling <strong>af</strong> dokumenter, der er<br />

indekseret med et forskelligt antal termer. Jo flere termer man forsyner et dokument med, desto<br />

mere tilgængeligt bliver det, og formodentlig vil det derfor blive fundet oftere. Lancaster foreslår en<br />

politik, hvor man tildeler mellem 8 og 15 termer til de fleste dokumenter. 62<br />

Vi mener, at hver post bør indeholde bibliogr<strong>af</strong>iske oplysninger om dokumentet. Det drejer sig om<br />

ophav, dato, filtype (dvs. om der er tale om et word-dokument, en PDF-fil osv.), titel (hvis en sådan<br />

findes) og filstørrelse. Sammen med disse bibliogr<strong>af</strong>iske oplysninger mener vi, at tre emneord vil<br />

være nok til at identificere <strong>IDAs</strong> dokumenter. 63 Hvis alt i et dokument skal registreres vil det skabe<br />

unødig støj, og brugerne vil få alt for mange resultater, med mindre de også inkluderer mange<br />

emneord i deres søgninger.<br />

Vi forestiller os, at når brugerne har fundet nogle poster, der ser relevante ud, kan de fortsætte<br />

søgningen ved at bruge de samme emneord, eller kombinationer <strong>af</strong> emneord, der bliver brugt i de<br />

poster, de har fundet. Det kunne f.eks. ske ved, at der i søgemaskinen var en indbygget ”Søg<br />

lignende titler”-funktion. Fra alle poster med mere end ét emneord bliver det via denne funktion<br />

muligt, at linke videre til en mellemside, hvor emneordene i posten vises tillige med information om<br />

hvor mange poster der findes med den samme kombination <strong>af</strong> emneord. Brugeren kan herfra vælge<br />

emneord til eller fra, og videresøge på den valgte kombination <strong>af</strong> emneord.<br />

I udgangspunktet forestillede vi os, at producenterne selv skulle tildele emneord til dokumenterne.<br />

Rent praktisk skulle dette foregå på den måde, at når man har skrevet en tekst, vælger man tre<br />

emneord, til at beskrive dokumentet. Disse kan frit vælges fra de niveauer man ønsker. Har man<br />

således valgt et emneord fra facetten medlemmer, er man ikke bundet til, hverken at vælge ord fra<br />

samme niveau, eller udelukkende fra medlemmer (skal uddybes yderligere). Hvis producenten<br />

mener, at der mangler et emneord, kan denne rette henvendelse til den person, som er udnævnt til<br />

administrator <strong>af</strong> taksonomien, som så tager stilling til, om termen skal medtages i taksonomien.<br />

61<br />

Lancaster, F. W. (1998), s. 26.<br />

62<br />

Ibid, s. 23.<br />

63<br />

Disse bibliogr<strong>af</strong>iske oplysninger er jo også termer, og dermed nærmer vi os de otte termer.<br />

24


Lars Aagaard fra <strong>IDAs</strong> IT-<strong>af</strong>deling mener, at denne proces skal administreres automatisk. Dette<br />

sikrer bedre konsistens, og man kommer ud over de udfordringer der er forbundet med at lære folk<br />

at tildele emneord, og at de måske ikke gider, og det derved bliver noget sjusk… Til gengæld bliver<br />

det sværere, at fange de tilfælde, hvor taksonomien har mangler. I hvert fald kræver dette mere <strong>af</strong><br />

testfasen… (mere om dette i <strong>af</strong>snittet om testning og vedligeholdelse <strong>af</strong> taksonomien).<br />

Card sorting<br />

En metode, man kan anvende til kvalitetskontrol <strong>af</strong> taksonomien, er Card sorting. 64 Card sorting er<br />

en metode til at undersøge, hvordan folk grupperer ting. Herved kan man udvikle strukturer, der<br />

øger sandsynligheden for, at brugerne kan genfinde tingene. Card sorting er således en brugbar<br />

metode, når man har identificeret de termer, man ønsker at gruppere, men også som supplerende<br />

metode til at teste, om der er overensstemmelse med den måde, man har struktureret taksonomien<br />

på, og brugernes opfattelse <strong>af</strong>, hvordan begreberne hænger sammen.<br />

Fordelene ved denne metode er:<br />

At den er nem og billig at udføre.<br />

At den sætter en i stand til at forstå, hvordan ”rigtige mennesker” grupperer ting.<br />

Man identificerer, hvilke termer, der er svære at placere.<br />

At man identificerer terminologi, der er tilbøjelig til at blive misforstået.<br />

Rent praktisk gennemføres metoden ved, at navnene på de ting man ønsker at få grupperet, skrives<br />

ned på individuelle kort/sedler. Derefter beder man en række testpersoner om, at gruppere termerne<br />

på en måde, der giver mening for dem. Man kan også bede testpersonerne om, at navngive disse<br />

grupper.<br />

Efter at alle testpersonerne har gjort dette, skriver man disse data ind i et regneark, og undersøger<br />

grupperingerne. Højst sandsynligt vil der være en generel enighed om mange <strong>af</strong> termerne, og<br />

hvordan disse skal grupperes, så disse grupper giver sig selv. Særlig fokus skal man lægge på de<br />

termer, der ikke er konsensus omkring. Måske hjælper det, hvis de bliver omdøbt?<br />

For at metoden skal kunne fungere optimalt, er det vigtigt at sikre sig, at testpersonerne er<br />

repræsentative for dem, der i sidste ende skal anvende taksonomien. Litteraturen anbefaler, at man<br />

bruger så mange testpersoner som man kan overskue, og mindst seks. Man skal dog være<br />

opmærksom på, at jo flere man bruger, jo mere analysearbejde giver det i sidste ende.<br />

Hvor lang tid folk er om at sortere, varierer selvfølgelig meget, men som en tommelfingerregel, skal<br />

man regne med, at det tager ca. en halv time at sortere 50 termer. (Det skal man lige huske at have<br />

med i regnestykket, før man sætter folk til at sortere flere tusinde termer!!!)<br />

Det kunne have været spændende, at prøve denne metode. Men det tillod tiden desværre ikke.<br />

64 Information & Design. (2006, 25. oktober).<br />

25


Konklusion (HCKH og LH)<br />

Således mener vi, at have besvaret spørgsmålene i problemformuleringen.<br />

I planlægningsfasen undersøgte vi, hvilke former for klassifikationssystemer der findes.<br />

På baggrund her<strong>af</strong> fandt vi ud <strong>af</strong>, at et facetteret klassifikationssystem, med kontrolleret hierarki i<br />

form <strong>af</strong> en taksonomi ville være bedst for IDA. Både på grund <strong>af</strong> dens gode egenskaber til at<br />

strukturere information i et hierarki, samtidig med at den er nem at vedligeholde og opdatere. Dette<br />

var også i overensstemmelse med <strong>IDAs</strong> ønske.<br />

At finde gode termer til vores taksonomi var et vigtigt arbejde, og til dette arbejde anvendte vi<br />

forskellige metoder.<br />

Vi har, som der bliver anbefalet i litteraturen omhandlende taksonomikonstruktion, fundet mange<br />

termer fra <strong>IDAs</strong> eksisterende vokabularer. Disse termer anser vi som gode, eftersom de er skabt <strong>af</strong><br />

<strong>IDAs</strong> egne ansatte, og derfor er termer de selv anvender internt i organisationen.<br />

Interviewene var en også en meget givende metode, da de gav os både gode termer og indsigt i<br />

<strong>IDAs</strong> struktur og kommunikationsveje. Vi har også kunnet opsætte test-scenarier ud fra de svar vi<br />

fik i interviewene, og har på denne måden fått testet vor taksonomi. Denne testning skal der bygges<br />

videre på ved hjælp fra <strong>IDAs</strong> medarbejdere.<br />

Teorier omhandlende taksonomikonstruktion anbefaler, at man finder eksemplariske dokumenter<br />

fra samlingen taksonomien skal bruges på, og udtrækker termer fra disse ved hjælp <strong>af</strong> ordoptælling.<br />

Denne metode virkede i udgangspunktet som en god idé, men det viste sig, at være svært, for ikke<br />

at sige umuligt, at anvende den i praksis. Det store antal dokumenter på <strong>IDAs</strong> P-drev gjorde, at vi<br />

ikke kunne få overblik nok til udvælge eksemplariske dokumenter. Vi har således ikke nogen<br />

chance for at vurdere, hverken dækningsgrad <strong>af</strong> dokumentet, eller hvor dybt ned i de enkelte<br />

<strong>af</strong>delinger vi egentlig kom. Dermed ikke sagt, at metoden ikke vil kunne fungere i en anden<br />

sammenhæng.<br />

På grundlag <strong>af</strong> dette konstruerede vi taksonomien. Her tog vi udgangspunkt i PMEST, samt ni<br />

nøglekriterier for at sikre en robust taksonomistruktur.<br />

For at taksonomien kan fungere optimalt, er det vigtigt at den bliver implementeret i det allerede<br />

eksisterende informationslandskab. For at bibeholde sin aktualitet og relevans, skal taksonomien<br />

jævnligt opdateres og vedligeholdes. I den forbindelse er det en god idé, at udpege en person, eller<br />

en gruppe <strong>af</strong> personer til at varetage disse opgaver. En god metode til at kvalitetskontrollere<br />

taksonomien, er card sorting.<br />

26


Perspektivering (HCKH og LH)<br />

Den 16/12-2008 præsenterede vi taksonomien for <strong>IDAs</strong> IT-<strong>af</strong>deling. De var overvejende positive<br />

overfor projektet og gav udtryk for, at det var et godt udgangspunkt for deres videre arbejde frem<br />

mod Vision 2011.<br />

Vi har <strong>af</strong>talt, at følge dette op, med en længere præsentation i slutningen <strong>af</strong> januar 2009, hvor<br />

interesserede fra flere <strong>af</strong> de andre <strong>af</strong>delinger også vil være til stede. Det drejer sig hovedsageligt om<br />

dem, vi interviewede i forbindelse med projektet. Derfor får vi først deres endelige tilbagemelding<br />

efter denne dato.<br />

Fremadrettet er der en række tiltag man kan gøre, for at optimere taksonomien:<br />

Når man først har fået defineret taksonomien, kan den anvendes til flere formål. F.eks. kunne man<br />

forestille sig, at man udvider taksonomien til også at omfatte medarbejdere. Således at når man<br />

f.eks. søger på arbejdskonflikter, får man ikke alene de dokumenter, der omhandler<br />

arbejdskonflikter, men også en liste over de medarbejdere, der arbejder med/har speciale indenfor<br />

netop dette område.<br />

Man kan sørge for, at brugeren guides videre til de rigtige dokumenter, selv om der er søgt på et<br />

synonym. Det sikrer, at man når frem til relevant information, uanset hvilket ord man søger på.<br />

Endelig skal det nævnes, at gr<strong>af</strong>isk navigation letter tilgangen til information, også for de utrænede<br />

informationssøgere. Derfor er det vigtigt, at opretholde fokus på dette aspekt, i det fremadrettede<br />

arbejde med taksonomien.<br />

27


Litteraturliste<br />

Fastformsdokumenter<br />

Blair, D. C., & Kimbrough, S. O. (2001). Exemplary documents: a foundation for information<br />

retrieval design. Information Processing and Management, 38/2002(3), 363-379.<br />

Kowalski, G. J., & Maybury, M. T. (2000). Information storage and retrieval systems: Theory and<br />

implementation (2. udg). Norwell, Massachusetts: Kluwer Academic Publishers.<br />

Lambe, P. (2007). Organising Knowledge: Taxonomies, Knowledge and Organisational<br />

Effectiveness. Oxford: Chandos Publishing.<br />

Lancaster, F. W. (1998). Indexing and Abstracting in Theory and Practice (2. udg). London:<br />

Library Association Publishing.<br />

Lykke Nielsen, M. (2004). Conceptual tools supporting information retrieval and sharing.<br />

Hummelshøj, M (ed). Proceedings of the 12th Nordic Conference for Information and<br />

Documentation, September 1-3, 2004, Aalborg, Denmark. Aalborg: Royal School of Library and<br />

Information Science. 14 - 21.<br />

Lykke Nielsen, M. (1999). Tesaurus, datawarehouse og elektronisk dokumentstyring.<br />

Bibliotekspressen, 1999(17), 524-527.<br />

Lykke Nielsen, M. (2001). Tesauruskonstruktion: Tesaurustyper, metoder, retningslinier:<br />

Undervisningsnoter. Upubliceret. København: Danmarks Biblioteksskole.<br />

Stewart, D. L. (2008). Building Enterprise Taxonomies (1. udg). Mokita Press.<br />

Wyllys, R. E. (1981). Empirical and Theoretical Bases Of Zipf's Law. Library Trends, 30/1981(1),<br />

s. 53-64.<br />

28


Elektroniske dokumenter<br />

BAR-eva.dk. (2005a). Interview. Lokaliseret den 4. januar 2009 på URL: http://www.bareva.dk/Metoder/Interview.aspx<br />

BAR-eva.dk. (2005b). Personlige interview. Lokaliseret den 4. januar 2009 på URL:<br />

http://www.bar-eva.dk/Metoder/Interview/Personlige%20interview.aspx<br />

Bitconomy. (2005, 13. december). Folksonomien: den mindste indsats betydning. Lokaliseret den 4.<br />

januar 2009 på URL: http://www.bitconomy.dk/default.asp?articleid=3196<br />

Information & Design. (2006, 25. oktober). What is Card Sorting. Lokaliseret den 4. januar 2009 på<br />

URL: http://www.infodesign.com.au/usabilityresources/design/cardsorting.asp<br />

Ingeniørforeningen, IDA. (2008). Vision 2011 IDA. Lokaliseret den 4. januar 2009 på URL:<br />

http://ida.dk/omida/visionogvaerdier/Sider/visionforida2011.aspx<br />

Levy, T. (2004). The State and Value of Taxonomy Standards. Lokaliseret den 4. januar 2009 på<br />

URL: http://www.dig-mar.com/worksem/Taxonomy.pdf<br />

White, H. (2007, 12 marts). How to Construct a Concept Map. Lokaliseret den 4. januar 2009 på<br />

URL: http://www.udel.edu/chem/white/teaching/ConceptMap.html<br />

Wikipedia, den frie encyklopædi. (2008, 10. december). Taksonomi. Lokaliseret den 4. januar 2009<br />

på URL: http://da.wikipedia.org/wiki/Taksonomi<br />

Wikipedia, den frie encyklopædi. (2008, 26. december). Top-down and bottom-up design.<br />

Lokaliseret den 4. januar 2009 på URL: http://en.wikipedia.org/wiki/Top-down<br />

29


Bilag 1 – Taksonomien<br />

1. Medlemmer 1.1 Arbejdsmarkedssager Ansættelsesforhold<br />

Ansættelsesvilkår Jobklausuler<br />

Konkurrenceklausuler<br />

Kundeklausuler<br />

Medarbejderklausuler<br />

Ophavsret<br />

Arbejdskonflikter Blokade<br />

Uddannelsesklausuler<br />

Strejke<br />

Arbejdsmiljø Fysisk arbejdsmiljø<br />

Personaleforhold<br />

Psykisk arbejdsmiljø<br />

Arbejdsophør Afskedigelse<br />

Bortvisning<br />

Masse<strong>af</strong>skedigelse<br />

Opsigelse<br />

Arbejdsrettigheder Barsel<br />

Ferie<br />

Pension<br />

Arbejdstid Deltid<br />

Arbejdsvilkår<br />

Sygefravær<br />

Flextid<br />

Jobløn<br />

Merarbejde<br />

Beredskab (se Foreldreløse termer) Risiko<br />

Børn<br />

Forhånds<strong>af</strong>tale<br />

Grænse<strong>af</strong>tale<br />

Hoved<strong>af</strong>tale<br />

Ingeniørmangel<br />

Klagesagsbehandling<br />

Konkurs<br />

Overarbejde<br />

Sikkerhed<br />

Terror<br />

Kontrakt Induividuelle kontrakte<br />

Ledelse Projektledelse<br />

Legater og fonde<br />

Lovgivning Arbejdsretssager<br />

Fagretlige spørgsmål<br />

Ferieloven<br />

Forhandlingsret<br />

Funktionærloven<br />

Kollektiv arbejdsret<br />

Markedsføringsloven<br />

Organisationsret<br />

30


Retssag<br />

Virksomhedsoverdrage<br />

Voldgiftssager<br />

Løn Aktieløn<br />

Efterløn<br />

Feriepenge<br />

Honorar<br />

Incitaments<strong>af</strong>lønning<br />

Lønforhandling<br />

Manglende løn<br />

Vederlag<br />

Overenskomster Overenskomstforhand<br />

Stillingsbeskrivelser Ledige stillinger<br />

Udstationering<br />

1.2 Medlemskategorier Ledere i private virksomheder<br />

1.3 Fagtekniske netværk AIR<br />

Virksomhedsgruppe Anlæg<br />

Medlemmer i udlandet samt officerer m.v.<br />

Pensionister<br />

Privatansatte medlemmer <strong>af</strong> virksomhedsgrupper eller ACklubber<br />

Regions og kommunalt ansatte<br />

Selvstændige<br />

Statsansatte<br />

Bioteknologi<br />

Byggeri<br />

Datasikkerhed<br />

Elektronik<br />

Elektroteknik<br />

Industri<br />

Infastruktur<br />

Innovation<br />

IT<br />

Kemi<br />

Levnedsmiddelteknolo<br />

Planlægning<br />

Produktion<br />

Teknologi<br />

Telesektoren<br />

Transport<br />

Studiemedlemmer Studieliv<br />

Tillidsrepræsentant<br />

Øvrige privatansatte<br />

Byggeteknisk Gruppe<br />

DSM<br />

Elektronik og IT Gruppen<br />

Energiteknisk Gruppe<br />

Fagteknik<br />

Lederforum Forbundets Forretning<br />

LSI<br />

31


ManifiQue<br />

Miljøteknisk Gruppe<br />

MPS<br />

Netværk for selvstændige<br />

Nordjyske Planlæggere<br />

PTS<br />

Selskab for Informationsteknologi<br />

Skibs- og Maskinteknisk Gruppe<br />

Spildevandskomiteen<br />

Sundhedsteknologisk Gruppe<br />

1.4 Uddannelse Bygningskonstruktør<br />

Cand. IT<br />

Cand. Tek. Soc.<br />

Civilingeniør<br />

Datalogi<br />

Datateknologi<br />

Diplomingeniør<br />

Efteruddannelse<br />

Eksportingeniør<br />

Farmaceut<br />

Informatik<br />

Levnedsmiddelingeniør<br />

Matematik<br />

3. Videndeling 3.1 Arrangement Konference<br />

Kulturelle arrangementer<br />

Kurser Karriereplanlægningsk<br />

Seminar<br />

3.2 IT IT-support<br />

Sociale arrangementer<br />

3.3 Kommunikation Ekstern kommunikation<br />

3.4 Listevalg<br />

Intern kommunikation<br />

3.5 Møder Direktionsmøde<br />

Forbundforsamling<br />

Generalforsamling<br />

Personalemøde<br />

Politisk møde<br />

Repræsentantskabsmøde<br />

SU-møde<br />

Årsmøde<br />

3.6 Politisk Politisk dagsorden<br />

Politisk indflydelse<br />

TRU kursus<br />

Påvirkning <strong>af</strong> samfundet Faglig analyse<br />

Uddannelsespolitik<br />

3.7 Projekter Projekttype (?) Beskæftigelsesfremme<br />

3.8 Rådgivning Beskæftigelse<br />

3.9 Økonomi Budget<br />

Regnskab<br />

FIDA<br />

32


2. Dokumenttype 2.1 EDB-systemer Axapta<br />

DOC2000<br />

IDA Dokumenthåndtering<br />

2.2 Håndbøger Kontaktcenterhåndbog<br />

Miljøhåndbog<br />

2.3 Love og vedtægter Direktiv<br />

2.4 Publikationstype Artikler<br />

Personalehåndbog<br />

Proceshåndbogen<br />

Projekthåndbogen<br />

Brev<br />

IDAvisen<br />

Medlemsmail<br />

Nyhedsbrev<br />

Pjece<br />

Pressemeddelelse<br />

Presseomtale<br />

Referat<br />

4. IDA 4.1 <strong>IDAs</strong> <strong>af</strong>delinger Bestyrelse<br />

Rapport Direktionsrapport<br />

Direktionen<br />

Ejeiendomsadministrationen<br />

Projektrapport<br />

Salgsrapport<br />

Årsrapport<br />

Forbunds<strong>af</strong>delinger IDA-Kommunal<br />

Fællesadministrationen<br />

Fællessekretariatet<br />

IDA-STAT<br />

Hovedbestyrelsen Formand<br />

HR-<strong>af</strong>delingen<br />

<strong>IDAs</strong> administration<br />

IT-<strong>af</strong>delingen<br />

Kommunikations-<strong>af</strong>delingen<br />

Mødecenter<br />

PIV<br />

PGA<br />

PGS<br />

Repræsentantskabet<br />

ROF<br />

Salg<br />

Politiske udvalg<br />

Sekretariater (?) TRUs sekretariat<br />

VGA<br />

33


4.2 <strong>IDAs</strong> regionale netværk IDA Fyn<br />

Økonomi-<strong>af</strong>delingen<br />

IDA Nord<br />

IDA Sjælland<br />

IDA Syd<br />

IDA Vestjylland<br />

IDA Østjylland<br />

Københavns Region<br />

Nordsjælland Region<br />

5. Eksterne<br />

samarbejdspartnere 5.1 Andre danske fagforeninger AC<br />

HK<br />

5.2 Ingeniørfamilien DIP<br />

IAK<br />

IDA Forsikring<br />

Ingeniøren<br />

ISP<br />

Komplement<br />

Mannaz<br />

5.3 Medlemsrettede<br />

samarbejdspartnere AF<br />

ATP<br />

LG<br />

5.4 Samarbejde Det internationale samarbejde EF-Specialudvalg<br />

Energistyrelsen<br />

Erhvervs- og Selskabsstyrelsen<br />

EMF<br />

34


Bilag 2 – Interview<br />

Allerførst forklare, hvad vi egentlig laver:<br />

En taksonomi, der skal hjælpe IDA med at strukturere informationerne. En taksonomi er en<br />

hierarkisk organiseret emneordsliste der tilstræber, at dække alle aspekter <strong>af</strong> IDA. Meningen er, at<br />

når man efterfølgende opretter et nyt dokument, skal der tillægges emneord fra denne taksonomien,<br />

så det bliver nemmere at genfinde det. Det smarte ved en taksonomi er, at man kan se hvor i<br />

strukturen et dokument befinder sig, og derfor kan finde relaterede dokumenter. F.eks. kan man<br />

bevæge sig op i strukturen for at finde mere generelle emner og ned for at finde mere specialiserede.<br />

1. Hvad laver I, i denne <strong>af</strong>deling?<br />

2. Hvilke problemer løser I?<br />

3. Hvilke faggrupper er ansat i denne <strong>af</strong>deling?<br />

4. Hvilke andre <strong>af</strong>delinger samarbejder I med?<br />

5. Hvilke typer <strong>af</strong> information producerer I, i denne <strong>af</strong>deling? (eks. Manualer, små<br />

hjælpetekster, vejledninger)<br />

6. Hvem er ansvarlig for indholdet? (er der en hovedansvarlig, eller er producenterne selv<br />

ansvarlige for indholdet)<br />

7. Hvilke formater gemmer I jeres dokumenter i? (eks: doc, txt, hard copy)<br />

8. Hvilke drev ligger I informationerne ud på?<br />

9. Organiserer I denne information i producerer på en eller anden måde? I så fall: Hvordan?<br />

10. Hvilke former for information søger du typisk efter i forbindelse med det daglige arbejde?<br />

11. Hvor finder du informationerne?<br />

12. Køber I informationer udefra? I så fald, hvilke og hvorfra?<br />

Må vi vende tilbage senere, hvis (når) der dukker flere spørgsmål op?<br />

35


Bilag 3 – Foredrag<br />

36

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!