Oppgave 2.
Kjære medstudenter.
Kanskje er det ikke så lenge til vi også skal organisere kunnskap i form av emnetilleggelse, slik at et relevant innhold skal bli tilgjengelig for en tilfeldig bruker?
Jeg våger å påstå at arbeidet med å indeksere et dokument kan gi oss enkelte utfordringer.Frustrasjonene blir forhåpentligvis ikke for store, når vi skal velge emneord som gir god gjenfinning i en søkeprosess, og når vi skal følge det gitte regelverk som skal sikre kvaliteten på arbeidet.
Hvilke utfordringer står vi da overfor når vi sitter med dokumentet foran oss? Hvordan sikrer vi grad av gjenfinning?
For at du og jeg skal ha samme oppfatning av hva en som indekserer har som oppgave, ønsker jeg først å ta opp formålet med indeksering.
Kunnskapsorganisering er å beskrive dokument for å sikre gjenfinning.
Katalogisering sikrer et dokuments gjenfinning utfra objektive, fysiske beskrivelser, som eksempelvis forfatter og tittel. Å indeksere et dokument gjør dokumentet gjenfinnbart også innenfor emne. Når vi indekserer, tilegner vi dokumentet verbale innganger som sørger for at en bruker kan finne dette dokument blant mange andre dokument, om brukeren søker etter de emneordene vi har tilegnet dokumentet.
Formålet er å organisere dokumenter slik at den kunnskapen de ulike dokumentene besitter, skal bli gjort tilgjengelig for brukerne. Dokument som har tilsvarende emneord blir samlet. Det kan gi brukeren en god oversikt over hvilke dokumenter som er tilgjengelige.
Oppgaven til en som indekserer er å gi dokumentet gode emneord som sier noe om hva dokument handler om. Dette kaller Ragnar Nordlie, i artikkelen «Kunnskapsorganisasjon- Kjerneteknologi for bibliotek- og informasjonsfag», for emneindeksering. (s.13)
So far- so good. Dette høres da ikke så avansert ut?
Hvilke utfordringer kan en så møte i indekseringsprosessen?
Å indeksere er å tolke et dokument. Broughton kaller det for en intuitiv prosess. (leksjonsvideo 3: indeksering) Det er en indre mental prosess, som kommer til uttrykk gjennom indeksererens valg av emneord. Det er med andre ord stor grad av subjektivitet i denne arbeidsprosessen. Det er dermed stor risiko at ulike indekserere velger ulike ord for å beskrive samme dokument. Dette fører til ulikheter i dataoppsett i søkemotorer. Det samme dokumentet kan få tildelt ulike emneord av ulike indekserere.
Når en indekserer er det gitte regler en skal følge. Den som skal gjennomføre indekseringen må ha kunnskap om hvilke regler som er gjeldene for valg av emneord, og hvordan disse emneordene skal skrives.
Det er vanskelig å oppsummere et emneinnhold i få ord, men om en skal sikre de to prinsippene en har for gjenfinnbarhet, er dette noe en må ha fokus på. De to prinsippene er fullstendighet og presisjon. (leksjonsvideo 3: emneord) Fullstendighet vil si å finne alle dokumentene som omhandler et emne. Presisjon er at en ikke får søketreff på flere dokument enn de som omhandler et bestemt emne.
Det å få inn for mange treff i en søkeprosess gir søkeren mye støy.Det er med andre ord viktig å velge de mest sentrale emneordene ved et dokument for å sikre en presis gjenfinning. Det er avgjørende å være så spesifikk som mulig, og unngå for generelle emneord. Det å velge noen få presise emneord, er viktigere enn å velge flere generelle.
Hvor nøyaktig en klarer å indeksere et dokument, avhenger av indeksererens kunnskap om det gitte dokumentet. Manglende kunnskap om et dokument kan resultere i feil indeksering og klassifisering. Derfor er det viktig at personen som indekserer klarer å identifisere de viktige aspektene i et dokument, slik at emnene dokumentet inneholder blir tydelige.
Det å indeksere er tidkrevende, og er dermed også en kostbar og arbeidskrevende prosess. I dagens samfunn er det en enorm økning i dokument som trenger å indekseres. Nå er det ikke lenger bare det trykte dokument i papirutgave vi omgir oss med. Mengder av digitale tekster er tilgjengelige for brukere.
Hvordan skal man klare å indeksere alle digitale dokument som utgis, uten at det skal resultere i for store økonomiske konsekvenser?
Tidligere var det fortrinnsvis fagpersoner som utførte indekseringsarbeid. I dag brukes også opphavspersoner /utgivere i arbeidet. De har fortrinnsvis dypest kunnskapen om dokumentets innhold. Til og med brukere er i dag med og indekserer dokument. Dette gjøres enten direkte gjennom eksempelvis kommentarer og omtaler på et gitt dokument, eller indirekte gjennom analyserer på hvilke søkeord som førte frem til bruk av gitte dokument.
Tidligere ble all beskrivelse gjort manuelt, i og med at dokumentene fantes i fysiske og håndholdte utgaver. I dag er svært mange tekster digitalisert. Dette gjør at tekstene blir tilgjengelige for maskinell analyse, og det kan gjennomføres avanserte ordtellinger i tekster. En kan da finne meningsfulle innholdsord som kan brukes for å klassifisere ulike dokumenter. («Kunnskapsorganisasjon-s.14)
Gevinsten av dette er at flere dokument indekseres. Det er raskere og enklere å indeksere. Flere dokument vil dermed få tildelt emneord, uten at det vil føre til store kostnader.
Ulempene ved at flere har ansvar for indekseringen er at indekseringsnivået blir lavere. Ufaglærte konsulterer ikke i regelverk for hvordan emneord skal skrives på samme måte som en faglært vil gjøre.
Ulike egenskaper i et dokument blir vektlagt. Det kan gi en unøyaktig betegnelse på et dokument, slik at gjenfinningen blir mindre presis.
Tradisjonelle indekseringsprosesser er i dag i utvikling. Fagpersoner som indekserer har god indekseringsbakgrunn, og følger gitte regler av valg av emneord. De har stor kunnskap om hvordan en sikrer kvaliteten på indekseringen. I og med at det i dag er flere som deltar i dokumentbeskrivelser, er det viktig å ha fokus på hvordan en skal finne gode emneord, og hvordan en best skal føre disse ordene for å sørge for god gjenfinning. Det er nødvendig at en i dag sørger for gode beskrivelser for hvordan en best ivaretar dette arbeidet.
Det viktigste aspektet ved indeksering er å sørge for høy grad av gjenfinnbarhet. God indeksering gir god gjenfinning! Vi får ønske hverandre lykke til i det fremtidige arbeidet med å gjøre dokumenter gjenfinnbare.

Kunsten i å finne de gode emneord. Foto: Anita
Kilder:
Artikler hentet fra heftet Kunnskapsorganisering; Bibliotheca Nova 4-2014
- Kunnskapsorganisasjon – «kjerneteknologi» for bibliotek- og informasjonsfag, av Ragnar Nordlie
- Digitalisering og klassifikasjon, av Lars G. Johnsen
- Leksjonsvideo: SK-100 Leksjon 3: indeksering
- Leksjonsvideo: SK-100 Leksjon 3: emneord