Tämä materiaali on arkistoitu. Sisältöä ei enää päivitetä. Kaikki sisältö ei välttämättä ole saatavilla.
Muokkaa

Tiedon organisoinnin ja kuvailumenetelmien perusteet

Osa 1: Johdanto

Tiedon organisoinnilla (knowledge organization, KO) ymmärretään tämän kurssin yhteydessä dokumenttikokoelmiin liittyvää systemaattista toimintaa, jonka tavoitteena on varmistaa dokumenttien löytyvyys kokoelman tunnistetuissa käyttötarkoituksissa. Tiedon organisointi on myös tutkimuskentän nimi. Termillä on kuvailumenetelmien analyysin, kehittämisen ja tutkimisen konnotaatio. Käytännössä tietysti kaikki puhtaasti teoreettinenkin tutkimus tähtää dokumenttien kuvailun ja organisoinnin menetelmien kehittämiseen.

Kuvailumenetelmät ovat määriteltyjä käytäntöjä, joita sovelletaan liitettäessä yksittäisiä dokumentteja osaksi kokoelmaa. Dokumenttiin liitetyt kuvailut ovat tiedon organisoinnin konkreettinen perusta nykyaikaisessa tietokoneella hallitussa dokumenttikokoelmassa. Kuvailumenetelmien piiriin kuuluvat mm. luettelointisäännöt, tallennusformaatit, luokitusjärjestelmät, asiasanastot jne. Kuvailumenetelmien soveltaminen on dokumenttien ulkoisten piirteiden ja sisällön kuvailua hakua varten. Ennen puhuttiin tiedon tallennuksesta ja hausta, mutta sanassa "tallennus" on passiivinen konnotaatio: se saa kuvailumenetelmien soveltamisen näyttämään mekaaniselta ja melko automaattiselta toiminnalta.

Internetin myötä on dokumenttien kuvailutietojen nimityksenä yleistynyt metadata-termi. Metadatalle annetaan usein määritelmä, jonka mukaan se on ”tietoa tiedosta”. Alkuperäinen englanninkielinen fraasi ”data about dataa” kuvaa hieman paremmin minkälaisesta tiedosta on kyse. Metadata voi kertoa mm. dokumentin ominaispiirteistä, sisällöstä, alkuperästä, muutoksista ja käytöstä. Metadataa voidaan käyttää moniin tarkoituksiin: tiedonhakuun, dokumenttien muutosten tai käytön seuraamiseen jne. (ks. Jani Stenvallin Dublin Core -formaatin käyttöopas).

Tiedon organisoinnin traditioita

Kirjastoilla on hyvin pitkät traditiot suurten dokumenttikokoelmien organisoinnissa. Kirjastoissa kokoelmat ovat pääosin julkaisuja ja tiedon organisointi perustuu bibliografisen kuvailuun. Kuvailun tulosta ei ole nimitetty metadataksi vaan bibliografiseksi viitteeksi. Bibliografinen viitekoostuu luettelointitiedoista, jotka kertovat dokumentin ulkoisista ominaisuuksista ja sisällönkuvailusta, joka kertoo dokumentin sisällöstä. Kuva 1.1 näyttää esimerkin Anu Alaterän ja Kai Halttusen kirjaan liitetyistä kuvailutiedoista.

Vastaavasti muilla muistiorganisaatioilla - arkistoilla ja museoilla – on omiin kokoelmiinsa ja tehtäviinsä kehitetyt tiedon organisoinnin ja kuvailun periaatteet ja käytännöt. Esimerkiksi provenienssi- eli alkuperäisperiaate on asiakirjojen kuvailun eräs erityispiirre: asiakirjojen alkuperäinen, toiminnan tuottama järjestys pyritään säilyttämään. Kurssilla asiakirjojen kuvailu on esillä bibliografisen kuvailun rinnalla ja näiden kahden perinteen eroja ja yhtäläisyyksiä pyritään selkeyttämään. Museologia piiriin kuuluvia asioita käsitellään vain sivu mennen.

Tietojenkäsittelytieteessä on vahva tiedon organisoinnin perinne, jota kutsutaan tiedonhallinnaksi. Tiedonhallintaa voi luonnehtia datakeskeiseksi, sillä kehitetyt menetelmät sopivat parhaiten määrämuotoisen ja –mittaisen eli rakenteisen datan organisointiin. Tiedonhallinnan opetusta tarjotaan tietojenkäsittelytieteen laitoksilla (ks. Tampereen yliopisto/TKT/tiedonhallinta). Data ja dokumentit ovat organisoinnin kohteina erilaisia eikä datakeskeistä tiedon organisointia käsitellä tällä kurssilla. On syytä kuitenkin huomata, että suuri osa bibliografisesta viitteestä on määrämuotoista- tai mittaista rakenteista dataa ja että bibliografisen kuvailun kehittämisessä on sovellettu tiedonhallinnassa kehitettyjä suunnittelumenetelmiä. Kaikella tietokoneen käyttöön perustuvalla tiedon organisoinnilla on tiettyjä yhteisiä lähtökohtia aineiston muodosta riippumatta.

Kuva 1.1 Esimerkki kirjan luettelointi ja sisällönkuvailutiedoista.

Tietojenkäsittelytieteen piiriin sijoittuu myös dokumenttien hallinta, jossa ollaan kiinnostuneita rakenteisten sähköisten dokumenttien tietoteknisen hallinnan kysymyksistä (ks. Jyväskylän yliopisto/Salminen/Document Management Research tai Airi Salmisen luentokalvot sähköisten dokumenttien hallinnasta). Dokumenttien hallinnan kysymykset jäävät tämän kurssin ulkopuolelle mutta niihin on hyvä perehtyä erityisesti, jos on kiinnostunut digitaalisesta asianhallinnasta ja sähköisistä asiakirja-arkistoista.

Dokumentit kokoelman perusyksikköinä

Dokumenttikokoelman organisoinnin tarve syntyy, kun hallittavien dokumenttien määrä ylittää tietyn tason. Karkeasti voidaan määritellä organisoinnin tarpeen syntyvän, kun halutun dokumentin tai informaation löytyminen käy vaikeaksi kokoelman suoralla selaamisella. On perusteltua käyttää resursseja kokoelman organisointiin, jos tuloksekas käyttö tulee sen avulla mahdolliseksi tai olennaisesti vaivattomammaksi.

Dokumentilla tarkoitetaan varsin erilaisia asioita eri yhteyksissä. Dokumentit voivat olla paperimuotoisia tai elektronisia, tekstejä, kuvia, ääniä tai näiden yhdistelmiä, erilaisia toiminnallisia tarpeita palvelevia jne. Joka tapauksessa dokumenttikokoelman hallinta edellyttää tietokantaa, joka sisältää dokumenttien kuvailutiedot ja mahdollisesti myös itse dokumentit. Kokoelma voi olla yksi fyysinen kokonaisuus (esim. kirjaston kirjakokoelma) tai se voi olla virtuaalinen kokonaisuus (esim. hakemistoon linkitetyt verkkoaineistot, viitetietokannan lähdeaineisto).

Dokumentti on tiedon organisoinnissa tärkeä käsite, sillä se on kuvailun perusyksikkö. Esimerkkejä erilaisista dokumenteista on helppo keksiä: kirja, raportti, käsikirjoitus, lehtiartikkeli, lehti, asiakirja, kirje, sähköpostiviesti, elokuva, tv-ohjelma, äänilevy, musiikkiteos, valokuva, Web-sivu jne. Kun listaa jatkaa huomaa, että dokumenttien välillä on eroja, jotka voivat olla tiedon organisoinnin kannalta ongelmallisia.

Esimerkiksi valokuva tai musiikkiteos voidaan tunnistaa dokumentiksi, mutta samat yksiköt voivat esiintyä myös osana yhtä tai useampaa muuta dokumenttia (esimerkiksi valokuva lehdessä, musiikkiteos äänilevyllä). Vastaavasti kirje voi olla osa asiakirjojen sarjaa, jotka liittyvät tietyn viranomaisen käsittelemään asiaan. Yksittäinen Web-sivu (=HTML-sivu) voi olla itsenäinen dokumentti tai käyttöliittymä laajaan verkkopalveluun. Tiedon organisoinnin lähtökohtana on se, että kuvailun kohteena olevat dokumentit (tai dokumentin kaltaiset yksiköt) pystytään nimeämään yksiselitteisesti. Joskus kuvailtava yksikkö on musiikkiteos, joskus äänilevy. Valinta riippuu kokoelman käyttötarkoituksesta.

Esimerkkejä tiedon organisoinnin sovellusalueista

Edellä on viitattu eri muistiorganisaatioihin ja niiden erilaisiin aineistoihin ja toiminnallisiin käytäntöihin. Dokumenttikokoelmia organisoidaan muistiorganisaatioiden ulkopuolellakin joten kuvailumenetelmien soveltaminen saa sitä kautta lisää monisäikeisyyttä. Seuraavassa tarkastellaan muutamaa tiedon organisoinnin sovellusalueita sovelluskirjon havainnollistamiseksi.

Kirjastojen näyttöluettelo ovat tyypillinen esimerkki bibliografisesta tietokannasta, jonka avulla kirjaston asiakkaat ja henkilökunta voivat etsiä tarvitsemaansa aineistoa. Näyttöluettelo on kokoelmakohtainen, mutta samoja kuvailutietoja tallennetaan lukuisien muidenkin kirjastojen luetteloihin. Eri kirjastot käyttävät suunnilleen samaa kuvailukäytäntöä ja hyödyntävät omassa kuvailussa valtakunnallisia yhteisluettelotietoja mikäli mahdollista. Kirjaston kokoelma on pääosin painettuja tai sähköisiä tallenteita, joten aineiston saaminen käyttöön saaminen vaatii fyysistä tallennekokoelman käyttöä. Esimerkki: PIKI-verkkokirjasto.

Alakohtaiset viitetietokannat ovat toinen esimerkki bibliografisista tietokannoista. Ne on suunnattu tietyn aihepiirin kirjallisuudesta kiinnostuneille tiedonhakijoille. Tyypillisesti kuvailtava aineisto on artikkeleita, konferenssiesitelmiä tai muuta alakohtaisesti kiinnostavaa aineistoa. Viitetietokantaan ei välttämättä liity fyysistä kokoelmaa, josta kuvaillut dokumentit olisivat hankittavissa. Käyttäjän oletetaan käyttävän esimerkiksi kirjastojen palveluja alkuperäisen lähteen käyttöön hankinnassa. Vapaan verkkojulkaisemisen lisääntyessä viitetietokannan tietueet sisältävät usein suoran linkin alkuperäiseen lähteeseen. Esimerkkejä: kotimainen artikkelien viitetietokanta ARTO, kansainvälinen kasvatustieteellinen viitetietokanta ERIC.

Provenienssi-periaatteen mukaan erityisesti arkistoinstituutioiden luettelot ovat hierarkkisia viitetietokantoja, jotka sisältävät tietoja lähinnä arkistonmuodostajista ja asiakirjasarjoista ­ ei yksittäisistä asiakirjoista. Organisaation asianhallintajärjestelmän sähköisessä arkistossa voi viitetietojen lisäksi olla myös varsinaisia asiakirjoja sähköisessä muodossa. Esimerkki: Suomen Elinkeinoelämän Keskusarkisto – ELKA.

Media-arkisto on joukkoviestintäorganisaatiolle (sanomalehdet, radio ja tv-yhtiöt) tyypillinen tapa organisoida tuotantolähtöisiä dokumenttikokoelmia. Tyypillisesti media-arkisto koostuu erillisistä teksti-, kuva-, äänite- ja videoarkistoista. Tekstiarkisto sisältää toimituksen tuottamat tai käsittelemät tekstiaineistot (esimerkiksi lehden kaikki artikkelit). Kuva-arkisto tallentaa kuvaajien ottamat tai kuvatoimistoilta hankitut valokuvat ja graafiset esitykset. Äänitearkisto vastaa tuotetuista radio-ohjelmista ja hankituista äänilevyistä. Videoarkistoon kootaan vastaavasti kaikki lähetetyt tv-ohjelmat sekä hankitut videodokumentit. Media-arkistolle on tyypillistä, että kaikki tekstit, kuvat ja äänitteet (vähitellen myös videot) ovat samassa tietokannassa kuvailutietojen kanssa. Aineistoa voidaan hakea, ottaa käyttöön ja siirtää toimitusjärjestelmään hyvin kätevästi omalla työasemalla. Esimerkki: Aamulehden tai Yleisradion arkistot.

Museon kokoelmaluettelo on analoginen sovellus kirjaston näyttöluettelosta, mutta kuvailun kohteet ovat pääasiassa esineitä. Esineistä voidaan kirjata samantyyppisiä ominaisuuksia kuin julkaisuistakin ja niistä on usein esitettävissä edustava kuva. Erityisesti taidemuseoiden osalta Internet mahdollistaa virtuaalikokoelmien perustamisen. Esimerkiksi taidemuseot ovat hyödyntäneet tätä mahdollisuutta kokoelmiensa avaamiseen laajalle nettiyleisölle. Esimerkki: The Metropolitan Museum of Arts.

Virtuaalikirjastot ja Web hakemistopalvelut ovat esimerkkejä tiedon organisoinnin sovellusalueesta, jossa verkottuva informaatioympäristö asettaa suuret haasteet perinteisille toimintamalleille. Internetissä kokoelma eli linkitettävät aineistot eivät ole tiedon organisoijan hallinnassa ja kontrolloitavissa. Aineistot ovat luonteeltaan hyvin vaihtelevia - voidaan puhua dokumentin kaltaisista resursseista tai niitä välittävistä palveluista. Toisaalta internetin resursseihin päästään käsiksi hyvin vaivattomasti, aktivoimalla hakemiston sisältämä linkki. Esimerkkejä: yleisten kirjastojen portaali, kansallinen elektroninen kirjasto, korkeakoulukirjastojen portaali.

Tiedon organisointi tutkimusalueena

Kuten edellä todettiin tiedon organisointi on tutkimuskentän nimi ja viittaa luetteloinnin ja sisällönkuvailun teoreettisiin periaatteisiin Tiedon organisoinnin tutkimuskenttään kuuluvat esimerkiksi seuraavat teemat:

  • luokitusten merkitys kielessä, sosiaalisissa järjestelmissä ja organisaatioissa
  • luokitusjärjestelmien teoreettiset perusteet - niiden pohjalla olevat käsitykset tiedosta, todellisuudesta, dokumenteista, tieteestä ja kielestä
  • sisällönkuvailun käytäntöjen empiirinen tutkimus erilaisissa toimintakonteksteissa
  • sisällönkuvailun menetelmien historiallinen analyysi: miten menetelmät ovat syntyneet ja kehittyneet, millaisessa historiallisessa kontekstissa ja millaisten ajatusvirtausten pohjalta
  • terminologiaan ja erityisalojen terminologiaan kohdistuva tutkimus
  • dokumenttien rooli yhteiskunnan tiedon tuotannon ja viestinnän viitekehyksessä.

Tiedon organisoinnin kenttä voidaan Richard P. Smiraglian mukaan jakaa kahteen traditioon: pragmaattis-rationalistiseen ja teoreettis-tutkimukselliseen. Jälkimmäistä Smiraglia nimittää "empiiriseksi" traditioksi, luokittaen näin teoreettisenkin tutkimuksen tähän traditioon. Yleisesti empiirinen traditio mielletään filosofiseksi tai sosiologis-humanistiseksi orientaatioksi informaatiotutkimuksen kentässä. (ks. tutkimussuuntauksista).

Pragmaattinen traditio kiinnittyy olemassa oleviin standardeihin (lisää standardeista). Standardien kehittäminen ei välttämättä näyttäydy niinkään empiirisen ja teoreettisen tutkimuksen kysymyksenä, vaan käytännöllisenä ja teknisenä kysymyksenä. Empiirinen traditio pohtii kysymystä, onko mahdollisuus kehittää erilaisia / erityyppisiä tai uudenlaisia standardeja.

Tiedon organisoinnin menetelmien kehittäminen on Smiraglian mukaan nojannut pääosin pragmaattis-rationaaliseen traditioon. Tämä ei tarkoita sitä, että kirjastonhoitajat olisivat olleet suuntautuneita kirjastojen ja kokoelmien hoitoon ajattelematta tekevänsä kuvailutyötä käyttäjiä varten. Vaikka esimerkiksi yleinen kymmenluokitus on lähtökohdiltaan universalistinen, eli näkee, että on tiedon universumi, joka voidaan jaotella kymmeneen pääluokkaan ja nämä edelleen alaluokkiin, jo Dewey korosti sitä, että dokumentin sijoittaminen luokitusjärjestelmään on aina tehtävä ajatelleen käyttäjää ja myöhempää käyttöä. Kuitenkin kirjastojen perinteisenä vahvuutena on ollut yhteisten universalististen standardien kehittäminen ja soveltaminen. Tämä on mahdollistanut erittäin laajojen dokumenttikokoelmien hallinnan. Kun periaatteet ja standardit ovat kaikkialla suhteellisen samanlaiset, voidaan samaan systeemiin yhdistää haettavaksi suuri määrä dokumenttikokoelmia ilman ylitsepääsemättömiä ongelmia.

Siirtymässä elektroniseen ympäristöön aikaisemmat standardit ja kuvailusäännöt siirrettiin aluksi uuteen ympäristöön lähes sellaisenaan. Tämä ratkaisu toimii vain osittain, koska elektronisessa ympäristössä dokumentin muoto ja olemus muuttuvat toisenlaisiksi. Dokumentit eivät ole samalla tavoin stabiileja kuin silloin kun dokumentit olivat olemassa fyysisinä esineinä, jotka sijaitsevat konkreettisesti tietyssä paikassa tai kokoelmassa.

Toinen uusi seikka elektronisessa ympäristössä on se, että dokumentit muuttuvat webbiympäristössä uusiksi genreiksi. Webbiympäristön uudet genret vaativat uusia tiedon organisoinnin menetelmiä. Näiden kehitysten vuoksi tiedon organisoinnin empiirinen tutkimus on viime vuosina herännyt ikään kuin Ruususen unesta. Elektronisen ympäristön uusien piirteiden ja mahdollisuuksien takia kiinnostus ei kohdistu enää vain hyvin laajojen dokumenttikokoelmien hallinnan menetelmiin, vaan myös dokumenttien tutkimukseen - dokumenttirakenteisiin, -genreihin ja -arkkitehtuuriin - mikrotasolla.

Toinen kiinnostuksen kohde, joka on elektronisessa ympäristössä herännyt uudelleen on kiinnostus dokumenttien "sosiaaliseen elämään" (Brown & Duguid). Tutkijat ovat kiinnostuneita kokeilemaan, tuoko erityyppisten dokumenttien (esimerkiksi tieteellisen artikkelin rakenne, sanomalehtitekstin rakenne) ja niiden käyttötapojen tutkimus (esimerkiksi henkilökohtaiset luokitusjärjestelmät, henkilökohtaisten kokoelmien / tiedostojen organisointi, muistiinpanokäytäntöjen tutkimus) mahdollisesti uudenlaisia ratkaisuja tiedon organisointiin .

Elektronisessa ympäristössä dokumenttikokoelmien hallinnan ja organisoinnin kysymykset eivät ole enää kirjasto- ja informaatioalan erityisosaamista samalla tavoin kuin fyysisessä kirjastoympäristössä. Internetissä vallitsee kilpailutilanne, hyvin monet eri tahot: yritykset, monet eri tieteenalat ja erilaiset yksityiset toimijat kehittävät ratkaisuja ja menetelmiä dokumenttien kuvailuun ja tiedon organisointiin. Näin myös informaatiotutkimuksen alalta valmistuvat pääsevät yhä useammin sellaisiin tehtäviin, joissa ei ole kyse vain valmiiden kuvailustandardien kanssa tehtävästä työstä, vaan dokumenttienhallintasysteemien kehittämisestä tietylle organisaatiolle tai tiettyyn työtehtävään. Tähän haasteeseen koulutus pyrkii osaltaan vastaamaan vahvistamalla tiedon organisoinnin asemaa koulutuksessa.

Pohdintatehtäviä

  1. Dokumentti-käsitteelle on vaikea keksiä hyvää määritelmää johtuen mm. siitä, että dokumentteja on kovin monenlaisia. Pohdi minkälaisia ominaisuuksia tai piirteitä useimmilla dokumenteilla näyttäisi olevan.
  2. Tekijöiden (tai tekijyyden) nimeäminen on yksi dokumenttien kuvailun osa-alue. Mieti millä tavalla tekijyys on erilaista seuraavissa dokumenttityypeissä: a) kirja, b) äänilevy ja c) elokuva.

Kurssin rakenne ja yhteydet muihin kursseihin

Tämä verkkoaineisto koostuu 12 jaksosta:

  1. Johdanto I: tämä jakso
  2. Johdanto II: Dokumentit ja toiminnalliset prosessit
  3. Dokumenttien ulkoisten piirteiden kuvailua (kirjastojen luettelointiperinne)
  4. Asiakirjojen organisointi ja kuvailu
  5. Sisällönkuvailu I: luokitus
  6. Sisällönkuvailu II: asiasanoitus
  7. Tesauruksen suunnittelu
  8. Erityisaineistojen kuvailukysymyksiä (musiikki, kuvat, videot, kaunokirjallisuus)
  9. Internet ja Dublin Core
  10. Informaatioarkkitehtuurit nettipalveluissa
  11. Johdatus tiedon organisointiin tutkimuskenttänä
  12. Yhteenveto, kuvailujen integrointi

Kurssiin osallistuvien oletetaan suorittaneen jo aiemmin opintojaksot Informaatiotutkimuksen perusteet ja Tiedonhaun perusteet. Kurssin suoritus tukee puolestaan opintojaksojen Tiedonlähteet ja välittäjäorganisaatiot ja Tiedon organisoinnin perusteet –kirjatentti. Kurssista on erityisesti hyötyä Tietokantaprojektin suorituksessa, koska siellä suunnitellaan ja toteutetaan viitetietokanta asiasanastoineen ja kuvailuineen.

Lähteet

Smiraglia, R.P. (2002) The progress of theory in knowledge organization. Library Trends 50(3), 330-349.