Tämä materiaali on arkistoitu. Sisältöä ei enää päivitetä. Kaikki sisältö ei välttämättä ole saatavilla.
Muokkaa

Tietokannat

Tietokantojen käyttö

Tietokannalla tarkoitetaan informaatiokokoelmaa, jota hallitaan koneellisesti. Kokoelma koostuu tietueista, tiettyä kohdetta koskevista tallenneyksiköistä. Bibliografisilla tietokannoilla, joilla tällä kurssilla on tärkeä rooli, sisältönä ovat lähteiden kuvailutiedot. Kuvailutiedot eivät siis sisällä varsinaista lähdettä vaan nimeävät esimerkiksi sen nimen, tekijän, julkaisijan, ja mahdollisesti jotain sisällöstä ja ulkoasusta.  Lähdetietokannoissa sisältöinä taas ovat lähteiden informaatiosisällöt,  kokonaiset lehtiartikkelit, ohjelmakoodi, kuvat ja multimedia esimerkiksi. Lähdetietokannoista siis saa esiin varsinaisen etsityn asian, bibliografisesta tietokannasta viittauksia toisiin lähteisiin.

Tietokannan määritelmiä:

  • 1. Informaatiokokoelma koneluettavassa muodossa, jossa informaatiota voidaan käsitellä.
  • 2. Tekstien tai tietojen kokoelma, joka kattaa tietyn rajatun aiheen tai alueen.
  • 3. Informaation varasto, joka käsittää rajatun alueen tai aiheen, ja jota on tarkoitus käyttää tiettyyn tarkoitukseen.
  • 4. Pysyvästi tallennetun tiedon kokoelma, jota jokin yritys tai organisaatio käyttääEtsittäessä laajasti tietoa jostakin aiheesta aloitetaan usein jostain sekundäärista julkaisusta (bibliografia, indeksi, luettelo). Näitä on saatavissa painetussa muodossa ja tietokantana CD-ROM-levyillä, suorasaantisena (online) ja internetin kautta. Monenlaisia hakuteoksia ja käsikirjoja on nykyään käytettävissä tietokantoina ja suuntaus on, että kirjastot tarjoavat entistä useammin käsikirjastoaineistoja ja hakuvälineitä tietokantoina.
     
  • Tietokantoja on tarjolla vaihtelevin ehdoin. Yleensä esimerkiksi CD-ROM-kantojen käyttöikeudet on sopimuksissa rajattu niin, että yhden käytettäväksi lisensoitua tietokantaa ei saa asettaa jaettuun verkkoon puhumattakaan avoimesta verkosta. Niinpä jotkut tietokannat ovat käytettävissä vain paikallisesti kirjastoissa (paikalliset CD-ROM -tietokannat). Korkeakulujen verkossa on  korkeakoulun henkilökunnan ja opiskelijoiden käytössä olevia tietokantoja, joissa käyttö on rajattu korkeakoulun verkkoon. Suorasaantisista tietokannoista osa vaatii käyttäjätunnuksia. Internetissä on vapaasti käytettäviä tietokantoja  (esimerkiksi Libris, Medline, kirjastojen luettelot)
     

Tietokantojen tyyppejä

(näistä tarkemmin, esim. Järvelin, Kalervo (1995). Tekstitiedonhaku tietokannoista)

1. Sisältöön perustuva jaottelu:

Korviketietokannat sisältävät tietoa primäärilähteissa olevasta informaatiosta eli niissä viitataan primaarilähteisiin

  • Bibliografiset tietokannat eli viitetietokannat (esim.. KATI, Medline, PsychLit)
  • Kirjastoluettelot

Indeksit / rekisterit / hakemistot (esim. Yritysfaktat)

  • Luettelot

Lähdetietokannat  (faktatietokannat, tietopankit)

Tekstitietokannat

  • Kokotekstitietokannat (esim. NEXIS, FINLEX)

Tesaurukset, termiluettelot

Faktatietokannat  (numeeriset tietokannat)

Muut

  • Ohjelmistotietokannat (esim. Internetissä)
  • Kuvatietokannat
  • Äänitietokannat
  • Hypermedia-tietokannat www:ssä
  • Tietokannat tietokannoista

2.  Jakelutapaan perustuva jaottelu:

  • CD-ROM -tietokannat
  • Online-tietokannat
  • WWW-tietokannat

3. Käyttöalan mukainen jaottelu:

  • Monitieteiset tietokannat (tieteidenväliset tai tiederyhmäkohtaiset)
  • Alakohtaiset  tietokannat

 Tietokantojen valinta

Tietokannan  valinnassa voi käyttää mm seuraavia kriteereitä:

  • valitse tietokanta kysymyksen tai hakulausekkeen aihealueen mukaan. Usein joutuu valitsemaan kaksi tai useampiakin tietokantoja.
  • valitse niin spesifi tietokanta kuin mahdollista
  • minkä tyyppisestä tietokannasta ja minkä tyyppisestä dokumentista on kyse?
  • mistä aineisto on peräisin (mistä aikakauslehdistä artikkelit ovat peräisin; mistä  maista markkinatiedot kerätään jne.)
  • kuinka pitkän aikajakson aineisto kattaa?  Kuinka ajankohtaista se on?
  • tietokannan kieli
  • käytetäänkö luokitusjärjestelmää?
  • avainsanojen valinta ja muoto?   

Bibliografiset tietokannat
 

-Sisältävät viitetietoa (viite, bibliografiset tiedot) dokumentteihin, esim. suureen määrään aikakauslehtiartikkeleita

  • informaatio on osin strukturoitua (tekijä, aikakauslehti, painovuosi), osin tekstiä (otsikko, abstrakti)
  • informaatio on epäsuoraa, se kuvaa jotain dokumenttia. Tarkoitus on viitteen kautta löytää tai paikallistaa dokumentteja
  • hakukysymykset ovat tyypillisesti epämääräisiä ("artikkeleita tietystä aiheesta")
  • hakutulokset ovat usein epätäydellisiä

Kirjastoluettelot

- sisältävät tiedot yhden tai useamman kirjaston kokoelmista

Faktatietokannat

- sisältävät suoraan käytettävissä olevaa tietoa tilastoja, markkinatietoa, kemiallisia kaavoja, geenisekvenssejä, termejä tai numeerisia arvoja

  • informaatio on rakenteista eli strukturoitua
  • hakulausekkeet muotoillaan usein hyvin eksaktisti
  • vastaukset ovat täydellisiä, eksakteja, virheiden riski pieni
  • informaatio saadaan välittömästi

Kokotekstitietokannat

- Uutistietokannat, lakikokoelmat tai kokotekstiartikkelit yhdestä tai
useasta julkaisusta.

  •   informaatio pääasiassa strukturoimattomana (rakententeistamattomana) tekstinä
  •   informaatio saadaan suoraan, mutta vaatii läpilukemista ja analyysiä
  •   hakutulos voi olla epätäydellinen ja sisältää virheitä

Kuvatietokannat
- sisältävät graafista aineistoa,

  •  esim. sanomalehtien digitaaliset kuva-arkistot
  •  koostuvat usein kahdesta osasta: tekstiosasta, jossa on kuvien kuvailu, tietoja kuvista ja kuvatekstit (haettavissa oleva osa) ja osa itse kuvat sisältävä osa, josta kuvat voidaan ottaa käyttöön, kun ne on paikallistettu.
     

Esimerkki:
Projektet Bildarvet - fyra bilddatabaser vid Bildsamlingarna, Åbo Akademis
bibliotek (http://www.abo.fi/library/bildarvet/)
- Trip-tietokanta, jossa on linkit eri palvelimella oleviin kuviin.

Artpic, Taideaineiden laitokset

Bildsam, Åbo Akademis bildsamlingar

Etnpic, kansantieteelliset laitokset

Musicpic, Sibeliusmuseo / Musikvetenskapliga institutionen
 

Tehtävä: Etsi Åbo Akademin kuvakokoelmasta kuvia Turun kaupunginkirjastosta vuosisadan alusta

Suomen Valtion taidemuseon kuvista on myös kuvatietokanta verkossa. Katso. esimerkiksi miltä Werner  Holmbergin maalaus Kyröskoski näyttää ja mitä muita Holmbergin töitä on Ateneumissa:

 Äänitietokannat
 

Arkivet för ljud och bild, ALB on Ruotsin kansallinen arkisto, jonka tehtävänä on tallentaa ääntä, liikkuvaa kuvaa, radio- ja tv-ohjelmia, filmejä, videoita, äänilevyjä, CD-levyjä, äänikasetteja, multimediaa jne.

Suomessa ei ole vastaavaa julkista laitosta, mutta yksityiset asianharrastajat ovat perustaneet Suomen äänitearkiston, johon pyritään (ja onkin lähes onnistuttu) kokoamaan täydellinen, ennen vuoden 1981 vapaakappalelakia ilmestyneiden suomalaisten äänilevyjen kokoelma ; tietoja ja mm. luettelot:  Suomalaisten äänilevyjen luettelo 1901-1945 ja Suomalaista laulutaidetta äänilevyillä 1902-1945. Myös ääninäytteitä kappaleista jotka on äänitetty ensimmäisen kerran 50 vuotta sitten ja joitten tekijöitten ( säveltäjä tai sanoittaja ) kuolemasta täytyy on vähintään 70 vuotta.  http://www.yle.fi/aanilevysto/firs/

 

Cd-rom-tietokannat
 

CD-ROM  (compact data-read only memory) on optinen levy, jossa voi olla aineistoa 650 MB. (MB eli Megatavu tarkoittaa hieman yli miljoonaa tavua; tavu voi sisältää esimerkiksi yhden kirjaimen. Tavu taas on kahdeksan bitin jono, jossa bitin arvona voi olla päällä tai pois ).  CD-ROM:it eli romput soveltuvat hyvin esim. hakuteosten, multimediatietokantojen ja bibliografisten tietokantojen tarjoamiseen.     Näitä tietokantoja voidaan käyttää omalla tietokoneella tai ne voidaan sijoittaa paikalliseen verkkoon.  Monilla korkeakoulukirjastoilla on suuri määrä CD-ROM-tietokantoja paikallisissa verkoissaan, jolloin tietokannat ovat käytettävissä haettavissa kaikilta tietokoneilta, jotka kuuluvat  korkeakoulun paikallisverkkoon. DVD on CD-ROM -teknologiasta edelleen kehitetty teknologia, joka on varsinkin multimediassa vallannut markkinoita suuremman tallennetilansa vuoksi (4700 MB ja yli).
 

Monet tietokannat ovat nykyisin käytettävissä sekä CD-ROMeina että suorasaantisina (online).  Periaatteessa haku tapahtuu samalla tavalla, mutta tiettyjä eroja on:
 - CD-ROM-versiota ei päivitetä niin usein kuin online-tietokantaa
 - käyttökustannukset eivät CD-ROMia käytettäessä ole riippuvaisia käyttöajasta.
 - Online- ja CD-versioilla on usein hieman erilaiset, ainakin erinäköiset käyttöliittymät


 Online-tietokannat

Online-tietokannat eli suorasaantiset tietokannat ovat elektronisten tietokantojen muoto, jolle on tyypillistä mm. että ne sijaitsevat palvelimella, johon otetaan yhteys omalta tietokoneelta .  Monia online-tietokantoja ylläpitävät kaupalliset tietokantojen tarjoajat (datahosts) ja niiden käyttö on maksullista.

Online-tietokantojen historia alkoi toden teolla 1972, jolloin Dialog alkoi tarjota tuotteitaan myyntiin.   Yhteys tietokannan tarjoajaan ja haku tietokannasta oli pitkään melko monimutkaista ja vaati yleensä ammattimaista informaationvälittäjää (informaatikkoa).   Viime vuosina monet  online-tietokannat tulleet käyttöön WWW:n kautta ( esim. Dialogweb). Online-tietokanta saattaa vaatia käyttöoikeuden ja salasanan. Haun kustannukset voivat perustua hakuaikaan tai näytettyjen viitetietojen määrään. Online-tietokantojen hyvä puoli on se, että ne voidaan päivittää vaikka kerran päivässä tai viikossa. Jos tätä mahdollisuutta käytetään,  tietokannan sisältö on silloin ajankohtaisempaa kuin harvemmin asiakkaille jaettavissa painatteissa ja rompuilla.


WWW -tietokannat
 

Nykyään on yhä useampi tietokanta käytettävissä WWW:n kautta. Esim.
- Libris
- Medline (PubMed)

- Eric

Elektroniset aikakauslehdet
 

Monista aikakauslehdistä tuotetaan sekä painettu että elektroninen versio. Elsevierin julkaisemat lehdet esimerkiksi ovat saatavana suorasaantisena sähköisesti.

 Tietokannat tietokannoista

Tietokantatietokannat vastaavat idealtaan bibliografioiden bibliografioita. Tietokannat tietokannoista  sisältävät tietoja saatavilla olevista tietokannoista

Esim. . Gale Group julkaisee luetteloa Gale Directory of Databases - Vol. 99 (99th ed.) 1998 (ISBN/ISSN: 0-7876-2298-2), jossa on tiedot yli  13.000 tietokannasta ympäri maailmaa,  mukana tietokannan kuvaus sekä tietoja aiheesta, kielestä, maantieteellisestä katteesta, käytettävyydestä ja hinnasta sekä yhteystiedot tuottajaan. On käytössä myös online-tietokantana, CD-ROMina ja levykkeellä. Dialog oli edelläkävijä tietokantatuottajana. Palvelussa kanta Dialindex, kanta 411 on tietokanta Dialogin kaikista tietokannoista.

Tietokantojen tuottajat ja tietokantapalvelujen välittäjät

Online-tiedonhakujärjestelmä tai tietopankki on yleisesti  käytettävissä oleva, usein maksullinen palvelu.  Organisaatio,  joka ylläpitää
järjestelmää, tarjoaa yhden tai useita tietokantoja (jotka sijaitsevat yhdellä tai usealla suurtietokoneella) sekä hakukielen tai ohjelman, jonka
avulla on mahdollista etsiä ja poimia haluttua tietoa tietokannoista. Palvelua ylläpitävät kansalliset tai kansainväliset organisaatiot, jotka
ovat erikoistuneet tieteellisen tiedonvälitykseen, tai kaupalliset yhtiöt tai yritykset.

Tietokantojen välittäjät eivät usein itse tuota tietokantaa vaan toimivat "tietokantatavaratalona", joka tarjoaa eri tuottajien tietokantoja.  Sen
vuoksi monet tietokannat ovat käytettävissä useiden tietokantavälittäjien kautta. Tietokantavälittäjien toiminta perustuu tietoverkon ja tietojenkäsittelyn kehitykseen. Kehitys alkoi 1960-luvulla, kun luonnontieteellisiä ja teknisiä abstraktijulkaisuja siirrettiin magneettinauhalle.  1970-luvulla kehitettiin ensimmäiset online- (interaktiiviset) järjestelmät. Ensimmäiset tietokantojen välittäjät olivat amerikkalaisia yrityksiä. Edelläkävijä on Dialog (yhä yksi suurimmista), joka toi markkinoille kolme online-tietokantaa 1972.

Suomessa kolme suurinta tietokantojen välittäjää ovat  Tieto-Enator, Helsingin kauppakorkeakoulun Helecon ja VTT .
 


Tiedonhaku tietokannoista
 

Tiedonhaku tietokannasta on suunnittelua vaativa prosessi. Tietokone ei ole informaatikko eikä kirjastonhoitaja, jolla on "sormenpäätuntuma" asiakkaan tiedontarpeisiin. Tietokantahauissa hakija yrittää muotoilla sellaisen hakulausekkeen, joka kuvaa jotakin mahdollisimman oleellista ja erottelevaa etsittävästä aineistosta ja joka informaatio on myös kuvattu tietokantaan.

Tietokannoista tapahtuvan haun etuja manuaaliseen hakuun nähden:

  • haun tuloksen saaminen nopeampaa
  • haku tapahtuu suuresta aineistosta.  Monet tietokannat, erityisesti suuret bibliografiset tietokannat sisältävät aineistoa varhaiselta 1970-luvulta alkaen
  • ajankohtaisuus. Painetut tiedonlähteet ilmestyvät aina tietyllä viiveellä.
  • joustavuus.  Hakustrategiaa voidaan muuttaa haun aikana.
  • aineistosta voidaan hakea yksityiskohtaisesti käyttäen monia lähestymistapoja (esim. bibliografisesta tietokannasta julkaisuvuoden, sivumäärän, kuvituksen yms. mukaan)