RAAMATUKOGU ELEKTRONKATALOOG 1: ARENGULUGU JA OLEMUS

Sirje Nilbe


1. Sissejuhatus

Et tänapäeva muutuvas maailmas elus püsida ja edasi areneda, on raamatukogud üha enam kanda võtnud infokeskuste rolli. Informatsiooni kogumine, töötlemine, säilitamine ja kättesaadavaks tegemine koosneb suurelt jaolt rutiinsetest toimingutest, mida arvutipõhise tehnoloogiaga saab tunduvalt ratsionaliseerida. Informatsiooni taasleidmiseks pakub kaasaegne infotehnoloogia kvalitatiivselt paremaid võimalusi kui varasemad "paberist" süsteemid.

Juba hulk aastaid on arvuteid kasutatud sellisteks tegevusteks nagu jadaväljaannete haldus ja registreerimine, laenutuste registreerimine, komplekteerimine, bibliokirjete koostamine, koondkataloogide pidamine jms. Meilegi on see tuttav asi. Lugejateni on aga raamatukogu sisetöö tulemused jõudnud ikka traditsioonilisel kujul: kartoteekide ja trükitud bibliograafiatena, trüki- ja kaartkataloogidena.

Lugeja infootsingu seisukohalt algas uus etapp raamatukogude automatiseerimises avalike siduskataloogide (online public access catalogue/OPAC) juurutamisega.

Käesolev kirjutis juhatab sisse artiklisarja, milles püütakse kirjanduse ja mõningase isikliku kogemuse põhjal anda ülevaade raamatukogu elektronkataloogide olemusest, arendamisest ja uurimisest. Eesti seni ainuke avalik siduskataloog töötab Tartu Ülikooli raamatukogus. See loodi täiesti oma jõududega ja on paljuski ebatüüpiline oma tehniliste lahenduste poolest, eriti võrreldes angloameerika malliga. 1997. aasta tõotab tulla meie suurematele teadusraamatukogudele huvitav, sest alanud on ühise integreeritud raamatukogusüsteemi INNOPAC evitustöö. Vahest leiavad raamatukoguhoidjad neist kirjutistest natuke taustteadmisi, et valutumalt läbida keeruline periood üleminekul uuele töötehnoloogiale.

2. Elektronkataloogide tekkimine ja areng

Raamatukogude elektronkatalooge (EK) saab vaadelda kahest aspektist: kui infootsisüsteeme (IR-süstemid) ja kui raamatukogutöö automatiseerimise põhikomponenti. Infootsisüsteemina peab EK täitma eelkõige neidsamu nõudeid, mis C. A. Cutter juba 1867. aastal raamatukogukataloogile esitas. Kataloog peab:

Raamatukogutöö tehnoloogia seisukohalt on EK andmebaas selleks tuumaks, millel rajaneb kogude haldus ja laenutus. EK-de sünnis oli määrava tähtsusega just viimane aspekt (vajadus ratsionaliseerida kataloogimist ja laenutuste kontrolli, raamatukogu igipõliseid tegevusi).

Kui kataloogima hakati arvuti abil, ei nähtud algul ette tekkiva andmebaasi kasutamist lugeja poolt. See oli mõeldud raamatukogu sisetööks, et hõlbustada traditsiooniliste kataloogivormide (kaart-, trüki- ja mikrovormkataloogide) tootmist. EK-de sünnimaal Ameerikas oli reeglikohaste kirjete koostamine suurelt osalt koondunud kataloogimiskeskustesse, mis müüsid valmis kaarte või MARC-formaadis elektroonilisi kirjeid. Arvestuseks ja ringluse kontrolliks arvuti abil piisas raamatukogudel minimaalsete bibliograafiliste andmete sisestamisest teaviku kohta. Üsna varsti leiti, et need andmebaasid võiksid olla kättesaadavad ka lugejale nii raamatukogus kui sideliinide kaudu väljaspool raamatukogu. Elektronkatalooge hakati nimetama avalikeks siduskataloogideks (online public access catalog - OPAC).

Esimesed automatiseeritud süsteemid, mida võiks nimetada EK-deks, võeti kasutusele 1970. aastate keskel Ameerikas. Organisatsioonid, kus need juurutati, olid Online Computer Library Center (OCLC) (jaanuar 1974), Research Libraries Group/Research Libraries Network (RLG/RLIN) (detsember 1974) ja Ohio State University Library (jaanuar 1975) (Su 1994).

1970. aastate teine pool oli paljudes raamatukogudes katsetuste aeg. EK-de juurutamine ei läinud algul kuigi libedalt. Mõned raamatukogud loobusid EK-dest kui liiga kulukatest ja liiga "eksootilistest" süsteemidest. Osa raamatukoguhoidjaid pidas automatiseerimist tühjaks trikitamiseks. Kongressi Raamatukogu plaanis lõpetada kaartkataloogi täiendamise 1980. aastal, kuid valis jätkamiseks mitte EK, vaid arvuti abil toodetud mikrokaardid. Barjäär murdus 1980. aastate algul. 1982. aastal oli Ameerika Ühendriikides vähemalt 20 EK-d. Kui esimesed EK-d programmeeriti ainueksemplaridena kohalikuks kasutamiseks, siis 1985. aastal oli USA-s juba 48 firmat, kes müüsid kataloogisüsteeme (Su 1994). EK-d ja nende kasutamine lugeja poolt said ka teadusliku uurimistöö objektiks.

C. R. Hildreth, üks juhtivaid EK-de uurijaid, on juba 1983. aastast alates korduvalt rääkinud ja kirjutanud EK-de kolmest põlvkonnast. Tema jaotus põhineb EK-de kvalitatiivsetel erinevustel, sidumata ühtegi põlvkonda mingi kindla ajavahemikuga (Hildreth 1987). Hildrethi kriteeriumide järgi saab EK-de arengu kokku võtta järgmiselt.

Esimesed EK-d tekkisid suurte raamatukogude laenutus- ja kataloogimissüsteemidest. Kuigi tasulisi infoteenuseid pakkuvaid infootsisüsteeme (Information Retrieval system - IR süsteem) oli käigus juba palju ja pikemat aega, ei võetud neid esialgu kuigivõrd eeskujuks EK-de loomisel. Peamine põhjus oli süsteemide erinev suunitlus: IR-andmebaasid olid algusest peale mõeldud infootsinguks, eriti aineotsinguks, EK-d aga kopeerisid kaartkatalooge. Erinevus nähtub juba bibliokirjete struktuurist: EK-s ei ole kokkuvõtteid ja sisuanalüüs on muuski osas palju napim kui kommertsandmebaasides. Sidusandmebaase vahendasid väljaõppinud infoteenindajad, kes said hakkama keerulise, kuid tulemusliku otsitehnikaga. Raamatukogu lugejalt ei saanud samasugust asjatundmist eeldada.

IR-andmebaase ja EK-sid võrreldes tuleb meeles pidada ka seda, et raamatukogudel pole olnud nii palju raha arendustööks kui infofirmadel. Oluline vahe on seegi, et raamatukogus kataloogitav ainestik on palju mitmekesisem kui keskmise andmebaasi oma nii sisu, keelte kui ka teavikulaadide ja -tüüpide poolest.

Esimeste EK-de kirjed olid üsna napid: tihti vaid autor, pealkiri, kohaviit ja saadavusandmed. Märksõnu sageli polnudki. Ei olnud võimalik kasutada täistekstotsingut ega kärpimist (truncation), päring pidi täpselt vastama andmebaasi registri sõnadele või väljenditele. Järelkoordinatsiooni ei saanud üldiselt rakendada, mõnes süsteemis võis siiski otsida koos autori nime ja pealkirja algust.

Esimese põlvkonna EK-de loojad eeldasid, et kasutaja teab täpselt, mida otsib. Registrite või kirjete sirvimise (browsing) võimalust polnud või oli see väga piiratud. Otsiterminite valimiseks ega muukski süsteem abi ei pakkunud ja tihtipeale lugeja ei saanudki aru, miks tema otsing ebaõnnestus.

Suhtlemine arvutiga käis enamasti menüüreziimis ja tulemuseks saadi lühikirjed, mis võimaldasid teose lokaliseerida.

Teise põlvkonna EK-des on eelmise põlve vigu püütud parandada, võttes eeskujuks IR-süsteemide omadusi. Kirjed on täielikumad ja otsitavaid välju on rohkem. On suurendatud registrite arvu ja täiustatud autoriteetfaile ning antud võimalus neid lehitseda. Aineotsing märksõnade ja võtmesõnade abil on tavaline ning täiendatud järelkoordinatsiooni ning Boole'i operaatoritega. Võtmesõnaregister on moodustatud tavaliselt pealkirja ja märksõnade väljadest. Otsitermineid saab paremalt poolt kärpida. Sageli on võimalik otsingut piirata ilmumisaja, ilmumiskoha, keele järgi.

Kasutajaliides on muutunud mitmekesisemaks ja interaktiivsemaks: juba registris antakse teada otsitunnusele vastavate kirjete arv, otsingu käigus on võimalik tagasi liikuda, saab valida menüüreziimi (algajatele) ja käsureziimi (edasijõudnutele) vahel jms. Arvutis on harjutusprogrammid ja eksimustest antakse teada koos parandusjuhistega. Leitud kirjed on võimalik saada mitmes formaadis (nt. lühiandmed, täielik bibliokirje, MARC-kirje). Niisiis on teise põlvkonna EK-des ühendatud hästistruktureeritud raamatukogukataloogi ja konventsionaalse Boole'i otsingul põhineva IR-süsteemi omadused. Enamik praegu töötavaid EK-sid on seda tüüpi.

Kui lisada teise põlve omadustele mitmeid täiendusi, peaksid EK-d muutuma veel efektiivsemaks ja kasutajasõbralikumaks ning moodustama kolmanda põlvkonna. Oluliseks peetakse, et päringuid saaks esitada loomulikus keeles, et andmebaasis navigeerimist assisteeriks intelligentsed programmid, et otsingu igas järgus oleks hea tagasiside. Aineotsingus näiteks tuleb integreerida märksõna-, liigi- ja võtmesõnaotsing, nii et otsiterminite konversioon toimuks automaatselt. "Täpse vaste" (exact-match) printsiibi asemel peaks süsteem toimima "lähima vaste" (best-match) põhimõtte järgi. Väljundkirjed tuleks reastada vastavalt nende oletatavale relevantsusele ja kasutajal peaks olema võimalus anda tagasisidet väljundi relevantsuse kohta (relevance feedback).

Kataloog peaks hõlmama raamatukogu varasid täielikult, osalt bibliokirjetena, osalt täistekstidena ja kujutistena. Bibliokirjed võiks olla inforikkamad. EK-le peaks olema laialdane juurdepääs infovõrkude kaudu, teisalt peaks kataloog olema seotud mitmesuguste teiste andmebaaside ja infosüsteemidega.

Kolmanda põlvkonna EK-sid, millel oleks kasvõi enamik loetletud omadusi, praegu veel ei eksisteeri. Prototüüpsüsteeme, milles katsetatakse üht või mitut uuendust, on küll loodud, kuid raamatukogusüsteeme tootvad firmad on üsna visad oma toodangut kardinaalselt muutma, olemata kindlad, et see nende läbimüüki oluliselt suurendaks. Integreeritud raamatukogusüsteem on üks keerukamaid infosüsteeme, ja raamatukogud mitte just eriti maksujõulised kliendid.

Raamatukogu seisukohalt vaadates leiab samuti mitmeid takistusi EK-de põhimõtteliseks uuendamiseks. Kataloog on kumulatiivne andmebaas, mille kirjete, sisuanalüüsi ja autoriteetfailide tagantjärele täiendamine ei tule suuremas mahus kõne alla, eriti kui järjekorras ootamas hulk konverteerimata materjali ja uudiskirjandust. Kui on vaja valida, kas eelistada sisetöö ja bibliograafilise kontrolli või lugeja vajadusi, kaldub kogu maailma ramatukoguhoidjate südametunnistus esimese alternatiivi poole, kasvõi juba seepärast, et oma vajadused on paremini ja ühemõttelisemalt teada.

Nimetatud vastuolud ei tähenda aga, et EK-de areng oleks lõplikult seiskunud. Infootsing kui uurimisala areneb jõudsalt ning küllap jõuavad tulemused ka raamatukogukataloogidesse. Meie oludes oleks suur edasiminek teadusraamatukogudes korralikult käima panna teise põlvkonna omadustega elektronkataloog ja see võimalikult kiiresti rohke infoga täita.

3. Elektronkataloogi kontseptuaalne mudel

Iga EK-i,  hoolimata selle konkreetsetest iseärasustest, saab vaadelda kui funktsionaalsete kihtide (layers) süsteemi, mis vahendab kasutajat ja andmebaasis säilitatavaid bibliograafilisi andmeid. Need funktsionaalsed kihid on järgmised (Larson 1991):

Funktsionaalsed kihid on realiseeritud infootsisüsteemina vastava tarkvara ja riistvara abil. Realisatsiooni tasandil on kihtide ülesanded lahendatud eri süsteemides erinevalt ja kihid ise pole nii selgelt eristatavad.

Raamatukogukataloogile omast informatsiooni sisaldab ja säilitab niisiis ainult andmebaasikiht, kuna ülejäänud kihtide ülesanne on seda informatsiooni korrastada ja kasutajale väljastada. Funktsionaalsete kihtide, eriti andmebaasi, suhtelise iseseisvuse tõttu on võimalik näiteks kirjeid ühest süsteemist teise üle kanda.

EK andmebaasis säilitatavad infokogumid on tavaliselt kolme tüüpi: bibliokirjed, registrid ja autoriteetfailid. Lähemalt nendest edaspidi.

Andmebaasihaldussüsteemi (Database Management System/DBMS) kihi ülesandeks on:

Lugejad saavad kasutada vaid EK otsifunktsiooni. Kirjete lisamine, parandamine ja kustutamine on võimalik ainult selleks volitatud personaliliikmetel. Andmebaasi hooldus toimub sõltuvalt tarkvarast kas reaalajas, mispuhul muudatused andmebaasis ilmnevad vahetult pärast nende tegemist, või pakktöötlusena (batch processing), mil sisestatud muudatused lisatakse andmebaasi portsukaupa näiteks õhtul või öösel; süsteemi otsifunktsioon on sel ajal blokeeritud.

Andmebaasi struktuur ja otsimehhanismid võivad olla küllalt keerulised, kuid kasutaja ei pea neid tundma.

Andmebaasihaldussüsteemi liidese kihi ülesanne on tõlkida kasutaja käsud või menüüvalikud vastavaks reaks andmebaasioperatsioonideks. See rida võib sisaldada mitmete pöördus- ja otsimeetodite, registrite ja andmebaasifailide koordineeritud kasutamist selleks, et anda vastus lugeja päringule.

DBMS-i liidese kihi ülesandeks on ka sellised otsinguga seotud toimingud, mida ei soorita DBMS ise, näiteks loogikaoperatsioonid eelnevalt väljaotsitud kirjete hulkadega või kirjete reastamine relevantsuse järjekorras.

DBMS-i liides võib osaliselt või tervikuna paikneda isegi hoopis teises arvutis. Sellisel juhul peab liides sisaldama programme, mis konverteerivad päringud ja vastused võrguülekandeks vajalikku standardvormingusse.

Kasutajaliidese kihti kuuluvad need süsteemi osad, mis vahetult tegelevad infovahetusega kasutaja ja süsteemi vahel. See on EK kõige nähtavam osa ja mõjutab, nagu näitavad uuringud, kõige enam tavakasutaja arvamust kataloogist, kuigi andmebaasi sisu ja süsteemi otsiomadused on tulemuste seisukohalt olulisemad.

Kasutajaliidese põhiülesanded on:

Hästi projekteeritud ja kergesti käideldav kasutajaliides võib varjata otsimehhanismide sisemise keerukuse või korvata nende mehhanismide puudujääke inimese ja arvuti interaktsiooni parandamise teel.

Esitatud kontseptuaalne mudel peaks aitama arvutihariduseta raamatukoguhoidjatel, kes kataloogi koostavad, kasutavad, lugejatele vahendavad ja täiustusi planeerivad, mõista, mis põhimõtteliselt toimub selles "mustas kastis", millest pole näha muud kui see, mis kuvarile ilmub.

Kasutatud kirjandus

Hildreth, C. (1987). Beyond Boolean: designing the next generation of online catalogs. Library Trends  45 (4) : 647-667.

Larson, R. R. (1991). Between Scylla and Charybdis: subject searching in the online catalog. Advances in Librarianship 15 : 175-236.

Su, S.-F. (1994). Dialogue with an OPAC: how visionary was Swanson in 1964? Library Quarterly 64 (2) : 130-161.

English

Tagasi koduleheküljele


Koostatud 17.veebruaril 1997
sirvir@tpu.ee