INFOOTSING INTERNETIS

Internet
Ajalugu
Eesti
Struktuur
Teenused
Otsing Internetis
Otsivõimaluste tutvustus
Eesti otsisüsteemid:
Eesti WWWärk
Neti
Eesti keelde tõlgitud otsisüsteemid:
AltaVista
Euroseek
 
Teised enamkasutatavad otsivõimalused:
Excite
HotBot
Infoseek
Lycos
MetaCrawler
WebCrawler
Yahoo


Ajalugu

 Internet on alguse saanud neljast arvutist koosnevast militaarsest kaugvõrgust ARPAnet (U. S. Defeuse Departments Advanced Research Projects Agency), mille esimene proovivõrk hakkas tööle 01.09.1969. a. ja seda päeva loetaksegi Interneti sünnipäevaks.

1977. aastal hakati ARPAnetiga ühendama ka teisi tekkinud arvutivõrke, üha enam tuli kasutusele Interneti nimi. Algsest militaarsüsteemist sai rahvusvaheline arvutivõrk ja seda eelkõige tänu ülikoolidele, mis olid loonud kohtvõrke ja neid ARPAnetiga ühendanud.

 Pärast külma sõja lõppu 1987. a. sai ARPAnet üldkasutatavaks ning nimeks Internet.

 1994. a. liideti veel 10 tuhat erinevat alamvõrku ning kasutajaid oli ligi 20 miljonit enam kui 70 eri riigist, 1997. a. olid vastavad arvud juba 50 miljonit ja 100 eri riiki.

Tagasi algusesse


Eesti

 Eesti ühines Internetiga peagi pärast iseseisvumist, st. 1991. a. Esimesed keskused  (Keemilise ja Bioloogilise Füüsika Instituut, Eesti Biokeskus, Tõravere) kasvasid kiiresti ning eelmiseks aastaks oli Eestis juba üle 10 tuhande Internetti ühendatud arvuti.

Tagasi algusesse


Struktuur

 Võrk on üles ehitatud hajuspõhimõttel, et tagada selle pidev töövõime. Internet koosneb paljudest suhteliselt iseseisvatest omavahel võrdsetel tasemetel ühendatud lokaalsetest arvutivõrkudest, mis kokku moodustab globaalse arvutivõrgu, milles infovahetus on reguleeritud standartitega.

 Suvalisest Internetti ühendatud arvutist on võimalik pääseda ligi igasse võrku ühendatud  arvutisse ning seal olevatele inforessurssidele (osa materjalist on piiratud paroolkaitsega). Teatud arvutiga ühendusse astumiseks  piisab vaid selle  nime teadmisest.

Tagasi algusesse


Teenused

 Peale elektronposti ja FTP on väga laialt kasutatavaks teenuseks  WWW (World Wide Web), mis kujutab endast infovõrgus Internet toimivat globaalset hüpermeediasüsteemi ning dünaamilist kommunikatsioonisüsteemi, mille moodustavad erinevais arvutites paiknevad andmed, mis on soovijatele kättesaadavad  lehekülgedena. WWW-s on ühendatud grupi- ja isikliku kommunikatsiooni võimalused. Süsteem pakub  maailma eri paigus olevaile inimestele ja organisatsioonidele vahendi, millega jagada või otsida informatsiooni.

 Kõik WWW materjalid on seotud hüpertekstseostega, nii saab dokumendist dokumenti liikuda  seoste abil. Seosteks on tavaliselt tekstis olevad sõnad, mis on märgitud muust tekstist erinevalt. Neile klikkides saab liikuda ühest tekstist teise.

 Lisaks passiivsele vaatamisele saab ka infootsija ise sekkuda sisestades huvipakkuvaid märksõnu.

 Dokumente saab otsida ka aadressi e. URL-i järgi. 

Tagasi algusesse


Otsing Internetis

 Otsingu hõlbustamiseks on loodud spetsiaalsed otsisüsteemid (search engines).

 Ülesehituselt on paljud otsisüsteemid sarnased kujutades endast kodulehekülgede kataloogi, mis sisaldab viiteid nii lehekülgedele kui ka neil paiknevatele märksõnadele, kusjuures enamik otsisüsteeme ei piirdu vaid  www lehekülgede pealkirjadega, vaid vaatavad ka  nende sisu (uudistegrupid, artiklid).

 Otsing toimub üle kogu maailma, kuid ei võta eriti kaua aega.

 Formuleerida saab nii liht- kui ka keerukamaid päringuid.

Näide1:

otsing sõna "hobune" järgi annab nimekirja  kõikidest otsisüsteemide registreeritud lehekülgedest, mis sisaldavad seda sõna.

Näide2:

liitpäringuga saab otsida mitme sõna järgi, nii otsitakse päringu "hobune+eesti" korral lehekülgi, kus esinevad mõlemad sõnad.

Näide 3:

samuti saab otsida vaid sõna esimese osa järgi esitades päringu "hobu*" kujul. Sellisel juhul otsitakse lehekülgi, kus paiknevad sõnad, mille eesliiteks on hobu, näiteks hobune, hobupäevad jne.

 Otsisüsteemides saab päringu formuleerimisel kasutada Boole'i loogikat:

 Igal otsisüsteemil on olemas ka abi ehk help, mis tutvustab just selle konkreetse otsisüsteemi otsinguoperaatoreid ja -võimalusi.

 Päringu tulemusena esitatakse nimekiri, kus leitud leheküljed on järjestatud otsitava sõna esinemisrohkuse järjekorras. Nimekiri edastatakse tavaliselt 10 dokumendi kaupa.

  Sageli on viidete juures toodud kokkulangevuskoefitsient, mida väljendatakse protsentides või arvuga 0 ja 1 vahel. Selle leidmiseks kasutatakse mitmeid erivõtteid - loendatakse, mitu korda, kus ja millises vormis otsitav märksõna leheküljel paikneb. Meeles tasub pidada, et otsisüsteemid otsivad informatsiooni mehaaniliselt, saamata aru sisust.

Tuntumad otsivõimalused- AltaVista, Lycos, Webcrawler, Yahoo, Excite, Infoseek, HotBot, Metacrawler.

Tagasi algusesse


Otsivõimaluste tutvustus

AltaVista  

sisaldab informatsiooni rohkem kui 30 miljoni erineva kodulehekülje kohta, otsingut saab teha 11 miljardi sõna järgi. Lisaks lehekülgedele vaatab ta läbi ka 14 tuhat olulisemat uudistegruppi ja otsib informatsiooni seal olevate artiklite kohta. Uuendatakse iga päev.

Lihtpäringu kõrval on ka suhteliselt keerukad võimalused: otsida saab ühe või mitme märksõna samaaegset esinemist (operaatorid AND, OR, NOT), ette anda sõna algusosa, otsida dokumenti, milles ühed etteantud märksõnad esinevad, teised mitte (+ ja -).

Vastused esitatakse lehekülgede kaupa, millest igal paikneb 10 viidet. Igast leitud leheküljest kuvatakse aadress, mis toimib viitena, pealkiri ning 2 esimest rida teksti. Lisaks on võimalus saada vastus kompaktkujul pealkirjade loendina. Kirjas on ka lehe loomise kuupäev.

Eestis kasutamiseks kohandatud: http://www.altavista.telia.com

Rahvusvaheline: http://www.altavista.digital.com

Excite  

Otsingut on võimalik täpsustada. Sisaldab temaatilist kataloogi. Otsing viiakse läbi WWW-lehekülgedel, Excite'i enda lehekülgede ülevaadetes, Useneti uudistegruppides ja -klassides. Ta on kõige laiahaardelisem otsisüsteem sisaldades 50 miljonit erinevat WWW-lehekülge, samuti 10 tuhandet uudistegruppi viimase 1 miljoni artikli kohta.

Otsib ka neid dokumente, mis on antud päringuga sisult sarnased. N: koerte kasvatamine = koduloomade kasvatamine.

Täpsustamine: + sõna ees = dokument, milles sõna on sees; - sõna ees = dokument, milles antud sõna ei esine; Boole'i operaatorid (AND, OR ja AND NOT); sulud ( ) grupeerivad.

Vastused esitatakse lehekülgede kaupa, lisatud on kokkulangemise koefitsient 0-100%, lehekülje pealkiri, olulised teksti algusread. Võib näha ka vaid pealkirja.

http://www.excite.com

HotBot  

Otsing 54 miljoni WWW-lehekülje seast, Userneti uudistegruppidest.

1. Lihtotsing- Boole'i operaatorid (AND ja OR), fraasotsing ( ) ja " ", isikuotsing, URL- otsing, + ja -, ALL THE WORDS (esinevad kõik sõnad ), ANY OF THE WORDS (mõni sõna esineb). 2. Ekspertotsing - saab piiritleda geograafiliselt, ajaliselt, tüübilt.

Vastused kuvatakse 10 kaupa (vaikimisi), võimalik kuvada ka 25, 50, 75 ja 100 kaupa. Saab valida dokumendi täiskirje, lühikirje ja pealkirja vahel. Täiskirje sisaldab pealkirja, sisu, aadressi, kuupäeva ja suuruse. Näitab kokkulangevuse koefitsienti ja saabunud dokumentide arvu.

http://www.hotbot.com

Infoseek  

51 miljonit WWW-lehekülje, Useneti uudistegruppide, e-maili aadrresside hulgast otsing. Saab tutvuda viimase kuu uudistega kogu maailmast. Temaatiline kataloog.

Võimalik vaid lihtotsing (Ultrasmart), mislle täpsustamisel kasutatakse  + ja - märki.

Vastused kuvatakse 10 kaupa,  näitab koos vastusega päringuga seotud valdkond aehk kohti, kust sama informatsiooni veel leida võiks. Võimalik tutvuda värskete uudistega, mis seonduvad otsitava valdkonnaga. Vastus sisaldab dokumendi pealkirja, aadresse, paarirealist sisukokkuvõtet, kokkulangemiskoefitsienti. Soovi korral saab vastuse päringule käsuga "hide summaries" kuvada 20 kaupa, st. nähtavale jäävad vaid vastuse pealkirjad.

http://www.infoseek.com

Lycos  

Registreeritud WWW-lehekülgede arv on üle 50 miljoni. Otsingud WWW-lehekülgedel, eraldi saab otsida pilte ja heli sisaldavaid dokumente. Spetsiaalne otsing maailma parimatest WWW-lehekülgedest koosnevatest nimetutest. Otsing andmebaasist, mis sisaldab informatsiooni rohkem kui 600 Ameerika Ühendriikide, Kanada, Iirimaa ja Suurbritannia linna kohta.

Päringud kaheastmelises süsteemis: 1. Lihtotsing (simple search),  selle operaatoriks punkt (.) sõna lõpus, mis täpsustab sõna kuju. Miinusmärgiga (-) saab sõnu välistada. Dollarimärk ($) lubab otsida persooni, kelle nimes ei olda kindel ( 3 perekonnanime esitähte on vajalikud). 2. Tavaotsing (custom search), mis lubab kasutada Boole'i operaatoreid (AND ja OR). 3. Tavaotsingu beetaversiooni (Beta Custom Search) operaatoriteks AND, OR ja NOT ning teised: ADJ (sarnase termini otsing), NEAR (konkretiseerib), BEFORE (määrab terminite järjekorra vastuses), " " - fraseerivad termineid, ( ) - grupeerivad. Lisaks veel käsk FAR, mis otsib teineteisest teataval kaugusel asuvaid sõnapaare.

Vastus kuvatakse 10 kirje kaupa, märgitakse ära kokkulangevuskoefitsient. Näitab lehekülgede suurust ja 6-8 esimest rida. Samuti sooritatud otsingute puhul saab leida temaga seotud pildi- ja helimaterjali või tutvuda otsitavale temaatikale lähedaste dokumentidega.

Temaatilised jututoad ja  kataloog, kus leheküljed liigitatakse hierarhilise struktuuri alla, selles 18 alajaotust, st. vastuse päringule võib leida juba temaatilise kataloogi alt.

Lisaks inglisekeelsele liidesele ka itaalia-, rootsi-, prantsuse-, flaami-, saksa- ja hispaaniakeelne liides.

http://www.lycos.com

MetaCrawler  

Põhineb AltaVista, Excite'i, Lycose, WebCrawleri ja Yahoo WWW-lehekülgede andmebaasidel.

Standardotsing võimaldab valida, kas dokument sisaldab kõiki esitatud sõnu või mõnda neist, ka saab esitada päringut kui fraasi.

Kuvatakse vastuste koguarv ja tulemus 20 kaupa. Vastus sisaldab dokumendi pealkirja, pikka sisukorda, aadressi - millise otsisüsteemi kataloogis asub. Alternatiivne otsing lubab otsingu määratleda geograafiliselt ja  ajaliselt ning vastused kuvatakse 10, 20 või 30 kaupa. Temaatiline kataloog.

http://www.metacrawler.com

WebCrawler  

Informatsiooni üle 10 miljoni WWW-lehekülje kohta. Kasutamine on lihtne.

Vastused kuvatakse lehekülgede kaupa, milles viidete arv 10, 25 (vaikimisi) või 100. Algselt näidatakse vaid pealkirja ja kokkulangemise koefitsienti, mis asub vahemikus 0-100%. Võib kasutada ka pikemat kuju, millel lisaks lehekülje aadress ja teksti esimesed 4 rida. Lihtne temaatiline kataloog.

http://www.webcrawler.com

Yahoo  

Võimalik otsida Interneti ressursside temaatilises kataloogis, Useneti uudistes ja e-maili aadresside hulgast. Yahool on puukujuline struktuur, mingi osa on võrgukujuline. Temaatiline kataloog hästi organiseeritud, sisaldab 16 valdkonnast koosnevat loendit.

Lihtpäring võimaldab täpsustada ajaliselt (nädal, kuu, aastaaeg), kasutatakse Boole'i operaatoreid (AND ja OR).  Viidetele klikkides saab päringut pidevalt kitsendada, kuni jõutakse konkreetsete veebilehtedeni. Kui otsitavat dokumenti ei leita, suunatakse päring automaatselt AltaVistale, mis selle teostab ja Yahoosse tagasi saadab. Kui AltaVistaga pole võimalik ühendust saada, annab Yahoo võimaluse otsingu teistes otsisüsteemides läbi viia.

Ühele leheküljele kuvatakse 25 vastust, mis sisaldab pealkirja ja lehekülje lühikirje. Lisaks virtuaalne jututuba.

http://www.yahoo.com

Tagasi algusesse
Tagasi infootsingu leheküljele