Gopher kujutab endast analoogiliselt anonüümse FTP-ga hajusandmebaasi, kus kõik kasutajad pääsevad ligi suurele hulgale seal leiduvale infole. Gopheri kui süsteemi moodustab teatud hulk gopheri servereid üle kogu maailma, neis paiknevad gopheri andmed ning töötab süsteemi ülalhoidev tarkvara. Erinevalt anonüümsest FTPst, kus eri serverid paiknevad üksteisest eraldatult ning ei taha teineteisest sageli midagi teada, moodustab gopher ühe terviku, millesse on harmooniliselt lülitatud kogu maailma gopheri serverid.
Gopherisse ehk "kohvrisse" (kohalik släng) sisenemisel ilmub ekraanile menüü, mis sisaldab kuni mõnisada objekti. Menüü objektid võivad olla kas mingid dokumendid (teksti- või ka binaarfailid) või omakorda menüüd. Objektide sisu on menüüs kirjeldatud ühe tekstireaga. Kogu "kohverruum" (gopherspace) koosnebki sellistest menüüdest ning dokumentidest (failidest), millele menüü objektid viitavad. Menüüs saab liikuda noolklahvidega (mõnes süsteemis ka hiirega) ning sealt mingi objekti välja valida. Kui valitud objekt on omakorda menüü, kuvatakse ekraanile uus menüü, kus saab seejärel samamoodi edasi ekselda. Peale edasiliikumise saab gopheris liikuda alati ka tagasi juba läbitud menüüdesse ning valida edasiseks infootsinguks mingi teine haru (menüü).
Kui valitud objekt on mingi dokument, siis edastatakse see kõigepealt kohalikku arvutisse. Edasi käitutakse vastavalt dokumenditüübile: tekstikujul oleva faili sisu kuvatakse ekraanil, binaarfaili saab salvestada aga kettale. Peale menüüde ja dokumentide leidub gopheris ka muid objekte: näiteks viiteid telnetiga kättesaadavatele teenustele (mis selle ka käivitavad) või siis mitmesuguseid otsingusüsteeme. Objekti tüüp on näha menüüst: märk
/ tähistab, et tegu on teise menüüga (kataloogiga), <TEL> viitab telneti ühendusele, <?> otsingusüsteemile, <BIN> binaarfailile, <Picture> pildile jms. Graafilises keskkonnas töötavatel gopheri klientidel on loetletud sümbolid asendatud tihti vastavate ikoonidega (pildikestega).Oluline on aga see, et menüüd ning nendes sisalduvad dokumendid paiknevad laiali paljudes maailma erinevates gopheri serverites. Valides ühe menüü alt teise, satutakse tihti ühest serverist teise. Kasutajat sellest aga ei informeerita, gopher siirdab vajaliku menüü või dokumendi vajaduse korral ise kohalikku arvutisse ning näitab seda kui olemasolevat. See võimaldabki kasutajal ühes kohast (menüüst) süsteemi sisenedes käia põhimõtteliselt läbi kogu maailma gopheri serverid, samal ajal üldse teadmata, millises gopheri serveris paiknevad need menüüd või dokumendid, kus ta parajasti viibib. Nii ongi kogu maailma gopheri serverid liidetud üheks suureks infosüsteemiks.
Gopheril nagu kogu Internetilgi pole aga kindlakavalist ega hierarhilist ülesehitust. Iga firma või organistsioon võib ju püsti panna oma gopheri serveri koos selles asetseva lokaalse infoga, mis siis vajaduse korral viitab mõningatele teistele gopheri serveritele (menüüdele). Seega on gopher suhteliselt korrapäratu ja kaootilise struktuuriga ning selle menüüdes kolades võib väga kergesti ära eksida.
Gopherile pääseb ligi kas telnetiga gopheri serverisse sisse logides või siis gopheri kliendi abil, mis võtab ise gopheri serveritega ühendust. Viimasel ajal kasutatakse valdavas enamuses teist võimalust, seega pääseb telneti kaudu tänapäeval ligi ainult üksikutele gopheri serveritele. UNIXi all käivitatakse gopheri klientprogramm tavaliselt käsuga
gopher (abiinfo man gopher), MS-Windowsis võib kasutada näiteks programmi WS_Gopher.WS_Gopheril on ka graafiline kasutajaliides. Kõigile kohverruumis paiknevale pääseb ligi aga ka paljude graafiliste WWW-brauseritega, näiteks Netscapega. Viimane on tänapäeval kasutatavaim võimalus.
Finger
Interneti teenus finger annab infot kasutajate kohta, kes on parajasti mingis arvutis "sees". UNIXis vastab sellele käsk
finger. Finger annab infot nii kohaliku kui ka suvalise kaugarvuti kasutajate kohta, samuti saab sellega vaadata nii kogu serveri kasutatust kui ka uurida konkreetse kasutajaga seonduvat. Tippides UNIXi käsurealt lihtsalt finger, väljastab ta nimekirja, kes on hetkel jooksvas arvutis.finger
Login Name Tty Idle Login Time Office Office Phone
argo Argo Vessmann /0 1:30 Nov 3 12:25 (tiik.aklubi.ee)
kalle Kalle Tihemets /1 Nov 3 14:17 (ppp380.estpak.ee)
Tippides aga näiteks
finger kallet, annab ta kasutaja kallet kohta hulgaliselt infot:Ekraanil näidatakse järgmisi andmeid:
Kasutaja: kallet Nimi: Kalle Tihemets Kataloog: /home/kallet Shell: /bin/tcsh Masinas alates K, 03. nov 14:16 (EET), terminalilt pts/290 masinast ppp380.estpak.ee Uus kiri tulnud K, 03. nov 13:39. Viimane lugemine: K, 03. nov 10:14. Plaane pole.
Kindla kasutaja info väljastatakse fingeriga sõltumata sellest, kas kasutaja on parajasti sisselogitud või pole.
Täpselt sama on võimalik teada saada ka ükskõik millise Internetti ühendatud kaugarvuti arvuti kasutajate kohta.
Käsk
finger @queenie.lai.ut.ee(märki
@ mitte ära unustada!) annab kasutajate nimekirja, kes on hetkel arvutisse queenie.lai.ut.ee sisselogitud.Käsk
finger kasutajanimi@arvuti_nimiannab aga infot kasutaja kohta. Viimatipruugitud kujus tuleb fingeris kasutada alati aga meiliaadressi pikka kuju, milles sisaldub konkreetse arvuti nimi. Lühikuju pruukimisel ei leia ta vajalikku serverit üles.
Mõned süsteemid võivad aga fingeriga info andmisest üldse keelduda, andes vastuseks
Connection refused. Sel juhul on finger ning ka mitmed muud teenused seal spetsiaalselt blokeeritud, kuna serveris asub arvatavasti erilist kaitsmist vajavat infot.Kui kogu info ei mahu korraga ekraanile, siis käsu
finger … | more
abil näidatakse seda infot lehekülgede kaupa.
Tihti oleks huvitav teada, kas mingi arvuti ja temani ulatuv Interneti haru on töökorras või mitte, st kas masin on hetkel "võrgus" või pole. See võib olla näiteks vajalik enne sinna meilimist või sealt mahukate failide tõmbamist. Selleks on UNIXis olemas käsk
ping. Näiteksping oudekki.geo.ut.ee
oudekki.geo.ut.ee is alive
kontrollib, kas Geograafia Instituudi server on võrgu teel kontakteeruv või mitte. Mõned pingi realisatsioonid lubavad lisaks vaadata ka võrgu edastuskiirust vaadeldava arvutini. Ka MS-Windowsi platvormilt on võimalik teist arvutit pingida, seda lubab näiteks programm WS_Ping.
Vahend on orienteeritud eelkõige süsteemi administraatoritele
Nslookup Nslookup on Interneti teenus info saamiseks Interneti arvutite kohta. Programmi käivitamise järel Te satute interaktiivsesse keskkonda. Õpetuse seal käitumiseks saate korraldusega ? UNIXi käsk nslookup edastab päringu nimeserverile, saamaks teada seal asetsevat infot. Nii saab käsu
nslookup abil teada, milline IP-aadress vastab arvuti nimele või vastupidi, millised nimed vastavad teatud IP-aadressiga arvutile. Näiteks käsk nslookup oudekki.geo.ut.ee annab vastuseksName: oudekki.geo.ut.ee
Address: 193.40.8.222
Korraldus ls domeen (näiteks oudekki.geo.ut.ee) annab selle domeeni arvutite või alamdomeenide loetelu. Nii saate korraldusega ls ee loetelu kõikidest Eestis registreeritud domeenidest. Korralduse täitmise katkestamiseks kasutatakse sõrmisekombinatsiooni Ctrl-C. Programmi töö lõpetamiseks kombinatsiooni Ctrl-D (või CTRL-Z - nii nagu konkreetses arvutis on faili lõpu tähis defineeritud).
Vahend on jälle orienteeritud eelkõige süsteemi administraatoritele.
Talk
Korraldus talk kasutajatunnus@arvuti võimaldab analoogselt telefoniga kutsuda otsevestlusele mingi teine parajasti Internetist kättesaadav partner. Analoogselt finger korraldusega, ei piisa kutsumiseks e-aadressist, vaid on vajalik täisaadress. Tavaliselt ongi mõistlik eelnevalt finger korraldusega kontrollida, kas kutsutav isik on arvutisse loginud või mitte. Korraldus talk saadab kutsutava ekraanile umbes sellised teated:
Message from TalkDaemon@her_machine at time ...
talk: connection requested by your_address
talk: respond with: talk her_address
Selleks, et Te saaksite "vestlema" hakata, tuleb inimesel, kelle ekraanile selline tekst ilmus, oma arvutis käsurealt sisestada:
ntalk <Teie_aadress>
Ekraani puhastamiseks sinna arvuti poolt kirjutatud tekstist on klahvikombinatsioon Ctrl+L
Kui ühendus on loodud, jagatakse ekraan kaheks. Ühte ekraaniossa ilmub see tekst, mida Teie trükite, teise ossa aga ilmub Teie vestluspartneri tekst. Iga sõrmisevahetus kajastub momentaalselt (sekundi murdosast kuni sekundiliste niheteni) mõlema ekraanil.
Ühenduse katkestamiseks tuleb ühel vestlejaist vajutada Ctrl+C.
Eelmistes osades mainisime, et WWW on samasugune hajussüsteem nagu kogu Internetki, kuhu iga huviline saab üles panna suvalist teemat kajastavat infot. Seega on vajaliku info leidmine üle kogu maailma (täpsemini üle kõikide WWW lehekülgede) sageli ülimalt komplitseeritud, kuna üldisest infouputusest tingituna ei leia tihti konkreetsele teemale vastavat kodulehekülge üles. Läheneb ju maailma kõikide kodulehekülgede üldarv sajale miljonile, mis on tohutu maht.
WWW otsisüsteemid Eeltoodu hõlbustamiseks on Internetis koostatud spetsiaalsed otsisüsteemid (search engines), mille ülesandeks on info otsimine etteantud märksõnade põhjal.
Enamik otsisüsteeme on oma ülesehituselt põhimõtteliselt sarnased. Nad kujutavad endast tohutut Interneti kodulehekülgede kataloogi, mis sisaldab viiteid lehekülgedele endile ning leheküljel paiknevaid olulisemaid märksõnu. Enamik otsisüsteeme ei piirdu WWW lehekülgede pealkirjadega, vaid vaatab ka nende sisu. Lisaks sellele hõlmavad paljud neist lisaks kodulehekülgedele ka olulisemaid uudisegruppe koos neis ilmunud artiklitega, mille sisudes saab otsida samamoodi kui WWW lehekülgedes.
Lehekülgede registreerimine WWW-lehekülje, täpsemalt selle viida ülesseadmine otsisüsteemi võib toimuda mitmeti. Esimene ja lihtsaim võimalus, mida kasutavad kõik süsteemid, on lehekülg WWWs oleva spetsiaalse vormi (ankeedi) abil registreerida. Registreerimise käigus küsitakse lehekülje kohta hulga andmeid. Neist tähtsaim on kahtlemata lehekülje URL-aadress, mille põhjal selle üle kogu Interneti mõõtmatute avaruste üles leiab. Ülejäänud andmed pole tavaliselt nii olulised, kuid tihti küsitakse ka autori nime ja aadressi, käsitletavat valdkonda jms.
On registreerimisvorm täidetud, vaatab otsisüsteem lehekülje mingi aja pärast üle, veendumaks, et see tõesti eksisteerib. Sellele järgneb lehekülje registreerimine ja lisamine andmebaasi. Alates sellest hetkest on lehekülg otsiaparaadi abil ükskõik kust Interneti osast üles leitav. See protsess võib võtta aega mõnest päevast mõne nädalani, olenevalt sellest, millise otsisüsteemiga on tegu ja kui pikk on registreerimst ootavate uute WWW-lehekülgede "järjekord".
Lisaks traditsioonilisele WWW lehekülgede käsitsi registreerimisele võimaldavad mõned otsisüsteemid täiendada oma andmebaasi ka muul teel. Mitmed neist koguvad infot uudisegruppidest, tihti vaatavad nad üle aga ka kõik sellised koduleheküljed, millele juba varem registreeritud koduleheküljed viitavad. On ju paljud WWW-leheküljed omavahel viitadega mitmeti seotud.
Päringud Otsisüsteemides paiknevat saab kasutada info otsimiseks üle kogu Interneti mingi(te) märksõna(de) järgi. Tihti saab ka valida, kas otsida WWW lehekülgedest, uudisegruppidest või siis mõlemist korraga.
Näiteks otsing sõna "
tallinn" järgi annab nimekirja kõikidest otsisüsteemis registreeritud lehekülgedest, mis sisaldavad seda sõna, so mingit infot Eesti pealinna kohta. Kuna mitmed otsisüsteemid sisaldavad oma baasis infot kümne või isegi mitmekümne miljoni eri lehekülje kohta, hõlmates sellega olulisema osa kogu Internetis avalikult kättesaadavast infost, toimub sõna tallinn otsing tegelikult üle kogu maailma. Tänu otsisüsteemi optimaalsele ülesehitusele ei võtagi see pealtnäha tohutu töö aga tavaliselt eriti kaua aega. Kui otsisüsteem ja selleni viivad sideliinid on koormamata, on tavaline otsiaeg vahemikus mõnest sekundist kuni minutini, varieerudes erinevate süsteemide korral. Kahjuks on mitmed otsisüsteemid ka üsna sageli hõivatud, sest tuntud otsisüsteeme on maailmas vaid mõni, nende potentsiaalseid kasutajaid aga miljoneid. Seega tuleb mõnikord tipptunnil (kui USAs on varahommik või keskpäev) oodata vastust sageli mitmeid minuteid või koguni saada teate, et süsteemi kõik kanalid on hetkel hõivatud ja soovitakse proovida mõne aja pärast uuesti. Otsisüsteeme on aga mitmeid - kui üks on hetkel hõivatud, võib pöörduda ju mõne teise poole.Lisaks lihtpäringutele saab teha ka keerukamaid: lehekülge saab otsida mitme märksõna järgi korraga; samuti saab ette anda märksõna algusosa jms. Näiteks päring "
estonia+drugs" otsib WWW lehekülgi, millel sisaldub nii sõna "estonia" kui ka sõna "drugs", seega võimaldab see otsing tuvastada, kuidas on Eesti narkoprobleem kajastatud Internetis. Päring "hansa*" otsib aga sellised lehekülgi, kus paiknevad sõnad, mis algavad eesliitega hansa, näiteks sõna hansapäevad (hansadays).Päringute tulemused väljastatakse tavaliselt nimekirjana, kus leitud leheküljed (viited neile) on järjestatud otsitava(te) sõna(de) esinemisrohkuse järjekorras. Nimekiri edastatakse kliendile tavaliselt kümne või mõnekümne ühiku kaupa; selle läbi vaadanud, saab siirduda järgmistele viidetele, mis langevad kokku juba väiksema tõenäosusega. Tihti paikneb viidetel juures ka kokkulangevuskoefitsent (score), mida väljendatakse kas protsentides või siis 0 ja 1 vahel paikneva arvuna. Kokkulangevuskoefitsendi arvutamisel kasutatakse tihti mitmeid kavalaid erivõtteid - loendatakse, mitu korda, kus ja millises vormis otsitavad märksõnad leheküljel paiknevad. Nii näiteks saadakse tavaliselt suurem koefitsent juhul, kui otsitav sõna asub pealkirjas, võrreldes juhuga, kui ta paikneb lehekülje lõpus.
Sellele vaatamata on otsisüsteemid suhteliselt rumalad, kuna need pole võimelised saama aru teksti sisust, vaid otsivad sõnu või tekstiosi mehaaniliselt. Tavaline on olukord, kus mingit konkreetset teemat otsides saadakse vastuseks tohutu hulk viiteid, millest enamik on kasutud. Seepärast tuleb kõigepealt osata formuleerida võrdlemisi mõistlik päring, mis ei haara endaga kaasa igasugust "prahti". Ning ka siis tuleb olla valmis vaatama läbi tihti sadu kodulehekülgi, millest parimal juhul vaid üks või mõni vastab sisu poolest otsija konkreetsetele lootustele. Seega nõuab efektiivne otsing Internetis mõningaid vilumusi ja kogemusi.
Sellest hoolimata võib mingi lehekülje lisamist üldkasutatavatesse otsisüsteemidesse lugeda võrdseks seal sisalduva info globaalse reklaamimisega - saab see ju kättesaadavaks kõikidele asjast huvitatutele kogu (virtuaal)maailmas.
Järgmises osas vaatleme enamkasutatavamaid otsisüsteeme ning nende erivõimalusi põhjalikumalt.
Eelmises osas vaatlesime WWW otsisüsteemide üldpõhimõtteid, järgnevalt keskendume tuntuimatele konkreetsetele süsteemidele. Populaarsuse järjekorras oleks nendeks Alta Vista, Lycos, Webcrawler, Yahoo ja Excite.
Alta Vista Alta Vista on Interneti üks noorimaid otsisüsteeme, kuid sellegipoolest ületab ta oma populaarsuselt ja mahult enamikke teisi. Süsteem käivitus 15. detsembril 1995 firma Digital Research Laboratories projektina. Hetkel sisaldab Alta Vista infot rohkem kui 22 miljoni maailma erineva kodulehekülje kohta. Igal nädalal pöördutakse süsteemi poole nelja miljoni päringuga. Päringuid saab kokku teha 11 miljardi sõna järgi. Juba see näitab süsteemi võimsust, et kõikidel sellega seotud serveritel on ketaste üldmaht ligi 300 GB. Mainitud 22 miljonist leheküljest vaatab süsteem iga päev läbi 2,5 miljonit, seega peaksid uued leheküljed ja olemasolevate täiutused kajastuma Alta Vistas ligikaudu 10 päeva jooksul.
Lisaks WWW lehekülgedele vaatab Alta Vista läbi ka 13000 olulisemat uudisegruppi, infot seal olevate artiklite kohta uuendatakse iga päev. Kuna maailmas on üldse ligikaudu 15000 globaalset uudisegruppi, vahendab Alta Vista enamikke neist.
Alta Vista lubab lihtpäringute kõrval anda ka suhteliselt keerulisi päringuid. Otsida saab ühe või mitme märksõna samaaegset esinemist, samuti ka ette anda mingi sõna algusosa. Saab esitada ka päringuid, kus otsitakse dokumenti, milles ühed etteantud märksõnad esinevad, teised aga ei esine.
Vastused päringutele annab Alta Vista lehekülgede kaupa, millest igaüks sisaldab kümmet viidet. Igast leitud leheküljest kuvatakse seal aadress, mis toimib viitena, pealkiri ning kaks esimest rida teksti. Lisaks sellele on võimalik saada vastus ka kujul, kus kogu info on ühel real.
Alta Vista asub Interneti aadressil
http://www.altavista.digital.com/
Lycos Lycos on oma võimsuselt Alta Vistaga umbes samal tasemel, kuid ta on oluliselt vanem. Ka on Lycoses registreeritud WWW lehekülgede arv - 34 miljonit - Alta Vista omast veidi suurem.
Päringute tegemine ja nende vastuste struktuur on Lycoses analoogne Alta Vista omaga - korraga kuvatakse 10 vastust. Kuid iga vastuse korral näidatakse siin lisaks ära ka kokkulangevuskoefitsent, mis on vahemikus nullist üheni ja näitab, kui täpselt leitud lehekülg päringule vastab. Ka näitab Lycos leitud lehekülje suurust ja selle 6-8 esimest rida.
Oluline erinevus võrreldes Alta Vistaga on aga temaatilise kataloogi a2z olemasolu, kus paljud koduleheküljed on liigitatud hierarhilise struktuuri alla. Seega, kui otsida mingit infot võrdlemisi laia teema kohta, pole vaja käivitada otsiaparaati, vaid sellele võib leida vastuse temaatilise kataloogi alt. Temaatilistest kataloogidest teeme juttu järgmises osas.
Lycos asub aadressil
http://www.lycos.com/
Webcrawler Webcrawler on WWW otsisüsteemidest vanim, olles käivitumisel 20. aprillil 1994 esimeseks omataoliseks Internetis. Hiljem on temast aga mitmed süsteemid, nagu Lycos ja Alta Vista, populaarsuses mööda läinud. Kuid sellest hoolimata teenindab Webcrawler igal nädalal 2 miljonit otsingut ja temas sisaldub info üle kümne miljoni WWW lehekülje kohta.
Webrcrawler esitab päringutele vastused lehekülgede kaupa, milles sisalduvate viidete arv on vastavalt kliendi soovile kas 10, 25 (vaikimisi) või siis 100. Algselt näidatakse leitud lehekülgedest ainult pealkirja (mis töötab lingina) ja kokkulangevuskoefitsenti, mis on vahemikus 0-100%. Lisaks sellele saab leitud vastustest vaadata aga ka pikemat kuju, mis sisaldab lisaks toodule veel lehekülje aadressi ja teksti esimest nelja rida.
Webcrawler asub aadressil
http://www.webcrawler.com/
Yahoo Üsna populaarne on ka otsisüsteem Yahoo, kuid see on Eestist vaadatuna tihti aeglane. Päringud ja nende tulemuste kuvamine Yahoos on analoogne eelmiste süsteemidega. Ühele leheküljele kantakse 25 vastust, mis sisaldavad pealkirja ja lehekülje lühikirjelduse. Yahoo oli ajalooliselt esimene otsisüsteem, mis sisaldas endas ka temaatilise kataloogi. Võrreldes teiste otsisüsteemide vastavate kataloogidega, mis ilmusid hiljem, näib Yahoo oma olevat senini paremini organiseeritud.
Yahoo asub aadressil
http://www.yahoo.com/
Excite Excite on eelmistega sarnane otsisüsteem, ainsaks oluliseks erinevuseks on asjaolu, et tehtud otsingut on võimalik hiljem veel täpsustada. Excite sisaldab infot 11,5 miljoni erineva WWW lehekülje kohta, samuti 10000 uudisegrupis avaldatud viimase 1 miljoni artikli kohta.
Vastused väljastatakse siin 10 kaupa, näidates ära kokkulangevuskoefitsendi (0-100%), lehekülje pealkirja ja mõned olulisemad teksti algusread.
Excite asub aadressil
http://www.excite.com/Eesti WWW-otsingusüsteemid
Eesti kõige populaarsemad otsingusüsteemid asuvad aadressil Eesti WWW Wärk (
http://www.ee) ja Neti (http://www.neti.ee)