2. Geoinfosüsteemide rakendamine statistikateenistuses


2. Geoinfosüsteemide rakendamine statistikateenistuses

Geoinfosüsteemid peaksid saama Statistikaameti infosüsteemi loomulikuks osaks, hea võimaluse sellesuunalise tegevuse alustamiseks annab rahvaloendus. Rahvaloenduse organiseerijad ilma kaartide ja GISita läbi ei saa, Statistikaameti teised teenistused ei pruugi GISe aga esimeseks prioriteediks pidada.

Rahvaloenduse GISi olulisim tulemus on see, et kõik Eestis loendatud isikud on seostatavad nende elukoha, töökoha ning rännet iseloomustavate kohtadega hoone täpsusega.

Rahvaloenduse algatusel korralikult läbi viiidud GISi projekt võib tõsta Statistikaameti rolli Eesti infosüsteemide rakendajana. Näiteks Šveitsi Statistikaamet on asunud sisuliselt kogu riigi GISinduse eestvedajaks, kuna nad peavad ruumilist infot eriti oluliseks kvaliteetse statistilise info tootmisel. Süstemaatiline lähenemine muutis nad de facto GISiala liidriks terves riigis.

Teine riik, kus rahvaloenduse eest vastutajad olulisel määral kogu GISi tööstusharu tulevikku määravad, on USA. US Census Bureau toodab palju kaarte (tuntud TIGER-andmebaasi nime all), millele on tekkinud suur hulk kliente. USAs on rahvaloendusandmetega seotud kaardistamisküsimused isegi nii olulised, et on tekkinud eraldi termin ja tegevusharu - census geography.

Selles peatükis on kirjeldatud GISide olemust, GISide loomise ja haldamisega seonduvaid küsimusi ning GISi olulisust statistiliste andmete töötlemisel ja analüüsil.

2.1 Geoinfosüsteemi lühikirjeldus

GISi kõige levinum definitsioon on:

automatiseeritud süsteem ruumiliste andmete kogumiseks, haldamiseks, säilitamiseks, päringute teostamiseks (otsinguteks), analüüsiks ja esituseks.

GISi põhiülesandeks võib pidada ka andmete integreerimist. Objekti asukoht või sündmuse toimumispaik on integreeriv parameeter, mille abil erineval kujul olevat infot saab seostada, viidata, sorteerida ja analüüsida.

Laiemalt on GIS riistvara, tarkvara, andmete ja organisatsiooni kogum, mis lisaks tavalise infosüsteemi võimalustele saab

Peamised päringute liigid, mida GISiga tehakse, on

Enamik tegelikus elus ettetulevaist päringuist on komplekssed ning nõuavad paljude elementaarpäringute sooritamist.

GIS võib olla väga erineva rõhuasetusega. Sõltuvalt kasutuseesmärgist võib süsteem olla optimeeritud

GISides modelleeritakse looduses eksisteerivad nähtused. Nähtusteks on näiteks jõgi, tänav vms käegakatsutav asi, aga samuti ka nn imaginaarsed nähtused, mida otseselt näha ei pruugi olla - piirid, saastetaluvus jne. Arvutis organiseeritakse nähtused objektidena. Objektid kujutatakse kas vektorkujul või rasterkujul. Vektorkujul antakse objekti kuju ja asukoht edasi punktide, joonte, pindade jt geomeetriliste primitiividega, rasterkujul on kaardistatav ala jaotatud võrgustikuga ruutudeks, iga ruudu (ehk pikseli) väärtus iseloomustab nähtuse eksisteerimist/tugevust pikslile vastavas geograafilises piirkonnas. Vektorkujul olevate andmetega ühendatakse objekti atribuudid, mis võivad asuda ka GIS-programmiga seotud andmebaasisüsteemis. Rasterkujul olevaid andmeid eraldi andmebaasiga ei seota, kogu info sisaldub pikseli väärtuses.

2.2 GIS osa rahvaloenduses

Rahvaloenduse GISil on kaks eesmärki:

Eelmistel rahvaloendustel kasutati samaks otstarbeks tavalisi paberkaarte. Kaasaegse tehnoloogiaga kaarte tootes luuakse kõigepealt GIS andmebaas, mille üheks väljundiks on hiljem paberkaardid.

        2.2.1 Kaardid ja GIS loenduse ettevalmistamisel

        Kui rahvaloendus viiakse läbi traditsiooniliselt loendajatega, vajatakse kaarte loenduspiirkondade moodustamiseks. Loenduspiirkonnad peavad katma kogu territooriumi ja koormus peab olema loendajate vahel võimalikult võrdselt jaotatud. GISiga saab loenduspiirkondi automaatselt suhteliselt lihtsalt genereerida. Loenduspiirkondade genereerimise diskussioon on peatükis 4.4.2.

        Kui rahvaloendus viiakse läbi registripõhiselt, siis on kaartide vajadus enne loendust väiksem, kuid hiljem andmete töötlemisel läheb neid ikka vaja.

        2.2.2 Kaardid ja GIS loenduse läbiviimise ajal

        Traditsioonilise rahvaloenduse puhul vajavad loendajad kaarte maastikul orienteerumiseks. Nad peavad saama planeerida kõige otstarbekama liikumisteekonna ja leidma kõik hooned oma piirkonnas. Loendajad peavad kaardile märkima kõik sellised hooned, mis ei olnud märgitud neile eelnevalt jagatud materjalides.

        Sõltumata loenduse läbiviimise meetodist kasutatakse GISe rahvaloenduse käigu kontrollimiseks ja illustreerimiseks. Selleks piisab suhteliselt lihtsatest kaartidest ja GIS programmidest.

        2.2.3 Loendustulemuste analüüs ja levitamine

On väidetud, et isegi Euroopa statistikud peavad ennast GISi võimalustega alles kurssi viima, ning seejärel soovitama neid ka otsuste tegijatele (Cardoso, 1995). Ilmselt kehtib sama ka Eesti statistikute puhul.

Teatud päringute jaoks on GIS ainuke võimalus vastust saada, näiteks erinevate rahvaloenduste andmete võrdlemisel kui loendusüksused on aja jooksul muutunud.

Loenduse esmane analüüs toimub Statistikaametis. Enamik tarbijaid kasutavad oma uurimustes Statistikaameti poolt töödeldud andmeid, ainult vähesed vajavad ligipääsu originaalandmetele. See rõhutab esmaste töötlejate suurt vastutust, sest nende tehtud vead või ebakorrektsused võimenduvad järgmistes töödes.

Rahvaloendusandmete tulemusi illustreeritakse tavaliselt teemakaartidega, kus loendusüksused või administratiivsed üksused on värvitud vastavalt soovitud atribuutide väärtustele. Kombineerides värvi mustrite, diagrammide ja leppemärkidega, saab kujutada nähtustevahelisi seoseid. GISiga tehtava analüüsi meetodeid ja esitusvõimalusi on kirjeldatud peatükkides 2.9 ja 2.11.

2.3 GISi kasutamine Statistikaametis

GISide kasutusvaldkond Statistikaametis ei piirdu ainult rahvaloenduse läbiviimise ja analüüsiga. Viimase 3-4 aasta jooksul on praktiliselt kõik Euroopa statistikaametid laialdaselt GISe kasutama hakanud (Notes of..., 1996). GISid on isegi hakanud mõjutama statistikaametite sisemist struktuuri ning sidemeid teiste ametitega.

GISi saab edukalt rakendada statistiliste andmete integreerimisel nii statistikateenistuste sisemiste andmebaaside kui väliste registritega. Arvestades Eesti suhteliselt nõrgalt integreeritud andmebaase ja registreid võib GIS olla ainus võimalus andmebaaside üksteisega sidumiseks. Sellisel andmebaaside sidumisel tuleb muidugi järgida isikuandmete kaitse tagamist (vt ptk 3.3)

Teatud analüüse ei saa ilma GISita kvaliteetselt teha. Üheks põhjuseks on kohanimede liikumine või ka linnade ulatuse laienemine. Jälgida tuleb, kas analüüsi tehakse ühes piirkonnas elanud inimeste või mingi kohanimega seotud inimeste kohta. Detailsemalt on kohanimede liikumisega seotud küsimusi ja nende GISi abil lahendamist käsitletud peatükis 2.12.1.

Peale rahvaloenduse on Eestis tulemas ka põllumajandusloendus. Rahvaloenduse GIS on hea alus põllumajandusloenduse läbiviimiseks. Lisades rahvaloendusel saadud andmetele selleks ajaks (aasta 2001) ehk juba digitaalkujule viidud katastrikaardi, on võimalik teha väga keerukaid ning täpseid analüüse.

2.4 Statistikaameti GISi tähtsus teistele ametitele

Eesti 2000. aasta rahvaloenduse unikaalsus Eesti kartograafia ja GISide jaoks seisneb selles, et väga lühikese aja jooksul õnnestub välitöödel kontrollida suurt osa kaartidel kujutatavast informatsioonist. Külastatakse praktiliselt kõiki hooneid ja peaaegu kõik teed ja tänavad käiakse loetud päevade jooksul läbi. Teist samasugust võimalust nii mastaapseks kaartide kontrolliks niipea ilmselt ei tule.

Statistikaamet on teinud õige otsuse ning kasutanud riigi 1:50 000 baaskaarti alusena hajaasustusalade rahvaloenduskaartide (või GIS-andmebaasi) koostamiseks, sest tegemist on piisavalt hea asukohatäpsusega andmetega. Lisades sinna Statistikaameti poolt koostatud hoonete kihi valmib andmebaas, mis rahuldab paljusid tarbijaid.

Peale rahvaloenduse toimumist on võimalik siduda kaardiga ning kontrollida suurt osa hooneregistrist ning sealtkaudu ka rahvastikuregistrist. Peale seda saab alustada rahvastikurände detailset uurimist jms analüüse, mida enne info puudumise tõttu ei saanud teha.

Kui rahvaloenduskaartide loomiseks kasutatakse kaasaegseid meetodeid, on rahvaloenduse tähtsust Eesti kartograafiale raske üle hinnata. Näiteks tundub, et Statistikaameti poolt loodavad enamike linnade, alevite ja alevike kaardid on ainuke võimalus nendele asulatele kaasaegsete digitaalkaartide loomiseks. Põhjusi on kirjeldatud peatükis 4.3.7.

Rahvaloenduse tulemusena kogutud andmetest on huvitatud paljud asutused ja organisatsioonid. Mõistlik oleks nende nõuetega arvestada ka rahvaloenduskaartide ja -GISi väljatöötamise etapil. Samas nõuab paljude osapooltega töö palju rohkem aega ja vaeva. Tavaliselt saab komistuskiviks raha - kui kasutahtjaid on palju, siis oleks loomulik, et finantseerijaid on ka mitmeid. Segase finantseerimisskeemi korral on raske jagada õigusi, kohustusi ning vastutust.

2.5 GIS-projekti etapid

GIS etappide kirjeldamisel on kasutatud AboBase Systemsi poolt valminud rahvaloenduse infosüsteemi maksumuse hinnangu (Rahvaloenduse andmetöötluse..., 1996) sissejuhatavaid peatükke.

Joonis 1 Geoinfosüsteemi projekti etapid

Analüüsi- ja disainietapi jooksul luuakse GISi spetsifikatsiooni reaalsus- ja andmemudelid, juurutamisetapil valmivad esitus- ja vormistusmudelid (vt ptk 2.7).

2.5.1 Strateegia

Enne GISi loomist tuleb formuleerida ülesande püstitus, sest GISiga lahendatakse konkreetsed probleemid ja täidetakse ülesanded, mitte ei selgitata projekti olemust. Käesolevas töös on pakutud välja üks strateegiatest (vt ptk 4), lõplik valik on aga Statistikaameti teha. Peale strateegia formuleerimist saab jätkata edasiste etappidega.

2.5.2 Analüüs

Analüüsi etapil hakatakse lahendama strateegias määratletud ülesannet. Alustatakse GISi reaalsusmudeli ja andmemudeli loomist. Osaliselt saab andmemudeli luua kasutades CASE-tehnoloogiat. Osaliselt seepärast, et kõik GISid ei pruugi CASE vahendeid sisaldada, kuid relatsioonilise andmemudeli kasutamise korral on võimalik CASEga valmis genereerida andmetabelid. Analüüsietapil valminud tulemus peab olema mõistetav nii inimestele (diagrammide kujul) kui ka arvutitele (informatsioon andmebaasi tabelites).

2.5.3 Disain

Disaini etapil koostatakse detailne kirjeldus analüüsietapil valminud süsteemi realiseerimiseks. Disaini eesmärk on leida parim tee süsteemi realiseerimiseks arvestades tehnilist keskkonda, resursside (raha, aeg jt) hulka ja muid nõudeid. Disaini käigus võib selguda, et analüüsietapil valminud süsteemikirjeldust on tarvis muuta. Disain toimub koostöös tellijaga, sest veel on võimalus töö lõpptulemust muuta.

Disaini etapi tulemuseks on:

2.5.4 Programmeerimine

Programmeerimise etapis tuleb GISide puhul tavaliselt kohandada GIS baastarkvara, kasutades selleks spetsiaalset arenduskeelt. Lisaks luuakse ka vajalikud parameeterfailid jms hilisemaks efektiivseks tööks. GIS programmide jaoks ei ole välja kujunenud standardset keelt, iga suurem tootja on loonud oma. Pikemas perspektiivis on näha, et liigutakse üldlevinud programmeerimisvahendite poole, kuid reaalselt müügis olevat toodet veel ei ole.

Eestis levinumad GISid oskavad kõik kasutada tavalisi andmebaasisüsteeme. Suurematele neist on olemas CASE-vahendid, mille abil on võimalik programmikood genereerida.

Tavaliselt sisaldab programmeerimise etapp planeerimist, programmi struktuuri disaini, kodeerimist ning testimist. Esialgsele iga mooduli eraldi testimisele järgneb kogu süsteemi testimine.

2.5.5 Dokumentatsiooni loomine

Infosüsteemi tulusus sõltub suuresti tema kasutajamugavusest. Kasutajamugavuse tõstmise oluline osa on korralik dokumentatsioon. Traditsiooniline paberkujul olev dokumentatsioon, mida suuremate programmide puhul anti välja mitmes paksus köites, liigub järjest enam digitaalkujule. Digitaalse dokumentatsiooni vormistamiseks on samuti mitu võimalust - tavalise abifailina, kontekstitundliku abifailina, samm-sammulisi juhiseid andva programmina või intelligentse abivahendina, mis on võimeline aru saama ka akuutse probleemi tekkepõhjustest.

Dokumentatsioon tuleb valmistada nii tavakasutajatele, süsteemiadministraatoritele kui hilisematele edasiarendajatele.

Iga kroon, mis on kasutatud dokumentatsiooni loomiseks, hoiab kokku vähemalt samapalju hilisematest hoolduskuludest.

2.5.6 Juurutamine

Juurutamisetapil installeeritakase süsteem, teda kontrollitakse ja kasutatakse reaalses töös. Paralleelselt toimub kasutajate väljaõpe ja vajadusel vanade andmete konverteerimine. Juurutamine toimub samades ruumides ja samadel arvutitel, kus toimub ka hilisem töö. Etapi tulemuseks on:

2.5.7 Ekspluatatsioon

Ekspluatatsioonietapil hoitakse süsteemi töös ja teostatakse selle järelvalvet. GISide puhul tuleb arvestada pideva digitaalkaartide uuendamise (aktualiseerimise) vajadusega, sest üldjuhul GISi kasutajad ise kaarte ei tooda. Ekspluatatsioon on GIS projekti kõige kulukam etapp. Lisaks kaartide ostmisele tuleb tavaliselt tasuda ka GIS baasprogrammi hoolduse eest.

2.6 GISi komponendid

Geoinfosüsteem laiemas mõttes koosneb mitmest komponendist. Arvutid töötavad spetsiaalse GIS tarkvaraga. GIS tarkvara kasutab mitmesuguseid andmeid (kaardid, atribuuditabelid jne). Andmeid koguvad, haldavad ja analüüsivad inimesed.

2.6.1 Riistvara

GIS on olnud alati väga nõudlik riistvara suhtes olles veel hiljuti jõukohane peamiselt UNIX-tööjaamadele ja serveritele. See on ilmselt põhjuseks, miks GIS oli ainult väikese arvu spetsialistide pärusmaa. Viimastel aastatel tormiliselt levinud Pentium protsessorid on andnud võimaluse GIS programmide kasutamiseks igal arvutitöökohal.

GIS arvuti peaks vastama järgmistele nõuetele (1997. aasta jaanuari seisuga):

Tabel 1 GIS riistvara soovitavad konfiguratsioonid

 

Võimas

Hea

Desktop

Protsessor

(ainult Intelil põhinevad võrdlused)

1 või enam Pentium Pro 200 MHz, 512 KB Cache

Pentium 133MHz, 256 KB Cache

Pentium

Mälu (RAM)

64-256 MB

32-64 MB

16-32 MB

Monitor

üks või kaks 21", ka 27"

21"

15-17"

Graafika

1600x1280, 4MB VRAM

1280x1024, 2MB VRAM

760x1024

Kõvaketas

10 GB, Ultra SCSI

5 GB, SCSI

2 GB

Võrgukaart

10/100 Mbit/s

10 Mbit/s

ei ole oluline

Operatsioonisüsteem

(kõige levinum)

Windows NT,

UNIX

Windows NT, UNIX

Windows 95, OS/2

Perifeeriaseadmed

plotter, CDROM, DAT, CD-R

värviprinter,

CDROM

printer, CDROM

Ligikaudne hind

250 000 krooni

120 000 krooni

35 000 krooni

GIS arvutite puhul tuleb arvestada, et umbes 1.5-2 aasta pärast tuleb neid tõenäoliselt täiendada (vähemalt mäluga), sest uued programmid muutuvad järjest ressursinõudlikumaks. GIS arvutite moraalne eluiga on 3-4 aastat, sama kehtib ka perifeeriaseadmete kohta.

GIS riistvara hulka peab kindlasti lugema ka teatud tüüpi kantavad arvutid (üldjuhul ilmastikukindlad notebook arvutid) ning kiiresti arenevad palmtop ja pen-based arvutid. Viimased võiksid katseliselt olla kasutusel ka prooviloendusel.

Uuemad välitööseadmed (elekrtontahhümeetrid, GPS-seadmed) on samuti sisuliselt arvutid. Näiteks Trimble ProXL GPS vastuvõtja, mis sobib GIS andmete kogumiseks, sisaldab 8086 protsessorit ning kohandatud MS-DOS operatsioonisiüsteemi. ProXL välimus aga ei meenuta arvutit mingil kombel.

2.6.2 Tarkvara

GIS tarkvara valik on suhteliselt lai, kuid kõigist tootjatest eristuvad 4-5 peamist tarkvarafirmat. Need firmad toodavad tavaliselt nii professionaalseid kui ka nendega ühilduvaid lihtsamaid GIS-programme. See on oluline eriti rahvaloenduse GISi loomisel, sest GIS tehnoloogia peab olema lihtsasti kasutatav analüütikutel, kellel GISide kogemust ei pruugi olla ja arvutivilumust samuti. Selleks, et GIS andmeid teha lihtsasti kasutatavateks, peavad andmeadministraatorid tegema võimsate vahenditega eeltöötlust. Soovitav on, et kõik kasutajatüübid (vt Joonis 2) saaksid töötada sama firma tarkvaraga.

Kindlasti ei ole võimalik lahendada rahvaloenduse GISi ainult väiksemate, ehkki üldjuhul kasutajasõbralikemate GIS programmidega. Isegi nii väike riik nagu Eesti on andmete mahult liialt komplitseeritud.

Kuna andmete konverteerimine erinevate GIS programmide vahel ei pruugi olla kõige valutum, siis on otstarbekas valida selline Statistikaameti GIS tarkvara, mis ühilduks tema kõige tihedamate koostööpartnerite omaga. Täielik avatus on GISide alal küll suhteliselt aktuaalne teema, kuid käegakatsutavaid tulemusi ei ole veel saavutatud.

Alates 1990ndate algusest on selge, et ühelgi organisatsioonil, isegi riigil, ei ole mõtet kulutada oma ressursse järjekordse GIS programmi väljatöötamiseks. Sõltumatult ja tiheda konkurentsi tingimustes loodud GISid on suutnud palju edukamalt ära kasutada infotehnoloogia arengut ning nendega võistelda on üsna lootusetu. Nii Ungari kui Kanada statistikateenistused on loobumas oma väljatöötatud süsteemidest ning asendamas neid kommertstoodetega, Rootsis ja Soomes loodud nn "rahvuslike" GISide AutoK ja FinGIS arendamine on samuti lõpetatud.

Kõik tuntud GIS programmid sisaldavad ka arenduskeelt, mida saab kasutada süsteemi kohandamiseks. GIS baastarkvara annab ise skeleti korraliku töötava süsteemi loomiseks, millele arenduskeele abil luuakse tihti keerukamaid lisandusi kui baastarkvara ise.

2.6.3 Andmed

Andmed on GISi mootor, sest "puhta" tarkvaraga ei ole midagi peale hakata. Seetõttu sõltub ka töötava GISi turuväärtus peamiselt temas sisalduvate andmete hulgast ja kvaliteedist (vt ptk 2.10), mitte tarkvara hinnast. Teiseks sõltub GISi hind ka sellest, kes andmeid kasutab. Oskamatutes kätes ei ole ka hiiglaslikul andmebaasil väärtust.

GIS andmete omanik peab aega ja raha kulutama nende kvaliteedi tagamiseks ning vajalikuks standardiseerimistegevuseks. Suhteliselt lihtne on uuendada riistvara, mille peal GIS tarkvara töötab, teatud lisavaevaga on võimalik uuendada ka tarkvara uue põlvkonna vastu, kuid andmebaasi struktuuri ja infosüsteemi ideoloogia väljatöötamisel tehtud möödalaske on hiljem väga raske ja kallis parandada.

Maailm, milles me elame on väga keeruline ja seetõttu on ka andmestruktuurid, mis seda maailma arvutis modelleerivad samuti üsna keerulised. Erinevad GIS programmid realiseerivad sama struktuuri erinevaid meetodeid ja andmeformaate kasutades. Veel enam, andmestruktuuri tuleb tihti kohandada GIS tarkvara funktsionaalsete piirangute tõttu. See asjaolu takistab suurel määral universaalse GIS andmevahetusformaadi loomist.

Mitmed organisatsioonid ja riigid on loonud oma andmevahetusformaadid, mis on sõltumatud GIS tarkvara tootjatest. Standard ei saa aga enne efektiivseks, kui ta ei ole rahvusvaheliselt aktsepteeritud. Seetõttu ongi kasutatavaid GIS andmete standardeid nii palju ja veel rohkem selliseid, mida praktiliselt ei kasutata. Hoolimata kõigest töötatakse välja uusi andmeedastusstandardeid. Hiljuti valmis USAs uus standard SDTS (Spatial Data Transfer Standard), mille väljatöötamiseks kulus 10 aastat. Paar aastat tagasi asutatud Open GIS Consortium (vt http://www.ogis.org) töötab välja uut, rahvusvahelisele levikule pretendeerivat standardit.

Juhul, kui andmestruktuurid on võrreldavad, siis on erinevate GIS programmide vahel andmevahetus alati võimalik. Kui üks organisatsioon mõtleb "tee" all ühte nähtust ja teine natuke teistsugust, siis ei saa andmevahetusel tekkivaid probleeme lahendada isegi kõige parema andmetranslaatoriga. Samamoodi võrreldamatud on andmehulgad siis, kui ühes arvestatakse rahvastiku tiheduse määramisel ka suurte siseveekogude pindalasid, teises mitte.

2.6.4 Organisatsioon

Inimfaktor mängib GIS projekti edukuses kriitilist rolli, eriti Eestis. Importida on võimalik arvuteid, tarkvara ja teatud ulatuses ka andmeid, kuid Eesti olusid tundvaid GIS administraatoreid ja analüütikuid on äärmiselt raske leida. Loodetavasti aastaks 2000 on tööjõuturule jõudnud ka esimesed GISidele pühendunud kõrgharidusega spetsialistid, kuid tõenäoliselt on samavõrra suurenenud ka nõudlus nende järele.

Maades, kus GISe on kasutatud alates tehnoloogia loomisest alates, nõutakse GISi operaatorilt tavaliselt viieaastast töökogemust ja mitme GIS tarkvara tundmist, soovitavalt vähemalt ühe programmeerimiskeele valdamist ning teoreetilisi teadmisi andmebaasisüsteemidest. Eestis kvalifitseeruksid sellistele nõudmistele täna 3-4 inimest. See ei tähenda, et Eesti jõududega ei oleks võimalik luua suuri ning vastutusrikkaid süsteeme, seda on tõestanud infotehnoloogiafirmade konkurentsivõimelisus ka väljaspool Eestit.

GISide tarbijad jaotatakse kolme gruppi (vt Joonis 2). Kõige väiksema grupi moodustavad nn "tegijad", need on tüüpiliselt andmebaasiadministraatori õigustega spetsialistid, kelle ülesandeks on andmestruktuuride loomine, tarkvara arendamine ja optimeerimine ning riistvara haldus. Nemad vajavad ka üldjuhul kõige võimsamat tarkvara ning riistvara. Ligikaudu 10 korda suurema kasutajaterühma moodustavad nn "kasutajad", kes tegelevad tavaliselt info sisestamise või analüüsiga. Eestis on praktiliselt olematu veel nn "vaatajate" rühm, kuhu kuuluvad keskastme ning tippjuhid ja laiem avalikkus. See rühm vajab väga lihtsat või atraktiivset kasutajaliidest ning nad ei esita palju erinevaid päringuid.

Iga loetletud kasutajarühm vajab erinevat GIS tarkvara, suuremad GIS firmad toodavad midagi iga rühma jaoks.

Püramiidi tippu pürgiv spetsialist vajab aastatepikkust kogemust, kasutajad võivad piirduda kuuekuulise koolituse ja treeninguga ning vaatajate koolituseks ei tohiks kuluda üle 0.5-1 tunni.

Joonis 2 GIS programmide tarbijate tüübid ning nende hulga erinevus.

Statistikaametis oleks otstarbekas pühendada üks inimene ainult GISide temaatikale, eriti enne 2000. aasta rahvaloendust. Rahvaloenduskaartide loomine nõuab kümnete inimaastate suurust tööd, mida võib põhimõtteliselt teha nii Statistikaametis kui väljastpoolt tellides. Mõlema variandi häid ja halbu külgi kirjeldab Tabel 2.

Tabel 2 GISi ise loomise ja tellimustööde head ja halvad küljed

 

Positiivsed küljed

Negatiivsed küljed

Töö tehakse ise

· Loodetavasti väiksem otsene kulu

· tegevuse üle hea kontroll

· know-how jääb ettevõttesse

· konfidentsiaalsusküsimusi on lihtsam lahendada

· kogenud meeskonda on raske luua

· peale loendust tuleb meeskonda oluliselt kärpida

· meeskond ei ole rahaliselt vastutav

· lõplikku kulu raske hinnata

Kasutatakse tellimustöid

· Konkurents võib tagada kvaliteetse teenuse

· võimalik valida oma ala parimaid spetsialiste

· peale hoogtööd ei ole töötajate koondamise probleemi

· toob juurde värskeid ideid

· projekti kogukulu on fikseeritud

· eelarves otsesed kulutused suuremad

· teatav lisakulu konkursside ja järelvalve jaoks

· konfidentsiaalsusküsimused raskemini lahendatavad

· vajab korrektseid lepinguid

· oht, et alltöövõtjaid ei huvita süsteemi ülesanded väljaspool nende tellimust

2.7 GISi spetsifikatsioon

Enne rahvaloenduskaartide või -GISi loomist tuleb luua tema spetsifikatsioon, mis käsitleb andmete kogumise, haldamise, analüüsi ning levitamise küsimusi.

Spetsifikatsiooni struktuuris võib eristada järgmisi osi (samas ei pruugi nad olla vormistatud täpselt selliste peatükkidena):

Spetsifikatsiooni kirjutamine nõuab suurt kogemustepagasit kirjeldataval alal. Teatud kaartide puhul on seda raske saavutada, näiteks Eestis ei ole keegi massiliselt digitaalseid rahvaloenduskaarte teinud, rääkimata nende kasutamisest või töötlemisest. Enne Eesti merekaartide spetsifikatsiooni koostamist oli valminud juba 9 kaarti ning spetsifikatsiooni oli võimalik valmistada kogemuste põhjal, lisaks on merekaartide tegemiseks olemas väga hästi dokumenteeritud rahvusvaheline standard. Rahvaloenduskaartide puhul need eelised aga puuduvad. Teisest küljest oleks olemasoleva spetsifikatsiooni abil oluliselt lihtsam kaarte teha. Seega, kaarte ei saa kiiresti teha enne spetsifikatsiooni, ja spetsifikatsiooni ei saa teha ilma kaartide koostamise kogemusteta.

Hajaasustusalade rahvaloenduskaartide algvariant on peaaegu kogu Eesti jaoks valminud (algtöö on tehtud, nüüd järgneb majapidamiste kontroll), tiheasustusalade kaarte on valmis esialgu ainult üks - Kärdla linn. Proovimata on väikeste tiheasustusalade - alevike ja suurte külade kaartide tegemine. Olemas on tiheasustusalade rahvaloenduskaartide spetsifikatsioon, teataval määral on dokumenteeritud ka hajaasustusalade rahvaloenduskaartide koostamine. Nendele dokumentidele ja kogemustele põhinedes on võimalik alustada rahvaloenduskaartide GISi spetsifikatsiooni koostamist.

Spetsifikatsiooni üks olulisi väärtusi on tema püsivus, st alati võib temale tugineda otsustuste tegemisel. Samas peab spetsifikatsioon ajaga kaasas käima, muudatusi tuleb teha nii kiiresti kui vajalik ja nii vähe kui võimalik. Arvestades dokumendi muutuvat iseloomu, tuleb ta varustada versiooninumbritega.

Spetsifikatsiooni paberil vormistamisel tuleb järgida mitmeid reegleid, vt Tabel 3. Korrektse vormistuse näitena võib tuua merenduses levinud S-57 standardi ja merekaartide kirjastamisjuhiste dokumentatsioone, samuti Kanada SAIFi.

Tabel 3 GIS spetsifikatsiooni paberkujul vormistamise nõuded.

köidetud kiirköitjaga

võimaldab vahetada lehekülgi, millel on toimunud parandusi. Vanad leheküljed võib kasutaja säilitada ja saada nii ülevaade ka spetsifikatsiooni eelmistest versioonidest

leheküljed varustatud versiooninumbriga

võimaldab jälgida, et köidetud oleks kõige uuem versioon spetsifikatsioonist

sisaldab versiooniloendit

iga peatüki ees on loetelu, kus igale leheküljele on lisatud tema kõige viimase versiooni number ja selle jõustumise kuupäev

trükitud vastupidavale paberile

dokument kulub kiiresti. Eriti kiiresti kuluvad kiirköitjal lehtedele tehtud augud

leheküljed on numereeritud peatükkide kaupa

spetsifikatsiooni teatud osade pikenemisel ei tule ümber numereerida kogu dokumentatsiooni

kättesaadav ka inglise keeles

Eesti-suguses väikeriigis on oluline, et meie tegemistest oleks teadlikud ka teised riigid.

Digitaalkujul oleks spetsifikatsiooni oluliselt mugavam kasutada. Digitaalse spetsifikatsiooni haldamiseks on vaja andmebaasisüsteemil põhinevat tarkvara, seda levitada võib kas spetsiaalselt kirjutatud tarkvaraga, laialtlevinud tarkvarale lisaprogramme kirjutades või lihtsalt tekstiredaktoriga loetava failina. Soovitavaks tuleks siingi pidada mitme keele toetust ja erinevate versioonide lihtsat kasutatavust. Eestisse jõudnud välismaised standardid on kõik olnud tavalise tekstifaili kujul, seetõttu ei ole nende kasutamine kõige mugavam.

Statistikaamet ei pruugi spetsifikatsiooni kõiki osasid otsast lõpuni valmis teha, piisab ka viitamisest mõnele teise organisatsiooni poolt vastu võetud dokumendile. Näiteks ei pruugi esitusmudelis detailselt kirjeldada andmeesitusformaati, piisab viitamisest nt MapInfo MIF formaadile.

GIS spetsifikatsiooni reaalsus- ja andmemudelid valmivad GISi analüüsi- ja disainietapil, esitus- ja vormistusmudelid juurutamisetapi alguses (vt ptk 2.5).

        2.7.1 Reaalsusmudel

        Kaardile või GIS andmebaasi ei ole võimalik salvestada kõike, mis looduses leidub. Seetõttu tehakse valik nendest nähtustest, mida soovitakse GISis hoida, nt teed, metsad, hooned ja kraavid. Lisaks meid huvitavate nähtuste loetlemisele tuleb need defineerida, sest muidu ei ole võimalik tagada andmete ühest tõlgendamist erinevate kasutajate poolt. Näiteks, mis on tee ja tänava vahe, metsa, pargi ja võsa erinevus, mis on hoone, kuidas määrata rannajoone asukohta. Lisaks definitsioonile võib lisada ka teatud kitsendusi või täpsustusi, nt ei kaardistata alla 25 ha suurusi järvi, soo piir määratakse 50 m täpsusega jne.

        Reaalsusmudel on vajalik selleks, et tagada andmete ühilduvus erinevate andmebaaside vahel. Samas on reaalsusmudel võimalikult sõltumatu kasutatavast tarkvarast ja riistvarast.

        2.7.2 Andmemudel

        Andmemudel kirjeldab, kuidas looduse alamhulk, mis defineeriti reaalsusmudeliga, arvutis modelleeritakse. Andmemudeli koostamisel võib kasutada levinud andmebaaside dokumenteerimise meetodeid (CASE, ER-diagrammid). Looduses olev nähtus võib olla arvutis kirjeldatud ühe või mitme objekti abil, nt nähtus "tänav" objekti "keskjoon" ja "äärejoon" abil. Teatud objektid võivad looduses üldse mitte eksisteerida (keskjoon, tsentroid). Andmemudelis loetletakse ka atribuudid, millega nähtusi kirjeldatakse. Nimetada tuleb, millised atribuudid on kohustuslikud, kui suur on atribuutide täpsus ning objekti koordinaatide määramise täpsus (mitte segi ajada nähtuse defineerimise täpsusega!), milliseid kodifikaatoreid kasutatakse, millised on digimise nõuded (vt Joonis 3) jne.

        Joonis 3 Taani suuremõõtkavaliste kaartide spetsifikatsioonis (Specifikation af..., 1993) toodud digimisjuhendid. Ülal juhised tänavate telgjoonte määramiseks, all eeskiri telgjoone segmenteerimiseks.

        Andmemudel võib olla realiseeritud relatsioonilise andmebaasi või objektorienteeritud andmebaasi vahenditega. Neist esimene on levinum. Andmemudel on võimalikult sõltumatu kasutatavast tarkvarast (nt kas kasutatakse Oracle või Informix andmebaasisüsteemi). Arvestada tuleb siiski mõningaid praktilisi küsimusi nagu arvutite võimsus, päringute vajalik kiirus.

        Praktilisetel kaalutlustel ühendatakse teinekord andmemudel ja reaalsusmudel, seda eriti siis, kui nähtusi ja objekte on suhteliselt vähe või nende struktuur on lihtne (vt Joonis 4).

        Joonis 4 Rahvusvahelise Hüdrograafiaorganisatsiooni andmevahetusstandardi DX90 dokumentatsioonis (IHO Transfer..., 1992) on ühitatud reaalsus ja -andmemudelid.

        
         _____________________________________________________________________ 
        |                                                                     |
        | Object -  Class:     Bridge                                         |
        |_____________________________________________________________________|
        Code: BRIDGE                                                         
        Reference INT 1:	not specified                                   
        Chart Specification:not specified                                   
        Set Attribute_A:	OBJNAM; CATBRG; CONDTN; NATCON; COLOUR; HORCLR; 
        		QUAVEM; VERCLR; VERCOP; VERCCL; CONVIS; CONRAD;
        Set Attribute_B:	SCAMIN; SCAMAX; INFORM; PICREP;                 
        Set Attribute_C:	SORIND; SORDAT; RECIND; RECDAT;                 
        Geometric Primitive:Point; Line; Area;       
        Definition:		A structure erected over a depression, obstacle or water to carry traffic.(USGS Jan.89)     
        Remarks:		A bridge may consist of the areas which cover the tract on land and on water underneath. (see sketch)
        
        

        2.7.3 Esitusmudel

        Esitusmudeliga kirjeldatakse standardsed väljundid andmemudeliga defineeritud andmebaasist. Esitusmudeli abil võib luua nii paber- kui digitaalväljundit. Korrektse spetsifikatsiooni korral saavad kõik andmebaasihalduri õiguseta kasutajad andmetele ligi ainult esitusmudeli vahendusel.

        Digitaalandmete esitusmudel võib sisaldada nii andmete esitust ekraanil, andmeedastuse struktuuri kui nende kasutamiseks vajaliku tarkvara kirjeldust. Seega kuulub viide kasutatavale andmeedastusstandardile esitusmudeli koosseisu.

        Paberkujul levitatavate andmete esitusmudel kirjeldab leppemärkide süsteemi, kaardi värve, raamjooneväliseid elemente, projektsioone, paberi mõõtusid jne. Paberkujul olevate kaartide esitusmudeli lihtsamaks näiteks on kaardi legend, kuid korralik mudel sisaldab ka leppemärkide suurusi millimeetrites, värvide definitsioone jms (vt Joonis 5).

        Joonis 5 Esitusmudelis toodud leppemärkide kirjeldus ja nende mõõdud (Eesti merekaartide..., 1996)


        13 K

        Rahvaloenduskaartide all mõeldakse enamasti loenduse planeerimiseks ja läbiviimiseks mõeldud kaarte. Standardiseerimist vajaksid ka teemakaardid (nt kartogrammid), mis valmistatakse loendusandmete hilisema analüüsi käigus. Sõltumata teemakaardi suurusest oleks soovitav, et töötuid või eestlasi tähistab sama värv kõigis Statistikaameti väljaannetes (vt Joonis 19 ja Joonis 20).

        Esitusmudel on küllaltki sõltuv tarkvarast ja riistvarast, mille abil tulemust saadakse, näiteks plotterite kvaliteet jms.

        2.7.4 Vormistusmudel

        Vormistusmudel kirjeldab, kuidas tuleb tööd organiseerida, et saavutada andmemudelis ja esitusmudelis defineeritud tulemus võimalikult efektiivselt.

        Selleks sätestatakse kõik mehhanismid kvaliteedi tagamiseks, andmeturbe kindlustamiseks, tähtaegadest kinnipidamiseks jne. Vormistusmudelisse kuulub ka välitööde juhend ja kaardi korrigeerimise juhend.

        Vormistusmudel tuleb kirjutada lähtudes kasutatavast tarkvarast ja riistvarast ning meeskonna kogemustest. Juhul, kui Statistikaamet kavandab kaartide valmistamist alltöövõtu korras, ei pruugi vormistusmudeli loomine olla Statistikaameti ülesanne. Selle teevad töö täitjad ise. Juhul, kui kaarte teevad kaks erinevat firmat, siis võib juhtuda, et sama kaardi tegemiseks luuakse kaks erinevat vormistusmudelit, kuid nende eesmärgiks on saavutada täpselt samasugune tulemus.

2.8 Identifikaatorid, aadresside süsteem ja klassifikaatorid

Hoone aadress ning tema identifikaator ei saa olla samased (vähemalt reaalses elus mitte). Aadresse kiputakse pidevalt muutma (nt nimetatakse ümber tänavanimed), seetõttu ei sobi nad andmebaasides identifikaatorina kasutamiseks.

        2.8.1 Aadresside süsteem

        Linnades on aadresside süsteem suhteliselt hästi välja kujunenud. See koosneb tänavanimest ja maja numbrist. Siiski on erinevates linnades mõningaid erinevusi. Näiteks Raplas tundus olevat kohustuslik igale tänavanurgal olevale majale füüsiliselt kinnitada kaks aadressi - mõlema tänava järgi. Linnavalitsuse krundikasutuskaartidel oli ilmselt siiski ainult üks aadress.

        Eesti maapiirkondades ei ole aga üheselt defineeritud aadresside süsteemi. Postiljonid leiavad õige koha ka niisama üles, vallavalitsuses hoitakse dokumente omaniku nime või talu nime järgi. Katastriüksuste nimed ei ole aga Eestis veel kasutatavad, sest liialt vähe maad on katastrisse kantud.

        Aadressi põhinõue on unikaalsus omavalitsusüksuse territooriumil. Seda on suhteliselt lihtne nõuda eeldades, et piirid enam ei muutu. Tõenäoliselt seisab Eestis aga ees valdade ja isegi maakondade liitmine, mis algselt unikaalsed aadressid ära võib rikkuda.

        Aadresside süsteemis on raske ühest korda luua, see on seotud paljude ametkondadega ning juurdunud kommetega. Seetõttu tuleb aadresside asemel leida igale hoonele tõeliselt unikaalne, teda üheselt identifitseeriv tunnus.

        Soomes on maapiirkondades kõigile teedele antud nimi analoogiliselt tänavanimedele linnades (Strengell, 1995). Hoone aadress moodustatakse tee nimest koos kaugusega tee algusest mõõdetuna teed mööda kümnetes meetrites (põhjapiirkondades sadades meetrites). Sellise süsteemi loomine on suur töö, kuid teda on kerge kasutada. Ei ole sugugi kindel, et selline süsteem Eestis aastaks 1999 õnnestub jõustada. Kui seda siiski teha, siis tuleb ette näha vastavad täiendused kohanimeseadusesse.

        Eesti on väike ja esialgu on maal inimesed suhteliselt paiksed, seetõttu ei pruugiks aadresside süsteemi loomisega kiirustada, eriti veel arvestades piride liikumise võimalust. Luua tuleb korralik identifikaatorite süsteem, mida kasutatakse "tehnilisematel" eesmärkidel andmebaasides.

        2.8.2 Hoonete identifikaatorid

        Andmebaasid nõuavad igale hoonele identifikaatorit. Kuna aadressid praegusel kujul ei ole unikaalsed (ühel hoonel võib olla mitu aadressi, paljude hoonete aadress on teadmata või nad muutuvad), siis tuleb luua midagi uut. Hooneregister on oma sisemiseks majapidamiseks loonud identifikaatorid, kuid neil on kaks puudust: 1) nad ei ole ajas püsivad, so hoone hävimisel võib mõni uus hoone saada tema identifikaatori, ja 2) indentifikaatorid on liigselt seotud praeguse haldusjaotusega, mille muutumine toob kaasa palju lisatööd.

        Rahvaloenduse toimumise ajaks peab olema teada nende hoonete arv, asukoht ja aadressid, kus inimesed loenduse ajal elada võivad. Hooneregister ei jõua oma andmeid selleks ajaks arvutisse sisestada, samuti ei pruugi nende andmebaas täielik olla. Seetõttu tuleb hoonete revisjon teha ilmselt spetsiaalse tööna ja väga kiiresti. Suurt kiirust on võimalik saavutada ainult siis, kui tööd tehakse paralleelselt. See tähendab, et ka identifikaatoreid tuleb luua samaaegselt mitmes kohas. Identifikaatorite genereerimise algoritm peab tagama, et samale majale ei tekiks erinevaid identifikaatoreid ning erinevatele majadele samu identifikaatoreid.

        Hoonetele võib identifikaatoreid genereerida lähtudes nii andmebaast kui kaardist. Andmebaasis olevatele hoonetele võib omistada järjest numbrid ning lugeda need identifikaatoriteks. Kaardi põhjal võib identifikaatoreid genereerida mitmel viisil, kuid kõige loomulikum oleks kasutada koordinaate. Koordinaatide kasutamine lihtsustab identifikaatori unikaalsuse tagamist. Hoone tsentroidi koordinaat koos hoone ehitamise ajaga eristab hoone teistest piisavalt hästi. Selline identifikaator on aga pikk ja ebamugav kasutada. Identifikaatorit võib lihtsustada 1) ümardades koordinaati ja/või 2) kasutada ruutpuud (quad-tree).

        Ruutpuu abil identifikaatori genereerimisel kasutatakse samuti koordinaate. Riigi ametlikul koordinaatsüsteemil põhinev ristkoordinaadistik (selleks saab ilmselt praegune põhikaardi 1:20 000 süsteem) kodeeritakse ruutpuuga (vt Joonis 6). Hoone identifikaator võrdub ruudu numbriga, mille sisse tema tsentroid jääb. Lisada tuleb veel hoone ehitamise või esmamainimise aasta.

Joonis 6. Hoone identifikaatori genereerimine ruutpuu abil

Kui ruutpuuga katta 524x524 kilomeetri suurune ala ja viidata ta 5 meetri täpsusega, siis on suurim identifikaatori väärtus 68 719 476 736. Selline number mahub levinud andmebaasisüsteemides double või long double tüübi alla ja vajab 8 baiti ruumi.

Ruutpuu meetodi eelised:

Ruutpuu meetodi puudused:

Tartus tehti analüüs 565 hoonel (6.2% kõikidest hoonetest) määrates nende tsentroidide omavahelist kaugust. Vaatluse all olid Tähtvere linnaosa hooned, mis on üks tihedama hoonestusega linnaosi. Keskmine hoonete tsentroidide vaheline kaugus oli 25 meetrit. Alla 10 meetri oli vahekaugus 11 hoone tsentroididel, mis on va 2% hoonetest. Kaardile olid kantud kõik hooned, sh puukuurid ja garaazhid. Seega peaks 5 meetri täpsus tsentroidide kodeerimiseks piisav olema, sest 2% juhtudel, mil teoreetiliselt naaberhoonete ümardatud tsentroidid samasse asukohta võivad sattuda, saab tsentroidi sobivas suunas 5 meetrit nihutada. Eesti tingimustes jääb tsentroid siis ikkagi hoone ringpiiri sisse (vt Joonis 7).

Joonis 7 Tartu Tähtvere linnaosa hoonete tsentroidide ümber genereeritud 10meetrise läbimõõduga puhvrid. Puhvrid kattuvad üksteisega ainult 2% hoonete puhul (joonisel viirutatud). Kattuvad puhvrid tähendavad, et automaatselt identifikaatoreid genereerides satuvad kõrvutiolevatele hoonetele tõenäoliselt samad identifikaatorid. Ainult 2% vigade käsitsi kõrvaldamine ei ole liialt töömahukas, mis kinnitab meetodi rakendatavust.


21,7 K

        2.8.3 Klassifikaatorid

        Klassifikaatorite all mõeldakse lihtsustatult koode, mis on omistatud teatud atribuudi väärtustele. Näiteks eluhoone kood on hooneregistris "0100" ning riigi omandi kood "10" (Hooneregistri..., 1995). Selliste koodide loomise vajaduse määrab vajadus tagada andmebaasis võimalikult väike vigade arv ning ruumi kokkuhoid. Sarnaselt on otstarbekas kodeerida ka kõik ametlikud asulad, teede liigid, vooluveekogude tüübid jne.

        Olulised ei ole niivõrd klassifikaatori koodid, kuivõrd klassid (klassipiirid), mille numereerimiseks klassifikaatoreid kasutatakse, nad peegeldavad teatud määral maailmavaadet ehk eelpoolkirjeldatud reaalsusmudelit (vt ptk 2.7.1). Klassi koodi on lihtne muuta, kuid klassi piiride nihutamine on pahatihti võimatu ilma andmebaasi salvestatud info kaota. Seetõttu pööratakse klassifikaatoritele tõsist tähelepanu, Eestis on loodud ka Klassifikaatorikeskus.

        Juhul kui andmebaasi andmeid ei ole kunagi vaja siduda teiste andmebaaside andmetega, siis on klassifikaatorite loomine suhteliselt vaba. Klassifikaatorite kasulikkus ilmneb eelkõige üksteisest sõltumatult loodud andmebaaside ühendamisel. Kui andmebaasides kasutatakse külanimede asemel nende koode, siis on andmebaaside vahel relatsioonide loomine lihtne, vastasel juhul tekib alati tüütuid probleeme (tavaliselt tühiste koma- ja õigekirjavigade tõttu).

        Üleriigiliste klassifikaatorite haldamine on Klassifikaatorikeskuse ülesanne, kuid koodide levitamist ei ole seal eriti mugavalt õnnestunud organiseerida. Tulemusena tekib kiusatus ilma tsentraalsete klassifikaatoriteta läbi ajada. Riigi seisukohast oleks ilmselt odavam Klassifikaatorikeskuses hoitavaid andmeid tasuta jagada, sest mitmes kohas sama töö uuesti ümbertegemine on kindlasti majandusele asjatu koorem. Üksik ametkond võib liialt kergelt prioriteediks seada oma kõhna eelarve stabiliseerimise teenustasu abil.

        Riigi Statistikaameti poolt Eesti linnade ja alevite seas korraldatud küsitlus (Tepp, 1996) näitas, et umbes pooltel asulatel on välja töötatud kvartalite, tänavate või kruntide kodeerimise süsteem. Üldjuhul on selliste koodide põhiliseks puuduseks see, et keegi teine samu koode ei kasuta. Seetõttu saab neid pidada pigem andmebaasi sisemisteks koodideks.

        Ideaaljuhul võiks Eestis kõigil asulatel olla kvartalite, asumite ja tänavate koodid ning need võiksid olla kasutatavad klassifikaatorikeskuse kaudu samamoodi nagu praegu kohanimede koodid. Samas on seda raske saavutada, sest omavalitsustel ei ole kohustust informeerida klassifikaatorikeskust tehtavatest muudatustest.

        Mitmed asulad kasutavad oma koode ka kruntide jaoks. Pikemas perspektiivis asendatakse need koodid ilmselt katastriüksuse numbriga.

        Oma GISis on Statistikaametil otstarbekas kasutada neid koode, millised kehtivad omavalitsusüksustes. Juhul, kui omavalitsustel koode ei ole, siis tuleks need ise luua ning peale seda omavalitsustele tasuta digitaalkujul laiali saata. Suure tõenäosusega võetakse need kasutusse ning sellega tagab Statistikaamet lihtsa andmevahetuse oma tulevaste koostööpartneritega.

2.9 GISi abil tehtav analüüs

GIS on definitsiooni põhjal süsteem ruumiliste andmete kogumiseks, haldamiseks, säilitamiseks, päringute teostamiseks (otsinguteks), analüüsiks ja esituseks. Järgnevalt on tutvustatud GISi analüüsiosa, ehk mida GISiga "teha" saab.

GISi analüüsivõimaluste klassifitseerimine on suhteliselt raske, sest tegemist on tihti komplekssete ülesannetega, milles võib leida eri klassidesse kuulumise tunnuseid. Seetõttu ei tohiks siin toodud klassifikatsiooni pidada lõplikuks.

    2.9.1 Päringud andmebaasist

    Andmebaasi all mõeldakse siin "tavalist" alfanumeerilist andmebaasi, mis võib olla realiseeritud kas relatsioonilise või objektorienteeritud andmebaasisüsteemiga. GIS koosneb piltlikult kahest poolest - süsteemis salvestatud objektide asukoha ning kuju info (GISist G-pool), ning nende objektide atribuutinfo (GISist I-pool). Päringutega andmebaasist leitakse objektid nende atribuutinfo alusel ning näidatakse nende asukohta.

    Tüüpilisteks päringuteks on "Näita hoonet aadressil Kastani 16", "Näita kõiki kivikatusega elamuid", "Näita kõiki Eesti soid, mille pindala on üle 10 km2".

    Relatsionilises andmebaasis säilitatava atribuutinfo kohta tehtavate päringute standardiseeritud "keel" on SQL (ingl k. Structured Query Language), mida peaksid oskama kõik andmebaaside ning GISide kogenumad kasutajad.

    2.9.2 Päringud kaardil

    Päringuid kaardil võib vaadata kui GISi G-pooles tehtavaid päringuid. Sagedased on päringud "Milline on kahe objekti vaheline kaugus?", "Kui suur on põldude kogupindala?", "Mitu talu asuvad teele lähemal kui 500m?". Kõigile neile saab vastata objektide asukoha ja kuju põhjal, ilma atribuutinfot kasutamata.

    Kaardil tehtavate päringute standardiseerimiseks on loodud mitmeid keeli, kõige olulisemad neist on ehk kaardialgebra ja SQL3/MM Spatial Extensions. SQL keelele on pakutud ka teisi laiendusi, mis võimaldaks teha kombineeritud päringuid nii kaardil kui andmebaasis (Mainguenaud, 1993). Euroopas on asutud geograafilise infoga seotut standardiseerima (European Standard prEN 287013, 1996) ning muude standardite hulgas leidub ka päringuid standardiseeriv osa (vt Tabel 4). Teistes GISidega seotud standardites ei ole päringutele nii palju tähelepanu pööratud.

    Tabel 4 Kaardil tehtavate päringute predikaadid ning funktsioonid (European Standard prEN 287013, 1996).

    Predikaadi nimi

    Nimi inglise keeles

    Kirjeldus

    Naaber

    Adjacent to

    Näitab, kas objekt jagab teise objektiga ühte või rohkemat serva

    Asub

    At

    Näitab, kas objekt asub (küllalt lähedal) ette antud asukohas

    Lõpus

    At end of

    Näitab, kas punkt on näidatud joone lõpus

    Alguses

    At start of

    Näitab, kas punkt on näidatud joone alguses

    Ühendatud

    Connected to

    Näitab, kas joonel on teise joonega ühine punkt

    Sisaldab

    Contains

    Näitab, kas objekt sisaldab teist objekti tervikuna

    Lõikub

    Crosses

    Näitab, kas üks objekt lõikub teisega omamata temaga ühist punkti

    Hõlmab

    Encloses

    Näitab, kas objekti ruumiline ulatus sisaldab teist objekti

    Sisaldub (vt ka sisaldab)

    Inside (see Contains)

    Näitab, kas objekt sisaldub tervikuna teises objektis

    Vasakul

    Left of

    Näitab, kas polügon asub (suunatud) joonest vasakul

    Puutub

    Meets

    Näitab, kas objekt jagab teise objektiga ühte punkti

    Kattub

    Overlaps

    Näitab, kas üks objekt kattub (osaliselt) teise objektiga

    Paremal (vt ka vasakul)

    Right of (see Left of)

    Näitab, kas polügon asub (suunatud) joonest vasakul

    Hõlmatud (vt ka hõlmab)

    Within (see Encloses)

    Näitab, kas objekt sisaldub teise objekti ruumilises ulatuses

     

    Funktsiooni nimi

    Nimi inglise keeles

    Kirjeldus

    Pindala

    Surface

    Annab objekti pindala

    Suund

    Azimuth

    Annab kahe punkti vahelise joone suuna

    Puhver

    Buffer

    Loob objekti ümber etteantud laiusega tsooni

    Kaugus

    Distance

    Annab kahe objekti vahelise väikseima kauguse

    Pikkus

    Length

    Annab objekti pikkuse

    Ulatus

    Minimum Enclosing Rectangle

    Annab väikseima ristküliku, mis sisaldab antud objekti

    Ühisosa

    Overlap

    Annab kahe objekti ühisosa

    Ümbermõõt

    Perimeter

    Annab (pind)objekti ümbermõõdu

    Eraldusvõime

    Resolution

    Annab kahe väikseima vahemaa, mida on kahe punkti vahel võimalik eristada.

    2.9.3 Väljadega seotud analüüs

    Väljade eripära seisneb selles, et looduses on võimalik mõõta välja tugevust ainult kindlates punktides, GISis analüüsi ning esituse tegemiseks tuleb andmeid interpoleerida. Interpoleerimiseks on palju erinevaid meetodeid, mille hulgast tuleb valida konkreetse nähtuse olemusega kõige sobivam.

    Välja tugevust saab ette kujutada reljeefina, kus "kõrguseks" on välja tugevus antud punktis, ning seejärel rakendada maapinna reljeefi analüüsist tuttavat analüüsivõimaluste arsenali - määrata kõrgust (väljatugevust) suvalises punktis, genereerida samakõrgusjooni, valmistada profiile, leida lahkmejooni ning teha nähtavusanalüüsi, määrata nõlvakallet ja gradienti, teha reljeefivarjutust.

    Rahvastikuanalüüsil on rakendatav trendipindade loomine, kus joonisel tekkivad "kõrgustikud" näitavad piirkondi, mille elanike arv (tihedus) kasvab.

    Joonis 8 Genereeritud reljeefivarjutuse peal on näidatud viirutusega piirkonnad, mis jäävad lennukiga lennates nähtamatuks (http://www.esri.com/base/gis/military/48dzm.html).


    123 K

    2.9.4 Topoloogiline analüüs

    Topoloogilise analüüsiga saadakse vastuseid objektidevahelisest asendist tulenevatele küsimustele. Peamiseks rakenduseks on võrgustikanalüüs, võrgustik moodustatakse tavaliselt teedest. Sellistele päringutele nagu "Milline on lühim/kiireim/siledaim tee kahe linna vahel?", "Millises järjekorras tuleb läbida kliendid, et tagada lühim teekond?" vastamiseks tuleb arvestada teede ristumisi, objektide külgnemisi teede suhtes.

    Joonis 9 Näide optimaalse tee leidmisest linnas.

    Topoloogilise analüüsiga saab määrata objektide sisalduvust üksteises (nt koolid, mis asuvad X linnaosas) ja naabrussuhteid (nt kõrvutiasetsevad krundid).

    Joonis 10 GISi abil on võimalik leida krundid, mis jäävad tänava mõjupiirkonda (http://www.esri.com/base/gis/abtgis/buffer2.gif).

    2.9.5 Klassifitseerimine

    Pindobjekte, nt põllu- ja metsa-alad, on võimalik nende atribuudiväärtuste alusel klassifitseerida mitmel viisil. Klassifitseerimisel võib osutuda, et naaberobjektid asuvad samas väärtusvahemikus. Edasisel analüüsil ei ole otstarbekas kasutada kahte kõrvutiolevat sama sisuga pinda, vaid need ühendada.

    Teistpidi, kahe temaatilise kihi (nt mullatüübid ja põllud) analüüsil võib tekkida vajadus nende info kombineerida (overlay), sellega luuakse uued, pindobjektide piiride lõikumisel tekkivad, pinnad.

    Joonis 11 Polügonide kombineerimise (overlay) näide

    Satelliitfotode töötlemine ning kasutamine on samuti suuresti klassifitseerimisülesanne. Klassifitseerimisel liigitatakse tavaliselt rasterandmed (ka vektorandmetega saab teha sama, kuid algoritmid on oluliselt keerulisemad) gruppidesse vastavalt nende väärtustele. Satelliidid mõõdavad pinnaühikute heledust erinevatel lainepikkustel, pildil väljenduvad need pikslitena. Saadud andmed kombineeritakse spektrialade kaupa või klassifitseeritakse pildi sagedusjaotuse (histogrammi) põhjal kokkuleppelistes värvides (vt Joonis 12). Sellisel meetodil saadud satelliitfotosid nimetatakse valevärvilisteks piltideks (ingl k false color imagery).

    Joonis 12 Kosmosefotod saadakse erinevatel lainepikkusel tehtud mõõtmistulemuste klassifitseerimisel/kombineerimisel, mis värvitakse vastavalt legendile (nn false color).


    84,4 K

    2.9.6 Transformeerimine

    GISi abil tehtavaks analüüsiks on kindlasti erinevad transformeerimisülesanded. Üks tuntumaid on projektsiooniteisendused, mille abil viiakse andmed ühest projektsioonist või matemaatiliselt aluselt teise projektsiooni. Andmete konverteerimine erinevate GIS programmide vahel on samuti sagedane ülesanne.

    GISides salvestatud andmed on enamasti kas vektor- või rasterkujul. Analüüsi tarvis on neid vaja ühelt kujult teisele teisendada, paberkujult skaneeritud kaardid tuleb tavaliselt vektoriseerida, teatud analüüsiülesannete või kvaliteetsete kaartide tegemiseks tuleb andmeid ka rasteriseerida.

    Vähem tuntud ülesanne on servasobitamine (ingl k edge-matching). Siiani pärineb suur osa andmeid GISides paberkaartidelt, mis on välja antud lehtedena. Lehed on aga erineva vanuse ning kvaliteediga, seetõttu ei pruugi kahel naaberlehel teed täpselt kokku sobida ning esineb teisigi sarnaseid vasturääkivusi. Käsitsitöö vähendamiseks on GISidega võimalik suur osa vigu automaatselt parandada.

    2.9.7 Komplekssed ülesanded

Grupp ülesandeid, mida GISidega teha saab, on nii keerulised, et nad sisaldavad praktiliselt kõiki ülalnimetatud GISide funktsioone. Teatud osa on siiani arvutitega lõpuni lahendamatu, vajades käsitsitööd.

Generaliseerimine on äärmiselt arvutusmahukas operatsioon, mille eesmärgiks on lihtsustada kaardi kujutust vastavalt kaardi teemale või mõõtkavale ning andmebaasis olevate andmete väärtusele. Generaliseerimine on võimalik jaotada paljudeks võteteks, millest ainult osa on edukalt GISidega automatiseeritav: lihtsustamine, silumine, klassifitseerimine, liitmine, sulatamine, mestimine, kokkusurumine, sõrendamine, tüüpimine, liialdamine, rõhutamine ja nihutamine.

Joonis 13 Rannajoone võrdlus mõõtkavas 1:200 000 vormistatud teede kaardil ning ca A4 ehk 1:1 500 000 Eesti kaardil (näidatud punase joonega). Joone lihtsustamine ja silumine on üks lihtsamaid generaliseerimise võtteid.


21,7K

Simuleerimine ja modelleerimine on samuti GISi oluline rakendusvaldkond. Modelleerida saab nt saaste levikut valgalas, õhku pihkunud gaaside levimist, ilma muutumist järgmisel nädalal jne.

Joonis 14 Ilmaennustamine nõuab eriti võimsaid arvuteid ning spetsialiseeritud GISe. Esimesed neli pilti on ilmast 23. veebruaril 1997, viimane pilt on ennustus järgmiseks päevaks. Näited aadressilt http://www.meteo.fr.


114,4 K

Optimeerimisülesandeid kasutatakse etteantud kitsendusi arvestades parima lahendi leidmiseks. Võrgustikmudelil leitakse tavaliselt lühimat teed, statistilisel pinnal lahendatakse paigutusülesandeid jms.

2.10 GIS andmete kvaliteet

GISis kasutatavate andmete väärtus sõltub nende kvaliteedist.

GIS andmebaasi kvaliteet on järgmiste parameetrite summa (Stanek and Frank, 1993):

Siia võiks veel lisada asjakohasuse (relevancy) ning töötluse kvaliteedi (processing quality).

Asukohatäpsus. Asukohatäpsus näitab, kui täpselt on objektide asukoht GISis salvestatud. Tihti luuakse GIS andmed olemasolevate paberkaartide digimise teel, sellisel juhul ei saa GISi asukohatäpsus olla parem kui paberkaardil. Paberkaardi täpsuseks peetakse maksimaalselt 0.3 millimeetrit, mis näiteks 1:5 000 kaardi puhul võrdub 1.5 meetriga, 1:50 000 kaardi puhul 15 meetriga. Kui GISi ei looda olemasolevate paberkaartide põhjal, siis tuleb arvestada andmete kogumise tehnoloogia täpsust. Asukohatäpsust mõjutab ka töötluse kvaliteet, mida andmetele peale kogumist rakendatakse (vt allpool).

GISis võib iga andmekiht (või isegi objekt) olla kujutatud erineva asukohatäpsusega, rõhutada tuleb, et objekte ei ole suurt mõtet kujutada GISis täpsemalt kui nad looduses eksisteerivad. Näiteks Eesti tingimustes ei ole rannajoon määratav täpsemalt kui 5 meetrit, tänava äärekivi on identifitseeritav millimeetri täpsusega.

Asukohatäpsuse hindamiseks on mitmeid meetodeid, mis algselt olid mõeldud paberkaartide kvaliteedi hindamiseks. GISidele kohandatutest võib märkida standardvea meetodit (Acharya and Bell, 1992),

Atribuuditäpsus. GIS andmed salvestavad peale objektide asukoha ka nende kohta atribuutinfot. Atribuutide vastavust tegelikule iseloomustab atribuuditäpsus. Teoreetiliselt võib GISis hoonete asukoht olla esitatud 1 cm täpsusega (mida loetakse väga heaks), kuid tema aadress vale.

Atribuutide skaala võib olla järgmist tüüpi:

Skaala tüüp

Kirjeldus

Nominaalskaala

Objektid on klassifitseeritud grupidesse, sageli tähistatud tähtede või numbritega. Nominaalskaala puhul ei ole võimalik teha aritmeetilisi operatsioone, on võimalik öelda ainult, et grupp A ¹ grupp B.

Järjestatud skaala

Objektid on klassifitseeritud gruppidesse, mille vahel on võimalik teha pingerida. On võimalik öelda, et grupp A < grupp B, kuid ei ole võimalik määrata vahede suurust.

Arvuline skaala (intervallskaala)

Objektid on võimalik järjestada ning nendevahelist kaugust määrata. Intervallskaalal ei pruugi olla nullpunkti ning seetõttu ei saa kasutada kordseid arve. Näiteks ei ole 50ºF kaks korda kuumem kui 25ºF.

Arvuline skaala (suhteskaala)

Objekte on võimalik järjestada, nendevahelist kaugust määrata ning kõik suurused on absoluutsed. Suhteskaala on kõige levinum skaala

Atribuuditäpsuse määramise testi valik sõltub atribuudi skaala tüübist (Dent, 1990):

Skaala tüüp

Täpsuse määramise võimalused

Keskkoht

Dispersioon

Testid

Nominaalskaala

Mood

Variatsioon

Chi-ruut, koonduvuskoefitsent

Järjestatud skaala

Mediaan

Persentiilid

Spearmani rho; Kendalli Tau

Arvuline skaala (intervallskaala)

Keskmine

Standardhälve

F-test; t-test; Pearsoni V

Arvuline skaala (suhteskaala)

Geomeetriline keskmine

Variatsioonikoefitsent

F-test; t-test; Pearsoni V

Üldiselt ei ole atribuuditäpsuse määramine GISi-spetsiifiline, seetõttu sobib atribuutide kvaliteedi määramisel kasutada samu meetodeid, millega vastavat ala iseloomustavaid andmeid tavaliselt hinnatakse.

Loogiline õigsus. Loogiline õigsus kirjeldab andmestruktuuri vastavalt tegelikkusele. Loogilist õigsust tuleb hinnata eraldi atribuutandmetel ning graafilistel andmetel. Näiteks võivad ebakorrektsed atribuudid olla korruste arv = -1 või korterite arv majas = 2000, aga ka vasturääkivad (ehitusaasta=1996 ja remondiaasta=1967).

Graafiliste andmete loogiline õigsus sõltub graafilisest korrektsusest ning sisulistest vigadest. Graafilised vead tekivad tavaliselt digimiseeskirjade rikkumisest, nt jooned on topelt sisestatud, pinnad ei ole suletud, jooned ei lõiku korrektselt jms. Sisulised vead tekivad enamasti asukohatäpsusest tulenevalt. Kuigi objektid võivad vastata esitatud asukohatäpsuse kriteeriumitele (nt 5 meetrit), siis kokkusattumuste tulemusena satuvad teinekord hooned järve, haljasala jõkke ja tekivad muud sarnased loogilised või topoloogilised vasturääkivused.

Täielikkus. Täielikkus kirjeldab andmete vastavust püstitatud valikukriteeriumitele. Kriteeriumiks võib olla nt üle 25 ha suuruste järvede või kõigi hoonete kaardistamine. Kui osa hooneid on kaardile kantud täpse kujuga ning osa leppemärgiga, kuid kujutatud on kõik hooned, siis on andmehulk täielik, aga ilmselt väikese asukohatäpsusega. Näiteks rahvaloenduskaartide puhul on täielikkus olulisem kui asukohatäpsus.

Täielik andmebaas ajalises mõttes on aktuaalne, so vastab andmebaasi kasutamise hetke seisule.

Täielikkust koos asukohatäpsusega arvestades on võimalik hinnata, millise mõõtkavaga paberkaardile vastab GIS andmebaas. Täielikkuse määr ning objektide esitamise täpsus kirjeldavad suhteliselt täpselt kaardile rakendatud generaliseerimise astet ning "suurendust" ehk mõõtkava.

Asjakohasus ehk ülearuse puudumine. Päringutulemused või GIS andmebaas ei tohiks sisaldada liialt palju infot, mis segab olulise tajumist või kasutamist.

Töötluse kvaliteet. Andmete transformeerimisel ühest koordinaatsüsteemist teise või rasterkujult vektorkujule tekivad paratamatult teatud kaod või moonutused. Tihti on nende suurust raske määratleda, seetõttu dokumenteeritakse kõik tegevused, mida andmehulgale on rakendatud. Oluline on teada rakendatud algoritme ning kasutatud parameetrite väärtusi. Näiteks võib kaardi matemaatilist alust ühelt ellipsoidilt teisele konverteerida Bursa-Wolf või Molodenski parameetreid kasutades, mis isegi teoreetiliselt ei anna täpselt sama tulemust. Konkreetse rakenduse puhul võib tekkivat erinevust ignoreerida, kuid seda tuleb teha teadlikult, mitte lasta vigadel kumuleeruda.

2.11 Analüüsitulemuste esitus teemakaartidel

GISide abil kogutud või analüüsitud tulemusi võib edastada mitmel viisil:

Allpool on kirjeldatud detailsemalt ainult paberkujul teemakaarte kui kõige levinumat esitusviisi.

Teemakaardi eesmärk on analüüsitulemuste adekvaatne edastamine info vajajale, seega on teemakaart omamoodi kommunikatsioonikanal. Eriti tuleb rõhutada teemakaartide adekvaatsuse nõuet. Teemakaardi eesmärgiks on kujutada kaardil infot nii, et kaardi kasutaja näeks kaardil seda, mida koostaja on soovinud edastada. See ülesanne ei pruugigi kõige lihtsam olla.

Üldjuhul on teemakaardid väikese formaadiga (A4 kuni isegi 5x5 cm) nendel kujutatud info paremaks hõlmamiseks. See tingib väikeste mõõtkavade kasutamise (Eesti puhul 1:1 500 000 ja väiksemad). Väike mõõtkava tingib info tugeva üldistamise ja abstraheerimise, mida on täisautomaatselt raske teha ja seetõttu tuleb kasutada kvalifitseeritud tööjõudu.

Teemakaardid, mille formaat on üle A3, on tavaliselt eriti hoolikalt ettevalmistatud kallid väljaanded. Suurte teemakaartide koostajad peavad orienteeruma ka värviteoorias, leppemärkide standardites, projektsioonides, spetsiaaltarkvara võimalustes ja paljudes teistes kartograafiaga seotud valdkondades.

Teemakaartide abil võib esitada väga erinevat tüüpi nähtusi, mis oma olemuselt on kas punktid, joonelised, pinnalised, ruumilised või aegruumilised (vt Joonis 15). Teemakaart esitatakse paberil või ekraanil tasapinnalistena, kuid nähtusi on nullimõõtmelistest neljamõõtmelisteni. Lähtudes kaardi mõõtkavast ja koormatusest ning nähtuse suurusest tuleb valida, kas teda kujutada teemakaardil punkt-, joon- või pindeelemendina (interaktiivsel arvutikaardil saab elementidele anda ka ruumilisuse illusiooni). Nende elementide kujutusviis kannab sõnumit, mida teemakaardil edastada tahetakse. Nähtuse iseloomu antakse edasi kaardielementide suuruse, kuju, orientatsiooni, mustri, värvi või animatsiooniga (viimane on rakendatav ainult digitaalsetel teemakaartidel).

Joonis 15 Teemakaartide esitusviisi valikuvõimalused

Nii suure hulga võimaluste (5x3x6=90) seast otstarbeka variandi valimine ning selle kvaliteetne vormistamine nõuab kogemusi. Statistikaametil oleks soovitav enne rahvaloenduse tulemuste töötlemist viia läbi oma analüütikutele teemakaartide koostamise kursused.

Teemakaartide lõplikku ning laialdaselt heaks kiidetud klassifikatsiooni ei ole teada. Ilmselt on üks põhjusi ka see, et teemakaart on oma olemuselt väga loominguline - pidevalt proovitakse leida paremaid meetodeid oma sõnumi edastamiseks. Loomingut on aga väga raske klassidesse liigitada. Teemakaardi tüüpidena tuleks nimetada:

Allpool on kirjeldatud ainult olulisemate teemakaartide tüüpe. Enne avaldamisele kuuluvate kaartide koostamist tuleks aga kindlasti lähemalt tutvuda iga teemakaardi tüübi kvaliteedinõuetega, muidu võib juhtuda, et põhjalik uurimus on illustreeritud ebaprofessionaalsete kaartidega.

Teemakaartide tüüpe võib ka kombineerida, näiteks koropleetkaardi ja sümbolkaardi kombinatsiooni nimetatakse ka kartodiagrammiks, levinud on ka punktkaardi ja koropleetkaardi sulam.

        2.11.1 Koropleetkaart

        Koropleetkaardil esitatakse nähtusi pindadega, mis on klassifitseeritud mingi väärtuse alusel. Pindu eristatakse üksteisest värvi, mustri või kolmemõõtmelisuse illusiooni loovate efektidega.

        Koropleetkaarte võib kasutada siis, kui nähtuse olemus on diskreetne ja teda saab kujutada hästipiiritletud geograafilise alana. Näiteks sobivad koropleetkaardil kujutamiseks elanike keskmine sissetulek valdades, maa hinnaklass linnaosas jms. Koropleetkaardiga ei ole otstarbekas esitada näiteks keskmist õhutemperatuuri, sest mingisse vahemikku jääv keskmine temperatuur ei levi korralikult piiritletaval alal.

        Koropleetkaartide tüüpiline kasutusala on statistiliste andmete lausaline esitamine arvestuslike geograafiliste üksuste kaupa: omavalitsused, rajoneeringuüksused, administreerimis- või majandamisüksused (nt müügipiirkonnad, metsakvartalid jms). Kujutusviis peaks võimaldama võrrelda nähtuse geograafilist jaotumust ja aitama tuvastada regionaalseid iseärasusi.

        Tavaliselt esitatakse koropleetkaardid kas võrdsete vahemikega või jaotatuna nii, et igas vahemikus oleks võrdne arv elemente. Täpselt sama informatsiooni kujutamine erinevate klassidega võib anda väga erineva tulemuse. Joonis 16 näitab, kui erinev võib teemakaart näida võrdsete vahemike või võrdse arvu vahemike abil. Täpselt sama info on näidatud ka Joonis 17-l, vallad on grupeeritud seal kolme võrdsesse vahemikku. Kolm vahemikku on eriti ebasobivaks osutunud, sest näiteks Kiili vald Tallinna külje all on näidatud valge värviga, kontrastina ümbritsevate punaste tihedalt asustatud valdadeda. Rohkemate klassidega kaardid näitavad Kiili valla elanike arvu korrektsemalt.

        Ükski siintoodud koropleetkaart ei vasta väga kvaliteetse teemakaardi nõuetele ning neid ei tohiks eeskujuks võtta. Käesolevale tööle on nad lisatud erinevate kujutusmeetodite illustreerimiseks.

        Koropleetkaartide puhul on eriti oluline, et väärtused oleksid sobivalt klassifitseeritud. Minimaalse ja maksimaalse väärtuse vahe on võimalik jagada intervallideks mitmel erineval viisil, millest osade määramine nõuab eraldi analüüsimeetodite rakendamist (vt Tabel 5).

        Klasside arvul on ka kindel roll - neid ei saa liialt palju välja tuua (pole jälgitav), ega liiga vähe (ei ütle midagi). Optimaalseks arvuks on viis-kuus, paaritu isegi parem - siis on keskmine tulemus paremini silmatorkav (vrdl Joonis 16 ja Joonis 17).

         

        Tabel 5 Koropleetkaartide vahemike jaotusvõimalused (Dent, 1990)

        Vahemike jaotamise viis

        Seletus

        võrdsed vahemikud

        minimaalse ja maksimaalse väärtuse vahe on jaotatud võrdseteks osadeks, nt 1-5, 6-10, 11-15. Tavaliselt piisab viiest vahemikust.

        võrdse arvuga vahemikud

        vahemikud püütakse määrata nii, et igasse vahemikku jääks võimalikult samasugune arv elemente. Ei ole soovitav kasutada, kui elemendid on kaardil eri suurusega.

        aritmeetilise jada vahemikud

        nt vahemikud 1-3, 4-8, 9-15

        geomeetrilise jada vahemikud

        nt vahemikud 1-3, 4-8, 9-17, 18-34.

        standardhälbe vahemikud

        leitakse väärtuste keskmine ning kaardil näidatakse erinevust keskmisest. Erinevused rühmitatakse tavaliselt kuude klassi.

        kvantiilid

        vahemikud määravad atribuudiväärtuse jaotuse mingi teise väärtuse suhtes, näiteks linnarahvastik kogurahvastiku suhtes.

        loomulikud vahemikud

        vahemike eraldused määratakse kohtadesse, kus väärtuste jaotusel on suuremad hüpped.

        optimaalsed vahemikud

        Igas vahemikus on võimalikult homogeenne sisu ning vahemike erinevused märgatavad. Kasutatakse klastrite moodustamist.

         

        Joonis 16 Koropleetkaardid, millel on näidatud Eesti valdade rahvaarv. Kaardi tajumise seisukohast on oluline kas väärtused on klassifitseeritud võrdsete vahemikega (ülemine kaart) või nii, et igas vahemikus oleks enamvähem võrdne arv elemente (alumine kaart). (Vt ka Joonis 17)


        51 K

        Joonis 17 Koropleetkaart, kus rahvastiku arv valdades on grupeeritud kolme klassi. Kolm klassi on selle jaoks selgelt ebapiisav, näiteks moonutatakse liigselt Kiili valla elanike arvu esitust. (Vt ka Joonis 16)


        18 K

        2.11.2 Punktkaart

Punktkaartidel esitatakse nähtusi kindlal viisil paigutatud punktide abil (vt Joonis 18), punktid ei pruugi esindada ühte nähtust või objekti, vaid nt 1000 samaväärset asja. Kaardi kasutajal tekib visuaalne tunnetus nähtuse ruumilise jaotuse kohta. Punktkaarte on otstarbekas kasutada juhul, kui:

Punktkaardil on mõned puudused:

Joonis 18 Punktkaart võib esitada rahvastiku jaotust paremini kui koropleetkaart. Punktkaardiga ei saa edasi anda tuletatud väärtusi (nt tihedust), sest punktkaart iseloomustab niigi levikut pinnaühiku kohta. Kaardil näidatud elanike arv kujutubki tihedusena.

        2.11.3 Sümbolkaart

Sümbolkaartidel esitatakse nähtust sümboli suuruse varieerimisega (vt Joonis 19 ja Joonis 20). Sümboliks võib olla ring, ruut, kolmnurk (või muu lihtne geomeetriline kujund), aga ka mõni keerukam leppemärk või graafik. Peamiselt vene kartograafiakoolis eristatakse sümbolkaardil kolme alaliiki:

Märgikaardil juhitakse tähelepanu objekti asukohale, märgi suurusega varieerimine ei ole oluline (nt bensiinijaamade asukohtade teemakaart on märgikaart). Diagrammkaartide puhul on rõhk nähtuse sisemisel struktuuril, seda saab edasi anda nt sektordiagrammidega. Lokaliseeritud diagrammkaardil kombineeritakse märgikaart ning diagrammkaart - diagrammid või märgid asetatakse nende õigesse asukohta.

Sümbolkaarti on soovitav kasutada siis, kui esitatav nähtus asub ühes punktis (nt proovivõtukoht) või ta on kaardil selgelt eraldatud aladel (nt vallakontuuride sees). Sümbolkaartidega saab lihtsalt edastada koguarve, suhtarve ja proportsioone, tihedust on otstarbekam esitada punkt- või koropleetkaardil.

 

Joonis 19 Elanike arv sümbolkaardil. Sektordiagramm väljendab korraga nii elanike arvu kui nende vanuselist koosseisu.


52 K

Joonis 20 Eelmise joonisega sarnane sümbolkaart, kus sektordiagramm on asendatud tulpdiagrammiga. Tulpade ja sektorite värvid on ära muudetud illustreerimaks segadust, mis võib tekkida ühes asutuses erinevate värvistandardite kasutamisel.


17,5 K

        2.11.4 Isaritmiline kaart

Isaritmilise kaardiga iseloomustatakse kolmemõõtmelist objekti tasapinnal, tavaliselt maapinna reljeefi. Kolmemõõtmeliselt võib ette kujutada ka nähtusi, mis oma olemuselt tegelikult ei ole kolmemõõtmelised. Näiteks proovivõtukohtade asukohakoordinaadid annavad kaks mõõdet ning proovi tulemust kujutatakse kolmanda mõõtmena, "kõrgusena".

Isaritmilised kaardid jaotatakse kaheks:

Isomeetrilised

kirjeldavad nähtusi, mis asuvad mingis kindlas punktis, nt kõrgus

Isopleetilised

kirjeldavad nähtusi, mis levivad mingil alal, näiteks tihedus. Isopleetilise kaardiga ei saa edasi anda absoluutväärtusi.

Isaritmilisi kaarte on otstarbekas kasutada, kui:

Isaritmiliste kaartide puuduseks on see, et nende lugemine nõuab ettekujutusvõimet ja vilumust.

Joonis 21 Isaritmiliste kaartide näidised. Ülemisel kaardil on toodud Eesti maarahvastiku tihedus samatihedusjoonte ja -vahemikega, alumisel sama info DEM-kõrgusmudeli abil.


75 K

        2.11.5 Pindalakaardid

        Pindalakaartide (value-by-area map, kartoid, anamorfoos) puhul muudetakse objektide pindala nii, et see vastaks nähtuste omavahelisele suhtele. Seetõttu objektide kuju moonutatakse (vt Joonis 22). Areaalide pindala on ekvivalent koropleetkaardi värvi või tekstuuri intensiivsusele. Pindalakaarte kasutatakse suhteliselt vähe, ilmselt sellega saab seletada ka nende pilkupüüdvust. Selle esitusviisi suurim puudus on ilmselt harjumatule silmale raske loetavus ning objektide omavahelise ruumilise paiknemise moonutus. Pindalakaartide koostamise algoritm on samuti väga keeruline.

        Lihtsamatel pindalakaartidel asendatakse objektide kujud rööptahukatega, keerulisematel püütakse võimalikult säilitada nende looduses eksisteerivat kuju.

        Joonis 22 Pindalakaardil on näidatud tornaadode esinemissagedus USAs (Dent, 1990). Iga osariigi pindala on muudetud nii, et see oleks proportsionaalne tornaadode arvuga aastas. Samas on püütud säilitada osariigi kuju ja asetust teiste suhtes.


        28,8 K

        2.11.6 Vookaart

Paljud nähtused on dünaamilised (inimeste ja kaupade liikumine), või seotud kahe osapoolega (kontaktide tihedus). Sellisel puhul on otstarbekas esitada neid vookaartidel (flow maps). Vookaartidel kasutatakse info edastamiseks muutuva jämedusega jooni ja/või nooli.

Vookaartidel võib seoseid näidata kahel viisil 1) geograafilisi iseärasusi ignoreerides ühendades kaks punkti otse või kujundusest tulenevatest tõekspidamistest lähtudes või 2) võimalikult arvestades nähtuste tegelikku paiknemist. Näiteks võib liiklusõnnetuste arvu või keskmist liikluskiirust esitada vastavate teelõikude jämeduse muutmisega.

Joonis 23 Vookaardi näide (Dent, 1990). Kaardil on näidatud maailma suuremate majanduskeskuste omavaheliste import-eksporttehingute maht noolte abil. Noole jämedus väljendab tehingute mahtu.


79,5 K

2.12 Võimalikud karid analüüsil ja esitusel

Järgnevalt on tutvustatud kahte kõige tõenäolisemat probleemi, millega tuleb rahvaloendusandmete töötlemisel ja esitamisel kokku puutuda.

        2.12.1 Kohanimede ümberpaiknemine

        Kõik analüüsid, mis hõlmavad Eestis rohkem kui 30-aastast ajaperioodi (demograafilised analüüsid vajavad sellist ajaskaalat tihti) peavad arvestama, et kohanimed võivad olla looduses liikunud mitmeid kilomeetreid (vt Joonis 24 ja Joonis 25). Lihtsate andmetabelite kasutajal ei pruugi tekkida kahtlustki kohanime mittekõrvutatavuse suhtes, kuid GIS-analüütikud peaksid sellistele probleemidele tähelepanu juhtima. Otsustada tuleb, kas võrreldakse rahvastikku mingis piirkonnas või sama nimega asulate rahvastikku omavahel.

        Veel sagedamini on linnade territoorium suurenenud. Analüüsil peaks arvestama, et Tartu linn on 1997. aastal võrreldes 1918. aastaga oluliselt suurenenud. Seda arvestamata võib elanike arvu muutust seostada migratsiooniga, kuid tegelikult mõjutas elanike arvu ka linna territooriumi suurenemine.

        GISi abiga on võimalik kohtade ja kohanimede muutustest tulenevaid erinevusi elimineerida, või vähemalt oluliselt vähendada.

        Joonis 24. Vasakpoolsel kaardil (1:50 000 topograafiline kaart aastast 1937) asub Tõrvandi praeguse raudteeülesõidu kohal. Parempoolsel kaardil (1:50 000 topokaart aastast 1989, vastab asulanimede osas ka 1996 aasta seisule) on Tõrvandi alevik endiste Tombi, Tuule ja Raja talude maadel. Kas 50 aasta jooksul on 1.5 kilomeetrit lõuna poole liikunud asula või ainult tema nimi?


        601 K

        Joonis 25. Vasakpoolsel kaardil (1:200 000 topograafiline kaart aastast 1939) loeti Missoks mõisa asukohta. Parempoolsel kaardil (1:200 000 REGIO Teede Atlas 97) on Misso alevik endiste Pulli ja Lemmatsi külade asemel. Endiseid külanimesid mäletavad ainult kohalikud elanikud.


        501,6 K

        2.12.2 Koropleetkaartide pindade valik

Koropleetkaartide valmistamisel on oluline kasutatavate elementaaralade valik. Kõige mugavamad alad ei pruugi anda kõige korrektsemat esitust.

Joonis 26 kaardil A on näidatud Kärdla linna rahvastikutihedust loendusüksuste kaupa. Kõrvaloleval kaardil B on sama info näidatud kvartalite kaupa. Välja joonistub tihedalt asustatud ala linna kirdeosas, mis loendusüksuste kaardil kaduma on läinud. Kvartalite kaardi paremust tunnistab ka kaardil B näidatud hoonete levik, iga must punkt näitab ühte hoonet.

Kvartalid ei pruugi samuti kõige otstarbekamad esituspinnad olla. Kvartalid on üldjuhul väga erineva suurusega, eriti linna servades sisaldavad nad palju tühermaad. Kaardil B on linna idaservas näha tihedalt paigutatud majade kogum, kuid vastava kvartali keskmine elanike tihedus on suhteliselt väike. Juhul, kui kasutada korrapärast võrgustikku, mille silmade suurus on sobivalt valitud, siis kirjeldatakse korrektselt väiksemad tihedalt asustatud alad. Võrgu silmade vähendamine ei pruugi esituse täpsust tõsta - liiga tiheda võrgustikuga kaart D ei annagi ülevaatlikku pilti. Eesti linnade puhul võiks kasutada 250 meetrilist võrku, maapiirkondades ehk 500 meetri võrku.

Loendusüksused on mõeldud loendajate vahel töökoormuse võimalikult võrdseks jaotamiseks. Analüüsi seisukohast peab aga iga ala olema võimalikult homogeense sisuga. Seega ei pruugi loendusüksused sobida analüüsiks ning vastupidi, homogeense sisuga alad ei pruugi sobida loenduse läbiviimiseks (vt ka ptk 4.4.2).

Selleks, et rahuldada mõlemaid eesmärke, tuleb rahvaloendusandmed siduda hoonetega ning hiljem on võimalik sobivaid alasid genereerida. Genereerimine nõuab aga võimsamat tarkvara kui tavatarbijal kasutada on. Seetõttu on otstarbekas Statistikaametil valida mingi analüüsialade standard ning edaspidi kasutada seda agregeeritud andmete analüüsil ja levitamisel.

Rahvastikutiheduse illustreerimiseks soovitatakse kasutada regulaarset võrku, mitte administratiivseid või muid ebakorrapärase kuju ja suurusega alasid (Langford & Unwin, 1994). Ebakorrapärastel aladel on järgmised puudused:

Eestis ei ole erinevalt paljudest teistest maadest välja kujunenud postiindeksite konkreetseid piire. Postiindekseid kasutatakse erinevates riikides rahvaloendusandmete teemakaartide loomisel suhteliselt tihti, kuigi nad ei ole selleks kõige õigemad eelpoolnimetatud homogeensuse nõude rikkumise tõttu.

Joonis 26 Näited analüüsil kasutatavate erinevate alade valikuprintsiibi ja suuruse mõjust esitustulemustele. Illustreeritud on Kärdla linna rahvastikutihedust.


40 K

      2.13 Paberkaardi kvaliteet

Kaardi kvaliteeti on raske defineerida. Kartograafiat peetakse teaduseks, tehnoloogiaks ja kunstiks korraga, teadusele ja kunstile on aga üheselt mõõdetavaid kvaliteedinõudeid raske seada. Kaardiga on keerulist geograafilist sõnumit lihtsam edasi anda kui sõnade abil. Õnnestunud ja kvaliteetne kaart on ise sõnumi kandja ja vajab väga vähe teksti sõnumi täpsustamiseks (Shirreffs, 1992).

Kõige levinum paberkaartide kvaliteedimõõt on nende asukohatäpsus, millega iseloomustatakse objektide kaardilt mõõdetavate koordinaatide erinevust tegelikust. Suur asukohatäpsus on nõutav eelkõige topograafilistele kaartidel, teemakaartide puhul on olulised teised kriteeriumid, nt esitatava info adekvaatne tajumine.

Paberkaartide kvaliteedinäitajateks võiks pidada:

Nimetatud kvaliteedinäitajad on üksteisest suhteliselt sõltumatud, so korrektse sisuga kaart võib olla loetamatu ja esteetiliselt nauditav kaart mitte kasutatav, loetavatuse nimel generaliseeritud kaart sisuliselt ebakorrektne jne. Paberkaardi valmistamisel tuleb nende kvaliteedinäitajate vahel pidevalt kompromisse leida (vt Joonis 27).

Kahjuks ei taga laialt levinud GIS paketid vaikimisi kõige kvaliteetsema väljundi genereerimist ja juhul kui kartograafi käepärast ei ole, kipuvad avaldatavad kaardid kandma halva maitse pitserit. Kõige tüüpilisem viga on teemakaartide ebaülevaatlik värvivalik. Näiteks eristab üks laialt levinud kaardistamistarkvara koropleetkaartidel pindu vaikimisi üksteisest värvi ja mustriga korraga. Tulemuseks on tumedusskaala, millel on äärmiselt raske tunnetada pingerida. Liiatigi on kartograafiliselt korrektse tulemuse saamine selles programmis tülikas. Juhul, kui tulemuse valmistamisega on kiire, siis kipub programm soodustama ebakorrektsete kaartide levikut.

Kvaliteetseid statistilisi teemakaarte tehti Eestis juba seitsekümmend aastat tagasi. Kvaliteetseks tuleb nende puhul pidada eriti asjakohasust, värvitoonide ja leppemärkide valikut. Käsitsi kaarti tehes tuleb tema sisu eriti hoolikalt läbi mõelda, sest paranduste tegemine võib tähendada kogu aeganõudva joonestamise uuestitegemist. Sobiv näide on 1925. aastal välja antud statistiline album (Schmidt, 1925), kus sündide teemakaardi tonaalsus on meeldivalt roosa, surmade kaardil tumedam ning tulpdiagrammidki tunduvad leinaraamides olevat.

 

Joonis 27 Kvaliteetse teemakaardi näide (Steffen&Haug 1995). Ülemine teemakaart (välismaalaste osakaal) on tehtud kiirustades ning väikese eelarvega. Kasutada oli ainult kaks trükivärvi. Alumine teemakaart on valmistatud digitaalselt, kaasaarvatud reljeefivarjutus. Näha on, kui oluline on Šveitsi puhul reljeefivarjutuse kasutamine, sest lõuna pool on haralise kujuga alad põhjustatud mäeahelikest. Reproduktsioon ei anna adekvaatselt edasi kaartide tegelikku kvaliteeti.


398 K


473 K

Joonis 28 Seitsekümmend aastat tagasi tehtud teemakaart on tänini kvaliteetne. Joonise kvaliteet ei pruugi tänapäeva arvutiga genereeritud kaartidest parem olla, kuid kaardi värvivaliku, asjakohasuse ning leppemärkide valikule pühendati rohkem aega. Vähendus 1925. aasta statistilisest albumist (Schmidt, 1925).

        2.13.1 Kaardi loetavus

        Kaart on loetav, kui kõik kaardielemendid on üksteisest eristatavad, leppemärkide esitus korrektne ning loogiliselt kokkukuuluv info kergesti seostatav. Loetavust mõjutab otseselt trükikvaliteet, kartograafide töö sõltub suuresti trükkalite töö (kaasajal ka plotterite ja printerite) kvaliteedist.

        Kaardi loetavust parandab sobiv kirja tüübi ning kirja suuruse valik, kohanimede reeglitepärane paigutus jms.

        Hästiloetava kaardi leppemärgid on üksteisest selgelt eristatavad (0.2 mm), kasutatavad jooned piisava kontrastiga ja peened (trükitud kaardil kuni 0.05 mm) ning trükivärvide vahelised nihked minimaalsed (kuni 0.1 mm).

        Kaardikirjad ei tohi üksteisega kattuda, nad peavad lõikuma võimalikult väheste joonobjektidega ning asetsema kirjeldatavale objektile võimalikult lähedal. Kõiki nõudeid kaardikirjade paigutamisel ei ole korraga võimalik rahuldada, seetõttu on kaardikirjade paigutamine pigem halbade variantide hulgast kõige vähem halva otsimine.

        Rahvaloenduskaarte valmistatakse suhteliselt vähe eksemplare, seetõttu on ilmselt otstarbekas neid vormistada plotteri või suureformaadilise printeriga. Printerite kvaliteet jääb veel alla traditsioonilise trükiprotsessi kvaliteedile. Loendajate poolt kasutavatel kaartidel on oluline ka üheselt mõistetavus - majade numbrid ja tänavate nimed peavad olema eksimatult arusaadavad.

        2.13.2 Kaardi mitmeplaanilisus

        Kvaliteetsel kaardil on vähemalt kaks plaani. Kaugemas plaanis peab olema haaratav kaardi sisu kogu ulatuses, lähemas plaanis võimalik leida detailide iseloomustusi. Seinakaarte peab saama vaadelda 2-5 meetri kauguselt, kust on näha kaardistatud piirkonna olulisemad elemendid ning üldine iseloomustus. Lähedalt (alla 0.5 meetri) peavad olema jälgitavad peenemad elemendid, nagu näiteks sillad või mäetippude kõrgusarvud.

        Loendajate poolt kasutatavad kaardid peavad andma ülevaate teede ja tänavate võrgust ja hoonete asetusest teekonna planeerimiseks, lähemas plaanis majanumbritest ning vajaduse korral ka hoone sissekäikudest.

        2.13.3 Kaardi esteetilisus

        Esteetilisel kaardil sobivad leppemärkide suurused, värv ning paigutus üksteisega, kujundus on ilus jne. Ebasoovitavaks peetakse liialt tumedate või kiiskavate värvidega pindade värvimist, rohmakate ja läbipaistmatute mustrite ja kaardi stiiliga mitte kokkusobivate kirjatüüpide kasutamist. Kaardil kujutatud jooned peavad olema piisavalt sujuvad ning mõõtkavale vastavalt üldistatud.

        Esteetilisust on kõige raskem hinnata, sest see sõltub hindajast ning tema kultuuritaustast. Euroopa kartograafiakool peab USAs valmistatud kaarte (eriti linnakaarte) üsna "inetuteks". Samas on need kaardid üsna praktilised. Äratuntavad on ka teised koolkonnad.

        2.13.4 Kaardi kasutusmugavus

        Igal kaardil on oma kasutusotstarve, tema sisu ja leppemärkide õnnestunud valik määrab tema kasutusmugavuse.

        Lisaks raamjoone sisesele infole on kasutusmugavuse tõstmisel tähtis roll ka raamivälistel tekstidel, (kohanimede)loenditel, paberilehe formaadil ja paberi kvaliteedil, voltimisel jms otseselt kaardiga mitte seotud elementidel.

        Kaardi kasutusmugavus ei ole midagi absoluutset, kaart võib olla sobiv laual hea valgustusega kasutamiseks, kuid väga ebamugav välitöödel vihmasajus.

        2.13.5 Kaardi sisu korrektsus

Eelmised kaardi kvaliteedi kriteeriumid olid suuremal või vähemal määral vormilised. Kaardi sisu korrektsuse olulisus sõltub suurel määral tema kasutusotstarbest. Katastrikaardil ja linnade geoalustel on peamine, et seal kujutatu on tegelikult looduses olemas ning vastupidi, midagi olulist ei ole kaardilt ära jäetud. Turismikaartidel andestatakse ebatäpsused kaardi sisus kergemini, ajaloolistel kaartidel ei saa sisu vastavust kaardi kasutamise ajal kehtivale olukorrale nõudagi.

Paberkaardi sisu korrektust saab liigitada samamoodi nagu GIS andmete kvaliteeti, paberkaarti tuleb vaadata GISi erilise andmeformaadina:

asukohatäpsus

kaardil määratud objektide asukoha erinevus tegelikkusest

atribuutide täpsus

leppemärkide abil edasiantud objektide iseloomustuse vastavus tegelikkusele

loogiline õigsus

väiksemõõtkavalistel kaartidel objektidele rakendatud generaliseerimise määr säilitamaks nende omavahelise asukoha õigsust.

täielikkus

kaardil on näidatud kõik objektid, mis antud mõõtkava ja kasutusotstarbe puhul olulised on, ning kaart vastab väljaandmiskuupäeva seisule.

2.14 GISi maksumust määravad faktorid

Suuremate projektide puhul on väga oluline tema võimaliku maksumuse määramine. Esmapilgul võib tunduda, et GISi maksumus koosneb arvuti ja tarkvara hinnast, lisaks veel natuke ettenägematuid kulutusi. Tegelikult moodustab kogu GISi elutsüklis arvutite ja tarkvara hind kuni 25%, põhiosa kulub andmete ostmisele või kogumisele ning GISiga tegelevale personalile. Seetõttu tuleks GIS tarkvara ostes uurida, milline neist tagab kättesaadavuse kõige odavamale alginfole (konverteerimine tuleb info hinna sisse arvestada) ning millise programmiga töötades on tööjõudlus kõige kõrgem või spetsialistide koolitus kõige parem (vähendab organisatsiooni kulusid).

GIS andmete amortisatsiooniks loetakse rusikareegli järgi 20% aastas, st 5 aasta jooksul kahekordistuvad andmetele tehtavad kulutused, kui soovitakse andmebaase hoida pidevalt kaasaegsena. Juhul, kaasajastamise käigus muudetakse andmebaasi ka täielikumaks, suureneb tema väärtus ning see omakorda suurendab veelkord andmebaasi ülalpidamise kulusid. GIS andmebaasi investeerijad võivad sattuda olukorda, kus andmete haldamiseks võimalusi ei ole, aga haldamise lõpetamine tähendaks aastate jooksul tehtud investeeringu kaotamist.

Joonis 29 GIS projekti planeeritud eelarve võib tegelikust oluliselt erineda. Enamlevinud viga on see, et unustatakse arvestada andmete ostmise või kogumisega ning organisatsioonikuludega

2.15 Soovitused

Järgnevalt on toodud soovitused, mis põhinevad peatükis 2 toodud põhjendustel. Kasutusmugavuse huvides on lisatud ka viide konkreetsele punktile, kust leiab detailsema info. Soovitused ei ole toodud tähtsuse järjekorras.

1.

Rahvaloenduse GISi loomisel tuleb arvestada kahte eesmärki: 1) toetada loenduse ettevalmistamist ja läbiviimist ning 2) hiljem avardada andmete analüüsi võimalusi ning muuta töödeldud andmed paremini arusaadavaks (vt ptk 2.2).


2.

GISide kasutusvaldkonda Statistikaametis ei tohiks piirata ainult rahvaloenduse läbiviimise ja analüüsiga, vaid juurutama GISe ka nt põllumajandusloenduse ettevalmistamisel, ettevõttestatistikas jt teenistustes (vt ptk 2.3).


3.

Rahvaloenduskaartide koostamine annab hea võimaluse parandada hooneregistri kvaliteeti, luua linnade ja alevike digitaalkaardid, värskendada suurt osa kaartidel kujutatavast infost (vt ptk 2.4).


4.

Rahvaloenduse tulemusena kogutud andmetest on huvitatud paljud asutused ja organisatsioonid, seetõttu on otstarbekas nende ootustega arvestada ka rahvaloenduskaartide ja -GISi väljatöötamise etapil. Samas nõuab paljude osapooltega töö palju rohkem aega ja vaeva (vt ptk 2.4).


5.

Statistikaametil on otstarbekas välja töötada teemakaartide analüüsiala standard (korrapärane nt 500 m võrgustik), mida kasutada edaspidi agregeeritud andmete analüüsil ja levitamisel (vt ptk 2.12.2)


6.

GIS arvutite moraalne eluiga on 3-4 aastat, ilmselt 2 aasta möödudes tuleb konfiguratsiooni täiendada (vt ptk 2.6.1).


7.

GIS tarkvara kirjutamine ei ole enam ostarbekas, arendustööd tuleb teha ka olemasoleva baastarkvara kohendamisel. Väga raske on ennustada, millised on GIS programmide standardsed funktsioonid aastal 2000, kui algab rahvaloendusandmete töötlemine (vt ptk 2.6.2).


8.

GISi kõige kallim osa on andmed. Seetõttu tuleb andmestruktuuri loomisele eriti suurt tähelepanu pöörata, muidu võib andmete kasutusefektiivsus olla madal või kulud ennustatust oluliselt suuremad. GIS tarkvara valides tuleks uurida, milline neist tagab kättesaadavuse kõige odavamale alginfole (konverteerimine tuleb info hinna sisse arvestada) ning millise programmiga töötades on tööjõudlus kõige kõrgem või spetsialistide koolitus kõige parem (vähendab organisatsiooni kulusid). GIS andmete amortisatsiooniks loetakse rusikareegli järgi 20% aastas (vt ptk 2.6.3).


9.

GISi turuväärtus sõltub peamiselt temas sisalduvate andmete hulgast ja kvaliteedist, mitte tarkvara hinnast. Teiseks sõltub GISi hind ka sellest, kes andmeid kasutab. Oskamatutes kätes ei ole ka hiiglaslikul andmebaasil väärtust (vt ptk 2.6.3).


10.

Statistikaametis oleks otstarbekas pühendada üks inimene ainult GISide temaatikale, eriti enne 2000. aasta rahvaloendust. Rahvaloenduskaartide loomine nõuab kümnete inimaastate suurust tööd, mida võib põhimõtteliselt teha nii Statistikaametis kui ka Statistikaameti tellimusel teistes asutustes (vt ptk 2.6.4).


11.

GISi korrektse spetsifikatsiooni koostamine võib GIS projekti käigus kokku hoida arvestatava koguse aega ja raha. Spetsifikatsiooniga peaksid enne lõplikku heakskiitu tutvuda saama ka potentsiaalsed kliendid (vt ptk 2.7).


12.

GISide kasutamine ja rahvastikuandmete sidumine hoonetega vabastab demograafilise analüüsi tegijad nõudest võimalikult täpselt jälgida eelmiste loendusüksuste kuju.


13.

Teemakaartidega manipuleerides võib "tõestada" suvalisi seisukohti. Kõige mugavamalt kasutatavad alad ei pruugi anda kõige korrektsemat esitust. Seetõttu on vajalik analüütikutele teemakaartide alane koolitus (vt ptk 2.11).


14.

Väiksemõõtkavaliste teemakaartide tarvis tuleb GIS andmeid dubleerida, sest automaatne generaliseerimine ei ole tavaliselt otstarbekas. Rahvaloenduse GIS peab sellist dubleerimist võimaldama (vt ptk 2.11).


15.

Maapiirkondades teede nimedel põhineva aadressisüsteemi loomine on suur töö, kuid teda on kerge kasutada. Ei ole sugugi kindel, et selline süsteem Eestis aastaks 1999 õnnestub jõustada. Kui seda siiski teha, siis tuleb ette näha vastavad täiendused kohanimeseadusesse (vt ptk 2.8.1).


16.

Statistikaameti GISis on otstarbekas kasutada omavalitsustega kooskõlastatud kodifikaatoreid. Vajaduse korral tuleb need ise luua ning peale seda omavalitsustele tasuta digitaalkujul laiali saata. Suure tõenäosusega võetakse need kasutusse ning sellega tagab Statistikaamet lihtsa andmevahetuse oma tulevaste koostööpartneritega (vt ptk 2.8.3).


17.

Kõik analüüsid, mis hõlmavad Eestis rohkem kui 30-aastast ajaperioodi peavad arvestama, et kohanimed võivad olla looduses liikunud mitmeid kilomeetreid või asulate administratiivne territoorium võib olla oluliselt muutunud (vt ptk 2.12.1).


18.

GIS andmebaasi kvaliteedikomponendid on asukohatäpsus, atribuuditäpsus, loogiline õigusus, täielikkus ja asjakohasus (vt ptk 2.10).


19.

Paberkaardi kvaliteeti on raske defineerida. Kartograafiat peetakse teaduseks, tehnoloogiaks ja kunstiks korraga, teadusele ja kunstile on aga üheselt mõõdetavaid kvaliteedinõudeid raske seada. Paberkaartide kvaliteedimõõtudeks on asukohatäpsus, loetavus, mitmeplaanilisus, leppemärkide esteetilisus, mugav kasutatavus ja sisu korrektsus (vt ptk 2.13).



Viimati muudetud: 05/11/97

Copyright © 1997, Teet Jagomägi
HTML & Design: Kalver Keskküla