GEOINFORMAATIKA ALUSED
Loengukonspekt
- geoinformaatika kui informaatika (vt. eraldi konspekt "Informaatika põhimõisted") ja geoteaduste integratsioonil tekkinud suund; Anglo-Ameerikas ei kasutata;
- GIS - vt.[1]; lisaks sellele: pikka aega tähistati mõistega GIS (eriti Anglo-Ameerika kirjanduses) kogu valdkonda, nii et ta lähenes oma mahult mõistele geoinformaatika;
- geomaatika (geomatics) kui mõiste GIS (laias tähenduses) asendaja moodsas lähenemises;
- lühiülevaade ajaloost
- geograafia, kartograafia ja GIS-id arvutieelsel ajastul;
- Harvardi ülikooli Arvutigraafika labor;
- Canadian Geographic Information System;
- ESRI;
- sotsialismileer (T?ehhi, Ungari);
- NCGIA;
- vt. ka [3] ja Steinitz, C. GIS: A personal historical perspective // [õppejõult]
3.1. Territoriaalsed andmed /ruumilised andmed, [spatial data], kohateave
- näited
- geograafias jagatakse lihtsustusena nähtused temaatiliselt ja ajaliselt elementideks, et siis uurida ruumilist külge;
- ruumilist muutujat kirjeldab asend [location] - paiknemine millegi suhtes
3.2. Allikad
3.2.1. Primaarne andmekogumine.
- mõõtmiste sagedus ajas või tihedus ruumis määrab mõõtmiste ajalise ja ruumilise eraldusvõime (mõõtkava);
- mõõdetu on tavaliselt valim, iseloomustamaks suuremat, generaal-andmekogumit
3.2.2. Sekundaarsed andmeallikad.
- tähtis on reeglina ka informatsioon andmete endi kohta [metadata]:
- milline on täpsus,
- milline on ühe või teise asja tähendus,
- kuidas on andmed omavahel seotud;
- eelnev on vajalik, et anda andmetele tähendus, sellest omakorda sõltub nende kasulikkus.
- andmed <> informatsioon
3.3. Andmete esitusviisid
- vahetud mõõtmised käivad "geograafilise punkti" kohta;
- keerukamad mõõtmised ja andmed on nendest tuletatavad;
- andmed kas nominaalsed, järjestatud [ordinal] või arvulised; viimased võivad olla kas pidevad või sõredad;
- arvandmeid esitatakse kas intervallide või suhte abil
3.3.1. Täpsus
3.3.3. Andmete standardid
3.3.4. Maksumus
3.4. Andmemudel
- erinevalt matemaatilisest punktist on geograafilisel punktil (edaspidi lihtsalt punktil) alati suurus (ja seega ka kuju);
- punkti suurus sõltub selest, kui "lähedalt" me vaatame;
- lihtsustusena võib need punktid esitada kui rastri elemendid: pikslid [pixel->picture element];
- andmeid millegi kohta võime koguda teatud punktides, tavaliselt eeldame aga, et geograafiline ruum on pidev ja tahame olema võimelised interpreteerima ka ülejäänud punkte;
- sarnaseid punkte klassideks ühendades jõuame keerukamate andmemudeliteni, kus objektideks on ka jooned ja pinnad;
- lihtsustatult võib need objektid esitada kui teatud omadustega punktikogumid e. vektorid;
- vastavaid mudeleid nimetatakse rastermudeliks ja vektormudeliks
3.4.1. Rastermudel
- see töötab hästi, kui on sujuvalt muutuvad nähtused;
- sobib paremini geoandmete töötluseks
3.4.2. Vektormudel
- objektorienteeritud;
- peegeldab hästi keerukamaid geograafilisi objekte;
- ei eelda, et geograafiline ruum oleks pidev.
- need ei ole ainsad geoinformaatikas kasutatavad andmemudelid.
4.1. Ajalugu ja üldiseloomustus
- uusim versioon on möödunud kevadel müügile tulnud Idrisi for Windows; praktikumis kasutame versiooni 4.1, mis on uusim DOS jaoks;
- nagu kõigis kaasaegsetes GIS-pakettides, on olemas nii raster- kui vektormudel kui ka nendevahelised teisendused;
- kasutusel enam kui 100 riigis, ka Eestis kõige levinum täismõõduline GIS-i tarkvara, kuigi legaalseid kasutajaid (litsentsi omanikke) on paarikümne ringis;
- odav, sobiv õppimiseks, paljude funktsionaalsete võimalustega andmete töötlemiseks;
- leplik riistvara suhtes kuid tundlik lisamälu ja eriti aritmeetika kaasprotsessori osas (kiirus!);
- võimeline paljude SVGA monitoridega töötama re_iimis kuni 1024x768 pikslit ja korraga 256 värvi (16,8 milj. tooni seast), kuid sel juhul võib vajada kuni 570 kB põhimälu;
- arvutikartograafia võimalused DOS-i versioonis piiratud, selleks võimalik viia andmed spetsiaaltarkvarasse (väljastab .dxf, .tif ja .ps faile, lisaks teisendab paljude teiste GIS-pakettide formaatidesse).
4.2. IDRISI struktuur
- koosneb iseseisvatest exe-moodulitest, mis vajavad tööks vaid resursse kirjaldavat keskkonnafaili (idrisi.env) ja kui kasutatkse välisseadmeid (printereid, plottereid, digitaisereid jms.), siis neid kirjeldavaid faile; kõik need abifailid on avatud struktuuriga ASCII koodis tekstifailid, vajadusel kergesti muudetavad;
- mooduleid seob lihtne menüüdesüsteem (moodul idrisi.exe), mis residentsena võtab umbes 50kB mälu, kuid on laaditav ka ülamällu; tegelikuks tööks pole vajalik;
- menüüde ja funktsioonide loogika alusel võib mooduleid grupeerida järgmiselt:
- põhimoodulid [core modules]: andmete sisestamise, korrastamise, visualiseerimise ja süsteemi enda haldamiseks,
- piirdemoodulid [peripheral modules]: failide import/export ning süsteemivälised teisendused (näiteks baitide järjekorra muutmine 2-baidises täisarvus, mis võimaldab teisendada UNIX-i ja Macintoshi faile PC jaoks;
- töötlusmoodulid, mis moodustavad Idrisi põhiosa ja jagunevad tinglikult kolme põhigruppi:
- geograafiline analüüs [geographic analysis],
- statistiline analüüs [statistical analysis] ja
- pilditöötlus [image processing] ning
- otsustuste tugi [spatial decision ring]
4.3. Kasutusviisid
- töö käsureast, metaprogrammeerimine, uued moodulid
4.4. IDRISI andmete ja failide tüübid ja struktuurid
- põhifail (.img rasterfaili, .vec vektorfaili ja .val andmefaili puhul) kujutab endast koordinaatide loetelu teatud formaadis ja
- dokumentfail (.doc rasterfaili, .dvc vektorfaili ja dvl andmefaili puhul) kujutab endast metaandmeid, mis on vajalikud põhifaili interpreteerimiseks;
- baidilised (naturaalarvud 0...255; salvestamiseks üks bait),
- täisarvulised (salvestamiseks 2 baiti),
- reaalarvulised;
- ASCII,
- binaarne,
- pakitud binaarne;
<objekti ID> <punktide arv>
<X1> <Y1>
<X2> <Y2>
... ...
ja mis lõpeb tunnusega:
0 0
- vt. praktikumis 2 mõnd faili!
<ID><tühik><väärtus><CR><LF>
- vt. ka [4]
4.5. IDRISI värvipalett
4.6. Töö mooduilis COLOR
4.7. COLOR a
edasine Idrisi uurimine toimub järgnevate praktikumide käigus
5.1. Raster GIS
- vaadeldav ala jagatakse regulaarse võrgustikuga elementideks;
- saadav andmemaatriksis /kujutisel - image/ olev element kirjeldab teatud ajaühikul teatud teemat iseloomustavat näitajat (atribuuti) ruumiosas, mis on määratud:
- maatriksi elemendi (cell) mõõtmetega;
- elemendi lokaalsete koordinaatidega maatriksis;
- raster GIS on selliste maatriksitega opereerimise süsteem, mis võimaldab paljude kujutistega opereerides lahendada vajalikke ülesandeid, mille sisu täpsustub edasise töö käigus;
- praktikas võivad rastermudeli esitusviisid - kujutise andmeformaadid olla keerukamad, näiteks samaväärtuse pikkuskoodid /run-lenght codes/ - vt. L4.4.
5.2. Raster GIS-i võimalused
- töötluse näidisülesanne;
- sage eksiarvamus on, et raster GIS ei võimalda seostamist atributiivandmebaasidega (võtame vaatluse alla hiljem).
6.1. Vektor- e. objekt-GIS
6.2. Põhimõisted
NB!-> ingliskeelne terminoloogia erinev
ka eri paketid võivad kasutada erinevat terminoloogiat,
näit. kaar [arc] Arc/Info jaoks tähendab sama,
mis sulgemata polügoon MapGrafix-i jaoks.
- sõlmed [nodes] kui erilised punktid; kaared [arcs] kui erilised jooned
6.2.1. Vektormudeli elementide vahelised seosed
- vektorid ilma topoloogilisi seoseid arvestamata e. spagetti võimaldavad tegelda küll temaatilise kartograafiaga, kuid paljude GIS-i tüüpülesannete lahendamine pole võimalik;
- kuuluvus, parem- ja vasakpoolsus, sidusus, saared
6.3. Andmemudel
- kajastab geograafilisi objekte ja nendevahelisi seoseid;
- selle loomine rastermudeli omast keerukam, kuid ta ise on efektiivsem
7.1. Andmesisestus
- on senini kogu GIS-induse kitsaskohaks, neelates umbes 4/5 projektide üldkuludest, olles kõige töömahukam ja vigaderohkem;
- vaatamata püüdlustele ja intellektuaalsetele investeeringutele sellesse valda, on kulude osakaal jäänud samaks, seetõttu on võetud suund andmete ühiskasutusele;
- võib tinglikult jagada kolmeks:
a) ruumiliste andmete sisestamine (digitaliseerimine ja skaneerimine);
b) atributiivandmete sisestamine;
c) atributiiv- ja ruumiliste andmete seostamine;
- ajaline järgnevus ei pruugi olla a, b, c,
- üldreeglina b ei kujuta endast probleemi;
- kaasajal puudub nii üks ja ühtne kui ka täisautomaatne andmesisestustehnoloogia, võimalik
(2) - andmed kiiresti digitaalkujule, kuid siis vajalik nende põhjalik toimetamine arvutis;
- valiku nende kahe äärmuse vahel määravad kavandatav andmemudel ja kasutusel olevad tehnilised võimalused, ka lähtematerjalide kvaliteet;
- on suundumus kasutada järjest rohkem (2), sest toimetamine üha enam automatiseeritav.
7.1.2. Andmesisestusviisid
- käsitsisisestus: - klaviatuurilt, - digitaiserilt;
- automaatsisestus: - skaneerimine: rasterskaneerimine,
vektorskaneerimine,
videoskaneerimine;
- kõnesisestus;
- konverteerimine:
- mõõdistusandmed:
- geodeetiliste instrumentide digitaalväljund,
- GPS seadmete andmed /väga perspektiivne suund!/.
7.1.3. Skaneerimine
- osa või kõigi andmete vektoriseerimiseks;
- kiire, kuid nõuab suhteliselt kallist tehnikat ja keerukat toimetamistarkvara;
- lähtematerjali kvaliteet peab vastama kavandatud kasutusviisile.
7.1.3.1. (Raster)skaaneri (scanner) tööpõhimõte ja omadused
- piksli suurus (100...1600 dpi),
- piksali heledus (2...156 jaotust),
- tööpinna suurus (postkaardist odava käsiskaaneri puhul kuni ca 1 meetri laiuse ribani rull-skaaneri [pinch-roller scanner] puhul);
- must/valged- [grey scale] ja värviskaanerid (RGB; "true color")
7.1.3.2. Tulemuste kasutamine
- pakkimismeetodid
- TIFF kui rasterandmete levinuim formaadiklass (vt.L18)
- esialgne töötlus (näiteks PhotoStyler-i abil);
- export toimetamis- ja vektoriseerimistarkvarasse.
7.1.4. Digitaliseerimine
- digitaliseerimise käsitsitöö osa kui kõige vaevarikkamat püütakse vähendada;
- kaks sisestamisstrateegiat:
- spagetti (sisestamine objekte ja topoloogiat arvestamata), saadakse struktureerimata joonte hulk, mida hakatakse arvutis toimetama, ja
- objektide kaupa, lisades topoloogia, märgendid jms. juba sisestamise käigus, et hiljem toimetada võimalikult vähe.
7.1.4.1. Digitaiseri tööpõhimõte ja omadused
- punkt- või voolmeetodil [point or stream mode];
- iseloomustavad: tööpinna suurus, täpsus (0.1...0.01 mm), anduri klahvide [buttons] arv (2...16);
- tarbijasõbralikkuse probleemid (disain, valgustus, paigutus arvuti suhtes;
- digitaiserit võib kasutada ka optilise menüüna või hiirena.
7.1.4.2. Konkreetne näide: digitaliseerimine TOSCA-s
- häälestamine (konfiguratsioonifail, klahvide tähendus),
- digitaliseerimisparameetrite määratlemine:
- koordinaatsüsteemide ühitamine (digitaiseri oma, seal oleva kaardi oma (a), ruumilise andmebaasi oma, kuhu sisestatud kaart talletatakse (b) - 4...125 kontroll- e. reeperpunkti, (a) ja (b),
- (b) andmed säilitatavad *.CTL failis;
- digitaliseerimispunkti tolerantsi määramine;
- digitaliseerimine:
määrame objekti tüübi, identifikaatori, sisestame joone koordinaadid, lõpetame objekti; kordame... 7.1.4.3. Tüüpilised digitaliseerimisvead
- osa andmeid puudu või topelt, - vead objektide määratluses (näit.: üks kaar mitme objektina, mitu kaart ühe objektina),
- ülearused "käevärinad" [spikes] joontes,
- joonte lõikumisi ülearu [overshoots] või puudu [undershoots].
7.2. Andmete toimetamine.
- kaasajal on andmete sisestamise raskuspunkt kandunud siia; kasutatav tarkvara küllaltki komplitseeritud.
7.2.1. Vektoriseerimine
- skaneeritud rasterkujutis on enamasti vaid vahe-etapp teel paberkaardist digitaalandmebaasini;
- käsitsi -> ekraanilt digitaliseerimine (tavaliselt hiirega): tavaliselt mugavam kui digitaiserilt (zoom), probleemid analoogsed;
- automaatselt -> mitmesugused vektoriseerimisprogrammid
- vajalik eelnev vigade parandus, rasterkujutise hea kvaliteet,
- mitmesuguste ruumilise info töötluse võtetega (vt. L14) hakatakse rasterkujutiselt otsima objekte (näiteks joon kui pikslitevööndi telgjoon), vajadusel kasutatakse operaatori abi või iteratiivset vigade parandust.
- IDRISI-s on võimalik nii a)pool- kui ka b)täisautomaatne polügonide vektoriseerimine tingimusel, et rasterpolügonid on loodud (a) või loodavad automaatselt (b); viimasel juhul peab vektoriseeritava lähtekujutise värvi/heleduse varieerumine iga polügoni sees olema kindlalt väiksem värvi/heleduse erinevusest naaberpolügonidega võrreldes.
7.2.2. Vektorandmete toimetamine (vt. ka praktikumi juhend nr. 13)
- andmete harvendamine (IDRISI: LINEGEN);
- üksikvigade parandamine: TOSCA võimalused ja piirangud;
- sõlmede ühitamine [snap nodes];
- topoloogia loomine;
- polygonide sulgemine (CYCLE);
- ühitamine teiste kihtidega, näiteks nn. "kummikiletehnikat" [rubber sheeting] kasutades (RESAMPLE);
- ühitamine andmebaasidega.
TOSCA Version 2.0 on IDRISI 4.1. paketiga tasuta kaasa antav andmete digitaliseerimise ja vektorandmete toimetamise programm, mis on oma nime saanud Genoa geograafi Paolo del Pozzo Toscanelli järgi ning mida on arendanud Jeffrey R. Jonesi poolt juhitud meeskond sõltumatult IDRISI projektist. Seetõttu on need paketid küll hästi paaris rakendatavad, kuid ei ole 100% ühilduvad.
TOSCA toetab (lisaks IDRISI andmetüüpidele) ka andmete topoloogiat (.top fail) ning andmetüüpi coverage, mis võib sisaldada üheaegselt nii punkte, jooni, kaari (arc) kui ka polügone, samuti nende objektide kuni 10-märgilise märgendeid (label). Kaar on joon, millel on määratletud naabrussuhted (topoloogia - left-right polygons).
Programm kasutab põhimälu, mille kasutamist saab konfiguratsioonifailiga küll muuta, kuid TOSCA töö efektiivsus sõltub tublisti sellest, kui palju on kasutada põhimälu lisaks obligatoorsele umbes 550kB-le (soovitav vähemalt 600). Mälu puudusel siirdub programmi töö nn. disk mode'i, mis on väga aeglane.
TOSCA keskkonnafail ja digitaiseri konfiguratsioonifail on samad, mis IDRISI-l. TOSCA enda lisatingimusi kirjeldavat konfiguratsioonifaili toimetatakse mooduliga TOSCACFG.
8.1. TOSCA võimalused
Programm võimaldab:
- andmete lihtsamat toimetamist:
- sõlmede ühitamine (snap nodes),
- koordinaatpunktide lisamine ja liigutamine,
- identifikaatorite muutmist;
- topoloogiliste suhete määratlemist:
- saarte omistamist põhipolügonidele;
- vektorkaardi esitamist kuni 13 eri värvi kihina, millest üks on aktiivne; kihi-info salvestamist nn. sessiooni andmefaili.
8.2. Paneel ja põhimenüüd
- Põhimenüüs sisalduvad järgmised grupid:
- Järgmine osa menüüst kujutab endast nn. kontrollpaneeli (Control Box), kus paiknevaid korraldusi saab avada ka enamikes teistes menüüdes olles, sest need on kõige sagedasemini kasutatavad abioperatsioonid:
värviline ristkülik:
kollane - suletud kontuuri;
roheline - kaare alguspunkti;
pruunikaspunane - kaare lõpp-punkti;
värviline rist:
helesinine - nimepunkti;
tumesinine - andmepunkti.
- Labels - identifikaatorite kujutamine ekraanil (võimalik kolm reziimi: puudub; järjekorranumber ja identifikaator; järjekorranumber ja nimi, kui see on olemas).
- Tolerance - määratletakse kaugus, millest väiksema korral kaks punkti loetakse identseteks;
- T circles - võimaldab joonistada iga punkti ümber ringi, mille raadius on võrdne tolerantsiga;
- Grid - abivõrgustiku kujutamine tagaplaanile;
- Windo - aktiivse andmefaili miinimum- ja maksimumkoordinaatide määramine/muutmine (võimaldab 'vähendamist' faili esialgse 'vaateaknaga' võrreldes;)
- Sysinf - ülevaade aktiivse faili punktide, identifikaatorite jms. hulgast võrreldes kasutada oleva maksimumiga (oluline digitaliseerimisel, sest liiga suur andmefail ajab arvuti 'umbe');
- Bound - kui on sisse lülitatud, kujutatakse kuvaril aktiivse faili miinimumide ja maksimumidega määratud akna piirid.
- Kontrollpaneeli all paiknevas lahtris on näha kujutise raamjoone minimaal- ja maksimaalkoordinaadid kujul:
xmin, ymin
xmax, ymax;
- Kõige alumises lahtris on näha kursori nooleotsa aktuaalseid koordinaate.
8.3. Lisamoodulid
Vektorfailide toimetamiseks on TOSCA-ga kaasas mõned iseseisvad .exe moodulid, mis võimaldavad täita vajalikke abioperatsioone väljaspool TOSCA-t; nõuavad, et faili formaat oleks binaarne (binary):
CYCLE - polügonide loomine kaartest (sisendiks cover-tüüpi vektorfail koos .top failiga; väljundiks loodud polügonide fail ja sulgemata kaari sisaldav uncycled.vec);
EXTLABEL - eristab TOSCA-s loodud märgendid ja kirjutab nad IDRISI mooduli PLOT jaoks eraldi script-faili;
VCONCAT - vektorfailide ühendamine (lubab ühendada eri tüüpi objekte, säilitab topoloogilise info);
VECTEDIT - vektorfaili objektide identifikaatorite (ID), alusel ümbernimetamiseks ja ümberklassifitseerimiseks; võib koostada ka histogrammi (ID-de alusel);
VWINDOW - etteantud ristkülikusse jääva failiosa eristamiseks (polügonid võidakse tükeldada, topoloogia läheb kaduma).