Metody lokálních odhadů v prostoru

Obecné úvahy

Tato kapitola bezprostředně navazuje na kapitolu "Interpolace a extrapolace v prostoru" a její úvodní pasáže je nutno mít na zřeteli: neustále je řeč o obecných statistických pojmech, o hodnocení uspořádaných trojic vzniklých z jakýchkoliv trojrozměrných výběrových množin. Abstraktní matematický popis jednotlivých metod je na jedné straně jediný korektní, na druhé straně však málo názorný.

Právě pro názornost je v následujících odstavcích důsledně použito geometrizace problémů: uspořádaná trojice je považována za "bod" v "prostoru", přičemž hodnoty dvou statistických nezávisle proměnných jsou považovány za souřadnice průmětu bodu do "půdorysny" - roviny XY, třetí hodnota statistické závisle proměnné je považována za orientovanou vzdálenost od této roviny. Zůstává ovšem skutečností, že v environmentálních vědách je dvojice nezávisle proměnných většinou skutečnou souřadnicí na zemském povrchu nebo jeho rovinném zobrazení. Třetí závisle proměnná je ovšem skutečnou nadmořskou výškou jen v úlohách digitálních modelů terénu; všude jinde je to nějaká zkoumaná veličina.

Demonstrovat to lze na následujícím příkladu: pro jistý tlak v [atm] a při jisté teplotě v [oC] byl zjištěn jistý objem v [m3] zkoumaného plynu, zde hélia. Zjištěné objemy pro dané tlaky a teploty jsou v tabulce:

 

Tab. 7.2: Trojrozměrný statistický soubor

Odpovídající vizualizaci obsahuje následující prostorový graf:

 

Obr. 7.7: Vizualizace trojrozměrných statistických dat

Jistě "půdorysna" určená osami tlaku a teploty na předchozím obrázku má daleko k reálnému terénu. Přesto budou v následujících odstavcích vysvětlovány pojmy na terénních modelech.

Definice problému

Problém jest následující: na jisté zájmové ploše (v terénu) mějme - obecně velmi nepravidelně - rozmístěno několik lokalit, ve kterých jsou známy (např. po analýze odebraného vzorku) hodnoty veličiny, kterou sledujeme - viz následující obrázek. Úkolem je poskytnout co nejlepší odhad hodnoty sledované veličiny v libovolném místě zájmové plochy, a to na základě oněch několika známých hodnot. Známé hodnoty jsou uvedeny převážně v tabulkové formě jako např. v příkladě shora.

 

Obr. 7.8: K definici problému lokálních odhadů

Tato základní formulace úlohy definuje tzv. bodové odhady. Výchozím elementem je zde bod v terénu a známá hodnota sledované veličiny v něm.

Shora formulovaná úloha je v praxi asi nejčastěji řešená. Jde o trojrozměrnou úlohu: dva rozměry (určované většinou souřadnicemi x a y) tvoří zájmová plocha - terén, třetím rozměrem je sledovaná veličina. V geo- praxi je úloha často chápána čtyřrozměrně: známé body leží ne v rovině, ale v prostoru - v horninovém bloku, geologickém tělese ap. Poloha bodu je dána souřadnicemi x a y udávajícími průmět bodu na zemský povrch, a souřadnicí z udávající např. hloubku, nadmořskou (podmořskou) výšku ap. Hodnoty sledované veličiny jsou pak čtvrtým rozměrem.

V obou případech je možno formulaci úlohy rozšířit na tzv. blokové odhady. Známé hodnoty jsou vázány ne na body, ale jsou získávány ze vzorků určité plochy s nebo určitého objemu v. Cílem metod je v tomto případě získat nejlepší odhad sledované veličiny v jiné ploše s (objemu v) dané polohy na základě těchto známých hodnot.

Další výklad se bude pro názornost opírat o bodové odhady a trojrozměrný model. Bude tedy řešit problém naznačený na obrázku:

 

Obr. 7.9: Znázornění problému lokálních odhadů

Modelová data

Jednotlivé metody budeme demonstrovat na následujícím environmentálním příkladu (jde o datový segment úkolu řešeného Institutem geologického inženýrství HGF VŠB - Technická univerzita Ostrava v letech 1992 - 1996 ve spolupráci s Norwegian Institute for Water Research, Oslo):

V několika lokalitách Ostravska byl zachytáván spad a měsíčně analyzován na některé znečišťující látky. Výsledky pro SO4 jsou uvedeny v následující tabulce spolu s polohou místa ve Vítkovicích, ve kterém hodnoty SO4 budou jednotlivými metodami odhadovány. Poloha lokalit je dána vzdáleností v [m] od poledníku, jdoucího 15 km východně od poledníku 18o, a od rovnoběžky, jdoucí 83 km severně od rovnoběžky 49o.

 

Tab. 7.3: Analýza spadu na SO4

Metoda nejbližšího souseda

Tato metoda je nejjednodušší a nejrychlejší. Používá se často pro první prostorový náhled na zadaná data. Odhadem hodnoty v místě X je prostě hodnota nejbližšího známého místa.

Modelová plocha znázorněná touto metodou jsou na následujícím obrázku:

 

Obr. 7.10: Model metodou nejbližšího souseda

Protože místu ve Vítkovicích je nejbližší místo v Mariánských Horách, je odhadem hodnoty SO4 ve Vítkovicích touto metodou hodnota 52,050.

Metoda trojúhelníková

Metoda trojúhelníková poskytuje odhad neznámé hodnoty pomocí lineární závislosti - jde o aplikaci lineární interpolace v prostoru. Lineárním útvarem je ve trojrozměrném prostoru rovina. Rovina z je dána rovnicí

z ş a.x + b.y + c

přesněji: bod P = [xP, yP, zP] leží v rovině z, jestliže pro xP, yP a zP platí

zP = a . xP + b . yP + c          (1)

Rovnice roviny obsahuje tři koeficienty. To naopak znamená, že pro určení konkrétní roviny (tj. určení jejich koeficientů a, b a c) jsou zapotřebí tři známé body P=[x1, y1, z1], Q=[x2, y2, z2], R=[x3, y3, z3]. Pro ně musí platit

z1 = a . x1 + b . y1 + c
z2 = a . x2 + b . y2 + c          (2)
z3 = a . x3 + b . y3 + c

Protože všechny xi, yi a zi jsou známé, řešením této soustavy jsou hledané koeficienty a, b a c té roviny, která body P, Q a R prochází.

Nechť nyní je dáno (např. tabulkově) několik trojic hodnot chápaných jako souřadnice bodů v prostoru. Nechť jest odhadnout z-ovou hodnotu v místě o "půdorysu" X, tj. v místě s danými souřadnicemi [x0,y0]. Vyberme proto tři "body" P, Q a R tak, aby X ležel uvnitř trojúhelníku získaného jako průmět trojúhelníku PQR (viz následující obrázek).

Obr. 7.11: Princip trojúhelníkové metody

Známými body P, Q a R je určena rovina, jejíž koeficienty lze určit řešením soustavy (2). Hledaný odhad Zx je pak dán vztahem

Zx = a.x0 + b.y0 + c

Uvedený postup demonstrujme na modelových datech. Odhadněme hodnotu SO4 pro Vítkovice. Okolními místy jsou Zábřeh, Mariánské Hory a Kunčice. Pro výpočet koeficientů roviny jdoucí těmito místy sestavíme soustavu

 

 

Řešme např. pomocí determinantů. Jest

 

 

a tedy koeficienty roviny

 

 

Dosazení souřadnic Vítkovic do rovnice roviny s těmito koeficienty dává odhad 49,180.

 

Trojúhelníková metoda však skrývá jistý prvek náhodnosti. Uvažujme následující data: P=[1,1,1], Q=[3,1,10], S=[3,1,10], R=[3,3,1]. Jaký je odhad pro X=[2,2]?

 

Obr. 7.12: Problém trojúhelníkové metody

Situaci znázorňuje předchozí obrázek. Ona náhodnost spočívá ve volbě trojúhelníka. Je-li zvolen PRS, je odhadem hodnota 1. Je-li zvolen QRS, je odhadem hodnota 10, tedy diametrálně odlišná.

Je zřejmé, v čem je problém: data mají velký rozdíl mezi "sousedními" hodnotami. Pohříchu právě takový charakter má většina geo- dat, proto zvláště na taková data není radno metodu aplikovat. Metoda se naopak s dobrými výsledky používá v případech, kdy sledované hodnoty v "blízkých" místech nemají příliš velkou odchylku.

Metoda inverzní vzdálenosti

Metoda inverzní vzdálenosti je jednou z metod, kterou by bylo možno označit jako "příspěvková". Hodnotu sledované veličiny v místě X si lze představit jako souhrn příspěvků z jednotlivých známých míst do X. Jednotlivé příspěvky jsou závislé především na jednotlivých známých hodnotách, a dále na vzdálenostech od bodu X.

 

Obr. 7.13: K metodě inverzní vzdálenosti

Logicky (viz předchozí obrázek): příspěvek místa A se známou hodnotou 1 do místa X bude jistě menší než příspěvek místa B se známou hodnotou 10 do téhož místa X (A i B jsou od X stejně vzdáleny). Velikost příspěvku se zdá přímo úměrná velikosti hodnoty. Na druhé straně příspěvek do místa X z místa C vzdáleného 10 bude jistě větší než příspěvek z místa D vzdáleného 50 (v C i D je stejná hodnota). Velikost příspěvku se zdá nepřímo úměrná vzdálenosti.

Jistou analogii lze pozorovat např. u silových a jiných fyzikálních polí (gravitačního ap.). Odhlédneme-li od vektorového tvaru a od případné konstanty a označíme-li Mi známou hodnotu v i-tém místě, ri vzdálenost i-tého místa od místa X, pak neznámou hodnotu Mx v místě X by bylo možno odhadnout jako souhrn

kde k je vhodná mocnina vzdálenosti (např. 1 nebo 2, nebo i třebas 1,3).

Vzorec (3) vyhovuje logickým předpokladům uvedeným shora: i-tý příspěvek je tím větší, čím je větší Mi a tím menší, čím je větší ri. Má však jednu zásadní nevýhodu. Pokud se totiž místo X nekonečně blíží nějakému místu se známou hodnotou (např. k prvnímu) - tj. r1 se nekonečně zmenšuje - pak se M1/r1 a tím i celý součet (3) nekonečně zvětšuje. Avšak čím blíže je místo X k místu prvnímu, tím více by se měla hodnota Mx blížit hodnotě M1 a ne růst nade všechny meze. Vztah (3) tedy není obecně použitelný.

Proto se v praxi používá obdobného vztahu, který diskutovanou vadu nemá:

I vztah (4) vyhovuje logické úvaze: Mx je přímo úměrné Mi a nepřímo úměrné ri, a navíc platí

pro všechna i.

Na modelových datech určeme nyní odhad hodnoty SO4 ve Vítkovicích metodou inverzní vzdálenosti. Podle (2) je zapotřebí zjistit vzdálenosti místa X ve Vítkovicích od míst Mi v ostatních obvodech. Označíme-li dX a dY rozdíly x-ových a y-ových souřadnic míst X a Mi, je podle Pythagorovy věty

Hodnoty dX a dY spolu s ostatními výpočty udává následující tabulka:

 

Tab. 7.4: Výpočet metodou inverzní vzdálenosti

Odhad hodnoty SO4 metodou inverzní vzdálenosti pro Vítkovice je tedy 0,0631/0,0014=45,559.

Další metody

Existuje řada dalších metod (nejmenší křivosti, radiální báze, multikvadratická, a zvláště tzv. krigování). Jejich podstata je však složitější, a proto jsou uvedeny v případných samostatných kapitolách.