Metody lokálních odhadů v prostoru

Doc. Dr. Vladimír Homola, Ph.D.

Obecné úvahy

Tato kapitola bezprostředně navazuje na kapitolu "Interpolace a extrapolace v prostoru" a její úvodní pasáže je nutno mít neustále na zřeteli: neustále je řeč o obecných statistických pojmech, o hodnocení uspořádaných trojic vzniklých z jakýchkoliv výběrových množin. Abstraktní matematický popis jednotlivých metod je na jedné straně jediný korektní, na druhé straně málo názorný.

Právě pro názornost je v následujících odstavcích důsledně použito geometrizace problémů: uspořádaná trojice je považována za "bod" v "prostoru", přičemž hodnoty dvou statistických nezávisle proměnných jsou považovány za souřadnice průmětu bodu do "půdorysny" - roviny XY, třetí hodnota statistické závisle proměnné je považována za orientovanou vzdálenost od této roviny. Zůstává ovšem skutečností, že v geo- vědách je dvojice nezávisle proměnných skutečně souřadnicí na zemském povrchu nebo jeho rovinném zobrazení. Třetí závisle proměnná je ovšem skutečnou nadmořskou výškou jen v úlohách digitálních modelů terénu; všude jinde je to nějaká zkoumaná veličina.

Demonstrovat to lze na následujícím příkladu: pro jistý tlak v [atm] a při jisté teplotě v [oC] byl zjištěn jistý objem v [m3] zkoumaného plynu, zde hélia. Zjištěné objemy pro dané tlaky a teploty jsou v tabulce, odpovídající vizualizace v prostorovém grafu. Jistě zde "půdorysna" určená osami tlaku a teploty má daleko k reálnému terénu.

 

 

Přesto budou v následujících odstavcích vysvětlovány pojmy na terénních modelech.

Definice problému

Problém jest následující: na jisté zájmové ploše (v terénu) mějme - obecně velmi nepravidelně - rozmístěno několik lokalit, ve kterých jsou známy (např. po analýze odebraného vzorku) hodnoty veličiny, kterou sledujeme - viz následující obrázek. Úkolem je poskytnout co nejlepší odhad hodnoty sledované veličiny v libovolném místě zájmové plochy, a to na základě oněch několika známých hodnot. Známe hodnoty jsou uvedeny převážně v tabulkové formě jako např. v příkladě shora.

 

 

Tato základní formulace úlohy definuje tzv. bodové odhady. Výchozím elementem je zde bod v terénu a známá hodnota sledované veličiny v něm.

Shora formulovaná úloha je v praxi asi nejčastěji řešená. Jde o trojrozměrnou úlohu: dva rozměry (určované většinou souřadnicemi x a y) tvoří zájmová plocha - terén, třetím rozměrem je sledovaná veličina. V geo- praxi je úloha často chápána čtyřrozměrně: známé body leží ne v rovině, ale v prostoru - v horninovém bloku, geologickém tělese ap. Poloha bodu je dána souřadnicemi x a y udávajícími průmět bodu na zemský povrch, a souřadnicí z udávající např. hloubku, nadmořskou (podmořskou) výšku ap. Hodnoty sledované veličiny jsou pak čtvrtým rozměrem.

V obou případech je možno formulaci úlohy rozšířit na tzv. blokové odhady. Známé hodnoty jsou vázány ne na body, ale jsou získávány ze vzorků určité plochy s nebo určitého objemu v. Cílem metod je v tomto případě získat nejlepší odhad sledované veličiny v jiné ploše s (objemu v) dané polohy na základě těchto známých hodnot.

Další výklad se bude pro názornost opírat o bodové odhady a trojrozměrný model. Bude tedy řešit problém naznačený na obrázku:

 

 

Modelová data

Jednotlivé metody budeme demonstrovat na následujícím příkladu:

V několika lokalitách Ostravy byl zachytáván spad a měsíčně analyzován na některé znečišťující látky. Výsledky pro SO4 jsou uvedeny v následující tabulce spolu s polohou místa ve Vítkovicích, ve kterém hodnoty SO4 budou jednotlivými metodami odhadovány. Poloha lokalit je dána vzdáleností v [m] od poledníku, jdoucího 15 km východně od poledníku 18o, a od rovnoběžky, jdoucí 83 km severně od rovnoběžky 49o.

 

Metoda nejbližšího souseda

Tato metoda je nejjednodušší a nejrychlejší. Používá se často pro první prostorový náhled na zadaná data. Odhadem hodnoty v místě X je prostě hodnota nejbližšího známého místa.

Modelová data znázorněná touto metodou jsou na následujícím obrázku:

 

 

Protože místu ve Vítkovicích je nejbližší místo v Mariánských Horách, je odhadem hodnoty SO4 ve Vítkovicích touto metodou hodnota 52,050.

Metoda trojúhelníková

Metoda trojúhelníková poskytuje odhad neznámé hodnoty pomocí lineární závislosti. Lineárním útvarem je ve trojrozměrném prostoru rovina. Rovina z je dána rovnicí

z ş a.x + b.y + c

přesněji: bod P = [xP, yP, zP] leží v rovině z, jestliže pro xP, yP a zP platí

zP = a . xP + b . yP + c (1)

Rovnice roviny obsahuje tři koeficienty. To naopak znamená, že pro určení konkrétní roviny (tj. určení jejich koeficientů a, b a c) jsou zapotřebí tři známé body P=[x1, y1, z1], Q=[x2, y2, z2], R=[x3, y3, z3]. Pro ně musí platit

z1 = a . x1 + b . y1 + c
z2 = a . x2 + b . y2 + c          (2)
z3 = a . x3 + b . y3 + c

Protože všechny xi, yi a zi jsou známé, řešením této soustavy jsou hledané koeficienty a, b a c té roviny, která body P, Q a R prochází.

Nechť nyní je dáno (např. tabulkově) několik trojic hodnot chápaných jako souřadnice bodů v prostoru. Nechť jest odhadnout z-ovou hodnotu v místě o "půdorysu" X, tj. v místě s danými souřadnicemi [x0,y0]. Vyberme proto tři "body" P, Q a R tak, aby X ležel uvnitř trojúhelníku získaného jako průmět trojúhelníku PQR (viz následující obrázek).

 

 

Známými body P, Q a R je určena rovina, jejíž koeficienty lze určit řešením soustavy (2). Hledaný odhad Zx je pak dán vztahem

Zx = a.x0 + b.y0 + c

Uvedený postup demonstrujme na modelových datech. Odhadněme hodnotu SO4 pro Vítkovice. Okolními místy jsou Zábřeh, Mariánské Hory a Kunčice. Pro výpočet koeficientů roviny jdoucí těmito místy sestavíme soustavu

Řešme např. pomocí determinantů. Jest

a tedy koeficienty roviny

Dosazení souřadnic Vítkovic do rovnice roviny s těmito koeficienty dává odhad 49,180.

Trojúhelníková metoda však skrývá jistý prvek náhodnosti. Uvažujme následující data: P=[1,1,1], Q=[3,1,10], S=[3,1,10], R=[3,3,1]. Jaký je odhad pro X=[2,2]?

 

 

Situaci znázorňuje předchozí obrázek. Ona náhodnost spočívá ve volbě trojúhelníka. Je-li zvolen PRS, je odhadem hodnota 1. Je-li zvolen QRS, je odhadem hodnota 10, tedy diametrálně odlišná.

Je zřejmé, v čem je problém: data mají velký rozdíl mezi "sousedními" hodnotami. Pohříchu právě takový charakter má většina geo- dat, proto zvláště na taková data není radno metodu aplikovat. Metoda se naopak s dobrými výsledky používá v případech, kdy sledované hodnoty v "blízkých" místech nemají příliš velký rozptyl.

Metoda inverzní vzdálenosti

Metoda inverzní vzdálenosti je jednou z metod, kterou by bylo možno označit jako "příspěvková". Hodnotu sledované veličiny v místě X si lze představit jako souhrn příspěvků z jednotlivých známých míst do X. Jednotlivé příspěvky jsou závislé především na jednotlivých známých hodnotách, a dále na vzdálenostech od bodu X.

 

 

Logicky (viz předchozí obrázek): příspěvek místa A se známou hodnotou 1 do místa X bude jistě menší než příspěvek místa B se známou hodnotou 10 do téhož místa X. Velikost příspěvku se zdá přímo úměrná velikosti hodnoty. Na druhé straně příspěvek do místa X z místa C vzdáleného 10 bude jistě větší než příspěvek z místa D vzdáleného 50. Velikost příspěvku se zdá nepřímo úměrná vzdálenosti.

Jistou analogii lze pozorovat např. u silových polí (gravitačního ap). Odhlédneme-li od vektorového tvaru a od případné konstanty a označíme-li Mi známou hodnotu v i-tém místě, ri vzdálenost i-tého místa od místa X, pak neznámou hodnotu Mx v místě X by bylo možno odhadnout jako souhrn

kde k je vhodná mocnina vzdálenosti (např. 1 nebo 2, nebo i třebas 1,3).

Vzorec (3) vyhovuje logickým předpokladům uvedeným shora: i-tý příspěvek je tím větší, čím je větší Mi a tím menší, čím je větší ri. Má však jednu zásadní nevýhodu. Pokud se totiž místo X nekonečně blíží nějakému místu se známou hodnotou (např. k prvnímu) - tj. r1 se nekonečně zmenšuje - pak se M1/r1 a tím i celý součet (3) nekonečně zvětšuje. Avšak čím blíže je místo X k místu prvnímu, tím více by se měla hodnota Mx blížit hodnotě M1 a ne růst nade všechny meze. Vztah (3) tedy není obecně použitelný.

Proto se v praxi používá obdobného vztahu, který diskutovanou vadu nemá:

I vztah (4) vyhovuje logické úvaze: Mx je přímo úměrné Mi a nepřímo úměrné ri, a navíc platí

pro všechna i.

Na modelových datech určeme nyní odhad hodnoty SO4 ve Vítkovicích metodou inverzní vzdálenosti. Podle (2) je zapotřebí zjistit vzdálenosti místa X ve Vítkovicích od míst Mi v ostatních obvodech. Označíme-li dX a dY rozdíly x-ových a y-ových souřadnic míst X a Mi, je podle Pythagorovy věty

Hodnoty dX a dY spolu s ostatními výpočty udává následující tabulka:

 

 

Odhad hodnoty SO4 metodou inverzní vzdálenosti pro Vítkovice je tedy 0,0631/0,0014=45,559.

Další metody

Existuje řada dalších metod (nejmenší křivosti, radiální báze, multikvadratická, a zvláště tzv. krigování). Jejich podstata je však složitější, a proto jsou uvedeny v případných samostatných kapitolách.

 

 

Rev. 10 / 2002