Semivariogramy

Doc. Dr. Vladimír Homola, Ph.D.

Experimentální semivariogram

Semivariogram je základní geostatistický nástroj pro vizualizaci, modelování a využití prostorové autokorelace regionalizované proměnné. Jak vyplývá z názvu, semivariance je míra variance. To, jak se hodnoty proměnné z mění při přechodu od x k x+h (tj. při změně vzdálenosti o h) je možno vyjádřit vztahem

kde g(h) je semivariance proměnné z pro vzdálenost h. V tomto pojetí je hodnota semivariance závislá na hodnotě vzdálenosti h; je tedy funkcí h a jako s funkční závislostí s ní lze nakládat.

 


Tabulka 1: Koncentrace Zn v hloubkových úrovních

 

Vypočítejme semivariance pro různé vzdálenosti zadaných bodů. Pokud jsou data (jako např. v této tabulce) k disposici s pravidelnou vzdáleností (zde 1.52 m), je možno počítat semivarianci s pravidelným přírůstkem (1.52 m). Pokud však data takto pravidelně k disposici nejsou, zvolí se minimální krok m, který dělí množinu vzdáleností jednotlivých bodů na třídy tak, že v každé třídě je dostačující počet hodnot. Tak krok např. m=2 znamená, že všechna data se vzájemnou vzdáleností d např. 11≤d<13 budou zahrnuty do výpočtu podle (1) pro h=12.

Základní schéma výpočtu pro vzdálenost h sestává z následujících kroků:

Po provedení uvedeného výpočtu pro všechny hodnoty h se získá řada hodnot nazývaných experimentální semivariance. Pro data z tabulky 1 jsou hodnoty experimentální semivariance tyto:

 


Tabulka 2: Experimentální semivariance

 

Graf hodnot experimentální semivariance se nazývá experimentální semivariogram. Pro hodnoty z předchozí tabulky ukazuje experimentální semivariogram obrázek 1.


Obr. 1: Experimentální semivariogram

 

Na křivce semivariogramu je zřetelný pokles na úrovni okolo 25 [m] a druhý na úrovni okolo 35 [m]. Na druhé straně jsou lokální extrémy na úrovních okolo 15 resp. 30 [m]. To znamená, že je výrazně menší diference mezi daty vzdálenými 25 [m] než mezi daty vzdálenými 15 [m] nebo 35 [m]. Obrátíme-li se zpět na data v tabulce 1, zjistíme, že semivariogram popisuje maximy a minimy data regulérně: hodnoty okolo 47 metrů jsou výrazně "hodně rozházené" a vyšší než "okolí", stejně tak hodnoty okolo 81 metrů a konečně do třetice okolo 106 metrů. Vzdálenosti mezi těmito lokalitami jsou 34 resp. 35 metrů, což je v dobré shodě s grafem na obr. 1.

Zvláštní případy

Pro názornější představu o vypovídací schopnosti semivariogramů uvažujme nyní dvě modelové situace; obě předpokládají např. svislý vrt a odebírání vzorků v hloubce 1, 2 ... [m].

V prvním modelu mějme celkem homogenní prostředí s hodnotami sledované veličiny okolo 20 jednotek. Toto homogenní prostředí je však v hloubce okolo 45 [m] porušeno úzkou diskontinuitou, v níž sledovaná veličina vykazuje hodnotu okolo 200 jednotek. Data tohoto modelu a jejich semivariogram je vynesen v následujícím obrázku v levých grafech.

Druhý model znázorňuje situaci, kdy se v hloubce okolo 45 metrů stýkají dvě celkem homogenní prostředí, z nichž v prvním je hodnota sledované veličiny okolo 20 jednotek, ve druhém okolo 200 jednotek. Data tohoto modelu a jejich semivariogram je vynesen v následujícím obrázku v pravých grafech.

 


Obr. 2: Modelová data

Teoretický semivariogram

Chování semivariogramu je možno - víceméně intuitivně a pro "rozumná" data - popsat takto:

  • velmi blízká data mají velmi malou odchylku

  • data ve větších vzdálenostech mají větší odchylky, avšak odchylky pro velmi vzdálená data a velmi velice vzdálená data se už zas tak moc neliší

  • od jisté vzdálenosti vzdálenosti už vzálemné odchylky nerostou - např. proto, že vzdálenost překračuje rozměry zkoumané plochy nebo tělesa.

  • Takto se chová např. křivka na obr. 3.

     


    Obr. 3: Teoretický semivariogram

     

    Křivku na obr. 3 je možno analyticky vyjádřit vztahem

    Semivariogram % Zn na obr. 1 by celkem měl tendenci se ideálnímu semivariogramu na obr. 3 zhruba podobat, nebýt dvou lokálních minim. Obecně lze říci, že v praxi se mnoho dat chová právě takto: až na větší či menší odchylky celkem tvar funkce (2) sledují. Ovšem na druhé straně je stejně tak mnoho dat, které tento tvar vůbec nesledují. Funkční vztah - např. (2) - který pokud možno dobře sleduje (modeluje) experimentální semivariogram, se nazývá teoretický semivariogram.

    Proto je významnou praktickou úlohou proces hledání teoretického semivariogramu pro daný experimentální semivariogram. Tento proces je nazýván strukturní analýza. Model nalezený pro danou množinu dat závisí jak na experimentálních, tak teoretických předpokladech. Vlastnosti, které prakticky vedou k určení konkrétního teoretického modelu, jsou

    Dosah je mírou korelace uvnitř množiny dat; "dlouhý" dosah indikuje vysokou korelaci, "krátký" dosah korelaci nízkou. Hodnota prahu je rovna celkovému rozptylu.

    Velmi často nenabývají experimentální semivariogramy v počátku nulové hodnoty; protínají osu y v nenulové hodnotě, která je nazývána zbytkový rozptyl (nugget effect). To může ukazovat na rozptyl menší než je "vzorkovací" vzdálenost, nebo na malou přesnost měření, kdy např. jsou v datech obaženy dva vzorky ze stejného místa, pokaždé s jinou hodnotou.

    V teorii i v praxi se ponejvíce užívá modelů experimentálních semivariogramů, popsaných v následující části.

    - Sférický model je popsán výše uvedenou rovnicí (2):

    - Exponenciální model je dán vztahem

    - Gaussův model je popsán rovnicí

    Gaussův model stejně jako sférický vykazuje výrazný práh, ale v okolí počátku se chová parabolicky, jak to ukazuje obrázek 4.

     


    Obr. 4: Gaussův model semivariogramu

    Složené modely

    Bohužel, v praxi se však experimentální semivariogramy nechovají jako estetické hladké a plynulé křivky. I takové rozložení semivariancí jako na obr. 5 nebývá časté. Tento obrázek však demonstruje řešení jiného problému: při modelování jednou z funkcí (2) až (4) nedostaneme nikdy uspokojivý výsledek; buď je počáteční stoupání křivky málo strmé, nebo sice sleduje počáteční data, ale zase práh je příliš vysoko ap. Pro co nejvěrnější sledování experimentálních semivariancí je možno použít složené modely. Teoretický semivariogram z obr. 5 vznikl složením

    pro h<14,

    pro h mezi 14 a 50, a konečně

    pro h>50.

     


    Obr. 5: Složený semivariogram

    Směrovost semivariancí

    V předchozích odstavcích byly experimentální semivariogramy konstruovány za předpokladu, že statistika byla závislá na vzdálenosti h a nezávislá na směrové orientaci vektorů daných jako spojnice dvojic bodů. Je však skutečností, že mnohé geologické fenomeny nevykazují prostorovou isotropii rozptylu - naopak se chovají anisotropně; rozsah influence je různý v různých směrech.

    Pro data, vykazující anisotropii, se využívá postupu spočívajícího v konstrukci dílčích semivariogramů pro stanovené směrové tolerance. V nejjednodušším případě rozdělme všesměrové pole rovnoměrně např. na směry sever±22.5o, jih±22.5o, východ±22.5o, západ±22.5o, severovýchod±22.5o, jihovýchod±22.5o, jihozápad±22.5o, severozápad±22.5o a zkonstruujme osm dílčích směrových semivariogramů tak, že do každého z nich zahrneme pouze ty dvojice daných bodů, jejichž směrový vektor padne do intervalu směrů daného dílčího semivariogramu.

    Z charakteru úlohy je zřejmé, že jde o směrově symetrický problém (míra variance mezi body A a B je stejná jako mezi body B a A), stačí tedy konstuovat pouze polovinu počtu semivariogramů. Po zjištění jejich dosahů se tyto dosahy zanesou do růžicového diagramu obsahujícího ty směry, pro něž byly dílčí semivariogramy sestaveny. Anizotropická množina dat je charakterizována směrem maximální variance a směrem minimální variance. Tyto směry jsou směry hlavní a vedlejší poloosy tzv. elipsy anizotropie. Elipsa anizotropie je pak zjistitelná jako elipsa, která aproximuje dosahy vynesené do shora zmíněného růžicového diagramu.

    Praktický příklad uvažuje soubor odběrních míst podzemní vody v oblasti Nové Vsi a sleduje jejich analýzu na pH. Pro tato data bylo použito směrového rozdělení podle předchozích odstavců. Ze zkonstruovaných semivariogramů byly zjištěny následující hodnoty dosahů:

     

    Směr Dosah [m]
    Východ 3154.230
    Severovýchod 3518.480
    Sever 5951.340
    Severozápad 4492.220

    Tabulka 3: Směrové dosahy

     

    Na obrázku 6 je uvedena konstrukce elipsy anizotropie popsaného praktického příkladu. Na směry východ, severovýchod ... jsou vyneseny hodnoty dosahů. Následně je zkonstruována elipsa tyto body aproximující. Osy elipsy (čárkovaně) jsou osy anizotropie. Odečtem úhlů lze konstatovat, že maximální dosah odpovídá 105° (měřeno od východu proti směru hodinových ručiček) - něco méně než severo - severo - západ.

     


    Obr. 6: Elipsa anizotropie

     

     

    Rev. 10 / 2002