2. Matematické základy geoinformatiky

Při řešení otázek spojených s projektováním, realizací a provozováním informačního systému je nutné převést konkrétní informační proces do abstraktní formy, která umožňuje:

Protože se v současné a budoucí době budou realizovat komplexní vazebně náročné a interaktivní úlohy, které jsou obecně pro vědy o Zemi typické, je rozhodující systémová analýza problematiky jako základ projektování datové základny. Ta pak musí být utvořena tak, aby vypovídací schopnost shromažďovaných dat umožnila řešit všechny požadované úlohy.

Při analýze a řešení naznačených problémů se využívá řada matematických postupů z oboru:

V dalším textu jsou stručně připomenuty základy těchto disciplin a uvedeny oblasti jejich využití při řešení úkolů geoinformatiky a to nejen obecně, ale konkrétně v jednotlivých fázích informačního procesu.

2.1 Stavba matematických disciplín

2.1.1 Matematické disciplíny

Matematika jako věda je v nejširším pojetí členěna na základní disciplíny, algebru, geometrii, matematickou analýzu a aplikovanou matematiku.

Základními disciplinami jsou zde rozuměny formulace a analýza jazyka, axiomů a logických metod, na kterých je celá matematika založena (viz matematická logika). Teorie množin, jejímž zakladatelem byl Georg Cantor, nyní zakládá univerzální matematický jazyk.

Algebra historicky vznikla jako nástroj ke studiu řešení některých algebraických rovnic, zvláště polynomických funkcí jedné a více proměnných. Aritmetika a teorie čísel je část algebry, která se soustřeďuje na studium specielních vlastností čísel.

Geometrie se týká prostorové části matematiky, tj. vlastností a vztahů mezi body, přímkami, rovinami, obrazci, tělesy a povrchy těles. Topologie studuje strukturu geometrických objektů nejobecnějším způsobem.

Matematická analýza obsahuje jako svůj základ jednak diferenciální, jednak integrální počet. Zabývá se dále řešením diferenciálních rovnic, nekonečnými řadami atd.

Na rozdíl od předchozích čtyřech oblastí matematiky se aplikovaná matematika neustále rozrůstá o další obory významné v současných empirických vědách. Aplikovaná matematika zahrnuje dnes široké spektrum oborů starších i modernějších, jako např. teorii pravděpodobnosti, matematickou statistiku, matematickou fyziku, počítačové vědy (computer science). Zvláště díky rozvoji výpočetní techniky a jejího výpočetního potenciálu se mnohé z těchto oborů dále dělí. Příkladem může být matematická statistika; vedle klasické statistiky se rychle vyvinuly moderní statistické metody používané zvláště při popisu přírodních procesů (neparametrické statistiky a jiné).

2.1.2 Metody a nástroje

Jednou ze základních metod výstavby matematiky jako vědy je deduktivní metoda. Na základě přijatých předpokladů se odvozují důsledky z nich plynoucí. Neméně důležité jsou induktivní metody, tzn. procesy usuzující z jedinečných výroků na obecné závěry. Mezi oběma metodami nelze vést ostrou hranici, neboť obě metody jsou vnitřně spjaty.

Samotná výstavba matematiky se opírá o logiku a její výrokový kalkul. Výroky pak používá ve dvou pilířích matematiky: definicích a větách.

Definice je výrok (vyjádřený slovně nebo symbolicky), kterým se zavádí (definuje) nový pojem na základě pojmů již definovaných, a na základě vlastností a dokázaných vztahů mezi již definovanými pojmy.

Věta je - zhruba řečeno - vždy platný výrok (vyjádřený slovně nebo symbolicky). Větami se vyjadřují vlastnost definovaných pojmů. Velmi podstatné je, že věty je nutno dokázat. Ke každé uvedené větě se tedy váže její důkaz.

Důkaz je výrok nebo posloupnost výroků (nejčastěji implikací nebo ekvivalencí), jimiž se dokazuje platnost věty. Vytvoření důkazu je často jedním z nejobtížnějších kroků při výstavbě matematiky jako vědy. Důkazy se provádí pomocí předem stanovených pravidel odvozování (např. důkaz matematickou indukcí, přímý důkaz apod).

2.1.3 Axiomatická výstavba teorie

Matematika je tedy věda rozvíjející se zdola nahoru. Na základě již známých pojmů se větami dovozují jejich vlastnosti a vztahy mezi nimi, což umožňuje definovat další pojmy atd. Na druhé straně nějaký pojem X byl definován na základě již definovaných pojmů např. U a V. Pojem U však musel být definován na základě již definovaných pojmů např. A, B a C, obdobně pojem V. Pojem A musel však být definován na základě ... atd. Musí tedy existovat jakási soustava pojmů, které jsou ”úplně dole” (proces definic se nesmí zacyklit: nesmí být X definováno na základě U, U na základě A a A na základě X !).

Každá disciplína má svou soustavu základních pojmů, které se nedefinují, ale přijímají jako obecně známé. Takovým pojmem je např. v geometrii bod, v teorii množin množina a prvek množiny. Je samozřejmě žádoucí mnohé takové pojmy i popsat, nejen předpokládat jejich obecnou známost. Používá se proto tzv. pseudodefinice; nejčastěji výroku v běžném jazyce, který může obsahovat množství běžně užívaných podstatných a přídavných jmen (nikterak dále nedefinovaných), upřesňující pseudo - definovaný pojem.

Obdobně se to má se soustavou vět. Na základě dokázané platnosti jedné věty se dokazuje platnost jiné věty atd. Opačně tedy musí "dole" existovat věty, které jsou ”konečné”: pro ně už neexistují věty, na základě kterých by je bylo možno dokázat. Takové ”základní” věty se nazývají axiomy. Axiomy jsou výroky, které se přijímají bez důkazu jako zřejmá, evidentní, apriorně pravdivá tvrzení. Je zřejmé, že pro budování vědního oboru je žádoucí, aby systém axiomů byl co nejmenší. Na druhé straně je často možno vybudovat tutéž teorii na základě více (různých) systémů axiomů. Pro axiomatizaci vědních oborů se požaduje pouze to, že v odvozované teorii nesmí dojít ke sporu. Vůči takové interpretaci je pak výchozí axiomatický systém pravdivý. Na systém axiomů jsou obecně kladeny podmínky:

Příkladem axiomaticky vybudovaného vědního oboru je euklidovská geometrie, historicky první axiomatický systém pro planimetrii a první axiomatický systém v matematice vůbec. Základními pojmy jsou bod, přímka, úsečka, úhel, kružnice, rovina. Soustavu axiomů tvoří následující výroky (v tom tvaru, jak je uvedl Euklides ve svých Základech): Právě geometrie vytvořená na základě těchto axiomů je běžně vyučována na základních i středních školách a v podvědomí všech je to jediná geometrie. Obměnou systému axiomů lze však vybudovat zcela odlišné geometrie. Tak např. změnou pátého Euklidova axiomu na tvar vytvořili nezávisle na sobě Nikolaj Lobačevský (1826) a János Bolyai (1832) hyperbolickou geometrii. Změna téhož axiomu na tvar vede k eliptické geometrii vytvořenou v r. 1854 G. Riemannem. Kromě euklidovské geometrie existují tedy i neeuklidovské geometrie založené na jiné soustavě axiomů.

2.2 Teorie množin

Pojmy teorie množin a množinové operace se začaly stále častěji využívat (s rozvojem poznatků o možnostech využití metod různých matematických disciplín) při studiu geovědních objektů a jevů. Vyplývá to ze skutečnosti, že výsledkem řešení geovědních úloh je z formálního hlediska nalezení určité množiny objektů (bodů). Např. úlohu okonturování ložiskového tělesa si lze představit jako nalezení horní hranice podmnožiny bodů XA, pro které platí, že x×d. Množinové vyjádření se široce využívá při tvorbě koncepčních modelů databází, např. v ER modelech (množina objektů a vztahů) nebo ERA modelech (množina objektů, vztahů a vlastností).

Za zakladatele teorie množin je považován Georg Cantor (1877). V dalším textu jsou uvedeny některé pojmy a pravidla, potřebná pro praktickou aplikaci teorie množin při řešení úloh geologické informatiky.

2.2.1 Základní pojmy

Kapitola předpokládá znalost základních pojmů teorie množin - samotného pojmu množina, prvek množiny, podmnožina, a také znalost základních množinových operací (sjednocení, průnik apod.). Zabývá se pouze pasážemi v těsné vazbě na geoinformatiku resp. informatiku obecně.

2.2.2 Kartézský součin

Kartézský součin množin A, B (značení: A×B) je množina všech uspořádaných dvojic takových, že první prvek dvojice je prvkem A a druhý prvek dvojice prvkem B:

A×B = { [a,b] | a A b B }.
Obdobně kartézský součin množin A, B, C (značení: A×B×C) je množina všech uspořádaných trojic:
A×B×C = { [a,b,c] | a A b B c C }.
Analogicky pro kartézský součin čtyř množin, pěti atd. Je-li jedna z množin prázdná, je i kartézský součin prázdná množina. Součin A×A označujeme také A2, M × M × M × M × M označujeme také M5 atd.

Jsou-li množiny A a B konečné s počty prvků nA a nB, je i jejich kartézský součin A × B konečná množina; počet jejich prvků (= počet uspořádaných dvojic) je roven nA×nB - dvojice obsahují kombinace „každý z A s každým z B”. Pro grafické zobrazení kartézského součinu se pro množiny s malým počtem prvků může použít např. tabulka:

I v některých případech nekonečných množin lze s výhodou kartézský součin znázornit graficky. Je-li např. A=<3,7> a B=<1,3> (A i B jsou uzavřené intervaly reálných čísel), pak znázornění A × B může být např. obdélník <3,7>×<1,3> v pravoúhlé soustavě souřadné.

2.2.3 Relace

2.2.3.1. Pojem relace

Binární relace R z množiny A do množiny B je libovolná podmnožina kartézského součinu A × B

R A × B
Je-li [a,b] R, píšeme:
a R b
a čteme „prvek a je v relaci R s prvkem b”, nebo „prvku a je v relaci R přiřazen prvek b”. Je-li naopak [a,b] R, píšeme
a ¬ R b
a čteme „prvek a není v relaci R s prvkem b”. Je-li R A × A, pak R nazýváme relací v množině A.
Příklad:
v množině A = {3, 5, 7, 9} je dána relace R = { [3,5], [3,7], [3,9], [5,7], [5,9], [7,9] }. Je tedy např. 3 R 7 nebo 7 R 9, ale 9 ¬ R 3

2.2.3.2. Vyjádření relací

Jsou-li množiny A a B konečné, lze pro znázornění relací použít několika způsobů. Nejčastěji používané jsou dva: maticový a tabulkový. Maticovým zápisem relace R z předchozího příkladu je následující matice vlevo 4×4 (nad matici resp. před matici byly pro přehlednost přidány nadpisy sloupců resp. řádků); v ní hodnota 0 značí, že prvky v relaci nejsou, hodnota 1 značí, že prvky v relaci jsou. Tabulkovým zápisem relace R je následující tabulka vpravo.

N-ární relace je libovolná podmnožina R kartézského součinu A1 × A2 × ... × An. Maticové zobrazení n-árních relací pro větší n je velmi nepraktické a nepřehledné. Proto se relace s konečným (často i značným) počtem prvků zobrazují výhradně jako n-sloupcové tabulky - pokud se samozřejmě nedají vyjádřit jinak, např. symboly výrokového počtu apod.

2.2.3.3. Relační databáze

Na shora zavedeném pojmu relace jsou konstruovány tzv. relační databáze. Nechť například množiny D, C a N značí po řadě množinu všech datumů, množinu všech textových řetězců (řetězec = posloupnost jednoho nebo více textových znaků) a množinu všech racionálních čísel. Mějme relaci R definovanou jako podmnožinu kartézského součinu

R K = D × N × C × C
Množina K je (nekonečná) množina všech uspořádaných čtveřic, kde první prvek čtveřice je datum, druhý racionální číslo, třetí je řetěz a čtvrtý je rovněž řetěz. Množinu R vytvořme tak, že vybereme jen některé čtveřice. Z hlediska praktického použití jakékoliv náhodná čtveřice např. [12/04/1543, 0, blabla, gaga] asi nebude příliš zajímavá. Ovšem čtveřice [01/01/1992, 9200, Novák, řidič] už může vypovídat o jisté reálné situaci: prvního ledna 92 byl přijat Novák jako řidič s platem 9200 Kč. Tabulkový zápis relace R pak může vypadat např. takto:

2.2.3.4 Vlastnosti relací

V následující tabulce jsou definovány některé základní typy relací podle svých vlastností; relace R je vždy v těchto případech relací v množině A:

Příklad:
Nechť je dána relace - viz příklad odstavce ”Vyjádření relací”. Tato relace je areflexivní (pro všechna [x,y] R je x # y) a tranzitivní (3R5 5R7 → 3R7; 3R7 7R9 → 3R9; 5R7 7R9 → 5R9). Relace je tedy ostré uspořádání; tato relace se často místo obecného R značí ”<”. Je tedy 3<5, 3<7, 3<9, 5<7, 5<9, 7<9.

2.2.4 Zobrazení

F je zobrazení z A do B, právě když je F binární relace z A do B a současně platí:

a A, b B, c B : aFb aFc b=c
jinak řečeno: při zobrazení jednomu a z A odpovídá nanejvýš jedno b z B.
Příklad:
Relace < z předchozího příkladu není zobrazení z A do A, protože je jednak 3<5 a jednak např. 3<7. Prvek 3 není v relaci s nejvýš jedním prvkem.
Shora definované zobrazení se také značí F: AB. Skutečnost, že xFy, se také zapisuje y=F(x). Je-li F zobrazení, aFb, pak se prvek a nazývá vzor prvku b a prvek b obraz prvku a. Množina všech vzorů zobrazení F ze nazývá definiční obor D(F) zobrazení F. Množina všech obrazů zobrazení F se nazývá obor hodnot H(F) zobrazení F:
D(F) = { a | a A b B : [a,b] F }
H(F) = { b | b B a A : [a,b] F }
D(F) = A, pak se F nazývá zobrazení (celé) A. Je-li H(F) = B, pak se F nazývá zobrazení na B. Existují tedy celkem čtyři zobrazení, terminologicky zachycená takto:
Mějme F: A B. Zobrazení F se nazývá prosté, platí-li:
a A, b A, c B : aFc bFc a=b
jinak řečeno dva různé vzory z A nemohou mít v prostém zobrazení F stejný obraz v B.
Příklad:
Na množině I přirozených čísel ( I = {1, 2, 3, ...} ) je dána relace ® takto: x→y y=x+1. Tato relace je tedy množinou dvojic typu [x, x+1], kde xI. Je-li x®y (tedy y=x+1) a současně x®z (tedy z=x+1), je evidentně y=z. Relace ® je tedy zobrazení. Definičním oborem je celá množina I: každému vzoru xI odpovídá - dokonce právě jeden - obraz y=x+1I. Oborem hodnot však není celá množina I (prvek 1 I není obrazem žádného vzoru xI; mělo by být 0®1, ale 0 I). Zobrazení ® je tedy zobrazení (celé) I do I (nikoliv na I).

2.2.5 Operace

Nechť M1, M2,..., Mn, V jsou libovolné množiny. F je n-ární operace z M1 × M2 × ... × Mn do V, je-li F (n+1)-ární relace, F M1 × M2 × ... × Mn × V, a platí-li:

ai Mi, z,u V : [a1, a2, ... , an, z] F [a1, a2, ... , an, u] F z=u.
N-tice a=[a1, a2, ... , an] se nazývá operandy operace F, prvek z V se nazývá hodnota operace F na operandech a. Velmi často se zapisuje z = F (a) nebo z = F (a1, a2, ... , an).
Poznámka:
Zobrazení definované v předchozím odstavci je unární operací ve smyslu definice n-ární operace. Obecně n-ární operace má n operandů. Specielně nulární operace nemá žádný operand; je pak z=F(), a protože z V, je nulární operace množina s nejvýš jedním prvkem. Nulární operace slouží k výběru tohoto prvku.
Příklad:
Zobrazení ® z příkladu předchozího odstavce je tedy unární operací z I do I. Je-li y=®x, je y=x+1. Je proto ®3=4, ®28=29, ®(x+5)=x+6 pro x I atd.

2.2.6 Rozklad na třídy

Jedním z důležitých pojmů jak teorie množin, tak disciplín na ní stavějících, je pojem rozklad na třídy:

Systém S množin { A1, A2, ... , An } je disjunktním systémem, platí-li pro libovolné dvě množiny Ai, Aj z S, že jejich průnik je prázdný: Ai Aj = {0}.

Nechť je dána neprázdná množina P a neprázdný systém T = { A1, A2, ... , An }, kde pro každé i je Ai P (T je tedy systémem podmnožin množiny P). Tento systém T nazýváme rozkladem množiny P na třídy, jestliže T je disjunktním systémem a T=P. Každá Ai T se nazývá třída v T.

Systém T je tedy rozkladem množiny P na třídy, jestliže průnik libovolných dvou tříd je prázdný a jejich sjednocením je celá množina P.

Jak bylo shora uvedeno, každé množině přísluší určující pravidlo, podle kterého byla množina vytvořena. Rozklad na třídy T je systémem podmnožin, je tedy sám množinou, existuje tedy i pro něj určující pravidlo. Velmi často mívá toto určující pravidlo matematickou podobu.

Příklad:
Barvy {červená, modrá, zelená, žlutá, jiná} rozkládají množinu všech jednobarevných aut na třídy. Tento rozklad B je tvořen pěti třídami (podmnožina červených aut, podmnožina modrých aut, ...). Sjednocení všech těchto tříd je celá množina všech jednobarevných aut, a každé dvě třídy jsou disjunktní (protože jde o jednobarevná auta, není žádné auto např. červené a zelené současně).
Bez důkazu uvádíme následující důležitou větu:

Věta: Každý rozklad množiny P na třídy definuje na P relaci ekvivalence. Každá ekvivalence na P definuje rozklad P na třídy.

2.2.7 Klasifikace

Při řešení otázek souvisejících s klasifikací dokumentů, sestavování tezaurů a formulování rešeršních hledisek je důležité najít optimální dělení množiny.

Definice: Klasifikací rozumíme roztřídění entit do skupin podle jejich podobnosti na základě společných vlastností. Dvě entity jsou ve stejné skupině, mají-li obě onu společnou vlastnost. Všechny entity tvoří dohromady výchozí množinu. Klasifikace tedy spočívá v nalezení vhodného rozkladu množiny na třídy.

Bibliografická klasifikace (třídění časopiseckých a sborníkových článků, knih, zpráv atd.) je založená na indexování, tj. přiřazení jednoho či více znaků k určité informační jednotce s cílem ji charakterizovat. Nejde tedy o pouhé roztřídění, ale o zobrazení obsahu dokumentu do redukované množiny znaků - číselných indexů, klíčových slov, deskriptorů. V pojmech teorie množin klasifikace množiny M je množina množin

KM = { A1, A2, . . . , An }
pro kterou platí, že:
  1. každý prvek x M náleží alespoň do jedné z množin Ai množiny KM ;
  2. průnik množin Ai Aj = {0} , i j 
  3. sjednocení množin A1 A2 ... An = M

Klasifikační kritérium K pro množinu M znamená:

  1. zobrazení [ x M K(x) ] ,
  2. že existují predikáty K1 ... Kn , tj. hodnoty klasifikačního kritéria.

Příklad:
Nechť M je klasifikovaná množina a K1 ... Kp jsou klasifikační kritéria s hodnotami 1K : 1K1 , 1K2 , .... , 1Ku (např. vědní obor), 2K : 2K1 , 2K2 , .... , 2Kv (např. autoři), 3K : 3K1 , 3K2 , .... , 3Kw (např. jazyky), Potom { M 1Ki 2Kj .... PKr } je jednoduchá vícekriteriální klasifikace (typu klasických katalogů).

2.2.8 Tezaurus

Definice: Nechť D = {D1, D2, ... , Dn} je množina dokumentů (knihovna) a nechť T = {T1, T2, . . , Tm} je množina klíčových slov (termínů), která v souhrnu postačí na charakterizování všech dokumentů. Pak množinu T spolu s množinou R vzájemných relací mezi termíny nazýváme tezaurus. Tabulka, která vyjadřuje, které prvky tezauru jsou přiřazeny k jednotlivým dokumentům, se nazývá dokument - termínová matice. margin-left:25px;

Příklad:
Dokumenty D jsou charakterizovány termíny T podle následujícího schématu:
D1: T1, T2, T3, T4
D2: T1, T3, T5
D3: T3, T5, T6, T7
D4: T2, T3, T6
D5: T1, T2, T4, T6
Tomu odpovídá následující dokument-termínová matice
Zároveň můžeme konstatovat, že průměrný počet deskriptorů na 1 dokument je 3.6 a že nejfrekventovanější deskriptor je T3.

2.2.9 Teorie shlukování

Intuitivně chápeme, že dva objekty jsou si podobné, když mají některé vlastnosti shodné. Čím mají více shodných vlastností, tím jsou si podobnější. Z hlediska množinové teorie podobnosti můžeme objekt P1 charakterizovat jistou množinou vlastností {Vi} a objekt P2 množinou {Vj}. Vzájemnou podobnost lze určit pomocí koeficientu podobnosti

 tj. podílu mohutnosti průniků a mohutnosti sjednocení množin. Podobně lze využít koeficient rozdílnosti d(P1,P2) = 1 - p(P1,P2)

Příklad:
Stanovme koeficient podobnosti objektů P1 = {V1, V2, V3, V4} a P2 = {V2, V4, V5} .
Shluk můžeme definovat jako množinu objektů, u nichž je hodnota koeficientu podobnosti vyšší, než hodnota jistého prahu.

2.2.10 Fuzzy množiny

V souvislosti s potřebou řešit úlohy rozpoznávání obrazů se začala od počátku 60. let rozvíjet teorie fuzzy množin. V naprosté většině případů se setkáváme s problémem míry příslušnosti určitého objektu xi k jisté klasifikační třídě F. Přechod od jedné třídy k druhé není zpravidla skokový, ale spíše postupný. Otázka tedy není v tom, náleží-li objekt xi k třídě F, ale v tom, do jaké míry k ní náleží. Docházíme tak k závěru, že třída F obsahuje objekty xi s různou mírou ui příslušnosti k třídě

F = { m1x1 , m2x2 , ... , mnxn }
F = { m1|x1 , m2|x2 , ... , mn|xn},
přičemž mi leží v intervalu < 0, 1>. Za hranici příslušnosti k třídě se obvykle volí mk = 0,5.

V pojmech teorie množin lze interpretovat i JAZYK, který představuje souhrn dorozumívacích znaků a pravidel jejich používání a interpretace. Velmi důležitá jsou právě pravidla interpretace.

Příklad:
CUP ... české slovo v latince ... cup - cupitat, ... angl. slovo v latince ... kap - šálek, ... angl. slovo v azbuce ... sir - pán
Není-li pravidlo interpretace zřejmé, musíme je explicitně přidat.

Ke každé realitě (objektu) existuje pojem (obraz objektu). Jeho zobrazení množinou písmen je slovo. Množina slov pak tvoří jazyk. Pravidla, určující formu přiřazení, složení a pořadí prvků jazyka tvoří gramatiku. Přirozený jazyk je zobrazení množiny pojmů do množiny slov konkrétního jazyka.Vlastností a velkou předností všech jazyků je nejednoznačnost přiřazení (synonymie, homonymie), což ale přináší z hlediska informatiky značné komplikace.

V současné době je možné využitím počítačové techniky vytvářet jakékoliv klasifikace. Stejně tak využití teorie množin má velmi široké možnosti.

Příklad: V pojmech teorie množin lze geologicko-průzkumnou organizaci považovat za dynamický systém S = { X, R, V, VF, W, WF, P, T }, kde X je množina prvků systému (pracovníci, útvary), R množina vztahů mezi prvky systému (organizační vazby), V vstupy a VF vstupní funkce, W výstupy a WF výstupní funkce, P množina pravidel činnosti podniku a T časová množina.

2.3 Matematická logika

Matematická logika má důležité místo v matematické lingvistice, v teorii vyhledávání a zpracování dotazů (tedy při zpracování vědeckých a průzkumných informací), v kybernetice, algoritmizaci a programování, ale také v konstrukci počítačů. V geovědách - např. geologických, se prakticky využívá při řešení řady problémů:

Protože matematická (formální) logika poskytuje základní nástroje pro popis výstavby ostatních věd obecně a informatiky zvláště, jsou v následujících odstavcích podány základy matematické logiky v potřebném rozsahu.

2.3.1 Binární algebra

Historicky nejstaršími hodnotami v logice jsou pravda a nepravda. Na základě těchto hodnot vznikla jako nejpropracovanější dvouhodnotová (binární) logika. Její matematické základy podal George Bool, který zveřejnil základní práce v roce 1847 a 1854. Proto se algebra vybudovaná nad dvěma různými hodnotami nazývá také Booleova algebra. Binární logika a binární algebra jsou základem číslicových počítačů. Jejich konstrukce se opírá zásadně o dvě hodnoty, ač modelovanými různými fyzikálními principy: zmagnetováno - nezmagnetováno; pod napětím - bez napětí; vede - nevede; odráží - neodráží atd.

2.3.1.1 Logické hodnoty

Různé principy vyjádření dvou stavů (nejen fyzikálních) modeluje binární algebra dvěmi hodnotami a vyjadřuje dvěma symboly:

0 - neplatí (často také symbol písmene O),
1 - platí (často také symbol písmene I).
Binární algebra tedy pracuje nad množinou {0, 1}.

2.3.1.2 Logické proměnné

Stejně jako v jiných oborech matematiky označujeme symbolicky ty objekty, které mohou nabývat různých hodnot. Zavádíme tak logické proměnné. Uvedeme-li například, že X je logická proměnná, pak to znamená, že X může nabývat (logických) hodnot 0 nebo 1.

2.3.1.3 Logické operace

Nad logickými hodnotami 0 a 1 (které mohou být reprezentovány logickými proměnnými) jsou zavedeny logické operace. Operace nad binárními hodnotami se nejčastěji popisují pomocí tzv. pravdivostní tabulky: Nejpoužívanější operace popisuje následující souhrnná tabulka:

Poznámka:
ve formálních jazycích se často místo znaménka ¬ používá tří písmen "not" zapsaných bezprostředně (bez mezer) za sebou a chápaných jako jeden nedělitelný symbol. Obdobně místo znaménka se používá tří písmen "and", místo znaménka se používá dvou písmen "or", místo znaménka → se používá tří písmen "imp" a místo znaménka ↔ používá tří písmen "equ" - to vše zapsáno bezprostředně za sebou a chápáno vždy jako jeden nedělitelný symbol.

2.3.1.4 Logické výrazy

2.3.1.4.1 Výrazy a priority

Logické výrazy se tvoří stejně jako výrazy např. aritmetické. Zápis logického výrazu tvoří buď jediná logická hodnota (kterou může reprezentovat logická proměnná), zápis logické operace (unární nebo binární), nebo logický výraz uzavřený do závorek ( ). Ve druhém případě jsou operandem nebo operandy logické výrazy, tj. buď logické hodnoty, nebo logické operace, nebo logické výrazy uzavřené do závorek ... atd.

Poznámka:
Takto definovaný výraz je definován tzv. rekurzivně: ke své vlastní definici používá sám sebe. Takové definice jsou podstatnou součástí definic např. v teorii automatů a gramatik.
Logickým výrazem je tedy např.
1 ¬(X → 0 Y) .
Pro případ, kdy výraz nebo jeho část tvoří konstrukce typu
1 → 0 1
je nutno rozhodnout (jde o binární operace!), zda takový zápis znamená
(1 → 0) 1
nebo
1 → (0 1).
Stejně jako v aritmetice se to děje přiřazováním priorit jednotlivým operacím. Priority popisuje tabulka vpravo. Před prioritami operací mají ovšem přednost závorky. Logický výraz v závorkách se vyhodnotí vždy nejdříve. Nejsou-li závorky, vyhodnocuje se v pořadí priorit, jsou-li stejné priority, vyhodnocuje se zleva doprava.
2.3.1.4.2 Vyhodnocování výrazů s proměnnými

Nejpohodlněji, s nejmenšími chybami, lze vyhodnotit výraz obsahující proměnné pomocí pravdivostní tabulky. Na příklad shora uvedený výraz

1 ¬ (X → 0 Y)
nabývá různých hodnot pro různá X a Y. K vyhodnocení tohoto výrazu napomůže např. následující tabulka vpravo. Z tabulky je vidět, že výraz je pravdivý pouze tehdy, je-li pravdivé X a nepravdivé Y.

2.3.2 Abecedy a jazyky

2.3.2.1 Abecedy a slova

Abeceda je konečná množina prvků. Symbol je libovolný prvek abecedy. Dvě abecedy jsou disjunktní, jsou-li to dvě disjunktní množiny.

Příklady:
Latinka = {A, B, C, ..., X, Y, Z} Kamenika = {mezera, a, á, b, c, č, ..., z, ž, A, Á, ..., Ž} Abeceda dekadických číslic = {0, 1, 2, …, 8, 9} Abeceda římských číslic = {M, D, C, L, X, V, I}
Slovo v abecedě A je libovolná konečná posloupnost symbolů abecedy A. Délka slova je počet jeho symbolů. Prázdné slovo je posloupnost s nulovým počtem symbolů.

Nechť S = (p1 p2 .. pn), pi A, je neprázdné slovo v abecedě A. Označme X = (p1 p2 .. pi-1), Y = (pi pi+1 ... pj-1 pj), Z = (pj+1 ... pn-1 pn). X, Y i Z jsou tedy také slova v abecedě A, alespoň jedno z nich neprázdné. Nechť Y je neprázdné slovo. Pak definujeme: X je prefixem slova Y ve slově S, Z je postfixem slova Y ve slově S. Každé ze slov X, Y, Z jsou podslova slova S. Prázdné slovo je podslovem každého slova. Každé slovo má prázdný prefix a prázdný postfix. Dvě slova jsou stejná, jsou-li to stejné posloupnosti symbolů dané abecedy (tj. zvláště co do počtu a co do pořadí). Dvě slova jsou různá, nejsou-li stejná.

Poznámka:
Ačkoliv se zdá, že rovnost slov je naprosto jasná, zavádějí některé informační systémy rovnost odlišně; např. tak, že dvě slova jsou stejná, je-li jedno z nich prefixem druhého. To má dobrý smysl při vyhledávání podle kriterií. Vyhledat všechny informace, kde příjmení = NOV znamená pak vyhledat nejen příjmení NOVÝ, ale i NOVÁK, NOVOTNÁ atd.
Nechť S, P, Q jsou slova v abecedě A. Nechť P je prefixem slova Q ve slově S. Nechť naopak Q je postfixem slova P ve slově S. Pak slovo S nazýváme slovo složené ze slov P a Q (v tomto pořadí!) a píšeme S = PQ.

2.3.2.2 Jazyky

Nechť je dána abeceda A. Množinu všech jejich slov označme A* (Pozn.: množina A* je nekonečná!). Označme LA libovolnou podmnožinu množiny A* (množina LA může být i množinou A*). Pak definujeme: Formální jazyk (často také jen jazyk) nad abecedou A je uspořádaná dvojice [A, LA]. Je-li množina LA konečná, nazývá se jazyk L konečný; je-li prázdná, nazývá se jazyk L prázdný; je-li nekonečná, nazývá se jazyk L nekonečný.

Příklad:
Čeština je konečný jazyk nad Kamenikou (ve smyslu zavedení abecedy Kamenika shora).
Množina LA je množina slov jazyka L. Slovo S je slovo jazyka L nad abecedou A, je-li S LA. Takto podaná definice je zcela obecná. V praxi se pracuje s konkrétními jazyky, proto je zapotřebí jazyk specifikovat. Protože pro jazyky (které jsou množinami) platí všechny množinové pojmy a tvrzení, lze specifikaci jazyka provést např. vyjmenováním všech jeho prvků, definovat určující vlastnost množiny apod. Aby jazyk měl praktický význam, musí být konečný. Počet slov jazyka může však být tak velký, že jazyk nelze specifikovat vyjmenováním slov. Specifikace určující vlastností se např. u jazyků typu Čeština blíží svým objemem specifikaci vyjmenováním. Proto se pro formální jazyky používá dvou systémů specifikací, zvláště vhodných pro počítačové aplikace a informační systémy:

2.3.2.3 Automat

Automat je procedurální systém, který po předložení slova konečným počtem kroků rozpozná, zda se jedná nebo nejedná o slovo dané abecedy.

2.3.2.4 Gramatika

Gramatika je generativní systém, který opakovaným užitím vytváří postupně všechna slova pouze daného jazyka.

Formálními jazyky a gramatikami se zabývá poměrně nová, v informatice však velmi významná oblast aplikované matematiky, teorie automatů.

2.3.3 Výroky a výrokové formy

2.3.3.1 Výrok

Základním objektem logiky je výrok. Logika pak zkoumá jeho obsahové a pravdivostní hodnoty a pravidla seskupování výroků. Jde o základní pojem; proto se výrok nedefinuje, pouze se popíše, co se pojmem rozumí. Nejčastěji se výrok definuje takto: výrok je tvrzení, o jehož pravdivosti má smysl uvažovat nebo také výrok je napsaná nebo vyslovená myšlenka, o jejíž pravdivosti má smysl uvažovat.

Příklady:
"Tato hornina je granit."
(x + 1)2 = x2 + 2x + 1
Tvrzením nebo myšlenkou se rozumí oznamovací věta (jistě nemá smysl uvažovat o platnosti věty tázací nebo o posloupnosti slov větu netvořící, např. "ačkoliv zemské jádro"). Tato oznamovací věta nemusí být vždy zapsána běžně používaným jazykem (čeština, angličtina ...). Zvláště v matematických disciplínách se používá symbolických označení, jak ukazuje druhý příklad nahoře. Vždy však výroky musí tvořit konečný jazyk nad nějakou abecedou.

Důležitým faktorem v definici výroku je to, že o pravdivosti má smysl uvažovat. Aby výrok byl výrokem, nemusí být jeho pravdivostní hodnota známa právě teď, dokonce ani nemusí být zřejmé, jakým způsobem by se pravdivostní hodnota určila. Výrok, o jehož pravdivosti nejsme schopni rozhodnout, se nazývá hypotéza.

Poznámka:
To, zda výrok je či není hypotézou, je převážně subjektivním hodnocením. Cílem zkoušky na vysoké škole je ověřit, zda jednoznačně pravdivé nebo nepravdivé (z hlediska pedagoga) výroky, kterými studenti prezentují své znalosti, nejsou (z hlediska studenta) pouhými hypotézami.

2.3.3.2 Abeceda výrokového jazyka

Abecedou je množina písmen, číslic a specielních symbolů používaných v té které disciplíně (např. symbol =). Zápis výroků je pak většinou jednodušší než zápis běžnou větou. Ovšem při čtení výroků zapsaných za pomocí specielních symbolů se vlastně provádí substituce symbolů jedním nebo více slovy běžného jazyka (např. A=B čteme "á je rovno bé"). Proto se specielní symboly tvořící abecedu často považují za metasymboly; každý takový metasymbol je pak při zpracování substituován jedním nebo více slovy, které už metasymboly neobsahují.

2.3.3.3 Kvantifikátory

Pro zápis výroků se v matematických disciplínách (kromě mnoha dalších specielních symbolů) používají kvantifikátory.

2.3.3.3.1 Existenční kvantifikátor

Existenční kvantifikátor slouží k zápisu takového výroku, který sděluje, že existuje alespoň jeden objekt (prvek nějaké množiny) mající nějakou vlastnost.

Příklad:
x Z : x > 117
Výrok sděluje, že existuje alespoň jeden takový objekt x který je prvkem množiny celých čísel Z (x je tedy celé číslo) a zároveň je větší než 117. Tento výrok je evidentně pravdivý, protože např. x=238 je jak celé číslo, tak je větší než 117.
2.3.3.3.2 Všeobecný kvantifikátor

Všeobecný kvantifikátor slouží k zápisu takového výroku, který sděluje, že všechny objekty (prvky nějaké množiny) mají nějakou vlastnost.

Příklad:
x Z : x2 > 0
Výrok sděluje, že pro všechna x, která jsou prvky množiny celých čísel (tedy pro všechna celá čísla) platí, že jejich kvadrát je větší než nula. Tento výrok je evidentně nepravdivý, protože nula je celé číslo, ale její kvadrát (což je nula) není větší než nula (protože je rovno nule) a tedy výrok neplatí pro všechna celá čísla.

2.3.3.4 Výroková forma, výroková proměnná

Výrokem je příklad shora: „Tato hornina je granit”. Ukážeme-li na nějakou horninu a proneseme uvedenou větu, pak jistě někdo může rozhodnout, zda to je či není pravda. Ukážeme-li na jinou horninu a opět proneseme uvedenou větu, opět jde o výrok. Jestliže se však snažíme generalizovat a vytvoříme konstrukci X je granit pak nejde o výrok; nelze rozhodnout o pravdivosti nebo nepravdivosti, protože není konkrétně řečeno, co to X je. Výrokem se uvedená konstrukce může stát po ”dosazení za X”. Takové konstrukce se nazývají výrokové formy a symboly (zde např. X), za které se dosazuje, se nazývají výrokové proměnné.

Výroková forma V(X) je výraz, který se skládá ze slov, symbolů a z výrokových proměnných. Dosazením konkrétních hodnot za výrokové proměnné vznikne výrok.

Výroková forma V může mít více výrokových proměnných: V = V (X, ... , Z). Pokud nebude řečeno v dalším textu jinak, bude sice užíváno zápisu V (X), ale pod X bude myšlen seznam výrokových proměnných: posloupnost jedné nebo více výrokových proměnných oddělených čárkou.

Příklady:
výroková forma V (x,y): y = x2 výrok (pravdivý) dosazením 4 za y, 2 za x: 4 = 22 výrok (nepravdivý) dosazením 6 za y, 3 za x: 6 = 32
2.3.3.4.1 Definiční obor výrokové formy

Pokračujme v předchozím příkladu: dosazením poněvadž za y, 8 za x dostaneme poněvadž = 82 což není výrok. Dosadit za výrokovou proměnnou (aby se výroková forma stala výrokem) není tedy možno cokoliv. Definičním oborem D (V) výrokové formy V(X) je množina všech takových A, pro něž je V(A) výrokem.

Příklad:
Forma "X je sudé" má za definiční obor "Množinu celých čísel Z". Forma "X má porfyroblastickou texturu" má smysl pro obor "Metamorfované horniny".
2.3.3.4.2 Obor pravdivosti výrokové formy

Pro některá A D (V) je výrok V (A) pravdivý, pro některá ne (vždy ovšem V (A) je výrokem). Definice: Podmnožina P (V) D(V) všech takových A D (V), pro něž je V(A) pravdivým výrokem, se nazývá obor pravdivosti výrokové formy V(X).

Příklad:
Obor pravdivosti pro formu V (X): "X je sudé" je množina sudých čísel P(V) = {X Z | X mod 2 = 0}.
2.3.3.4.3 Tautologie

Definice: Tautologie je výroková forma V(X), jejíž obor pravdivosti je roven jejímu definičnímu oboru:

P (V) = D (V)
Tautologie je tedy taková výroková forma, která po dosazení jakékoliv hodnoty z definičního oboru přechází v pravdivý výrok (”je vždy pravdivá”).

2.3.3.5 Operace s výroky, složené výroky

Výrok může nabývat hodnoty pravda a nepravda. Z tohoto hlediska na něj můžeme pohlížet jako na jedno z vyjádření hodnoty binární algebry. Proto se na něj vztahuje vše to, co bylo řečeno v kapitole shora.

Označíme-li jeden výrok A a druhý B, lze z nich především konstruovat logické výrazy pomocí logických operací. Zkoumáme pak, jak se to má s platností B A apod. Výsledkem může být opět jen platnost nebo neplatnost. Protože lze rozhodnout, zda B A platí nebo ne, je B A výrokem. Takový výrok nazýváme složeným výrokem.

Příklad 1:
Jestliže číslo končí nulou, pak je dělitelné dvěma. Pravdivostní tabulka je uvedena výše. Z tabulky je vidět, že uvedený složený výrok je pravdivý kromě případu, že číslo je sice dělitelné dvěma, ale nekončí nulou.
Příklad 2:
Podle rešeršního požadavku chceme vybrat dokumenty, které: popisují problémy, vyjádřené deskriptory A (Český masiv), B (zlomová tektonika), C (ložiska Pb-Zn) a D (mineralogie) nebo deskriptory A (Český masiv) a C (ložiska Pb-Zn); jsou z roku 1984 nebo 1985; jsou psány cizím jazykem, tj. nejsou české (ČJ) a slovenské (SJ). Zápis požadavku pro vyhledávání je pak výrazem ( A and B and C and D) or (A and C)) and (1984 or 1985) and (ČJ or SJ) ) Při procházení (např. databáze dokumentů) se pak tento výraz vyhodnocuje pro každý dokument a do výběru budou zahrnuty pouze ty, pro něž je výsledná hodnota pravda. Poznamenejme, že většina starších databází (založených před rokem 1980) měla pouze tři možnosti operací s výroky, a to konjunkci, disjunkci a negaci. Ostatní operace bylo nutno vyjadřovat výrazy pomocí konjunkce, disjunkce a negace.

2.3.3.6 Poznámky k logickým výrazům

Při praktickém využívání matematické logiky (a obecně všech metod klasické matematiky) narážíme na rozpor mezi přesností matematického popisu a složitostí popisované skutečnosti. Bertrand Russel (1923) napsal, že "tradiční logika předpokládá použití přesných pojmů, které jsou však aplikovatelné pouze v ideální představě". Snaha o stále větší přesnost vede k neúměrnému nárůstu definic a rozsahu popisu prakticky zcela jednoduchých jevů (Novák, 1990). Zvláště komplikovaná situace nastává při práci s přirozeným jazykem, který vyniká mnohotvárností a schopností pracovat s vágními, tj. nepřesně určenými pojmy, které vymezují určitou třídu objektů bez jasných hranic.

Příklad 1:
antický paradox hromady (sorites) „Ubírejme z hromady kamení jeden kámen po druhém. Ve kterém okamžiku přestane existovat hromada a zůstane jen pár kamenů?”
Příklad 2:
antický paradox holohlavého člověka (falakros): „Jestliže holohlavému člověku naroste jeden vlas navíc, zůstává holohlavý. Naroste-li mu však např. 80 000 vlasů, je ještě holohlavý?” Samozřejmá odpověď zní „ne”, logicky však vyplývá, že „ano”. Paradox totiž ve správné formulaci zní: On ... "člověk mající n vlasů je holohlavý" a tedy jde o množinu speciálních axiomů
X = { On-1 → On, Oo: n=0, 1, ... }.
V klasické dvouhodnotové logice je pravdivá pro každé n. Implikace On-1 → On není ale zcela pravdivá, neboť naroste-li holohlavému člověku jeden vlas navíc, stává se nepatrně méně holohlavým. Hodnota důkazu s rostoucím n klesá a při určitém n má nulovou hodnotu.

2.3.4 Fuzzy logika

Pod pojem fuzzy logika se zahrnují logiky obecnější povahy a to vícehodnotová logika a lingvistická logika.

2.3.4.1 Vícehodnotová logika

je logika s více než dvěma pravděpodobnostními hodnotami zpravidla z intervalu <0,1>. Je přímým zobecněním klasické dvouhodnotové logiky. Polský matematik J. Lukasiewicz nejprve vybudoval tříhodnotovou logiku s pravdivostními hodnotami [ANO, NEVÍM , NE] a později ji rozšířil na logiku se spočetně mnoho pravdivostními hodnotami.

Obdobně jako klasická logika pracuje i vícehodnotová logika s výroky spojovanými pomocí spojek (disjunkce, konjunkce, odvážná konjunkce, implikace, intenzifikátory atd.) do složených výroků.

Poznámka:
existuje-li mezi spojovanými výroky jisté vnitřní (kontextuální) ovlivnění, jde o odvážnou konjunkci.
Příklad:
Mějme výroky "Jan je tlustý" a "Jan je podobný Petrovi": "tloušťka" je součástí "podoby" a proto je konjunkce "Jan je tlustý a podobný Petrovi" odvážná (pravdivost složeného výroku je menší než pravdivost každého z obou výroků).

2.3.4.2 Lingvistická logika

je mnohem radikálnějším zobecněním klasické dvouhodnotové logiky. Vychází z předpokladu, že lidskému uvažování je přirozené vyjadřovat pravdivostní hodnoty lingvisticky, např. pomocí slov [PRAVDA, VÍCEMÉNĚ PRAVDA, ČÁSTEČNÁ PRAVDA, ČÁSTEČNÁ NEPRAVDA, NEPRAVDA, NEZNÁMO]. Významy těchto slov jsou hodnotami fuzzy množiny, která nemusí být uzavřená. Jejich pravdivostní hodnota je vyjadřována pomocí určitého pravidla v intervalu <0,1>.

Příklad:
Porovnání kyzového polymetalického ložiska Zlaté Hory s typy vulkanogenních sulfidických ložisek Kuroko, Rosebery, Besshi a Kypr na základě fuzzy lingvistické diagnostiky (Patočka-Vrba, 1989) ukazuje na jistou se příbuznost k typu Rosebery, ale podle primárních rysů je vyšší k typu Kuroko a podle druhotných (spjatých s regionální metamorfózou) k typu Besshi (viz tab. 2.1).

Tab. 2.1: Příbuznost ložiska Zlaté Hory s typy vulkanogenních ložisek (Patočka-Vrba, 1989)

diagnostický standard primární rysy sekundární rysy celkový soubor
typ Kuroko 1 0 0
typ Rosebery 1 1 1
typ Besshi 0 1 1
typ Kypr 0 0 0

2.3.5 Logické metody v geovědách

Logické metody (označované také jako logicko-informační, logicko-kombinatorní, logicko-matematické) jsou v geovědách vědách používány pro řešení:

Svou podstatou jde o heuristické procedury, založené buď zcela nebo částečně na postupech matematické logiky.

2.4 Kombinatorika

Kombinatorika je nauka o možnostech kombinování, tj. přeskupování prvků. Představuje velmi staré odvětví matematických věd. Z hlediska geologické informatiky je využívána při řešení pravděpodobnostních úloh v oblasti vědeckých informací, při automatickém zpracování textů apod. V této kapitole uvádíme jen zcela nejzákladnější pojmy.

Permutace z n prvků je každá uspořádaná n-tice utvořená z daných n různých prvků. Počet permutací z n prvků je P(n) = n!

Příklad:
Utvořme permutace z množiny M {a, b, c}.
Počet permutací je P(3) = 3! = 3 x 2 x 1 = 6.
Vzniklé skupiny jsou: abc, acb, cab, bac, bca, cba
Variace k-té třídy z n různých prvků nazýváme různé skupiny, z nichž každá obsahuje k prvků z daných n prvků, při čemž záleží na pořadí prvků ve skupině. Počet variací je

Příklad:
Kolik dvoupísmenových a trojpísmenových slov lze utvořit z 10 různých písmen?
10! = 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1
(10-2)! = 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1
(10-3)! = 7 x 6 x 5 x 4 x 3 x 2 x 1
V2(10) = 10! / (10-2)! = 10 x 9 = 90
V3(10) = 10! / (10-3)! = 10 x 9 x 8 = 720
Poznámka: permutace je variace n-té třídy z n prvků

Kombinace k-té třídy z n různých prvků jsou skupiny, z nichž každá obsahuje k prvků z daných n prvků, přičemž na pořadí prvků ve skupině nezáleží. Počet kombinací je

Poznámka:
(n nad k) je tzv. kombinační číslo.
Kombinace se prakticky využívají při úvahách o možném počtu rejstříků v bibliografii. Nejčastěji se používají 2 - 3 rejstříky (autorský, přírůstkový a předmětový). Ke každé knize se vztahuje okolo 20 základních údajů (aspektů, klasifikačních hledisek) a to - přírůstkové číslo, vědní obor, MDT, autor, instituce, redaktor (překladatel), pracoviště redaktora, titul knihy, titul v originále, vydavatelství, jazyk, země vydání, způsob získání, počet stran, počet obrázků, rok vydání, cena atd. Při 20 třídících aspektech lze teoreticky vytvořit:
20! / 1!(20-1)! = 20 jednoaspektových rejstříků
20! / 2!(20-2)! = 190 dvojaspektových rejstříků
20! / 3!(20-3)! = 1140 trojaspektových rejstříků
20! / 4!(20-4)! = 4845 čtyřaspektových rejstříků

Kombinace s opakováním k-té třídy z n prvků jsou skupiny po k prvcích z daných n prvků, přičemž každý prvek se ve skupině může vyskytnout až k-krát. Počet kombinací s opakováním je

2.5 Teorie grafů

Teorie grafů se využívá při řešení nejrůznějších úloh v řadě geovědních disciplin (v geologii např. popis vývoje geologických procesů, optimalizace průzkumných procesů, stromové grafy klasifikací apod.). Nespornou předností postupů, vycházejících z této teorie, je názornost.

Síťový graf (síťový model, logická síť) je názorné zobrazení procesu (projektu) ve tvaru grafu, který vyjadřuje vazby (logické, technologické) mezi dílčími ději (činnostmi).

2.5.1 Základní pojmy teorie grafů

V této kapitole jsou definicemi zavedeny grafy a jejich komponenty, a jsou podány jejich základní vlastnosti a vztahy. Kapitola sice v následujícím odstavci definuje grafy tak, jak je to v matematice obvyklé - zcela abstraktně, poté však přesnost výkladu omezuje na podporu názornosti.

2.5.1.1 Definice grafu

Mějme konečnou množinu V; její prvky nazývejme vrcholy nebo také uzly; množina V je tedy množina vrcholů nebo také množina uzlů. Mějme konečnou množinu E; její prvky nazývejme hrany. Množina E je tedy množina hran. Označme ve shodě s předchozími kapitolami

V2 = V × V = { [u,v] | u V v V }
V2 = V * V = { {u,v} | u V v V }
V2 je tedy kartézský součin (= množina uspořádaných dvojic) vrcholů, uzlů z V. V2 je množina všech dvouprvkových množin (= neuspořádaných dvojic), jejichž prvky jsou vrcholy, uzly z V. Označme dále
J = VxV V*V = V2 V2
(konečnou) množinu, jejímiž prvky jsou všechny uspořádané dvojice vrcholů, uzlů (prvky VxV) a všechny neuspořádané dvojice vrcholů, uzlů (prvky V*V). Označme konečně F zobrazení
F: E J
Je-li tedy eE hrana jakožto vzor v zobrazení F, je F(e)=vJ buď uspořádaná dvojice vrcholů (uzlů) nebo neuspořádaná dvojice vrcholů (uzlů) jakožto obraz ve zobrazení F. Zobrazení F nazývejme zobrazení incidence. Definice: Trojici G = (V,E,F), kde V je množina vrcholů (uzlů), E množina hran a F zobrazení incidence, nazýváme grafem; v některých literaturách se také používá termínu obecný graf.

Pro lepší pochopení uveďme nyní obrázek 2.1 (zřejmě nejnázornější a také nejpoužívanější vizualizaci grafu) a na něm objasněme podanou definici.

Obr. 2.1: Příklad grafu

Je až s podivem, že něco tak zřejmého, jako je na obrázku 2.1, může mít tak nepochopitelnou definici. Ta má však své důvody - teorie grafů totiž vznikla na základě potřeby zobecnit a formalizovat právě taková schémata, jako jsou na obrázku. Může jít např. o schémata dopravních cest, závislosti činností, rozvod energií apod. Právě z tohoto "zpětného" aspektu se podívejme na definici grafu.

Především máme uzly, z nichž některé jsou propojené (některé jednosměrně). To je tedy množina V uzlů zde znázorněna kruhy se symboly 15. Úsečky ag, z nichž některé mají koncovou šipku, pak tvoří jinou množinu - v definici označenou jako množina E hran.

Pro hrany je však typické, že vždy "spojují" dva uzly, každá hrana právě dva uzly. Pro popis, které dva uzly spojuje která hrana, je zavedena především množina uspořádaných dvojic (kartézský součin V×V, v definici označený V2). Prvkem tohoto součinu je např. dvojice [1,2] a také dvojice [1,3] (obojí v tomto pořadí!). Uzly 1 a 5 spojeny nejsou, uzly 1 a 3 však ano - úsečkou c s naznačenou orientací: vychází z 1 a končí v 3. Lze tedy říci, že hrana c inciduje s vrcholy 1 a 3 (v tomto pořadí), obdobně hrana e s vrcholy 3 a 4 (opět v tomto pořadí). To však odpovídá tomu, že je definováno zobrazení z množiny hran do množiny uspořádaných dvojic vrcholů a protože záleží na pořadí vrcholů, má smysl mluvit o orientaci: hrana je orientována z jednoho vrcholu (počátečního) do jiného (koncového). V případě např. silniční sítě může jít o jednosměrné ulice.

Na druhé straně u jiné hrany (např. b) orientace naznačena není. Jistě např. v silniční síti lze některými ulicemi projet tam i zpět. Nelze tedy jeden vrchol nazvat počátečním a jiný koncovým. Proto byla zavedena množina dvouprvkových množin vrcholů - v definici označena V2. Hrana b pak inciduje nikoliv s uspořádanou dvojicí [1,2], ale s dvouprvkovou množinou, která je evidentně rovna množině {1,2}. To však odpovídá tomu, že je definováno zobrazení z množiny hran do množiny dvouprvkových množin vrcholů. Protože nemá smysl používat termíny počáteční a koncový, zavádí se zde pojem krajní uzly hrany.

Pro jednotnou definici incidence hran s vrcholy je proto požadováno zobrazení do množiny sjednocující jak uspořádané dvojice vrcholů, tak ("neuspořádané") dvouprvkové množiny vrcholů - a to je množina J z definice.

2.5.1.2 Hrany, uzly

Teorie grafů dále definuje řadu pojmů používaných pro popis vlastností grafů. Bez nároku na exaktnost uveďme některé z nich - často mají pojmy zcela názorný význam:

V obecném grafu může zobrazení incidence F přiřazovat dvěma nebo více různým hranám stejnou dvojici vrcholů (uzlů). Zobrazení tedy nemusí být prosté. Různé hrany, které jsou zobrazeny na stejnou dvojici vrcholů (uzlů), se nazývají rovnoběžné (paralelní) hrany. Množinu všech e E takových, že F(e) V2 nazýváme množinou neorientovaných hran grafu G a její prvky neorientované hrany. Množinu všech e E takových, že F(e) V2 nazýváme množinou orientovaných hran grafu G a její prvky orientované hrany. Množinu všech e E takových, že F(e) { {v,v} | v V } nazýváme množinou neorientovaných smyček grafu G a její prvky neorientované smyčky. Množinu všech e E takových, že F(e) { [v,v] | v  V } nazýváme množinou orientovaných smyček grafu G a její prvky orientované smyčky. Pokud množina E obsahuje pouze neorientované hrany a neorientované smyčky, nazývá se graf G neorientovaný graf. Pokud množina E obsahuje pouze orientované hrany a orientované smyčky, nazývá se graf G orientovaný graf.

Buď e E orientovaná hrana. Je tedy F(e)=[u,v] V2. Vrchol (uzel) u nazýváme bezprostředním předchůdcem (také rodičem) vrcholu (uzlu) v. Vrchol (uzel) v nazýváme bezprostředním následníkem (také potomkem) vrcholu (uzlu) u. Krajní vrcholy (uzly) neorientované smyčky jsou totožné. Počáteční a koncový vrchol (uzel) orientované smyčky jsou totožné. Počet hran, jimž je vrchol (uzel) v neorientovaného grafu G krajním vrcholem, se nazývá stupněm vrcholu (uzlu) v. Počet hran, jimž je vrchol (uzel) v orientovaného grafu G počátečním vrcholem, se nazývá výstupním stupněm vrcholu (uzlu) v. Počet hran, jimž je vrchol (uzel) v orientovaného grafu G koncovým vrcholem, se nazývá vstupním stupněm vrcholu (uzlu) v.

2.5.1.3 Sledy, vzdálenosti, souvislost

Nechť G = {V, E, F} je neorientovaný graf. Nechť v0, v1, ... , vn-1, vn jsou vrcholy (uzly) z V. Nechť h1, h2, ... , hn jsou hrany z E takové, že F(hi) = {vi-1,vi} pro všechna i <1,n>. Pak posloupnost s=[v0, h1, v1, ... , hn, vn] se nazývá (neorientovaným) sledem mezi vrcholy (uzly) v0 a vn. Říkáme také, že v0 a vn jsou dostupné, nebo že v0 (vn) je dostupný z vn (v0). Nechť G = {V, E, F} je orientovaný graf. Nechť v0, v1, ... , vn-1, vn jsou vrcholy (uzly) z V. Nechť h1, h2, ... , hn jsou hrany z E takové, že F(hi) = {vi-1,vi} pro všechna i <1,n>. Pak posloupnost s=[v0, h1, v1, ... , hn, vn] se nazývá orientovaným sledem mezi vrcholy (uzly) v0 a vn (v tomto pořadí!). Říkáme také, že v0 a vn jsou orientovaně dostupné, nebo že vn je orientovaně dostupný z v0. Neorientovaný sled, v němž se každá hrana vyskytuje jen jednou, se nazývá cesta. Cesta, v níž se každý vrchol (uzel) vyskytuje jen jednou, se nazývá prostá cesta. Platí-li pro prostou cestu s=[v0, h1, v1, ... , hn, vn] rovnost v0=vn, nazývá se taková prostá cesta kružnice. Orientovaný sled, v němž se každá hrana vyskytuje jen jednou, se nazývá dráha. Dráha, v níž se každý vrchol (uzel) vyskytuje jen jednou, se nazývá prostá dráha. Platí-li pro prostou dráhu s=[v0, h1, v1, ... , hn, vn] rovnost v0=vn, nazývá se taková prostá dráha cyklus.

Počet hran ve sledu (cestě, dráze, kružnici, cyklu) se nazývá délkou sledu (cesty, dráhy, kružnice, cyklu). Je zřejmé, že existuje-li mezi dvěma uzly sled, může mezi nimi existovat sledů více. Každý z těchto sledů má jistou délku. Mezi těmito délkami (což jsou přirozená čísla) jistě existuje jedna nebo více délek s nejmenší hodnotou. Jsou to délky nejkratších sledů. Nechť G je orientovaný graf. Nechť u a v jsou uzly takové, že existuje sled z uzlu u do uzlu v. Pak délku libovolného nejkratšího sledu z uzlu u do uzlu v nazýváme vzdáleností z uzlu u do uzlu v. Nechť G je neorientovaný graf. Nechť u a v jsou uzly takové, že existuje sled mezi u a v. Pak délku libovolného nejkratšího sledu mezi uzly u a v nazýváme vzdáleností mezi uzly u a v.

Existuje-li pro libovolné dva uzly u a v grafu G sled, pak graf G se nazývá souvislý graf. Graf z příkladu shora není souvislý, protože např. mezi uzly A a E neexistuje sled.

2.5.2 Popis grafu

Popsat (definovat) graf G znamená popsat (definovat) každý element trojice V, E a F. Způsob popisu množin V a E je diskutován v předchozí kapitole, stejně jako definice funkce. Uveďme příklad popisu (definice) grafu G takovým způsobem:

G = {V, E, F}
V = { 1, 2, 3, 4, 5 }
E = { a, b, c, d, e, f, g }
F = { [a,{1,2}], [b,[1,2]], [c,{1,3}], [d,{3}], [e,[3,4]], [f,{2,4}], [g,[4,5]] }
Tato definice grafu je sice exaktní, ale pro složitější grafy se stává velmi nepřehlednou. Proto se často používá shora použité "obrazové" znázornění grafu. Shora definovaný graf G je např. popsán obr. 2.2.

Obr. 2.2: Příklad nesouvislého grafu

Grafy však můžeme popsat i pomocí matice sousednosti nebo pomocí incidenční matice.

Matice sousednosti je matice, ve které řádky a sloupce odpovídají uzlům. Platí že, aij=1, je-li mezi Ui a Uj hrana, aij=0, není-li tomu tak. Matice sousednosti odpovídající předchozímu grafu může být taková, jaká je uvedena v tab. 2.3 (pro větší názornost nejsou nulové hodnoty vepsány).

Tab. 2.2: Matice sousednost k obr. 2.2

1 2 3 4 5
1 1 1
2 1 1
3 1 1
4 1
5

Zavedení matice sousednosti umožňuje výhodná rozšíření při jejím použití. Plně však odpovídá pouze neorientovaným grafům bez rovnoběžných hran. Matice sousednosti lze však zavést i pro orientované grafy tak, že na uzly umístěné svisle pohlížíme jako na počáteční a na uzly umístěné vodorovně jako na koncové - opět pouze bez rovnoběžných hran. Prvek aij matice je pak roven 1, jestliže existuje hrana mající Ui za počáteční a Uj za koncový vrchol. Taková matice obecně není symetrická. Dále může být maticí sousednosti vyjádřeno ohodnocení (viz dále). Prvek aij pak je roven ohodnocení hrany UiUj. - a to jak pro neorientované (symetrická matice), tak pro orientované grafy.

Incidenční matice je obdélníková matice, ve které sloupce jsou uzly a řádky hrany. Platí, že aij = 1, je-li hrana hi incidentní s Uj, není-li, pak hodnota se rovná 0.

2.5.3 Les, strom

Neorientovaný graf bez kružnic se nazývá les (obr.2.3). Souvislý les se nazývá strom. Orientovaný graf ze nazývá orientovaným lesem, právě když graf vzniklý jeho dezorientací je lesem. Orientovaný graf ze nazývá orientovaným stromem, právě když graf vzniklý jeho dezorientací je stromem.

Poznámka:
terminologie (les, strom) vznikla z pohledu na "obrázkové" znázornění grafu. Následující obrázek vpravo ukazuje graf, který je lesem ("má dva stromy"):

Obr. 2.3: Graf, který je lesem

2.5.4 Ohodnocené grafy

Množství informatických aplikací pracuje s ohodnocenými grafy. Hranově ohodnocený graf je takový, kde každé hraně je přiřazen prvek množiny hodnocení. Uzlově ohodnocený graf je takový, kde každému uzlu je přiřazen prvek množiny hodnocení. V naprosté většině praktických aplikací jsou hrany a vrcholy (uzly) ohodnoceny numericky. Množinou hodnocení je pak množina všech reálných čísel, případně pro konkrétní úlohy množina racionálních, celých nebo i jen přirozených čísel. Pro jeden graf může existovat více než jedno uzlové a (třebas i současně) jedno či více hranových ohodnocení.

Důležitou aplikací v teorii grafů je např. hledání minimální kostry grafu v daném ohodnocení.

Obr. 2.4: Graf a jeho kostry

Příklad:
Ve vodním hospodářství tomu odpovídá následující – velmi idealizovaná - úloha: Z nově budovaných výrobních míst je zapotřebí odvádět použitou vodu (tj. vybudovat např. kanalizační síť). Technické podmínky i tvar terénu dovolují propojit jednotlivá místa jen podle připojeného plánku; na něm jsou také vyznačeny ceny v [mil.Kč] výstavby jednotlivých úseků (viz obrázek s řešením dole). Je zapotřebí nalézt nejlevnější vedení sítě.Otázku je možno mírně přeformulovat tak, aby se přiblížila teorii grafů: Kolik peněz je minimálně zapotřebí, aby z libovolného místa bylo možno odvést použitou vodu – jinak řečeno, aby každé místo bylo "kanalizačně dostupné" z libovolného jiného místa? Maximální možná síť odpovídá souvislému neorientovanému ohodnocenému grafu. Hledáme jeho podgraf, který jistě nebude obsahovat kružnice (vypuštěním jedné hrany kružnice se dostupnost míst nezmění, ale zlevní se výstavba).
Pro nalezení minimální kostry byla publikována řada algoritmů. Příklad aplikace jednoho z algoritmů na graf míst uvedený na obr.2.5 a možných vedení kanalizace dává jako výsledek kostru, která je vyznačena tučnými hranami. Posloupnost hran seřazených podle ohodnocení (v závorce je ohodnocení cenou) je např. tato: HO(2), CH(4), CO(5), EO(5), BC(5), AH(5), AB(6), GO(7), EF(8), FG(8), CE(9), AG(10), DC(12), EG(12)

Obr. 2.5: Hledání minimální kostry

Nejprve podle algoritmu zařadíme hranu HO, pak CH. CO však nezařadíme, protože by vznikla kružnice CHOC. Dále zařadíme EO, BC, AH, ale ne AB, protože by vznikla kružnice ABCHA – atd. Nalezená minimální kostra má součet ohodnocení hran (tj. minimální cena výstavby je) 48 [mil.Kč].

2.5.5 Kořeny, listy a zdroje

Nechť v V(G) je vrchol orientovaného grafu G. Řekneme, že v je kořen grafu G, jestliže každý vrchol grafu G je orientovaně dostupný z vrcholu v. Nechť v V(G) je vrchol orientovaného grafu G. Řekneme, že v je list grafu G, jestliže vrchol v grafu G nemá bezprostředního následníka. Nechť v V(G) je vrchol orientovaného grafu G. Řekneme, že v je zdroj grafu G, jestliže vrchol v grafu G nemá bezprostředního předchůdce.

Poznámka:
Má-li orientovaný graf jediný kořen, je tento kořen zdrojem (a naopak). Má-li orientovaný graf více kořenů, nemá zdroj (a naopak).
Definice kořene uvedená shora nevylučuje, aby graf měl více kořenů (v tom případě obsahuje graf alespoň jeden cyklus), jak to ukazuje obrázek 2.5; tento graf nemá zdroj: Orientovaný graf, který je stromem a má kořen, se nazývá kořenový strom. Velká skupina praktických úloh se opírá právě o kořenové stromy. Některé vlastnosti kořenových stromů je možno vyjádřit následující větou: Věta: Nechť G=(V,E,F) je orientovaný graf s n vrcholy (uzly). Pak následující tvrzení jsou ekvivalentní:

Důsledek: Kořenový strom má zdroj, a to jediný.

Poznámka:
Výrok předchozí věty, že např. "tvrzení 1 je ekvivalentní tvrzení 4" se lépe čte takto: (Graf G je kořenovým stromem) právě tehdy, když (Graf G má kořen a neobsahuje kružnici).
Uvedená věta dovoluje jednak lehce rozhodnout, je-li daný graf kořenovým stromem, jednak umožňuje sestavit algoritmy např. pro vyhledání kořenového stromu s daným vrcholem.

2.5.6 Poznámky ke grafům

Tezaurus si můžeme představit jako strom, jehož vrcholy odpovídají termínům (deskriptorům) a hrany (větve) sémantickým souvislostem mezi termíny. Ve skutečnosti je problém složitější, obvykle nevystačíme jen se vztahy precedence a následnosti, ale využíváme i vztahy průniku a sjednocení .

Příklad:
Mezinárodní desetinné třídění představuje stromové klasifikační schéma, např. "vrtný průzkumu" lze vyjádřit stromem s jednoznačným sledem od uzlu 550.822 k uzlu 5: 550.822 vrtný průzkum 550.82 průzkumné metody 550.8 aplikovaná geologie 550. pomocné vědy geologické 55 vědy o Zemi 5 přírodní vědy
Nejnázornějším a nejpoužívanějším stromem je pro uživatele PC adresářová struktura na diskově orientovaných mediích.

2.6 Základy matematické statistiky a geostatistiky

Úvodem je třeba upozornit, že existují určité rozdíly mezi klasickou matematickou statistikou a analýzou geodat pomocí statistických a geostatistických postupů, které vyplývají z vlastností přírodních objektů a z reálných možností jejich zkoumání. Prakticky vždy hodnocení vychází z nehomogenních souborů dat (důsledek různých nositelů - vzorků), které velmi často představují smíšené statistické distribuce. Veličiny, které charakterizují zkoumané objekty, často nejsou statisticky nezávislé. Přírodní objekty se vyznačují zastoupením strukturální i náhodné složky v prostorovém rozmístění hodnot veličin. Lze zkoumat jen v omezeném rozsahu a to vzhledem k dostupnosti a také k nákladnosti geovědních prací. Cíle analýzy a modelování jsou velmi odlišné podle typu objektů a řešeného problému. Uvedené aspekty ovlivňují možnosti a postupy statistické a geostatistické analýzy geodat.

2.6.1 Teorie pravděpodobnosti

Teorie pravděpodobnosti se zabývá studiem hromadných jevů, tj. jevů, které se za určitého komplexu podmínek vyskytují opakovaně ve velkém počtu. Jev představuje přesně vymezenou skutečnost jako výsledek pokusu (experimentu nebo pozorování). Jevy se dělí na jisté (I), nemožné (O) a náhodné (A, B, C, ...). Teprve při hromadném výskytu náhodných jevů se projevují jisté zákonitosti popisované jejich distribucí. To umožňuje odhadovat charakteristické hodnoty (parametry distribucí), předvídat výskyt dalších jevů apod.

Pravděpodobnost P(A) jevu A vyjadřuje kvantitativně možnost jeho uskutečnění. Základní požadavky zobrazení uvádí axiomatická definice pravděpodobnosti:

P(A)≥0, P(I)=1, P(A+B)=P(A)+P(B)
Z těchto axiomů lze odvodit další vlastnosti pravděpodobnosti
P(O)=0, P(A)=1-P(A), 0≤P(A)≤1
(A je jev opačný jevu A). Axiomatická definice neudává, jak lze pravděpodobnost jevů zobrazit na reálná čísla. Návody vyplývají z definic pravděpodobnosti.
  1. Klasická definice pravděpodobnosti: je-li v jevovém poli n elementárních jevů {E1,E2,...,En}, které jsou za daných podmínek stejně možné, tj. P(E ) = 1/n a rozpadá-li se jev A na m elementárních jevů (počet příznivých případů), m = n, pak pravděpodobnost jevu A je
    P(A) = m / n
    Příklad:
    Při průzkumu rudního ložiska bylo odvrtáno 23 vrtů, z nichž 4 zastihly průmyslové zrudnění. Pravděpodobnost výskytu využitelných rud bude P(R) = 4/23 = 0.17
  2. Geometrická definice pravděpodobnosti: je-li jev A modelován geometrickou oblastí GA, která je podmnožinou oblasti GI (modelu jistého jevu I), je pravděpodobnost, že po pokusu nastane jev A
    P(A)=|GA|/|GI|
    kde |GA|,|GI| jsou míry oblastí.
    Příklad:
    předpokládáme-li v průzkumné oblasti o ploše 10 km2 výskyt ložiska A modelovaného na povrchu elipsou o rozměrech 500 x 200 m, tj. o ploše cca 78 500 m2, pak pravděpodobnost jeho zastižení bude za předpokladu ploch jako měr oblastí
    P(A) = 78500 / 107 = 0.008
  3. Stochastická definice pravděpodobnosti: nastane-li po n provedených pokusech jev A fn-krát, bude pravděpodobnost jeho výskytu
    Jestliže se náhodný jev A vztahuje jen k určitému systému podmínek, pak se jedná o pravděpodobnost nepodmíněnou.V případě, že závisí ještě na dalším podmiňujícím jevu
    B, jde o pravděpodobnost podmíněnou P(A|B), jejíž hodnota
    Je-li A nezávislý na jevu B, pak platí, že P(AB) = P(A) × P(B)
    (věta o násobení pravděpodobností). V opačném případě bude
    P(AB) = P(A | B) × P(B) = P(B | A) × P(A)
    V případě sčítání pravděpodobností platí, že
    P(A+B) = P(A) + P(B) - P(AB).

2.6.2 Náhodná veličina

Lze-li náhodný jev popsat reálným číslem nebo mu číslo přiřadit, pak se toto číslo nazývá hodnotou (realizací) náhodné veličiny (proměnné) U. Množina těchto čísel tvoří obor možných hodnot náhodné veličiny. Náhodné veličiny se obvykle rozdělují na:

  1. diskrétní, které nabývají konečný počet nebo nejvýše spočetně mnoho hodnot z oboru možných (např. počet známých ložisek v rudním revíru),
  2. spojité, které mohou nabývat všech možných hodnot z ohraničeného či neohraničeného intervalu (např. obsah užitkové složky v rudě).

Přes nahodilost realizace podléhají náhodné veličiny určitým zákonitostem, které vyjadřuje zákon rozdělení náhodné veličiny U. U diskrétních veličin je plně popsán pravděpodobností jednotlivých hodnot (obr. 2.6 - A), tj. funkcí

p(u) = p(u=ui),
u spojitých veličin hustotou pravděpodobnosti f(u) ≥ 0, jejíž integrací v intervalu <ua,ub> získáme pravděpodobnost, že náhodná veličina nabývá hodnoty v tomto intervalu (obr. 2.6- B)

Představu náhodné veličiny lze dále zobecnit na vícerozměrnou náhodnou veličinu, tj. m-rozměrný vektor, jehož prvky jsou náhodné veličiny.

Vedle hustoty pravděpodobnosti (frekvenční funkce) se používá distribuční funkce F(ub), která udává pro každé ub pravděpodobnost nerovnosti u=ub. V případě diskrétních veličin bude

 a u spojitých veličin

 Body na číselné ose, ve kterých nabývá distribuční funkce jisté zvolené hodnoty, se nazývají kvantily

F(u[q]) = P(U=u[q]) = q .

Obr. 2.6: Hustota pravděpodobnosti diskrétní (A) a spojité (B) veličiny

Funkce, které popisují rozdělení pravděpodobnosti náhodné veličiny U, jsou složité a neposkytují jednoduchou koncentrovanou informaci. K tomu slouží parametry rozdělení, které stanovují polohu rozdělení (očekávanou hodnotu, střední hodnotu) E(U) a rozptýlení hodnot kolem ní D2(U). Je třeba mít na paměti, že odhad střední hodnoty a rozptýlení musí vycházet z charakteru statistické distribuce příslušející pozorováním. Střední hodnota diskrétní veličiny je

 a spojité veličiny

,

kde a,b jsou meze definičního oboru veličiny U. Další parametry lze odvodit pomocí počátečních Mk a centrálních mk momentů k-tého řádu

Mk = E(Uk), mk = E([U-E(U)]k).
Důležitý je centrální moment 2. řádu, který se nazývá rozptyl. Vyjadřuje míru kolísání hodnot náhodné veličiny kolem střední hodnoty. V případě diskrétní veličiny je

a u spojité veličiny

.

Odmocnina z rozptylu se nazývá směrodatná odchylka D(U). Dále lze stanovit normované momenty k-tého řádu mk, ze kterých se běžně používá koeficient asymetrie A a koeficient špičatosti (excesu) E

A = m3 = m3 / m23/2
E = m4 - 3 = m4 / m22 - 3 .
Poznámka:
je zřejmé, že hustota pravděpodobnosti f(u) je definována jako derivace distribuční funkce F(u) podle proměnné u (pokud derivace existuje).

Dále jsou uvedeny hustoty pravděpodobnosti vybraných typů distribucí náhodných veličin (a je parametr polohy, b2 parametr rozptýlení).

  1. Hustoty pravděpodobnosti diskrétních veličin.
    Rovnoměrné rozdělení R(U;n) p(u) = 1/n ; u = u1, u2, ..., un ; n přirozené
    Alternativní rozdělení A(U)
     
    Binomické rozdělení Bi(U;n,p)
    ; u=0,1,...,n; n přirozené; p(0,1)
    Poissonovo rozdělení Po(U;a)
    ; u=0,1,2,...; a>0
  2. Hustoty pravděpodobnosti spojitých skalárních veličin
    Rovnoměrné rozdělení R(U;a,b)
    f(u)=1/(b-a);u<a,b>;a<b

    Normální rozdělení
    N(U;a,b2)
    ;uR;b>0

    Logaritmicko-normální rozdělení LN(U;a,b2)
    ; u>0; b>0
    Exponenciální rozdělení Ex(U;a)
    f(u) = a×exp(-a×u) ; u≥0; a≥0
  3. Hustoty pravděpodobnosti spojitých vektorových veličin:
    Rovnoměrné rozdělení na kružnici R(φ)
    f(φ) = 1/(2π) ; 0<φ≤2π

    Kruhové normální von Misesovo rozdělení M(φ;μ,κ)
    ;0<φ≤2π; 0<φ≤2π; κ≥0
    J0(κ) je modifikovaná Besselova funkce 1. druhu nultého řádu (normalizační faktor) Fisherovo normální rozdělení na kouli F(φ,ψ;κ)
    ,
    kde φ je směr a ψ úklon i-tého vektoru, κ parametru koncentrace.

2.6.3 Náhodná funkce

Náhodnou funkcí se nazývá množina náhodných veličin {ψ(t)}, závislých na reálném parametru t v intervalu T. Je to tedy funkce, která nabývá při i-tém pokusu jistou konkrétní podobu ui(t), která se nazývá realizací náhodné funkce (obr.2.7).

Obr. 2.7: Realizace, střední hodnota a průsek náhodné funkce

Při určité hodnotě parametru (např. t1) získáme průsek náhodné funkce U(t1) a náhodná funkce přejde v náhodnou veličinu. Je-li náhodná funkce invariantní vzhledem k posunu času či polohy, nazývá se stacionární a v opačném případě evoluční. Parametr t se v teorii stochastických procesů označuje jako čas. V geovědách je parametrem nejčastěji poloha na přímce, v ploše či v prostoru. Náhodná funkce, jejímiž parametry jsou prostorové souřadnice X, Y, Z, se nazývá náhodné pole U(X,Y,Z).

Na rozdíl od parametrů náhodné veličiny představují parametry náhodné funkce rovněž funkce. Střední hodnota E[U(t)] náhodné funkce U(t) je nenáhodná funkce, která se při každé hodnotě parametru t rovná střední hodnotě odpovídajícího průseku. Je to tedy jistá "střední" funkce, kolem níž kolísají jednotlivé realizace ui(t). Na jejím základě lze zavést centrovanou funkci neboli pulsaci

U`(t) = U(t)-E[U(t)],
jejíž střední hodnota je nulová. Druhým hlavním parametrem náhodné funkce je rozptyl
D2[U(t)] = E(U(t)-E[U(t)])2,
tj. funkce, jejíž hodnota se pro každé t rovná rozptylu hodnot realizací odpovídajícího průseku. Charakter vnitřních vazeb mezi průseky náhodné funkce popisují strukturální funkce druhého řádu, mezi které náleží:

2.6.4 Vybrané pojmy matematické statistiky

Statistický soubor je konečná skupina pozorovaných hodnot jisté náhodné veličiny {u1,u2,...,un}. Hodnoty uspořádané do neklesající posloupnosti

u(1) u(2) ... u(i) ... u(n-1) u(n)
se nazývá variační řada o rozsahu n. Jako variační rozpětí se označuje délka intervalu <u(1),u(n)>. Počet případů nj výskytu hodnoty ui v souboru je absolutní a hodnota fj=nj/n relativní četnost. Hodnoty

jsou relativní kumulativní četnosti. Pro zjednodušení výpočtů a názornější grafické zobrazení souboru se používá třídní rozdělení četností. Spočívá v rozčlenění variačního rozpětí na zpravidla stejné intervaly - třídy - a nahrazení hodnot souboru náležejících do třídy zastupující hodnotou (zpravidla středem třídy) - třídním znakem. Počet hodnot ve třídě je třídní četnost. Třídní rozdělení četností se graficky zobrazuje histogramem nebo polygonem absolutních nebo relativních četností. Histogram a polygon četností představují empirickou frekvenční funkci, histogram a polygon kumulativních četností empirickou distribuční funkci. Vypovídací schopnost histogramu silně závisí na správné volbě počtu tříd, který by měl ležet v rozmezí 7 až 20. Stanovení počtu tříd vychází z variačního rozpětí, z počtu pozorování apod. Cílem statistického zpracování souboru je stanovení ukazatelů polohy (aritmetického průměru, mediánu apod.) a ukazatelů rozptýlení (rozpětí, rozptylu, směrodatné odchylky), které jsou definovány analogicky jako výběrové charakteristiky. U statistického souboru se dvěma a více argumenty se dále stanovují ukazatelé statistické závislosti (kovariance, koeficient korelace).

Množina všech možných hodnot náhodné veličiny, která může být konečná či nekonečná, se nazývá základní soubor (populace) s rozdělením pravděpodobnosti R(U;μ,σ2). Konstanty vyjadřující charakteristické vlastnosti základního souboru, se nazývají parametry nebo teoretické charakteristiky (střední hodnota μ, rozptyl σ2 atd.). Náhodný výběr je n nezávislých hodnot náhodné veličiny, vybraných ze základního souboru tak, aby výběr nebyl závislý na vlastnostech hodnoceného objektu a na subjektivní úvaze řešitele. Náhodné výběry se konvenčně dělí na výběry malé (n<30) a velké (n≥30). Náhodný výběr popisují výběrové charakteristiky polohy, rozptýlení apod., které jsou samy náhodnými veličinami, neboť závisejí na konkrétním výběru.

Úkolem statistické indukce je usuzovat z vlastností výběru na vlastnosti základního souboru. Přitom se kladou na bodové odhady parametrů, které jsou ve skutečnosti pouze a jenom jejich aproximací a jsou tedy zatíženy jistou chybou, určité požadavky. Za „dobrý” odhad považujeme takový, který vyhovuje požadavkům nestrannosti (tzn. střední hodnota diference odhadu a její chyby má být nulová), konzistence (s růstem rozsahu výběru roste pravděpodobnost, že se odhad blíží parametru), vydatnosti (jde o nejlepší nevychýlený odhad parametru) a robustnosti (odhad je stabilní i při ne zcela splněných požadavcích na pravděpodobnostní vlastnosti veličiny, je odolný proti vlivům odlehlých pozorování a proti chybám měření). Z uvedených důvodů se často používá intervalový odhad parametrů základního souboru - tzv. konfidenční interval, o kterém předpokládáme, že s předem zvolenou vysokou pravděpodobností (označovanou jako konfidenční koeficient) obsahuje odhadovaný parametr. Ve sféře geověd jsou intervalové odhady velmi užitečné vzhledem ke značnému stupni neurčitosti poznání přírodních jevů a rekonstrukce procesů jejich formování. Mají velký význam např. při hodnocení spolehlivosti výpočtů zásob nerostných surovin, technicko-ekonomických hodnoceních nebo při projektování průzkumných a těžebních prací.

Významnou součástí zpracování dat je testování statistických hypotéz. Pod statistickou hypotézou se rozumí jakýkoliv předpoklad o typu rozdělení pravděpodobnosti, o parametrech základního souboru, o charakteru závislostí náhodných veličin apod. Test statistické hypotézy je pravidlo, které na základě poznatků zjištěných z náhodného výběru umožňuje rozhodnout, zda má být ověřovaná hypotéza přijata (považována za možnou) nebo zamítnuta (považována za nepravděpodobnou). Nejde o důkaz platnosti či neplatnosti hypotézy! Při testu se rozlišuje hypotéza nulová H0 (testovaná) a hypotéza alternativní H1. Postup testování sestává z těchto kroků:

Při testování může podle obr. 2.8 vzniknout chyba I. druhu (zamítnutí správné nulové hypotézy) nebo chyba II. druhu (přijetí nesprávné nulové hypotézy).

Obr. 2.8: Druhy chyb při testování hypotéz

Vedle testování hypotéz na základě pevného rozsahu statistického výběru existuje odlišně přístup k testování hypotéz, který přináší sekvenční analýza. Základní myšlenkou sekvenčních metod je uskutečnit právě tolik pozorování, aby byl splněn požadavek určité předem zadané přesnosti odhadu nebo aby byla maximalizována přesnost při zadaných nákladech na pozorování. Takový přístup odpovídá realitě, neboť všechny průzkumy se provádějí sekvenčním postupem: v průzkumu se pokračuje, dokud se nenahromadí dostatek poznatků nutných pro rozhodnutí nebo dokud jsou finanční prostředky.

2.6.5 Geostatistická analýza dat

Termínem geostatistika označil Matheron (1963) aplikaci teorie náhodných funkcí na popis a oceňování přírodních objektů, které lze charakterizovat distribucí hodnot tzv. regionalizovaných - prostorových veličin (např. fyzikálních charakteristik, obsahu užitkových a škodlivých složek v ložiskovém tělese)

UK = fK(X,Y,Z) .
Uvedená definice prostorové proměnné má popisný charakter. Její přímé studium je prakticky nemožné a to jak z důvodu prostorové variability, tak pro omezené možnosti pozorování. Prostorová proměnná se obecně vyznačuje strukturním a náhodným aspektem, což lze postihnout pomocí pravděpodobnostní interpretace jako náhodného pole, kdy každou pozorovanou hodnotu uk1,uk2,...,ukn v bodech v1,v2,...,vn považujeme za realizaci tohoto pole. Očekávaná hodnota náhodného pole je
[Uk(X,Y,Z)] = mk(x,y,z)
a rozptyl
D2[Uk(X,Y,Z)] = E{Uk(X,Y,Z)-E[Uk(X,Y,Z)]}2.
Vzájemný vztah mezi hodnotami pole V v bodech vi,vj o souřadnicích (xi,yi,zi), (xj,yj,zj) vyjadřují strukturální funkce, z nichž je nejčastěji používán semivariogram
γk(vi,vj) = 1 E[Uk(vi)- Uk(vj)]2.
Není-li náhodné pole stacionární, pak je lze popsat výrazem
Uk(X,Y,Z)=E[Uk(X,Y,Z)+Rk(X,Y,Z)],
kde Rk(X,Y,Z) je funkce reziduí. Semivariogram je vektorová strukturální funkce, která popisuje závislost průměrné kvadratické diference hodnot prostorové proměnné veličiny U na velikosti vektoru h v poli V
,

kde ui,ui+h jsou hodnoty veličiny U ve vzdálenosti h. Experimentální semivariogram je empirická realizace určovaná z množiny pozorování u1,u2,...,un

kde m je počet dvojic pozorování v určitém směru objektem.

Experimentální semivariogram je pro návazné úvahy aproximován teoretickým modelem γ*(h). Modely semivariogramů se dělí do několika skupin a to na:

Jako příklad je dále uveden často se vyskytující sférický model s vysvětlením používané terminologie (obr.2.9).

Obr. 2.9: Terminologie popisu semivariogramu

Pomocí studia semivariogramů lze ocenit kontinuitu pole (dosahem u přechodových semivariogramů a koeficientem absolutního rozptylu u semivariogramů bez přechodu), nehomogenitu pole (podle oscilace prahu), nestacionaritu pole (podle parabolické deformace v oblasti prahu) a izotropii či anizotropii pole (vyhodnocením směrových semivariogramů).

Rovnice hlavních typů semivariogramů (použité označení odpovídá obr.2.10):Sférický semivariogram (Matheronův)

, a = 1.5 d

Exponenciální semivariogram (Formeryho)

γ*(h)=C0+C×[1-exp(-h/a)], a´≡3d
Gaussovský semivariogram
,

Logaritmický semivariogram (de Wijsův)

γ(h)=C0+k×ln h
Lineární semivariogram
γ*=C0+k×ha
Sinový semivariogram
, g=π/ω

kde ω je polovina periody, Cosinový semivariogram

γ*(h)=C0+C×[1-cos(g×h)]
Čistě náhodný semivariogram
γ*(h)=C0+C

V případě závislosti veličin Uk, Ul lze zobecnit představu strukturální funkce na koregionalizaci, tj. definování vzájemného semivariogramu

Základním úkolem geostatistiky je poskytnout odhady hodnoty veličiny v jistém bodě v0, elementární ploše δS či bloku δV studovaného náhodného pole V. Nejlepší odhad průměrné hodnoty u* veličiny U, který splňuje obecně požadované podmínky nestrannosti E(u*-u) = 0 a minimálního rozptylu D2(u*-u) = min, je určován z hodnot ui, (i=1,2,3,...,m) v okolí odhadu podle vzorce

za podmínky

.

V případě kvazistacionarity pole v okolí odhadu se váhy λi určí minimalizací rozptylu odhadu

kde A je odhadovaný element (bod, plocha, blok) a γ průměrná hodnota semivariogramu. Průměrné hodnoty semivariogramu se vypočtou podle vztahu

kde jeden konec vektoru (b-b´) popisuje nositel vb a druhý nositel vb' (obr. 2.10). Numerická aproximace je

b,b' jsou středy jistých úseků nositelů v a v'.

Obr. 2.10: Princip výpočtu průměrné hodnoty semivariogramu

Pomocí metody Lagrangeových multiplikátorů μ dostaneme po úpravách soustavu rovnic
ze které se určí hledané váhy. Rozptyl σK2 odhadu u* je
V případě bodového krigování, které je častým základem tvorby izoliniového modelu plochy, je postup analogický s tím, že krigovací soustava je

„0” označuje odhadovaný bod plochy. Není-li hodnocené pole stacionární, probíhá řešení analogicky s tím, že soustava rovnic se rozšíří o členy popisující drift. Soustava univerzálního krigování bude
, (i=1,2,...,n),
, (p=1,2,...,m)
a rozptyl krigování
kde člen
popisuje drift pomocí polynomu q-tého stupně. Dosud uváděné odhady vznikají lineárními kombinacemi hodnot studovaných proměnných. Vedle této lineární geostatistiky existuje řada postupů nelineární geostatistiky, které jsou založeny na odhadech jistých funkcí f[Uk(X,Y,Z)] studovaných veličin. Prakticky se uplatňují např. při oceňování vytěžitelných zásob nerostných surovin (indikátorové či disjunktivní krigování).

Indikátorové krigování vychází ze skutečnosti, že každou funkci f[Uk(X,Y,Z)] lze vyjádřit pomocí indikátorů. Je-li náhodnou funkcí proměnná, která nabývá konečný počet hodnot

U(X,Y,Z)=0,1,...,i,...,m,
indikátorová funkce (zkráceně indikátor) nabývá hodnot

Spojitou proměnnou lze převést na indikátorovou pomocí indikátorové funkce

Indikátorová proměnná je pak základem pro výpočet semivariogramu γI(h) a návazných odhadů krigováním

se soustavou

,
.

Disjunktivní krigování, které bylo vyvinuto pro řešení problému ocenění vytěžitelných zásob, je podle Davida (1988) teoreticky lepší metoda odhadu. Vyžaduje ale striktní stacionaritu náhodného pole. Cílem je získat podmíněnou distribuci dílčích jednotek pole reprezentovaných fyzickými body, kterou lze vyjádřit jako

,

kde Hi(U) jsou Hermitovy polynomy i-tého řádu a n+1 potřebný počet členů rozvoje,

,

h=n/2 pro n sudé a h=(n-1)/2 pro n liché. Každý koeficient Ci je odhadován nezávisle (proto název disjunktivní) řešením jednoduchého krigovacího systému

,

ve kterém váhy se určí řešením soustavy

, a=1,...,n,

kde je i-tá mocnina korelace mezi normalizovanými hodnotami vzorků a bloku a vzorků.

Obr. 2.11: Příklady využití krigování: A – výsledky blokového krigování; B - plocha modelovaná bodovým krigováním (Staněk, 1999)

Zásadní předností krigovacích postupů je skutečnost, že:

2.6.6 Prostředky pro statistickou a geostatistickou analýzu dat

Softwarový trh nabízí velké množství programových prostředků, určených pro statistickou a geostatistickou analýzu geodat. Vedle toho existuje řada volně dostupných softwarových produktů tohoto typu. Při výběru produktů je nutno jednak prostudovat jejich možnosti (tj. aplikované metody průzkumové, statistické a geostatistické analýzy a způsoby grafické prezentace), jednak uvážit vlastní požadavky a pochopitelně i finanční možnosti. Řada postupů je zabudována do jiných programových prostředků, jako jenapř. Surfer, produkty firmy Rockware apod.

2.7 Průzkumová analýza geodat

Je skutečností, že neexistuje jednotně a univerzálně použitelný návod pro analýzu dat. Jsou pouze známa pravidla a omezení, která je při zpracování nutno respektovat. Z tohoto důvodu se v posledních desetiletích začaly rozvíjet jednoduché popisné techniky (často empirické povahy), mezi které Tukey (1977) zahrnuje techniky pro ulehčení popisu dat a pro pochopení statistických souvislostí. Jde o průzkumovou analýzu dat, která vychází z velmi volných předpokladů (např. spojitost, existence momentů, derivovatelnost). Tato analýza využívá hlavně metody grafické analýzy a robustní metody založené na pořadových statistikách (kvantilové míry), které jsou definovány pomocí variační řady

u(1) ≤ u(2) ≤ ... ≤ u(i) ≤ ... ≤ u(n-1) ≤ u(n).
Cílem není ani tak popis dat, ale odhalení statistických zákonitostí v datech (např. utvoření předpokladu o možném typu statistické distribuce), resp. provedení úprav dat vedoucích ke zjednodušení návazného zpracování.

Průzkumová analýza dat je tedy jistý filozofický přístup, který naznačuje, jak analyzovat data, co v nich hledat a jak interpretovat zjištěné poznatky. Tyto myšlenky a postupy rozvíjela řada dalších autorů, např. Hoaglin et al. (1983), Velleman a Hoaglin (1981) atd.

2.7.1 Vizualizace dat

Základem postupů průzkumové analýzy je grafické zobrazení dat formou grafů rozptýlení, kvantilových grafů, krabicových grafů, grafů pro vyjádření stupně symetrie, grafů typu ”stromu s listy”, histogramů a polygonů četností, resp. i pravděpodobnostních grafů. Podle Hoaglina et al. (1983) jde v zásadě o zjištění:

2.7.1.1 Grafy rozptýlení

Nejjednodušším způsobem vizualizace dat je jejich vynesení na číselnou osu. Klasický graf rozptýlení, označovaný také jako bodový diagram, je v principu projekcí kvantilového grafu. Základní výhodou grafu je jednoduchost a kompaktnost, nevýhodou překrývání dat stejné hodnoty. Proto se body odpovídající stejným hodnotám vynášejí nad sebe (vznikají tak sloupečkové grafy) nebo se vynášejí náhodně v určitém zvoleném intervalu. Z grafů rozptýlení lze určit rozmezí a přibližně střed dat, lokální změny koncentrace dat, přibližně symetrii empirické distribuce a odlehlá pozorování.

2.7.1.2 Kvantilové grafy

Kvantilový graf znázorňuje průběh výběrové kvantilové funkce Qi(Pi), jejímž odhadem jsou pořadové statistiky ű(i) pro pravděpodobnost Pi= i/(n+1), resp. při malém výběru (n<30) Pi= (i-0.5)/n, kde i je pořadí hodnot u(i) ve variační řadě. Kvantilový graf se doplňuje obdélníky, které charakterizují oblasti vybraných kvantilů - kvartilů, oktilů a sedecilů (obr. 2.12). K jejich sestavení je třeba vypočítat potřebné kvantilové hodnoty podle vztahu

űp = (n+1)´[p-i/(n+1)] ´ (u(i+1)-u(i)) + u(i)
Kvantilové obdélníky jsou omezeny souřadnicemi: - kvartilový P0.25 P0.75 ű0.25 ű0.75 - oktilový P0.125 P0.875 ű0.125 ű0.875 - sedecilový P0.0625 P0.9375 ű0.0625 ű0.9375 Dále se na základě kvantilů vypočtou polosumy
Sp = 0.5 (űp + ű1-p)
a relativní šikmost empirické distribuce
Ap = (ű0.5 - Sp)/(űp - ű1-p)

Obr. 2.12: Kvantilový graf s kvantilovými obdélníky

Podle rozmístění kvantilových obdélníků a vývoje výše uvedených statistik lze odhalit základní statistické rysy hodnoceného výběru dat:

2.7.1.3 Krabicové grafy

Krabicové grafy (box plot) patří mezi základní techniky průzkumové analýzy. Jsou běžně používaným způsobem sumarizace dat a vizualizace základních charakteristik hodnoceného výběru, tj. polohy, rozptýlení, šikmosti a odlehlých pozorování. Při konstrukci krabicového grafu se nejprve určí medián ű0.5 a oba kvartily ű0.25 = QL a ű0.75 = QU. Dále se vypočítávají hranice vnitřních HL, HU a vnějších VL, VU hradeb

HL = QL - 1.5 (QU - QL)
HU = QU + 1.5 (QU - QL)
VL = QL - 3.0 (QU - QL)
VU = QU + 3.0 (QU - QL)
Uvnitř vnitřních hradeb leží tzv. přilehlá pozorování, mezi vnitřními a vnějšími hradbami tzv. vnější pozorování a mimo vnější hradby tzv. vzdálená pozorování. Nejjednodušší varianta krabicového grafu je obdélník omezený prvým a třetím kvartilem, ve kterém je čarou znázorněn medián a případně křížkem aritmetický průměr. V případě, že porovnáváme výběry s různými rozsahy, volí se výška obdélníku úměrná . Na obdélník navazují úsečky vymezující oblasti přilehlých pozorování. Vnější a vzdálená pozorování se znázorňují kroužky (obr.2.13-A). Variantu krabicového grafu představuje vrubový krabicový graf, ve kterém je vrubem znázorněn 95 % konfidenční interval mediánu (obr.2.13-B)

Obr. 2.13: Krabicový graf a vrubový krabicový graf (Honěk, Staněk, 1998)

2.7.1.4 Grafy pro vyjádření stupně symetrie

Symetrie rozdělení dat je důležitou charakteristikou výběrů. Pokud je rozdělení přibližně symetrické, lze snadno použít robustní metody odhadu parametrů rozdělení a provádět další statistické výpočty. Jednoduchý způsob posouzení symetrie je založen na transformovaných veličinách

vi = (u(n+1-i)- ű0.5), wi = (ű0.5 - u(i)), i = 1, ..., n/2.
Pokud je rozdělení dat symetrické, leží body {vi,wi} na přímce v = w.

2.7.1.5 Histogram četností

Běžně používaným postupem vizualizace empirických distribucí na základě třídního rozdělení četností je histogram (obr. 2.14). Vypovídací schopnost histogramu silně závisí na volbě počtu tříd, který by měl ležet v rozmezí 7 až 20. Vyhovující počet lze stanovit podle variačního rozpětí

h = 0.08 (umax - umin), k = int [(umax - umin )/h],
kde h je šířka a k počet tříd, nebo výhodněji podle rozsahu výběru např. podle vztahu
k = int [5 ln(n)], h = (umax - umin )/k,
nebo např. s ohledem na rozptýlení a rozsah výběru
h = 2 (QU - QL)/n1/3, k = int [(umax - umin )/h].

Obr. 2.14: A - histogram absolutních četností; B - histogram kumulativních relativních četností

2.7.1.6 Pravděpodobnostní graf

poskytuje jednoduchou možnost vizualizace empirické distribuční funkce a její porovnání s některou teoretickou distribucí. Jde v podstatě o kvantil-kvantilový graf, který využívá souřadného systému (u,up) v případě normální nebo (log u,up) v případě lognormální distribuce, kde up jsou probity, tj. upravené kvantily teoretické distribuce. Testovaná empirická distribuce se v případě shody s teoretickou zobrazí v grafu jako přímka (obr.2.15).

Obr. 2.15: Pravděpodobnostní graf

2.7.2 Robustní odhady statistických charakteristik

Robustní odhady statistických charakteristik jsou založeny na lineárních kombinacích kvantilů empirických distribucí. Pro ocenění charakteristiky polohy se vedle obecně známého mediánu Me, pro který platí, že P(ui = ű0.5 ) = 0.5, se používají další kvantilové odhady střední hodnoty. Velmi stabilní odhady poskytuje trimean

űT = (ű0.75+ 2ű0.5+ ű0.25)/4.
Mezi nejznámější a nejpoužívanější patří uřezaný průměr
,

kde g=int(n.α)+1, p=g-n.α, α se obvykle volí 0.1 (jde vlastně o aritmetický průměr). Podobně se určuje winzorizovaný průměr

,

kde

ud= (1-p)×u(g+1)+ p×u(g),
uh = (1-p)×u(n-g)+ p×u(n-g+1) .
Podle simulačních studií se v případě velmi malých výběrů doporučuje používat: - při n = 6 medián, - pro n = 7 winzorizovaný průměr (i=2,..6), - pro n = 8 uřezaný průměr s a = 0.25, - při možném výskytu odlehlých pozorování uřezaný průměr s a = 0.25÷0.4. Nejjednodušší, ale málo spolehlivou mírou rozptýlení je variační rozpětí
R = (umax - umin).
Vhodnější mírou jsou kvantilové odchylky
QSp = (ű1-p - űp)/2
(obvykle se používá kvartilová odchylka s p=0.25). Za předpokladu normálního rozdělení je odhad směrodatné odchylky
S = 0.741 (ű0.75 - ű0.25)
Kvantilová míra šikmosti (obvykle kvartilová s p=0.25) je
Ap = (ű1-p + űp - 2ű0.5) / (ű1-p - űp)
a míra koncentrace kolem mediánu
K = (űmax - űmin) / (ű0.75 - ű0.25)

2.7.3 Ocenění závislosti veličin

Předběžnou informaci o typu a charakteru závislosti veličin U a O, která je potřebná pro volbu postupu statistického zpracování, získáme z korelační tabulky a korelačního diagramu, ve kterém se může projevit i homogenita či heterogenita výběru pozorování. Těsnost vztahu lze jednoduše ocenit pomocí neparametrického Blomqvistova kritéria. (obr. 2.16). Rozdělíme-li korelační diagram rovnoběžkami s osami v mediánech obou veličin a označíme-li podle obr. 4.6 počet bodů v I. a III. kvadrantu n1 a počet bodů ve II. a IV. kvadrantu n2, pak mírou závislosti je veličina

q = (n1 - n2) / (n1 + n2),
jejíž hodnota leží v intervalu <-1,1>. Pokud má závislost mezi veličinami přímkový charakter, lze odhadnout parametry regresní přímky o = a+b.u pomocí kvartilů
b' = (ô0.750.25) / (ű0.750.25)
a' = ô0.5-b'* ű0.5

Obr. 2.16: Orientační ocenění těsnosti vztahu pomocí Blomqvistova kritéria

Na závěr je nutno uvést, že existuje řada dalších metod vizualizace dat a velké množství robustních statistik, založených na kvantilech empirických distribucí, které lze nalézt ve speciální literatuře. Poněvadž průzkumová analýza stále ještě není běžně využívána, bylo cílem této kapitoly ukázat, jak můžeme jednoduchými postupy získat první představu o zpracovávaných datech, na jejímž základě lze provést seriozní statistickou a geostatistickou analýzu dat. Proto také byly uvedeny alespoň některé vztahy pro určení robustních statistik.

2.8 Postupy statistické a geostatistické analýzy geodat

Ukazuje se, že z hlediska analýzy geodat je možno vyčlenit určité úlohy, které jsou společné různým typům geovědních problémů. Rodionov et al.(1973) je nazvali typové úlohy. Za hlavní můžeme považovat: popis typu statistické distribuce veličin, odhad středních hodnot a variability veličin včetně ocenění spolehlivosti odhadů, řešení problému odlehlých pozorování, ocenění a popis vzájemných vztahů veličin, analýzu struktury a popis průměrných charakteristik polí veličin a ocenění shody či rozdílů geologických objektů. Řešení těchto úloh je komplikováno jednak nestardandním charakterem geodat, jednak způsoby jejich sběru, tj. systémem pozorování (průzkumným systémem). Dále je věnována pozornost problémům, se kterými se v praxi setkáváme.

2.8.1 Statistická analýza

Jednou ze základních otázek statistického rozboru je studium charakteru statistické distribuce. Jen na základě správného popisu distribuce, který musíme prověřit pomocí testů shody, lze odhadnout statistické charakteristiky a realizovat statistické soudy. Při zpracování výsledků pozorování nejrůznějších veličin popisujících geologická tělesa se zjistilo, že značný počet jejich empirických distribucí nevyhovuje běžně uvažovanému normálnímu rozdělení N(U;μ,σ2), ze kterého také vychází většina statistických postupů, ale že vykazují více či méně asymetrickou distribuci (a to převážně kladně asymetrickou). Proto se pro popis využívají různé transformace veličin, např. obecná logaritmická v = ln(a+bu), která vede k velmi často používanému obecnému lognormálnímu rozdělení LN(U;μ,σ2,a,b), nebo obecná mocninná transformace

(Optimální hodnoty konstant použité transformace lze určit pomocí účelové funkce symetrizační nebo normalizační (obr. 2.17),

|A|→min, w×|A|+|3-K|→min,
kde A je šikmost, K koncentrace a w je váha volená tak, aby účelová funkce neměla více lokálních minim.

Obr. 2.17: Optimální transformace podle Box-Coxova principu

Při řešení praktických úloh se poměrně často setkáváme s případem cenzorování statistické distribuce, tj. podmíněného rozdělení veličiny U nabývající hodnot možných, jehož popis uvádí např. Hald (1949). To znamená, že určitý počet n0 pozorování ui z celkového počtu n hodnot leží pod mezí ma nebo nad mezí mb. Např. v chemických analýzách vzorků se vyskytují hodnoty označené symboly "0", "stopy", "<ma", ">mb" (ma je mez citlivosti a mb mez rozlišitelnosti analytické metody). Postup odhadu statistických charakteristik musí tuto skutečnost respektovat a to zejména v případech významnějšího zastoupení takovýchto hodnot.

Empirické distribuce mají často polymodální charakter, vyvolaný smíšením hodnot dvou nebo více základních souborů (např. hodnot normálního a anomálního chemického či fyzikálního pole, tj. hodnot horninového pozadí a lokální anomálie). Statisticky jde o smíšené rozdělení

f(u) = α1 f1(u) + α2 f2(u) + ... + αm fm(u) , kde αi jsou podíly a fi(u)
hustoty pravděpodobnosti jednotlivých distribucí. V případě bimodální distribuce odpovídající uvedenému příkladu jde o separaci a odhad charakteristik rozdělení R(U;μ121222,α) orientační grafickou metodou nebo metodou maximální věrohodnosti či momentovými metodami rozpracovanými Pearsonem (1894) a Raem (1952). Příklad využití momentových metod je uveden na obr. 2.18. Efektivnost momentových metod stoupá s rozsahem výběru a s růstem diference mezi průměry (Schejbal et al., 1976).

Obr. 2.18: Separace bimodální distribuce Zn v bilančních úsecích 6.-9. patra ložiska Horní Benešov (Schejbal et al.,1977)

Při posuzování výsledků pozorování se často setkáváme s výskytem hodnot, které se nápadně odlišují od ostatních. Tyto hodnoty jsou v geovědách známy pod označením extrémní (uraganní) hodnoty, ve statistice jako odlehlá pozorování. Vyloučíme-li případy hrubých chyb, pak před námi stojí problém posuzování reálných velmi nízkých nebo velmi vysokých hodnot, které přinášejí značné obtíže při odhadu statistických charakteristik (např. při výpočtu zásob značně variabilních rudních ložisek barevných a drahých kovů). Způsoby zpracování extrémních hodnot lze rozlišit na empirické (hodnoty jsou považovány za objektu vlastní nebo jsou jistým způsobem nahrazovány např. střední hodnotou, průměrem sousedních hodnot, nejvyšší ”normální” hodnotou apod.) a na matematicko-statistické, kdy jsou extrémní hodnoty vyčleňovány buď na základě kritérií odlehlých pozorování (např. Grubbsova testu či Dixonova kritéria) nebo pomocí separace smíšených distribucí. Problém reálných extrémních hodnot korektně a úplně řeší geostatistika v rámci variografie (efekt zbytkového rozptylu) a krigování (váha pozorování na odhad), jak je uvedeno v kapitole 2.4.

Reálné geologické objekty a procesy jsou popisovány řadou veličin U1, U2, ..., Um . Z teoretického i praktického hlediska nás zajímá, existuje-li mezi nimi určitý vztah, jaká je těsnost a forma vztahu. Tyto vztahy mají v převažující většině případů charakter statistické závislosti, kdy se se změnou hodnoty jedné veličiny mění podmíněná střední hodnota veličiny druhé nebo její rozptyl (skedastická závislost). Posouzení míry a formy závislosti veličin je náplní korelační a regresní analýzy, v případě studia veličin kvalitativní povahy asociační analýzy.

Běžně se studuje dvourozměrný statistický soubor N(U,V; μu, μv, σu, σv, σu,v), kde μu, μv jsou střední hodnoty, σu, σv směrodatné odchylky a σu,v je kovariance. Pro posouzení se nejčastěji používají parametrické míry závislosti, např. Pearsonův koeficient korelace, jehož použití vyžaduje splnění podmínek binormalitu rozdělení a existenci přímkové závislosti veličin. V případě odlišného typu distribuce je nutno provést vhodnou transformaci dat, aby byly splněny uvedené podmínky. Před věcnou interpretací výsledků je třeba vždy prošetřit statistickou významnost vypočtené hodnoty korelačního koeficientu. Obvyklou mírou těsnosti vztahu veličiny V na řadě jiných veličin U1, U2, ... ,Um je koeficient mnohonásobné korelace, který má podobné vlastnosti a podmínky použití, jako koeficient párové korelace.

Obecně lze doporučit využití metod pořadové korelace, které nejsou závislé na typu rozdělení a které umožnují analýzovat i semikvantitativní data a data s možným výskytem extrémních hodnot. Obvykle používanou mírou Spearmanův koeficient pořadové korelace Tyto míry mají jen velmi volné předpoklady použití a proto se při řešení geologických problémů dobře uplatňují.

Vedle těsnosti vztahu je pro řešení řady otázek nutno popsat i formu vztahu veličin. To umožňuje regresní analýza. Jejím cílem je popsat vztah mezi závisle proměnnou veličinou V a nezávisle proměnnými veličinami {U1, U2, ... }. Obecně používaný postup vychází z využití metody nejmenších čtverců. Při studiu statistické závislosti dvou veličin se často doporučuje stanovit obě možné regresní funkce V = f(U) a U = f(V), které v případě přímkové závislosti tvoří tzv. regresní nůžky, které při vysoké těsnosti vztahu se k sobě blíží. Dále je výhodné stanovit tzv. redukovanou hlavní osu regrese . Princip stanovení uvedených závislostí je zřejmý z obr.2.19.

Obr. 2.19: Princip odhadu regresních závislostí

V praxi často pracujeme s celou řadou veličin kvalitativní povahy, které lze členit do dvou či více kategorií. Často je užitečné posoudit a kvantifikovat jejich vztahy, resp. vztahy s veličinami kvantitativními, které je ale nutno pro tuto analýzu také přetransformovat na veličiny kvalitativní. To je náplní asociační analýzy.

Korelační a regresní analýza poskytuje při uvážlivém použití velmi efektivní nástroje studia struktury složitých přírodních objektů a procesů. Uvedené postupy totiž zkoumají a popisují pouze vnější formální vztahy, pod kterými se ale nemusejí skrývat reálné příčinné souvislosti. Formální vztah může být vyvolán definicí veličin, heterogenitou souboru dat, společnou závislostí na další veličině apod. Tedy sebesilnější statistické závislosti nemohou určit a objasnit příčinný vztah veličin. Idea příčiny musí vycházet z vlastní analýzy problému a z pečlivého posouzení výsledků (obr. 2.20). Při hodnocení statistických vztahů se totiž neustále pohybujeme mezi nebezpečím jejich přecenění nebo nedocenění, kdy je především nutno vyloučit možné zdánlivé vztahy, výstižně nazývané ”nonsense correlations”.

Obr. 2.20: Schéma logického rozboru výsledků analýzy závislostí

2.8.2 Popis polí geovědních veličin

Jednou ze základních úloh analýzy dat je popis struktury a modelování polí geologických veličin. Úkoly analýzy struktury pole pro potřeby modelování zahrnují popis kontinuity, homogenity či nehomogenity, stacionarity či nestacionarity a izotropie či anizotropie pole. Některé z těchto úkolů lze řešit pomocí statistických postupů (např. vymezení statisticky homogenních oblastí pole, studium anizotropie pole pomocí směrové analýzy variability apod.), komplexní řešení je založeno na geostatistické strukturální analýze, tj. na analýze semivariogramů, které v sobě obsahují všechny potřebné strukturální informace. Způsoby modelování geologických polí, které tvoří běžnou součást analýzy dat, lze podle použitého principu rozdělit do třech skupin.

2.8.2.1 Popis pole po kvazihomogenních úsecích

vychází z tradičního způsobu popisu zkoumaných geoobjektů v geologii. Studované pole se popisuje po úsecích, jejichž hranice lze určit podle věcných hledisek (např. hranic horninových komplexů, strukturně-tektonických jednotek, zón výrazných změn hodnot pole apod.). Po vymezení kvazihomogenních bloků je nutno prověřit statistickou homogenitu odpovídajících výběrů pomocí statistických kritérií a poté každý blok charakterizovat obvyklým statistickým způsobem, tj. odhadem středních hodnot Ej(Ui), rozptylů Dj2(Ui) a vzájemných vztahů veličin Ui, (i = 1,2,...,m) v každé j-té části pole.

2.8.2.2 Popis pole globálními funkcemi

Při popisu pole globálními funkcemi se považuje plošné nebo prostorové rozložení hodnot proměnné veličiny U za funkci polohy, tj. za regresní funkci plošných nebo prostorových souřadnic. Nejpoužívanější typ tzv. trendové analýzy je zpravidla založen na polynomickém mnohonásobném regresním modelu

kde φj jsou polynomické funkce souřadnic. Volba vhodného typu regresní rovnice představuje značný problém a řešení má dosti subjektivní ráz. Teoreticky by měla odrážet faktory, které kontrolují prostorovou distribuci hodnot studované veličiny (Whitten - Koelling, 1973). Prakticky se vychází z vizuálního porovnání výsledných trendových map se vstupními daty a s mapami reziduí a dále z vyhodnocení vhodných statistických ukazatelů přiléhavosti trendové plochy k experimentálním údajům (např. indexu mnohonásobné korelace a determinace, testu statistické významnosti členů regresního modelu, minimálního součtu kvadrátů odchylek apod.). Porovnávají se řešení při postupně zvyšovaném stupni polynomu podle uvedených kritérií, někdy pomocí tzv. mozaikového trendu (rozčlenění plochy na dílčí). Pro volbu „nejlepšího” tvaru regresní rovnice je nejvhodnější procedura kombinované krokové regrese. S rozvojem metod trendové analýzy se dospělo k poznatku, že při studiu jevů s oscilující povahou (např. zvrásněné plochy) je vhodnější použit trendový model typu harmonické, resp. polyharmonické funkce, která vedle základního trendu (střední hodnoty) umožňuje popsat i lokální periodické složky a charakter korelovatelnosti hodnot

2.8.2.3 Popis pole lokálními funkcemi

Lokální modely vytvářejí morfologii empirické křivky či plochy postupnou interpolací nebo aproximací pomocí funkcí, jejichž koeficienty jsou odvozeny z pozorování v dílčích úsecích pole. Často používané jsou procedury klouzavých průměrů a příbuzných aproximačních vzorců (např. Shepparových), které v podstatě náleží k metodám filtrace polí. Velmi rozšíženým postupem jsou metody inversních vzdáleností. Jde o vážené průměry, ve kterých vystupuje jako váha pozorování jistá mocnina τ převrácené hodnoty vzdálenosti di pozorování ui

kde ε→0 v závislosti na měřítku. použití uvedených postupů vznikají problémy vyvolané jednak anizotropií pole, jednak nerovnoměrným rozložením průzkumných bodů. Pro zabránění vlivu „shluků” pozorování se zavádějí různé omezující testy, zpravidla založené na výběru zvoleného počtu nejbližších pozorování a kvadrantových či oktantových výběrech. Vliv anizotropie pole lze eliminovat pomocí anizotropní oblasti výběru pozorování pro odhad.

Podobně se využívají splinové funkce, které se vyznačují hladkostí a minimální křivostí a které jsou schopny postihnout i velmi variabilní rozložení hodnot veličiny. Obvykle je využívána kubická funkce, kdy v každém úseku <xi, yj, xi+1, yj+1> je morfologie plochy dána funkcí

,

přičemž spojitost a hladkost se zajišťuje pomocí prvých a druhých derivací. Funkce musí splňovat podmínku

,

kde δu je chyba stanovení modelované veličiny a K minimalizační konstanta (při K=0 jde o interpolaci, při K>0 o aproximaci). Problém představuje stejně jako v případě krigování možná existence diskontinuit v ploše. Velmi úspěšné jsou krigovací metody, založené na teorii náhodných funkcí. Pro modelování ploch se aplikuje bodové krigování, jehož formulace je analogická jako v případě blokového krigování popsaného v kapitole 2.6. Zásadní předností tohoto postupu je skutečnost, že vychází ze strukturálních charakteristik pole (homogenity, anizotropie, stacionarity) a respektuje prostorové rozmístění míst pozorování.

2.8.3 Analýza příbuznosti geoobjektů

Velmi významnou součást analýzy geodat je hodnocení příbuznosti přírodních objektů. Obecně se jedná o klasifikační úlohu, kdy prověřujeme hypotézu o vzájemné shodě či rozdílu hodnocených objektů, hodnotíme shodu objektu s určitým typovým objektem či hledáme objekty sobě nejbližší. Nejjednodušším typem takovéto úlohy je klasifikace do dvou tříd. Úlohu můžeme samozřejmě rozšířit na případy porovnávání a klasifikace většího počtu objektů.

2.8.3.1 Základní statistické klasifikační postupy

se opírají o statistické testy různého typu, prověřující hypotézy o shodě rozptylů, středních hodnot, typu rozdělení apod. Při jejich používání je nezbytné respektovat podmínky aplikace, které jsou uváděny v každé učebnici matematické statistiky.

2.8.3.2 Multivariační klasifikační postupy

mohou při respektování podmínek použitelnosti mnohem úplněji popsat studované objekty s rozdíly mezi nimi. Např. studium petrochemické příbuznosti vyvřelých komplexů bude úspěšnější, bude-li využívat všech složek sledovaných při silikátové analýze, než studium založené pouze na jedné složce. Podobně vymezení komplexní geochemické anomálie je z hlediska lokalizace možného ložiska nadějnější, než posuzování anomálií jednotlivých prvků. Vícerozměrná náhodná veličina (náhodný vektor) U = {U1, U2, ..., Um} je charakterizována střední hodnotou (vektorem středních hodnot)

E(U)={E(U1),E(U2),...,E(Um)}
a kovariační maticí

jejíž diagonální prvku jsou rozptyly veličin U1, U2, ... , Um. Prošetření shodu nebo rozdílu výběrů popsaných vícerozměrnou veličinou může být založeno na ověření nulové hypotézy o shodě vektorů středních hodnot, o shodě kovariačních matic a konečně o shodě vektorů středních hodnot i kovariačních matic současně. Tyto hypotézy se ověřují pomocí různých kritérií, jako je např. Hottelingovo kritérium T2 o shodě průměrů, Mahalanobisova všeobecná vzdálenost D2 vážených průměrů či Kullbakovo kritérium pro ověření shody kovariačních matic.

Obecná analýza rozptylu

se používá k ověření hypotézy a shodě průměrů Ek(U) vícerozměrných veličin v k skupinách. Obdobně jako v případě jednofaktorové analýzy rozptylu se snaží popsat celkový rozptyl jako sumu rozptylu uvnitř skupin a mezi skupinami a ocenit jejich významnost.

Diskriminační analýza

je jednou z řady multivariačních klasifikačních technik, která umožňuje: zjistit rozdíly mezi hodnocenými objekty, které vytvářejí v m-rozměrném prostoru shluky , jejichž poloha je charakterizována multivariačním průměrem; stanovit hranice mezi skupinami objektů pomocí diskriminační funkce (nadplochy), která odděluje shluky; třídit další objekty pomocí stanovených hranic. To znamená, že pomocí diskriminační analýzy se řeší jednak problém existence a oprávněnosti odlišování tříd objektů, jednak klasifikace nových objektů do jedné z vymezených tříd (obr.2.10). Pro řešení konkrétního problému jsou při diskriminační analýze

D = f (U1, U2, ... , Um)
jsou využívány lineární, nelineární nebo i různé empirické funkce podle předpokládaného charakteru vztahů mezi třídami objektů.
Sdružovací (shluková, clusterová) analýza

zahrnuje velkou řadu procedur, které bez apriorního definování klasifikačních tříd podle určitého pravidla postupně sdružují objekty na základě jejich vzájemné podobnosti. Cílem je vytvoření struktury studovaného souboru objektů a klasifikace dalších. Sdružovací procedury mohou třídit objekty popsané jak kvantitativními, tak kvalitativními veličinami a vytvářet hierarchické či nehierarchické struktury objektů.

Hierarchické metody se dělí na metody sdružovací a metody nehierarchické. Sdružovací metody jsou rozšířenější, neboť výsledné grafické znázornění příbuznosti objektů dendrogramem (znázorňuje vztahy mezi skupinami) nebo dendrografem (postihuje i vztahy uvnitř skupin) je velmi názorné a snadno pochopitelné i pro toho, kdo není seznámen s matematickou podstatou metody (obr. 2.21). Nehierarchické metody vycházejí z počátečního rozkladu množiny objektů do k shluků a definovaných zárodků, tj. pro ně typických objektů nebo bodů ( např. těžišť). Počáteční rozklad je pak v iteračním procesu zlepšován pokud je to možno.

Obr. 2.21: Grafické znázornění hierarchického sdružování

Dosud uvedené metody sdružovací analýzy přiřazují objekty ke shlukům jednoznačně, což je často v rozporu s přirozenou povahou objektů, vyznačující se nejednoznačností. Proto se využívají metody fuzzy shlukování (Zadeh, 1965), ve kterých je příbuznost mezi objektem a shlukem vyjadřována pomocí funkce příslušnosti.

Je důležité zdůraznit, že sdružovací analýza je obdobně jako další klasifikační metody v podstatě empirická technika bez jednotného matematického základu. Zejména nejsou stanovena kritéria pro výběr vhodného algoritmu sdružování a pro prověření reálnosti vyčleněných skupin. Metody sdružovací analýzy jsou citlivé na odchylky od normality rozdělení a výskyt odlehlých pozorování (důsledek nutnosti počítat aritmetické průměry z hodnot proměnných, ze vzdálenosti objektů apod.). Proto se zavádějí postupy shlukování založené na odhadu středních hodnot pořadovými statistikami (nejčastěji mediánem).

Faktorová analýza

se používá pro řešení různých klasifikačních problémů a pro vytváření hypotéz o studovaném problému, objektu či jevu. Pojem „faktorová analýza” zahrnuje řadu variant, z nich jsou nejvíce používány metoda hlavních os - hlavních komponent. Cílem faktorové analýzy je zpracovat a redukovat matici dat U = {ui,j} s n pozorováními a m veličinami tak, aby vznikla co nejjednodušší struktura tzv. faktorů (obr. 2.22). V případě analýzy typu R, kdy n pozorování tvoří shluk v m-rozměrném prostoru proměnných, to jsou nové „hypotetické proměnné stojící v pozadí”, při analýze typu Q, kdy pozorování vytvářejí shluk m proměnných v n-rozměrném prostoru pozorování, jsou to „typy objektů”. Utvořená struktura musí obsahovat co největší množství informace obsažené v původních datech. Výsledkem faktorové analýzy je tedy buď vyseparování hypotetických faktorů nebo faktorových skóre.

Obr. 2.22: Princip odvozování hypotetických faktorů

2.9 Matematická statistika v dokumentografii

Značná část problémů, spojených se zpracováním průzkumných a vědeckých informací, se dá charakterizovat jako řešení problému zobrazit výsledky celého průzkumného programu, výzkumného úkolu, dokumentu apod. pomocí co nejmenšího počtu slov a jiných znaků (symbolů, čísel) a utvoření souhrnných závěrů. V oblasti zpracování výsledků pozorování a měření je situace zřejmá. Metody matematické statistiky jsou dnes široce využívány v průzkumné a ložiskové geologii, inženýrské geologii, hydrogeologii atd.

Matematicko-statistické metody se používají i v dokumentografii a bibliografii, zejména při automatickém indexování, metodě citačních vazeb, permutovaných rejstříků, tvorbě a aktualizaci tezauru apod. Při tom je přípravnou operací sestavení tabulky frekvence a pořadí slov v textu. Frekvenci slov a jejich pořadí vyjadřuje Zipfův zákon, podle kterého je frekvence a pořadí slova přibližně konstantní

F = C / Rg
F je frekvence (četnost) slova, R pořadí v tabulce frekvence, g a C jsou konstanty pro daný soubor. Obsah dokumentu ale necharakterizují slova s nejvyšší frekvencí! Nejfrekventovanější slova tedy patří mezi slova nevýznamová (spojky, předložky, zájmena), kdežto nositeli obsahu jsou podstatná jména, přídavná jména a slovesa.

Základní postupy knihovnické a informatické statistiky patří mezi techniky průzkumové analýzy a základní statistické analýzy dat. Typické úlohu jsou:

Obr. 2.23: Příklad grafické prezentace bibliografických údajů. Počet abstraktů z referátového časopisu INDEX 1986 (upraveno dle Königové et al., 1988)

Použití metod průzkumové a matematické statistiky vede ke snížení redundance (nadbytečnosti, obecnosti) informací ze zpracovávaného dokumentu a ke zvýšení relevance uživatelem požadované informace.

2.10 Principy studia, popisu a modelování geoobjektů

Geoobjekty představují z hlediska metodologie studia, popisu a modelování složitý špatně organizovaný systém, sestávající z relativně samostatných dílčích elementů, které jsou organizovány souhrnem vzájemných vazeb do určité, hierarchicky uspořádané prostorové struktury. Tato struktura je odrazem zpravidla velmi komplikovaných interakcí fyzikálních, chemických a biologických pochodů v průběhu procesů, které probíhaly v určité fázi vývoje jisté oblasti, např. geotektonické jednotky. To znamená, že v každém objektu, např. v horninovém tělese, musí existovat určitá zákonitost v prostorovém rozmístění hodnot veličin jej charakterizujících, která je ale komplikována řadou rušivých vlivů a elementů. Ty se projevují částečně jako nehomogenity na dané úrovni pozorování - tj. v určité průzkumné etapě - zjistitelné, částečně jako náhodné fluktuace. Nejobecnějšími vlastnostmi geoobjektů tedy budou:

2.10.1 Geoobjekty jako náhodné pole

Kterýkoliv geoobjekt si můžeme představit jako kvazihomogenní náhodné pole V, t.j. část geologického časoprostoru

{X,Y,Z,T; G1, G2, ... , Gn} ,
X,Y,Z jsou prostorové souřadnice, T čas, G1, G2, ... , Gn množina určujících veličin. Každému bodu v V o souřadnicích (x,y,z)přináleží určité hodnoty veličin U1, U2, ... , Um, které daný objekt charakterizují, např. obsahy chemických prvků, hodnoty fyzikálních či technologických veličin apod., tj.
vx,y,z V ukUk
přičemž platí, že uk = fk (X,Y,Z,T; G1, G2, ... , Gn) + ek , kde ek je náhodná složka. Obvykle se prostorové rozmístění hodnot veličiny Uk vyjadřuje jako jistá funkce prostorových souřadnic
Uk = fk (X,Y,Z) ,
přičemž mimo pole V nabývají alespoň ty veličiny Uk, na jejichž základě byl objekt definován, hodnot menších resp. větších, než určité mezní hodnoty εk (např. mezní mocnost nebo minimální obsah užitkového prvku v ložiskovém tělese).

Často se pro účely stanovení hranic objektu definuje geometrická funkce příslušnosti bodu v k tělesu V

Je-li potřebné popsat časové změny charakteristik objektů (např. při těžbě ložiska. při studiu hydrogeologických objektů či geodynamických jevů), použijeme vyjádření pomocí funkce prostorových souřadnic a času

Uk = fk ( X,Y,Z,T) .
Vyjádření hodnot veličin jako funkce určujících faktorů
Uk = fk (G1, G2, ... , Gn )
je obtížné a používá se např. při prognózování nerostného potenciálu v modelech geologických procesů, při studiu vývoje biologických společenstev apod.

2.10.2 Modely geoobjektů

Sestavování modelů geologických objektů (těles, procesů či jevů) je běžnou součástí práce po dlouhá desetiletí, neboť geologické modely ”jsou klíčem k jakémukoliv průzkumnému programu” (Babcock, 1984), tedy základem veškeré aplikované geologie. Jejich konstrukce byla založena především na mentální analýze. Byla tak silně závislá na odborné erudici a zkušenostech autora, jehož induktivně-deduktivní postupy byly a jsou často obtížně popsatelné a algoritmizovatelné. Široce se využíval princip analogie, který je jedním z hlavních metodologických principů dodnes. S rozvojem základních přírodních věd a nezbytných technik a hardwaru se modelování, založené na využití matematických metod a počítačových technologií, velmi rozvinulo a rozšířilo.

Základem použití matematických postupů při řešení geovědních problémů je převedení reálných objektů do formy abstraktních matematických modelů. Je nezbytné zdůraznit, že modelování je v prvé řadě určováno vlastnostmi geoobjektů. V podstatné míře je ale ovlivňování přijatým geometrickým modelem objektu. Ten je závislý na systému pozorování a představách řešitele a v řadě případů je modifikován oborově jinými faktory (např. v případě ložisek nerostných surovin naturálními a hodnotovými ukazateli využitelnosti nerostné suroviny). Posledně uvedené vlivy mohou v některých případech nabývat podstatný, resp. určující rozměr. Právě reálnost a hodnověrnost geometrického modelu geoobjektu představuje jeden ze základních problémů matematicko-geologického modelování. Jestliže je přijatý geometrický model založený na chybné koncepci geologické stavby objektu, pak seberafinovanější matematický model nemůže tuto chybu eliminovat.

V zásadě můžeme rozlišit prostorové modelování morfologie geoobjektů a modelování jejich ”vnitřních” atributů. Modelování morfologie může být vedle tradičních metod geometrie ložisek (aplikace deskriptivní geometrie) založeno na metodách dvou a trojrozměrné počítačové grafiky (vrstevnicové, drátové a objemové modely). Modelování vnitřních atributů geoobjektů vychází vedle empirických pravidel z využití matematicko-fyzikálních teorií polí a teorie náhodných veličin a náhodných funkcí. Vede tedy k modelům deterministickým, statistickým, geostatistickým a empirickým. Deterministické modely jsou využívány např. v geofyzice, hydrogeologii, geomechanice a v některých případech i v ložiskové geologii a aplikované geochemii. Jsou založeny na přesně popsatelných vztazích mezi nezávislými a závislými proměnnými, ze kterých lze odvodit jednoznačné důsledky za známých podmínek, takže chování daného systému je možno plně predikovat v čase i v prostoru. Z předchozího textu je ale zřejmé, že tento přístup představuje značné zjednodušení a že je použitelný jen za jistých podmínek. Velmi rozšířené jsou statistické modely, neboť funkční vyjádření polí sledovaných veličin a jejich vzájemných vztahů je obtížné a často prakticky nerealizovatelné. Za reálnější se považují geostatistické modely, založené na náhodných funkcích (polích), které mají schopnost postihnout jak prostorovou strukturu objektů, tak jejich náhodnou složku. Velmi časté jsou také empirické modely, které určitým matematickým aparátem popisují objekt na základě jisté apriorní představy autora bez teoretického zdůvodnění.

Pro efektivnost matematicko-geologického modelování mají velký význam datové modely. Modelování musí být založena na věcně opodstatněných koncepčních modelech, které vycházejí jednak z předem formulovaných cílů prací, jednak z obecných zákonitostí formování a vývoje geoobjektů. Jejich praktickou aplikací jsou modely sběru dat – průzkumné modely. Vztahy mezi uvedenými modely a etapami analýzy dat jsou znázorněny schématem na obr. 2.24.

Obr. 2.24: Vztahy mezi tvorbou modelů a etapami zpracování dat

Významnou složkou celého procesu modelování je báze znalostí. I když tento termín je vlastní sféře znalostního inženýrství, resp. konkrétně expertním systémům, má své obecné opodstatnění. Je důležitou složkou procesu modelování, neboť je základem tvorby koncepčních modelů a na nich budovaných matematicko-geovědních modelů.

Složitost přírodních objektů vyžaduje rozumné zjednodušení modelů, neboť jinak by řešení bylo příliš komplikované nebo dokonce nemožné. Tento fakt dobře vyjadřuje princip inkompatibility, zformulovaný Zadehem (1973): ”Roste-li složitost systému, klesá naše schopnost formulovat přesné a významné soudy o jeho chování, až je dosaženo hranice, za níž jsou přesnost a relevantnost prakticky vzájemně se vylučující charakteristiky.” Obecným problémem je skutečnost, že v každém objektu existuje určitá ”bariéra náhodnosti”, která nedovoluje ani při sebedokonalejším systému pozorování jít za hranice jeho poznatelnosti (Schejbal, 1982a). Bylo už konstatováno, že naše soudy o zkoumaných přírodních objektech jsou zatíženy větší či menší neurčitostí. Ta nevadí v koncepčních modelech vytvářených v přirozeném jazyce, který se vyznačuje vágností sémantiky a schopností s vágními pojmy pracovat. Při tvorbě matematicko-geologických modelů a procedur analýzy dat představuje neurčitost značný problém. Právě proto se začaly používat statistické a geostatistické postupy a v posledních letech i další přístupy, jako je teorie fuzzy množin a lingvistických proměnných.

Všechny přírodní systémy jsou ve své podstatě dynamické, vyvíjejí se v prostoru a v čase. Dynamika procesů, resp. jim odpovídajících geoobjektů, kolísá ve velice širokých mezích, od velmi vysoké (hydrologie, vulkanologie, seismologie), přes dynamiku pozorovatelnou v „lidském měřítku” (hydrogeologie, vlivy poddolování, sesuvy) až po velmi malé (např. pohyb litosférických desek, vrásnění).

Dynamické systémy se vyznačují prouděním a transportem. V geologických systémech je transport hmoty podstatným aspektem všech dynamických složek systému (např. difúze iontů v krystalové mřížce minerálů, šíření polutantů v podzemních vodách, transport klastických částic říčním tokem, přínos sloučenin kovů hydrotermálními roztoky do vhodných struktur horninového prostředí, pohyb magmatu, konvekční proudy v astenosféře atd.). V rámci dynamických systémů jsou tedy transportovány různé materiály v rozdílném prostředí (homogenním či nehomogenním, porézním či kompaktním (tab. 2.4).

Tab. 2.4: Příklady dynamických systémů v geologických vědách

kategorie typ materiálu proudění a transport
v nepórézním prostředí v pórézním prostředí
I voda vodní toky, mořské proudy proudění podzemních vod
ropa a plyn pohyb v ložiskových strukturách
led pohyb ledovců
II horniny plastické deformace hornin, deformace solných dómů
III horninové částice sesuvy, turbiditní proudy, bahnotoky, přenos
IV horninové taveniny efuzivní horniny intruzivní horniny
V vodní roztoky za vysokých pt-podmínek hydrotermální a metamorfní roztoky
vodní roztoky za nízkých pt-podmínek proudění mořské vody v pánvích vzniku evaporitů vznik akumulací U, V, Sr atd. z podzemních vod

Při studiu a popisu dynamických systémů se používají různé teoretické principy často v kombinaci s heuristickými postupy, neboť řada procesů není stále ještě dostatečně poznána. Lze však říci, že bez ohledu na tuto skutečnost existují možnosti matematického modelování procesů proudění a difuze.

Dynamické systémy mohou být lineární či nelineární, časově závislé nebo nezávislé. U reálných systémů je většina dějů popsána nelineárními závislostmi, ale pro praktické použití se nahrazují lineárními. Jejich konkrétné vyjádření vychází v principu ze základní diferenciální rovnice kde

Φ je přenosová funkce. Případ využití je uveden na obr. 2.25.

Obr. 2.25: Simulace vývoje geochemických sekundárních aureol

Uvedená rovnice je pro konkrétní problémy vhodně upravována. Např. Hobbs (1997) použil pro vyjádření poměru mineralizace Qm výraz
kde u je rychlost proudění kapaliny podle Darcyho zákona, ce rovnovážná koncentrace zájmové komponenty v pórové kapalině, T je teplota, p tlak a cr koncentrace jiných složek v kapalině, × označuje skalární součin, T gradient teploty, p gradient tlaku a cr gradient koncentrace složek.