4. Dokumentografie

Pravidelnou a nenahraditelnou součástí řešení jakýchkoliv geovědních výzkumných a průzkumných úkolů je studium informačních pramenů (dokumentů). Vzhledem k obrovskému rozsahu jejich produkce je nezbytné využívat odvozené sekundární a tercierní informační prameny, pomocí nichž lze dospět k potřebným pramenům primárním. Je nutno mít na zřeteli, že geovědy jsou svou povahou globální a historické (studují historii vývoje sfér Země pro pochopení jejich dnešního stavu), nestačí sledovat pouze současné dokumenty, ale v potřebné míře i dokumenty starší. Proto také nejlepší bibliografické systémy zahrnují dokumenty z několika staletí.

Pro výzkum, vývoj a průzkum v geovědních oborech je důležitým předpokladem pokroku komunikace a šíření informací. Rozvoj metod elektronického publikování a přenosu dat a dnes už obecná dostupnost počítačových sítí se vytvořily nové možnosti vědecké komunikace. Převažující počet vědeckých a odborných prací vzniká na osobním počítači autora. Z toho plyne, že každá publikovaná práce má svou elektronickou verzi, která plně vyhovuje dokumentografickým požadavkům. Pokud je elektronicky distribuována, lze ji považovat za elektronickou publikaci.

Stejně jako pracovníci informačních služeb musí i uživatelé znát alespoň základy procesu zpracování dokumentů a tvorby informací, tj. postupu jejich vzniku, který tvoří plynulou logickou posloupnost práce s publikovanými a nepublikovanými klasickými a elektronickými dokumenty.

4.1 Trochu historie

S mírnou nadsázkou můžeme říci, že dokumentografie započala s vynálezem písma. Písemné systémy se rozvíjely nezávisle v několika oblastech a to zcela odlišným způsobem. Prvou formou bylo obrázkové písmo, které se objevilo koncem 4. tisíciletí př.Kr. ve staré Mezopotámii a v Egyptě. Nejstarší známý skutečný systém bylo klínové písmo v Mezopotámii (nynějším Iráku) vzniklé nejméně 3100 let př.Kr. Jen o málo později Egypťané vynalezli hieroglyfické písmo, ze kterého se vyvinulo písmo hieratické a v 7. století př.Kr. písmo démotické (obr. 4.1). Moderní římská abeceda (latinka) se stejně jako další dnes užívané abecedy (cyrilice, řecká, arabská a hebrejská) vyvinula z písma severosemitského - fénického (obr. 2). Samostatným písemným systémem, který se objevil cca 2000 let př.Kr., je písmo čínské.

Obr. 4.1: Příklad klínového (A), hieroglyfického (B) a čínského (C) písma (in V. Zamarovský, 1961)

Ze 3. tisíciletí př.Kr. jsou známy sumerské odborné texty (lékařské, metalurgické, zemědělské "filozofické" a teologické), kolem roku 2000 př.Kr. i právnické ze zákoníku sumerského panovníka Ur-Nammua (i když patrně nejznámější je babylonský Chammurapiho kodex z roku cca 1750 př.Kr.), později v Babylónii texty matematické, astronomické, technické, stavitelské a historické. Podobné spisy jsou známy ze starého Egypta, Chetitské říše či Číny.

Obr. 4.2: Vývoj latinky od hieroglyfů (podle J.Wisemana in V. Zamarovský, 1975)

Prvé knihovny začaly vznikat ve 2. tisíciletí př.Kr. v Sumeru. Dosvědčují to nalezené knihovní katalogy. V hlavním městě chetitské říše Chattuši (u dnešní vesnice Boghazköy ve středním Turecku) byl objeven královský archiv z období cca 1600 až 1200 let př.Kr., podobně jako ve staroasyrském městě Kaneš (dnešní Kültepe u Kaysiri v Turecku). Velmi známá je knihovna asyrského panovníka Aššurbanipala (669-631 př.Kr.) v Ninive, která obsahovala 30 tisíc exemplářů. Podobné knihovny vznikaly v Indii, Číně a Egyptě. V řecké oblasti vznikaly soukromé knihovny od 6. století př.Kr. (Polykratova, Peisistratovců, Euripidova atd.). Nejznámější a největší byla knihovna v egyptské Alexandrii, založená faraonem Ptolemaiem I. Sótérem na rozhraní 3. a 2. stol. př.Kr. Fond této knihovny, která byla také nejvýznamnějším vědeckým a tvůrčím pracovištěm tohoto období, zahrnoval v Caesarově době 70 tisíc svitků.

Prvé veřejné knihovny byly ve starém Římě. Ve středověku vznikaly od 6. století knihovny klášterní a kostelní (např. u nás nejstarší knihovna břevnovského kláštera z 10. stol.). Od 13. stol. byly zakládány univerzitní knihovny (např. v Paříži, Boloni, Praze atd.), od 15. století šlechtické a městské knihovny, v 17. a 18. stol. knihovny akademií a učených společností. Největší evropské knihovny shromáždili papežové (Vatikánská knihovna) a francouzští králové (dnešní Národní knihovna v Paříži). Největší knihovnou současnosti je zřejmě knihovna amerického kongresu. K největším knihovnám v ČR náleží Národní knihovna, Státní technická knihovna a Knihovna Akademie věd.

Přestože seznamy dokumentů existovaly již ve starověku, pokládá se za prvý velký soupis knih dílo švýcarského polyhistora Konráda Gesnera Bibliotheca universalis let 1545 až 1555. K velkému rozmachu však došlo až ve 20. století, kdy byla zakládána bibliografická střediska ve velkých knihovnách, dokumentační střediska, ústavy pro vědecké informace atd.

Nosiče, na kterých se zaznamenávaly dokumenty, se vyvíjely v závislosti na technickém vývoji a dostupných materiálech. Nejstaršími nosiči informací byl kámen, hlína a dřevo, později pergamen a papyrus. Později se univerzálním nosičem stal papír vynalezený v Číně ve 2. století a přenesený ve 12. století prostřednictvím Arabů do Evropy, který převládá dodnes.

Nejstarší knihy měly podobu ručně zhotovovaných na slunci sušených nebo vypalovaných hliněných destiček, kamenných stél či bloků a pergamenových a papyrových svitků. Dnešní podoba knihy vznikla ve 2. století pod vlivem římských destiček z pergamenových dvojlistů. Výroba knih se zrychlila a zlevnila použitím papíru a vynálezem knihtisku. Podstata knihtisku byla nejdříve známa Číňanům (od 8. stol. tisk z desek, od 11. stol. tisk pohyblivými typy). V roce 1403-1405 byl objeven v Koreji. V Evropě jej vynalezl asi v r. 1444 Johannes Gutenberg v Mohuči. Prvým českým tiskem je Kronika trojánská, vyrobená v Plzni v r. 1468. Standardní technologií od té doby byl ruční tisk za použití ruční sazby. Technologie výroby se vyvíjela až k současným počítačovým technologiím přípravy tiskových matric a moderním tiskovým postupům, které stále zachovávají základní rysy klasické techniky, tj. nanášení barvy na papír.

Odborně a vědecky zaměřené spisy vznikaly po celou dobu lidské historie od vynálezu písma. Postupně se od jednotlivých pojednání zformovaly do podoby knih. Prvé vědecké časopisy Jornal des Scavans a Philosophical Transaction, které byly založeny před téměř 350 lety v r. 1665, byly vytištěny standardní technologií té doby (Mari Mutt, 2000). Nejstarší české vědecké a literární periodikum je Časopis Národního musea, který byl založen F. Palackým v roce 1827. Prvý elektronický vědecký časopis Psycholoquy vznikl teprve v roce 1990.

Dokumentace byla založena P. Otletem a H. M. Lafontainem (1854-1943), kteří se podíleli na založení Mezinárodního bibliografického ústavu v Bruselu. V dalším vývoji se zformovalo knihovnictví jako samostatný vědní obor. Až do zavedení informačních serverů na Internetu byli zájemci o knihovnické služby a vědecko-technické informace prakticky téměř úplně závislí na službách knihovníků a specializovaných informačních odborníků. V principu tak byla uchovávána v hluboké minulosti vzniklá profese knihovníka a kustoda.

4.2 Současný stav a vývoj

Počet odborných a vědeckých publikací neobyčejně rychle vzrůstá. To velmi názorně dokládá nárůst počtu citací v geovědních informačních bázích (obr. 4.3).

Obr. 4.3: Exponenciální vzrůst počtu geovědních publikací vyjádřených nárůstem počtu citací

Uvážíme-li ceny publikací a limitované možnosti skladování a nákupu ve všech informačních střediscích, je určitě elektronické publikování velmi atraktivní. Proto dochází k postupnému odklonu od tradičních nosičů k nosičům digitálním. Zároveň se mění i typy informací (tab. 4.1).

Tab. 4.1: Trendy vývoje předpokládané životnosti datových nosičů a typů informací (upraveno podle Rychnovského, 2001)

ukazatel podíl v % v roce
1995 2000 2005 2010 2015 2020
média papírová 85 70 50 30 20 15
digitální 15 30 50 70 80 85
typy informací text 80 70 60 50 40 30
2D obrázky/foto 17 20 25 25 25 30
3D modely 1 5 10 15 20 25
video/film 1 3 3 5 10 10
audio 1 2 2 5 5 5

Elektronickou publikaci lze stručně definovat jako dokument primárně distribuovaný elektronickými médii. Může být zveřejněn on-line (na síti) nebo off-line (na CD-ROM apod.). Elektronický časopis je editovaný soubor článků, který je distribuován v elektronické podobě (např. Journal of the Association for Information Systems). Hybridní časopis je soubor článků, které jsou distribuované v elektronické i klasické podobě. Může být papírovo-elektronický, kdy hlavní distribuční forma je papírová (např. Nature, Journal of Biological Chemistry), nebo elektronicko-papírový s primární formou elektronickou (např. Electronic Transactions on Artificial Intelligence).

Z hlediska autorů, editorů, nakladatelů, informačních středisek i čtenářů mají jak tradiční, tak elektronické publikace své přednosti i nedostatky a samozřejmě své zastánce i odpůrce (tab. 4.2). Přes mnohé zřejmé výhody jsou elektronické časopisy přijímány veřejností poměrně pomalu. Proto významné vydavatelské organizace a prestižní vědecké společnosti vydávají důležitá periodika paralelně v tradiční i elektronické podobě na Internetu. Např. kolekce více než 1200 časopisů nakladatelství Elsevier Science doplněná o vybrané tituly dalších prestižních společností s retrospektivou od roku 1995 je dostupná na online databázi Science direct, podobně přístup k elektronickým verzím téměř 500 časopisů nakladatelství Springer Verlag s retrospektivou do roku 1994 je na databázi Springer LINK.

Tab. 4.2: Výhody a nevýhody tištěných a elektronických časopisů (upraveno podle Mari Mutta, 2002)

tištěné časopisy elektronické časopisy
výhody nevýhody výhody nevýhody
neměnná technologie nákladnost nízké náklady změny technologie
hmatatelnost a stálost omezený rozsah neomezený rozsah změny hardwaru a nosičů
přenosnost složitá příprava jednoduchá příprava dosud malá prestiž
snadnější a pohodlnější čtení pomalé vydávání rychlost vydávání a přístupnost publikování má dosud malý kredit
omezená přístupnost multimediální pojetí nižší čtenářský komfort
skladovací nároky snadná revize/komunikace

Podle názoru J. A. Mari Mutta nastane úplný přechod k elektronické podobě časopisů tehdy, až je autoři plně akceptují a až bude pro čtenáře zajištěn snadno dostupný, trvalý a nenákladný přístup k Internetu.

Elektronických časopisů už v roce 2000 existovalo více než 1800. Rozsáhlý seznam elektronických periodik zveřejňuje E-journal. Dále je uvedeno několik příkladů ze sféry geověd.

Elektronické publikace: Internet Journal of Science The Scientist
Paralelní publikace: Nature

Je zřejmé, že se tvoří nová architektura institucí, které se zabývají zpracováváním a šířením informací (Vlasák, 1997). Styčnými institucemi uživatele (čtenáře) se systémy, které zprostředkují informační zdroje, jsou klasické knihovny a informační střediska. Vedle toho se vytvořila nadstavbová vrstva institucí, které slouží styčným institucím poskytováním knihovnických a informačních služeb. Sem náleží:

4.3 Informační prameny

Dokument lze obecně definovat jako prostředek komunikace tvořený nosičem informací v podobě hmotného předmětu a množinou údajů v něm obsažených a formálně i obsahově uspořádaných (Všeobecná encyklopedie Diderot, 1999). Je to tedy každá samostatně zpracovávaná a vyhledávaná jednotka informačního fondu, zveřejněná formou tisku, manuskriptu v tradiční nebo elektronické formě.

Informační fond je vybraná a odborně organizovaná sbírka informačních pramenů s určitým tématickým zaměřením.

Informační prameny (zdroje) jsou jakékoliv písemné a grafické zdroje informací v tradiční či elektronické podobě. Dělí se do tří skupin a to na primární, sekundární a tercierní prameny.

4.3.1. Primární prameny

Primární prameny jsou takové prameny vědeckých a odborných informací, které jsou uváděny v originálním, nezkráceném znění autorů. Jsou základním a nejdůležitějším prostředkem vědecké a odborné komunikace a předmětem bibliografického zpracování. Mezi primární dokumenty se řadí:

Všechny uvedené dokumenty mohou být v tradiční nebo elektronické podobě (in-line v síti či plnotextových databázích nebo off-line např. na CD-ROM).

Poznámka 1.:
Vedle "oficiálních" publikací Craig (1969) rozlišuje "neoficiální" komunikační prameny, kam řadí ústní informace a diskuse s kolegy, korespondenci, přednášky apod.

Poznámka 2:
Diplomové a disertační práce, výzkumné a průzkumné zprávy, firemní literatura jsou někdy označovány jako "šedá literatura". Jde o literaturu, která je vydávána v malých nákladech a obvykle ji nelze získat běžným knižním obchodem. Její význam ale výrazně stoupá vlivem nových technologií tvorby dokumentů. Jestliže v roce 1985 byl její podíl 9 % z celkového objemu dokumentů, pak v roce 1995 to bylo již 20 % (Bratková 1997). V současné době se podíl stále zvyšuje.

Z analýzy řady dokumentů je zřejmé, že při jejich sestavování často nejsou dodržovány doporučené postupy a platné normy. Proto jsou dále uvedena nejdůležitější doporučení pro příklad vědeckých a odborných článků.

Název (titul) článku musí poskytovat dostatečný a pro čtenáře srozumitelný popis obsahu. Zároveň musí být sestaven tak, aby byl přímo použitelný pro seznamy titulů, pro klasifikaci a vyhledávání. Názvy kapitol mají být krátké a výstižné. Při zpracování je nutno dodržovat pravidla českého pravopisu (v případě dvou povolených forem zápisu se doporučuje používat novější). Dále se musí dodržovat všeobecně přijatá terminologie, platné normy, zákonné měrné jednotky a symboly, způsoby citování a transliterace cizích jmen a názvů. Podle požadavků vydavatele je článek doplňován autorským abstraktem, závěrečným resumé a seznamem citované literatury.

V praxi se můžeme setkat se třemi způsoby citování použitých dokumentů v textu, který musí být v celém textu jednotný:

Autorský abstrakt, který může být podle požadavků vydavatele zpracován ve více jazykových mutacích, doplňuje vlastní text na počátku článku. Smysl abstraktu je v zásadě trojí:

Abstrakt má obsahovat stručný, ale informativní souhrn obsahu a závěrů článku. Má být psaný jako souvislý text, ale ne v první osobě. Nemá obsahovat specifické odkazy a citace. Obvykle nemá přesáhnout 200 až 250 slov.

Resumé je obsáhlejší shrnutí obsahu článku v délce 10 - 30 % jeho rozsahu. Je-li text článku v češtině, zpracovává se v cizí řeči (zpravidla v angličtině, němčině, francouzštině či ruštině podle požadavku vydavatele (někdy i ve více jazykových mutacích). Pro zpracování resumé platí stejné zásady, jako pro vlastní text článku.

Seznam použité literatury se sestavuje podle doporučených postupů, jež jsou obsahem norem ČSN ISO 690 a ČSN ISO 690-2e a které jsou uvedeny dále. Citace se obvykle uvádějí v abecedním uspořádání. V případě, že je citován větší počet prací téhož autora, uvádějí se chronologicky.

4.3.2 Sekundární prameny

jsou odvozené prameny, které vznikly výběrem, redukcí nebo syntézou z primárních pramenů. Přinášejí tedy údaje o existenci primárních dokumentů a o informacích v nich obsažených. Mezi ně náleží bibliografie, referáty, referátové časopisy, katalogy, rešerše, studijní rozborové zprávy atd.

Bibliografie je soupis primárních pramenů, který může být uspořádaný podle různých požadavků. Dělí se podle různých hledisek:

  1. podle vnější formy (bibliografie samostatné a skryté, které jsou součástí jiných publikací);
  2. podle způsobu vydávání (periodické, uzavřené);
  3. podle druhu zpracovávaného dokumentačního materiálu (současné, retrospektivní);
  4. podle rozsahu zpracování (úplné, výběrové);
  5. podle způsobu zpracování (registrující, analytické, kritické);
  6. podle seřazení záznamů (abecední, chronologické, topografické, systematické, věcné);
  7. podle uživatelů (odborné, vědecké, obchodní atd.);
  8. podle oblastního hlediska (lokální, regionální, národní, mezinárodní).

Bibliografie má význam jak v knihovnictví při akvizici dokumentů, jejich popisu a katalogizaci či při styku s uživateli, tak ve vědecké a odborné práci, kdy pomáhá při formování záměrů a při získávání přehledu o stavu znalostí a postupech řešení zformovaných úkolů.

Poznámka:
bibliografie (z řeckého bibliographia) původně znamenala psaní nebo kopírování knih; teprve od poloviny 18. století nabyla významu seznamu knih nebo techniky sestavování takového seznamu.

Bibliografický a katalogizační záznam je podle přijatých pravidel sestavený souhrn vnějších a obsahových údajů o určitém primárním dokumentu. Podle účelu se rozeznává bibliografický (dokumentační) záznam pro bibliografické a dokumentační seznamy a katalogizační záznam pro kartotéky a knihovní katalogy (obr. 4).

Předmětem záznamu je dokument nebo jeho část. Údaje pro záznam se přebírají především z titulního listu a tiráže publikace, popř. z textů uvedených v čele nebo na konci jednotlivých článků a podobných statí.

Obr. 4.4: Schéma uspořádání tradičního bibliografického záznamu

Záznam se skládá:

Třídící znak se uvádí obvykle podle mezinárodního desetinného třídění, např:

pojem MDT
petrografie 552
vyvřeliny 552.3
granit 552.311
hornictví 622
vyhledávání a průzkum ložisek 622.1
důlní měřictví a mapování 662.1:528
geofyzika a pomocné geologické vědy 550
geochemie 550.4
statistické metody v geochemii 550.4:519.2

Referát (abstrakt) je stručné vyjádření obsahu primárního dokumentu, které uvádí základní údaje o předmětu, cíli, metodách, výsledcích a závěrech popisované práce. Vydává se obvykle nezávisle na primárním dokumentu a je doprovázen bibliografickým záznamem popisovaného dokumentu. Referát má co nejobjektivnějším způsobem charakterizovat obsah a případně způsob zpracování popisovaného dokumentu, ale v zásadě jej nemá hodnotit. Skládá se z následujících částí:

Rozsah referátu závisí na množství údajů obsažených v primárním dokumentu a na jejich novosti či odborné hodnotě. Maximální rozsah referátu je do 2500 znaků. Doporučuje se 20 řádků po 60 znacích.

Rešerše obecně spočívá ve vyhledání, shrnutí a zhodnocení dosažitelných nebo vybraných informací, odpovídajících na dotaz uživatele. Umožňuje vědeckých a odborným pracovníkům rychle získat přehled o stavu dané problematiky jako základu řešení odborného či vědeckého problému nebo rozhodnutí o úkolu. Proto je důležité požadovat provedení rešeršní práce s dostatečným předstihem a využívat jen nejdůležitější, přístupné a prověřené prameny. V geovědních oborech je nutno upozornit na projektované a probíhající výzkumné a průzkumné akce, které se dotýkají rešeršního požadavku, což umožňuje předejít duplikátním pracím.

Úspěšnost rešerše ve značné míře závisí na rozsahu a kvalitě předcházejících operací (tvorbě bibliografických záznamů, bibliografií, referátů apod.). Při zpracovávání rešerše vždy dochází ke ztrátě relevantních informací (nezjištěním všech pramenů) a zároveň k jisté nadbytečnosti či výskytu irelevantních informací. Důležité ale je, aby po věcné stránce rešerše odpovídala formulaci dotazu.

Podle způsobu zpracování se rozlišují rešerše bibliografické (soupis citací dokumentů, které se týkají daného problému), rešerše záznamové (soupis anotovaných záznamů) a rešerše studijní (analytická kompilační zpráva s odkazy na citace). Rešerše se dále třídí podle časového hlediska (jednorázové, retrospektivní, průběžné), podle úplnosti (orientační, výběrové, vyčerpávající, doplňkové) či podle druhu dokumentů (jednodruhové, ..., komplexní).

Požadavkový list, který vyplňuje žadatel, musí obsahovat pokud možno jednoznačný dotaz, formulovaný pomocí klíčových slov - deskriptorů daného selekčního jazyka - tezauru).

Formální úprava rešerší se řídí příslušnou normou. Obsahuje titulní list (téma rešerše, evidenční číslo, klasifikační znaky - klíčová slova a MFT, zadavatel, zpracovatel, počet záznamů, datum zpracování), analytický list (druhy dokumentů, časové vymezení rešerše, jazykové a geografické vymezení, zvolené uspořádání rešerše, přehled použitých zkratek, výčet a charakteristika informačních zdrojů) a seznam bibliografických záznamů (v uspořádání a podobě podle norem), který je podle druhu rešerše doplněn anotacemi či kompilační zprávou.

Při zpracování rešerše lze použít strategii nepřímou (od seznamu literatury v díle význačného autora daného oboru) nebo přímou (výběr ze systematicky organizované informační soustavy po linii autorské, věcné nebo regionální). Důležitý je výběr informačních zdrojů (primární či sekundární, tištěné či elektronické apod.) a správní formulace dotazu, resp. převod do klíčových slov. V průběhu zpracování dochází při velkém počtu získaných informací k upřesňování nebo v opačném případě k rozšiřování dotazu.

Při zpracování rešerše je oproti klasickým ručním postupům mnohem výhodnější a rychlejší využití dokumentografických databází, kterých existuje velké množství. Přitom je třeba využívat vhodným způsobem vyhledávací stroje a jejich možnosti (hlavně při pokročilém vyhledávání).

Rejstříky informací poskytují uživateli přehledné informace. Podle formy a způsobu provedení lze odlišit:

  1. klasické rejstříky, obvykle autorské, předmětové a regionální;
  2. předmětové permutované rejstříky, které jsou počítačově zpracované jako restříky typu:
    1. KWIT (Key_Word_In_Title = klíčová slova v titulu); rejstřík se sestavuje z abecedně seřazených klíčových slov v titulu;
    2. KWIC (Key_Word_In_Context = klíčová slova v kontextu; rejstřík se sestavuje z abecedně seřazených klíčových slov z obsahové charakteristiky dokumentu;
    3. KWOC (Key_Word_Out of_Context = klíčová slova mimo kontext; rejstřík se vyznačuje předznačením a abecedním uspořádáním klíčových slov mimo ostatní popisné prvky záznamu, což umožňuje kombinovat klíčové slovo s autory, názvy prací, s regionálními hesly, apod.

Každé klíčové slovo je v rejstříku obklopeno předcházejícími nebo následujícími klíčovými slovy. Uživatel může hledat podle kteréhokoliv předmětového hlediska. Tím získá v souvislosti s dalšími klíčovými slovy obsahově přesnější názor o vyhledávaném dokumentu. Každý řádek rejstříku je doplněn odkazovým číslem k úplnému názvu dokumentu.

Referátové časopisy uveřejňují krátké anotace a případně abstrakty vydávaných primárních pramenů. Typickým příkladem jsou Chemical Abstracts vydávané od roku 1907 Americkou chemickou společností, Referativnyj žurnal vydávaný VINITI v Moskvě od roku 1954 či IMM Abstracts v Londýně.

Výtahy, informační a studijní zprávy jsou výsledkem studijní a rozborové činnosti, kterou provádějí kvalifikovaní pracovníci informačních středisek (např. Geofondu). Podávají ucelený přehled o určitém problému či objektu.

Bibliografické (dokumentografické) databáze slouží k vyhledávání bibliografických (dokumentografických) informací a mohou být propojeny se systémem dodávání primárních dokumentů. Obsahují přesné a úplné citace a většinou i abstrakty a klíčová slova dokumentů. Obsah je uložen v jednotně strukturovaných záznamech, umožňujících vyhledávání podle hodnoty položek, přičemž pravidla popisu se mohou v různých databázích lišit. Prostřednictvím hodnot bibliografických údajů mohou vstupovat do vztahů s dalšími bibliografickými informacemi (např. díly téhož autora, časopisy, články). Pro další hledání jsou často uvedeny klasifikační systémy (např. NAISC nebo SIC). Základními typy bibliografických databází jsou elektronické katalogy knihoven a archivů, oborové databáze zpřístupňované databázovými centry a internetové zdroje. V podstatě nahrazují klasické rejstříky a referátové časopisy, které lze chápat jako jejich předchůdce.

V posledním desetiletí se rozvíjejí plnotextové (fulltextové) databáze, které obsahují úplné texty primárních dokumentů.

4.3.3 Terciární prameny

V současné době informační exploze již nedostačují ani sekundární prameny, kterých je produkováno velké množství různými informačními středisky. Proto vznikají tercierní prameny, které lze stručně charakterizovat jako informace o sekundárních informacích. Obsahují vyhodnocené informace o sekundárních, ale i primárních dokumentech. Typickým příkladem jsou databáze katalogů, rejstříků a adresářů, dále dokumenty o tom, jak používat primární a sekundární zdroje - průvodci literaturou, oborové databáze, seznamy internetových zdrojů, různé přehledné práce apod.

Příklady průvodců z oboru geologických věd:
Hardy, Joan - Wood, D.N. - Harvey, A.P. (eds): Information Sources in the Earth Sciences. 2nd. ed. -London, N.>York, Bowker-Saur, 1989
Ward, Dedrick C. - Wheeler, Marjorie W., - Bier, Robert A.: Geological Reference Sources. 2nd. ed. - Metuchen, NJ, Scarecrow Press, 1981

Příklady průvodců z oboru biologických věd:
Wyant, H.V. (ed.): Information Sources in the Life Sciences. 4th ed. - London, N.York, Bowker-Saur, 1994
Crafts-Lighty, Anita: Information Sources in Biotechnology. - N.York, Stockton Press, 1986
Davis, Elisabeth B.: Guide to Information Sources in the Botanical Sciences. - Littleton, Col., Libraries Unlimited, 1987

4.3.4 Citace dokumentů

Bibliografické citace jsou upraveny normou ČSN ISO 690 (01 0197), která se týká tradičních dokumentů, citace elektronických zdrojů upravuje norma ČSN ISO 690-2e.

Mezi tradiční dokumenty se řadí monografické publikace (knihy, sborníky, diplomové a habilitační práce, firemní literatura), seriálové publikace (časopisy, noviny), části a stati v monografiích, příspěvek ve sborníku, článek v seriálové publikaci). Elektronické zdroje jsou programy, databáze, elektronický seriál, článek v elektronickém seriálu, WWW stránka, FTP archiv, e-mail, konferenční skupiny atd.

Bibliografické citace jsou velmi významnou součástí jakékoliv vědecké či odborné publikace. Dokazují autorovu znalost literárních pramenů a poskytují potřebné informace čtenářovi, aby byl schopen nalézt příslušný dokument.

Obecné zásady a pravidla citací

V zásadě platí, že citace musí být přehledná, úplná a zpracovaná podle pravopisných norem platných pro daný jazyk. Interpunkce citací je uvedena u jednotlivých typů. Základní schéma zápisu

Primární autorská odpovědnost (povinný údaj)
  1. má-li dílo jednoho autora:
    příjmení (zpravidla v kapitálkách), jméno nebo iniciály křestního jména
    Příklad:
    NOVÁK, Jiří BREJTR, Fr.
  2. do počtu tří se uvádějí všichni autoři:
    Příklad:
    DAVIS, G., JONES, P., FLETCHER, G. DAVIS, G. - JONES, P. - FLETCHER, G.
  3. při větším počtu autorů: příjmení a jméno prvého autora + et al. (et alii) nebo aj. (a jiní)
    Příklad:
    BURK, T., et al. ŠREJBR, A., aj.
  4. je-li autorem dokumentu korporace, uvádí se její název, pokud není totožný se jménem vydavatele
    Příklad:
    National Semiconductors
  5. autor je neznámý (častý případ u oficiálních dokumentů) oblast autorské odpovědnosti se vynechá
    Příklad:
    Zákon č. 44/1988 Sb. o využití nerostného bohatství
Název díla (povinný údaj)

se zapisuje v podobě, jaká je na titulní stránce. Možné případy jsou následující:

  1. jednoduchý název
    Příklad:
    Html - tvorba dokonalých stránek
  2. kniha má více názvových informací (náze a podnázev) uvádí se názvy v pořadí na titulní stránce, oddělené dvojtečkou
    Příklad:
    Internet : první kroky českého uživatele
  3. název je vícejazyčný vyskytuje se. u oficiálních dokumentů mezinárodních organizací nebo u reprezentačních publikací; názvy se zapisují v pořadí, v jakém jsou na titulní stránce, oddělené rovnítkem
    Příklad:
    Stará Šumava = Der Alte Böhmerwald
Typ média (povinný údaj u elektronických dokumentů)

Uvádí se v hranatých závorkách k identifikaci média, na němž je dokument umístěn.

Příklady:
[online] [databáze online] [CD-ROM] [disketa 3.5 ´´]
Sekundární odpovědnost

Je-li v dokumentu uveden pouze sestavovatel (editor), uvádí se v tomto poli. Příklad: Materiály z konference "Slovenské knižnice". Uspořádala a do tisku připravila Daniela Gondová. Do tohoto pole mohou být zapsáni i překladatelé či ilustrátoři.

Příklad:
Přeložil Jan Nikodým; ilustrace Josef Sládek
Údaje o vydání (povinný údaj)

Uvádí se přesně verze dokumentu.

Příklad:
2. vydání. 3rd edition. 3. auslage. 2. izdanie
Údaje o místu vydání

Zapisuje se první místo v pořadí, nebo místo typograficky zvýrazněné a to v podobě, jaké se objevuje v dokumentu (nepočešťuje se). V případě nejasnosti, kde se uvedené místo nachází, lze do závorky napsat upřesňující údaj (kvalifikátor), jako např. stát.

Příklad:
Praha Cambridge (Massachussets)
Není-li uvedeno místo vydání a je-li známa země původu, uvede se země v hranatých závorkách.
Příklad:
[Francie]
Nelze-li zjistit ani zemi vydání, uvede se v hranatých závorkách zkratka "b.m." (bez místa) nebo "s.l. (sine loco = bez místa).
Příklad:
[b.m.] [s.l.]
Nakladatelské údaje

Uvádí se jméno nakladatele v co nejkratší, ale srozumitelné podobě. Vynechávají se zkratky označující druh obchodních organizací (např. s.r.o., Inc., Ltd.), vždy ale zůstává zkratka "Press". Příklady jsou uvedeny v následující tabulce.

v dokumentu uvedeno v citaci
John Willey & Sons Willey
Cambridge University Press Cambridge University Press
Wordsworth Edition Limited Wordsworth
Dále mohou nastat následující případy:
Datum vydání (povinný údaj)

Vždy se zapisuje datum vydání (ne přetisku = reprint) nebo dotisku (= reset), jak je uvedeno v tabulce.

v knize v citaci
1985 1985
3rd edition 1990 1990
2nd edition 1986, reprint 1990 1986
3rd edition 1990, reset 1994 1994

U elektronických dokumentů se zpravidla zapisuje datum ve tvaru 2000-10-28. Další možné případy:

Údaje o fyzickém popisu

Uvádí se fyzický rozsah dokumentu (díly, stránky, ilustrace, přílohy atd.). Stránkování se uvádí v jazyce dokumentu.

Údaje o edici, případně podedici

Způsob zápisu je následující:
název edice; číslování v rámci edice

Příklad:
Malá řada, sv. 8
název edice; název subedice; číslování v rámci edice
Příklad:
Filozofické eseje. Malá řada, sv.12
Poznámky

Můžeme zapsat jakýkoliv text, který je důležitý.

Příklad:
Prvně publikováno jako doktorská práce.
Údaje o standardním číslu (povinný údaj)

Jde o čísla ISBN a ISSN, které jednoznačně identifikují dokument.

Příklady praktických modelů

Monografická publikace

Schéma (kurzívou uvedené prvky jsou volitelné):

Primární odpovědnost. Název díla: podnázev díla. Podřízená odpovědnost. Vydání. Nakladatelské údaje (místo, nakladatel). Rok vydání. Rozsah díla. Edice. Poznámky. Standardní číslo.

Příspěvky v monografických publikacích

Schéma:

Zvláštní typy monografií (tzv. „šedá literatura”)

diplomové, rigorózní a habilitační práce firemní literatura

Seriálová publikace

Schéma:

Název. Odpovědnost. Vydání. Údaje o vydání (data a/nebo čísla). Nakladatelské údaje (místo, nakladatel). Rok. Edice. Poznámky. Standardní číslo.

Články v seriálových publikacích

Schéma:

Primární odpovědnost. Název. Podřízená odpovědnost. Název zdrojového dokumentu. Vydání. Lokace ve zdrojovém dokumentu. Rok vydání. Číslo svazku. Lokace části.

4.3.5 Citace elektronických informačních zdrojů

V posledním období se v souladu s rozvojem především Internetu staly dalším zdrojem informací elektronické publikace. Podle normy ČSN ISO 690-2 se mezi elektronické dokumenty řadí: Elektronické monografie, databáze a počítačové programy, Elektronické seriálové publikace, Elektronické nástěnky, diskusní fóra a elektronické zprávy.

Způsob jejich citování není dosud v mezinárodním měřítku ustálen, tzn. že existují různé citační styly (např. Chicago Style, APA Style, CBE Style), které se vzájemně odlišují. Obecně ale platí dvě zásady:

  1. citace musí obsahovat maximum údajů potřebných pro zjištění dostupnosti zdroje,
  2. neexistují-li pravidla pro jistý typ elektronického zdroje, cituje se podle pravidel pro tištěný zdroj.

V našem případě poskytuje zásady a způsob citace elektronických zdrojů už uvedená norma ČSN ISO 690-2. Obecně platí následující pravidla:

Důležitými popisnými charakteristikami elektronických dokumentů dále jsou:

druh nosiče

Uvádí se za názvem dokumentu v hranatých závorkách.

Příklad:
on-line , disk , CD-ROM , magnetická páska
vydání

Např. verze dokumentu či programu

datum aktualizace

Aktualizace zpravidla vede ke změně obsahu původního dokumentu a proto je nezbytné uvést vedle data zveřejnění i toto datum.

datum citování

Uvádí se v hranatých závorkách u dokumentů, které mohou být měněny (on line dokumenty) ve tvaru obvyklém v jazyce originálu.

Příklad:
cit. 2001-02-16
údaj o dostupnosti

Za úvodní frází "Dostupný z" nebo "Přístup z", Dostupný na", "Available from" se uvádí přístupový protokol a URL adresa mezi znaky .

Příklad
Pokud bylo elektronickému dokumentu přiděleno standardní číslo ISBN, ISSN, má být v citaci uvedeno.

Příklad modelu:

PAPÍK, R.: Vyhledávání informací II. Uživatelské rozhraní a vlivy oboru "human-computer interaction. Národní knihovna. Knihovnická revue [on-line]. 2001, 2, 3-11. [cit. 7.11.2001]. Dostupný na WWW: <http://full.nlp.cz/nkkr/NKKR0102087.html>

4.3.6 Autorská etiketa

Autorskou etiku tvoří soubor nepsaných pravidel, který by měl každý autor jakéhokoliv díla dodržovat. V zásadě jde o to, aby si autor nepřivlatňoval cizí myšlenky a výsledky, aby důsledně citoval autory, jejichž práce použije a aby zveřejňoval jen pravdivé údaje. Pokud ve vlastní práci použije doslovné výňatky z cizí práce, je nezbytné je jasně vyznačit s uvedením autora.Nejčastějšími prohřešky proti citační etice jsou:

Právní oporu uvedeným morálním principům poskytuje autorský zákon č. 121/2000 Sb. Respektování ustanovení § 31 tohoto zákona představuje minimum slušnosti.

4.4 Zpracování dokumentografických informací

Zpracování dokumentografických informací se zakládá na popisu a uspořádání dokumentů, převedení jejich obsahu do dohodnuté formy a obsahu a poskytování odpovědí na rešeršní dotazy. Podstatou je formální a obsahová analýza (cílem je jasnou a stručnou formou charakterizovat posuzovaný dokument) a indexování dokumentu (vyjádření výsledků analýzy prostřednictvím prvků selekčního či přirozeného jazyka).

4.4.1 Pořádací soustava

Pořádací soustava je souhrn pravidel pro označování dokumentů třídícími znaky daného informačního systému. Podle KTB pořádací soustava znamená pořádání informací realizované prostřednictvím selekčního jazyka. Věcné pořádání informací (věcný popis) je proces, při kterém jsou informace získané obsahovou analýzou dokumentu vyjádřeny pořádacími znaky věcných selekčních jazyků. Předmětové pořádání informací (verbální pořádání - klasifikace) je druh věcného pořádání informací, při kterém je obsah dokumentu vyjádřen pomocí abecedně uspořádaných hesel či lexikálních jednotek.

Pořádání informací je úzce spjato s klasifikací (tříděním), které musí vycházet z klasifikačních schémat běžně používaných v geovědách. Proto je dále uvedena formulace klasifikačních schémat v obecné podobě.

Základem každé klasifikace je prostor atributů, kterými lze popsat danou množinu objektů. Z hlediska obecnosti řešení a také z praktických důvodů má klasifikace vycházet z atributů podstatných, které dostatečně charakterizují objekty a rozdíly mezi nimi a které odpovídají teoretickým předpokladům. Takto lze definovat přirozené klasifikace. Vedle toho existují klasifikace umělé, jejichž cílem je pouze systemizace objektů, které mohou být založeny na formálních znacích a které nemusí pokrývat celý možný prostor objektů. V podstatě tedy mají subjektivní povahu. Velmi častým případem jsou klasifikace smíšené, ve kterých se vedle atributů objektů uplatňují i hlediska formální.

Obr. 4.5: Schema využití rešeršního jazyka při ukládání a vyhledávání informací

Klasifikační schéma můžeme formulovat následovně. Mějme množinu objektů O={Oi}, i=1...n, které mohou být na základě množiny klasifikačních znaků A={ak}, k=1...h přiřazeny do některé z klasifikačních tříd Oj, j=1...m podle určitých klasifikačních pravidel V={vt}, t=1...z, tj. pravidel zobrazení [oOV(o)]. Klasifikační konstrukce {O:A,V} má různou povahu. Principem klasifikace může být:

Klasifikační systémy používané v dokumentografii jsou založeny na formálních vztazích mezi třídami, které jsou prekoordinovaně vyjádřeny notacemi v klasifikačních tabulkách. Ve většině případů se systém aplikuje kombinací analýzy témat na jednotlivé komponenty a syntézy znaků umělého jazyka do klasifikačních znaků analyticko-syntetického klasifikačního systému (ČSN ISO 5127-6). Pro většinu geověd je charakteristické hierarchické uspořádání objektů, čemuž odpovídá hierarchický klasifikační systém. V souvislosti s přechodem na počítačově orientované dokumentografické systémy se přechází od striktně hierarchických klasifikací k popisu informací na základě věcného heslování a využívání tezaurů deskriptorů.

4.4.2 Heslování - indexování

Hlavním problémem dokumentografie je nalezení a rozpracování způsobu, jak informace obsažené ve zpracovávaných dokumentech indexovat a přenášet při zachování jejich sémantického obsahu (Hruška 1991). Rozhodujícím krokem je popis obsahu dokumentu pomocí přijatého systému a vybraných povolených slov. Proces vyjádření obsahu dokumentu pomocí prvků selekčního jazyka, obvykle s cílem umožnit zpětné vyhledávání, se nazývá heslování (indexace). Podle ČSN ISO 5963 je to "pracovní postup popisování nebo identifikace dokumentu ve vztahu na jeho věcný obsah."

Výchozím krokem je je analýza obsahu dokumentu, jejímž smyslem je převedení obsahu do minimálně nutného počtu hesel (témat), které popisují hlavní problémy, pracovní postupy a dosažené výsledky. Míra podrobnosti heslování závisí na charakteru dokumentu (tvůrčí, kompilační, popisný), na odbornosti autora, na zájmu uživatelů daného systému apod. Dalším úkolem je rozložení složitých výrazů (hesel) na jednoduché výrazy označované obvykle klíčová slova. K získání souboru slov charakterizujících dokument se vychází z předpokladu, že podstatné informace jsou:

V konečné fázi heslování se klíčová slova nahrazují příslušnými deskriptory z oborového tezauru. Tím získáme selekční obraz dokumentu.

Podle použitých metod se rozlišuje pojmová a slovní indexace, podle použitých postupů intelektuální, automatická a poloautomatická indexace, z hlediska selekčních jazyků indexace prekoordinovaná (uspořádání termínů nebo třídících znaků je dán selekčním jazykem) a postkoordinovaná (ke koordinaci dochází až při vyhledávání).

Intelektuální indexace je prováděna odbornými pracovníky na základě mentální analýzy daného dokumentu. Podle Schwarze (2002) přináší ve srovnání s automatickou indexací doposud lepší výsledky.

Automatická indexace se dělí na dva typy a to automatickou extrakci (slovní indexace), která je založena na extrakci indexačních termínů přímo z plného textu dokumentu, a automatické přiřazování (pojmová indexace), využívající určování indexačních termínů z řízeného slovníku nebo znalostní báze porovnáním s výrazy plného textu dokumentu. Většina současných funkčních systémů pracuje na principu automatické extrakce, které je jednodušší.

Problematika automatické indexace dokumentů se řeší od konce 50. let minulého století. V současnosti převařuje trend její kombinace s intelektuální indexací a využití principů expertních systémů.

Klíčová slova

jsou nejvýznamnější slova (slovní spojení), která vyjadřují předmět dokumentu, případně předmět dotazu. Čili jde o jedno až několikavýrazová podstatná jména, která popisují hlavní informace obsažené v dokumentu. Mohou být převzata z dokumentu nebo zformulována odborníkem na základě řízeného slovníku. Nejsou předem uspořádána, seřazována jsou až při zadávání dotazu (jde tedy o postkoordinovaný selekční jazyk). V posledních letech jsou už primární dokumenty (zejména články v časopisech) vybaveny klíčovými slovy zformulovanými autory dokumentů, čímž je zajištěno optimální vyjádření obsahu dokumentu.

4.4.3 Selekční jazyky

Selekční jazyk je podle ČSN ISO 5127-6 formalizovaný jazyk používaný k charakterizování obsahu dokumentu nebo údajů pro potřeby jejich ukládání a vyhledávání. Je to tedy informační jazyk, který je určený pro:

Selekční jazyky se dělí na:

  1. systematické, které jsou historicky starší a které vznikly z potřeby uspořádávání dokumentového fondu ve skladech na bázi přirozeného jazyka (MDT - mezinárodní desetinné třídění, DDT - Deweyho desetinné třídění, LCC - klasifikace Kongresové knihovny atd.);
  2. předmětové, které vznikly následně v důsledku potřeb přístupu ke knižnímu fondu z předmětového hlediska; zahrnují
    1. jazyky předmětových hesel v prostředí lístkových katalogů,
    2. jazyky deskriptorového typu (oborové tezaury jedno a mnohajazyčné).

Každá skupina má své přednosti a nedostatky ovlivňující kvalitu indexování (tab. 4.3).

Tab. 4.3.: Výhody a nevýhody selekčních jazyků

systematické jazyky předmětové jazyky
výhody kontrolované pořadí vědeckých disciplin a termínů rozšířená možnost prohledávání do hloubky jednoduchost používání větší volnost při vytváření nových skupin
nevýhody " nemožnost úplné klasifikace celého souhrnu dokumentů systematické třídníky nejsou tak jednoduchý navigátor jako přirozený jazyk členitost předmětového přístupu sémantické problémy celková slabost pojmové struktury

4.4.4 Tezaurus

Tezaurus můžeme obecně popsat jako řízený a měnitelný slovník povolených standardizovaných a zpravidla hierarchicky uspořádaných výrazů, který se zakládá na běžné terminologii příslušného vědního oboru nebo skupiny oborů (např. geověd). ČSN ISO 8777 jej definuje jako "soubor výrazů vyjadřujících synonymické, hierarchické a další vztahy a závislosti, jehož funkcí je poskytnutí předem vytvořeného kontrolovaného slovníku pro ukládání a vyhledávání informací."

Podle jazykového zaměření se rozlišuje jednojazyčný a vícejazyčný tezaurus, podle šíře tematického zaměření speciální, polytematický a univerzální tezaurus, podle struktury fasetový a tematický tezaurus a podle funkcí tradiční, indexační a vyhledávací tezaurus. Dále se rozlišuje tezaurus s preferovanými termíny a tezaurus bez preferovaných termínů.

Pro utvoření tezauru je nutno stanovit vedle požadavků na celkové uspořádání pravidla pro jeho tvorbu, pro výběr a formalizaci deskriptorů, zásady logických vztahů mezi deskriptory a zásady notace.

Deskriptor (preferovaný termín)

Podle ČSN ISO 5964 je deskriptor "lexikální jednotka užívaná závazně při indexování k vyjádření určitého pojmu." KTD uvádí, že vyjadřuje sémantickou dominantu zastupující celou třídu podmínění ekvivalence, ostatní podmíněně ekvivalentní slova a slovní spojení označovaná jako synonyma a kvazisynonyma se považují za nedeskriptory. Deskriptory spolu s nedeskriptory tvoří obsah tezauru.

Jde o normalizovaný preferovaný výraz zařazený do tezauru pro kordinované heslování. Může být jedno i víceslovný.

Příklad:
granit … stavební nerostné suroviny
galenit … polymetalické rudy
Deskriptorem mohou být:

Deskriptory se v tezauru seskupují do tématických tříd a skupin podle obecně uznávaného a používaného třídění dané tématiky. Tyto třídy a skupiny lze označit číselným kódem tak, aby kód vyjadřoval hierarchii pojmů.

Příklad:
třída: hutnictví železa - 12
tématická skupina: rudy Fe a Mn - 1202
deskriptor: siderit - 120271

Výběr deskriptorů se provádí na základě jejich vhodnosti a užitečnosti v komunikaci a ukládání a vyhledávání uvnitř systému. Obecně je nutno vzít v úvahu:

Tvar deskriptoru se řídí následujícími pravidly:

Vzájemné vztahy deskriptorů

V tezauru musí být vyjádřeny vzájemné vztahy mezi deskriptory a to vztah ekvivalence, hierarchie (nadřazenosti a podřazenosti) a afinity (asociačního přidružení).

Vztah ekvivalence

Jsou-li výrazy pokládány za ekvivalentní, musí být přiřazeny k jednomu a témuž pojmu. Jen tak je možno při zodpovídání rešeršního dotazu vyhledat všechny dokumenty sdružené s kategorií ekvivalence, i když je pouze jeden z výrazů považován za deskriptor. V tezauru se vyznačuje:

vztah ekvivalence --- UŽIJ ... anglicky USE
reciproční kód --- UM (užito místo) ... anglicky UF (used for)
Příklad:
čedič ... UŽIJ
bazalt bazalt ... UM čedič
Hierarchické vztahy

Jde o vztahy nadřazenosti a podřazenosti pojmů, které se zakládají na generické příslušnosti (nikoliv na hledisku použití apod.). V tezauru se vyznačuje:

širší výraz --- ŠV ... anglicky BT (broader term)
užší výraz --- UV ... anglicky NT (narower term)
Oba kódy jsou reciproční, tzn. že označení ŠV musí odpovídat odkaz UV.
Příklad:
žilná ložiska ... ŠV
hydrotermální ložiska hydrotermální ložiska ... UV žilná ložiska
Vztah afinity

Mezi deskriptory může existovat úzký pojmový, ale nikoliv generický hierarchický vztah. Takovýto vztah se považuje za vztah příbuznosti a v tezauru se označuje:

příbuzný výraz --- PV ... anglicky RT (related term)
Tohoto kódu se používá k charakterizování deskriptorů, kterí vykazují hlediskové vztahy založené na použití, vztahy typu příčina - následek, věc - vlastnost, vlastnost - proces, látka - proces.
Příklad:
žárovzdorné suroviny ... PV vyzdívky pecí
sopečná činnost ... PV efuzívní horniny
sirníkové rudy ... PV spékání

Nedeskriptor

Nedeskritory jsou výrazy, které nejsou způsobilé k začlenění do tezauru a tudíž k heslování a tvorbě dotazů, protože jsou:

Formální úprava tezauru

Normou je stanovena formální úprava tezauru a řazení jednotlivých částí jeho náplně následovně:

Nejčastější formou úpravy hlavní části tezauru je abecední uspořádání deskriptorů zapsaných velkými písmeny a doprovázených s nimi paradigmaticky spojenými deskriptory a nedeskriptory popsanými konvencemi UŽIJ, UM, ŠV, UV, PV, ke kterým ještě mohou přistupovat vymezující definice a závorkové klasifikátory pro odstranění víceznačnosti a logických problémů. Používá se následující pořádek heslového odstavce:

Příklady:
ABRAZIVA (UM - brusné kameny, UV - spongilit, UV - pemza)
PEVNÁ PALIVA (ŠV - energetické suroviny, UV - uhlí černé, UV - hnědé uhlí, UV - lignit, UV - antracit)
CEMENTÁŘSKÉ SUROVINY (ŠV - stavební suroviny, UV - vápenec, PV - anhydrit, PV - korekční cementářské suroviny)
RADIOAKTIVNÍ SUROVINY (ŠV - energetické suroviny, ŠV - rudy, UV - uranové rudy, UV - uran)

Ve druhé části tezauru jsou deskriptory uvedeny podle tematických tříd a tematických skupin, které musí být vůči sobě exklusivní. Za základ může být vzato jakékoliv třídění, které vyhovuje danému oboru.

4.5 Příklady dokumentografických bází dat

V současné době existuje celá řada dokumentografických systémů, které jsou využívány ve sféře geověd. Dále jsou uvedeny některé z nich jako příklady.

ASGI/ASTI (Automatizovaný Systém Geologických Informací / Automatizovaný Systém Technických Informací) je dokumentografická databáze, jejíž záznamy se ukládají od počátku 70. let. Je tvořen univerzální soustavou programů pro ukládání, klasifikování, vyhledávání a tisk údajů, pro aktualizaci a opravy, pro výběr ukazatelů, zpracování statistik a pro speciální úlohy. Tématickým obsahem jsou informace o publikované geologické literatuře a o nepublikovaných zprávách a posudcích o geologických pracích prováděných na území České republiky nebo českými experty v zahraničí, vědecké, výzkumné a vysokoškolské práce z geologických oborů a zprávy o zahraničních cestách. K vyjádření obsahu dokumentů se používají deskriptory podle Základního odvětvového tezauru pro geologické obory. Systém umožňuje zpracovávat retrospektivní rešerše a to buď ve formě katalogizačních lístků formátu A6 nebo ve formě bibliografie, uspořádané podle témat, klíčových slov (deskriptorů) a regionálního členění, adresní informace, standardní profily se širokým tématickým nebo oblastním zaměřením, problémově orientované báze informací, statistické analýzy fondu apod.

PASCAL-GEODE je dokumentografická databáze produkovaná BRGM (Francie). Jde o jednu z nejrozsáhlejších databází ve sféře geověd, s ročním přírůstkem cca 50 000 záznamů především z evropské provenience. Databáze je členěna do devíti sekcí (obecná a regionální geologie a stratigrafie, mineralogie a geochemie, ložiska nerostných surovin, petrografie a geologie moří, tektonika a geofyzika, hydrogeologie a inženýrská geologie, geologie životního prostředí, pokryvné formace, paleontologie). Z databáze jsou zpracovávány adresní informace a standardní profily z přírůstků fondu uspořádané podle požadavků odběratele, retrospektivní rešerše ve formě katalogizačních lístků nebo v bibliografickém uspořádání podle individuálních požadavků s rejstříky a problémově orientované báze dat. Spolupráce a producentem umožňuje získávat i kopie primárních dokumentů.

GEOREF je největší a nejvíce využívaná dokumentografická databáze geovědních oborů, s více než 2.3 miliony záznamů a s ročním přírůstkem 100 až 120 tisíc záznamů. Bázi vytvořil a provozuje AGI (Americký geologický institut). Nejméně 55 % záznamů pochází ze Severní Ameriky (geologická literatura od roku 1787) a cca 30 % z Evropy (od roku 1933). Zpracovávané dokumenty (knižní publikace, 3000 časopisů, konferenční sborníky, disertace, publikované mapy a atlasy atd.) se člení do 30 tříd od klasických oborů po obory aplikační a hraniční, které od roku 1982 převládají. Nezahrnuje astrofyziku, biologii, meteorologii a klimatologii. Informačním jazykem je GeoRef tezaurus s cca 15000 deskriptory.Databázi lze využívat prostřednictvím databázových center přímo, objednávkami rešerší nebo odběrem na CD.-ROM.

GEOBASE je multidisciplinární databáze obsahující informace z geografie, ekologie, geologie, oceánografie, geomechaniky, demografie atd. od roku 1980. Excerpuje informace z více než 1700 časopisů, konferenčních materiálů, knih a dalších dokumentů. Obsahuje přes milion záznamů.

Proquest/PCI je rozsáhlá databáze aktuálních informací společnosti Bell Howell. Zahrnuje plné texty cca 5000 periodik a bibliografické záznamy z dalších cca 3000 časopisů. Má multioborové zaměření na humanitní a společenské obory, obchod, lékařství, aplikované přírodní vědy a výpočetní a telekomunikační techniků. Umožňuje retrospektivní souhrny od roku 1990. Záznamy o nových publikacích jsou v databázi zveřejňovány nejpozději do 48 hodin od jejich vydání.

Eifl-direct poskytuje přístup k plným textům z více než 3200 vědeckých časopisů, novin a zpravodajství a z cca 1399 příruček především z oblasti společenských věd.

Produkt WorldCat multifunkčního producenta OCLC (Online Computer Library Center) je největší dokumentografická databáze na světě, na jejíž tvorbě se podílí přes 20 tisíc amerických a téměř 800 evropských knihoven. Zahrnuje informace o knihách, časopisech, audiovizuálních médiích, mapách, počítačových souborech apod.

Energy Citation Database (USA) obsahuje bibliografické záznamy vědeckých a technických informací týkající se energie, pocházející z DOE (Department of Energy), ERDA (Energy Research and Development Administration) a ARC (Atomic Energy Commission) od roku 1948. Zahrnuje citace zpráv, článků, konferenčních příspěvků, knih, disertací a patentů.

NTIS (National Technical Information Service) je bibliografická databáze, která zahrnuje citace více než 750000 vědeckých, vývojových a technických dokumentů (stav k 9.6.2003) vzniklých za podpory federální vlády USA a propojení k plnotextovým dokumentům (do 20 stran) na www stránkách federální vlády USA od roku 1983.

Environmental Sciences & Pollution Management je bibliografická databáze obsahující přes milion citací a abstraktů z více než 4000 vědeckých časopisů a tisíců dalších zdrojů (konferenční sborníky, zprávy, monografie, knihy, vládní publikace). Dělí se do 12 částí (např. vodní zdroje, ekologie, znečištění, rizika, toxikologie). Zahrnují prameny od roku 1981, v případě vodních zdrojů od roku 1967.

National Geologic Map Database je katalog článků a digitálních geologických map sestavený USGS. Lze v něm hledat podle témat (topografie, geologie, geomagnetika, sopky apod.), podle geografické lokality a mnoha dalších hledisek.

IMMAGE (Information on Mining, Metallurgy And Geological Exploration) je počítačový dokumentografický systém, vyvinutý IMM (Institut hornictví a metalurgie) v Londýně. Základem databáze byly velice rozsáhlé dokumentografické fondy institutu od roku 1982 a od roku 1906 abstrakty zveřejňované v Buletinu IMM, které od roku 1950 přešly do periodika IMM Abstracts. Systém využívá databázový prostředek CAIRS, který umožňuje provozování na různých typech minipočítačů, resp MICRO-CAIRS pro osobní počítače. Data jsou získávána z cca 1200 časopisů a více než 500 knih ročně přímo a dále výměnou s cca 200 institucemi ve více než 50 zemích. Postup přípravy, prověřování a ukládání dat do databáze je znázorněn na obr.6 Databáze obsahuje vedle datových a indexových souborů i deskriptorový soubor, kterým je prováděno heslování a kontrola. Vyhledávání a zpracování údajů lze provádět různými způsoby podle komodit, oblastí, technologických procesů, ložisek, dolů, zařízení, autora, publikace, názvu časopisu, roku atd. samostatně nebo ve zvolených kombinacích. Výstupy mohou být ve formě záznamů, tabulek, klasických nebo permutovaných předmětových rejstříků atd.

ENVIRONMENTAL SCIENCES POLLUTION MANAGEMENT obsahuje přes milion citací a abstraktů z více než 4000 časopisů a tisíců dalších dokumentů.. Člení se do 12 oddílů, např. Vodní zdroje, Ekologie, Znečištění, Rizika, Toxikologie.

Obr. 4.6: Schéma sběru, přípravy a ukládání údajů do bibliografického systému IMAGE (upraveno podle McGarra, 1988)

GEOMAPFIL (Geologic Map File) je dokumentografická databáze USGS, která obsahuje údaje o geologických, fotogeologických, hydrogeologických, topografických a inženýrsko-geologických, mapách v USA, které byly vydány od roku 1930. Systém poskytuje katalogy map podle druhů. oblastí, roku vydání apod., různé typy statistických údajů ve tvaru grafů o geologických charakteristikách, akumulacích nerostných surovin, horninách, mapovacích a průzkumných technikách atd. a vlastní mapy.

4.6 Zprostředkovatelé informací

Už bylo řečeno, že mezi tvůrcem (producentem) informací (dokumentografických i faktografických) a uživatelem stojí poskytovatel a zprostředkovatel informací. Tím je zpravidla určitá informační instituce nebo i jednotlivec.

Velmi významnou instituci poskytování a zprostředkování vědeckých a odborných informací představují knihovny. Vedle základních knihoven, jako je např. Národní knihovna či Státní technická knihovna to jsou hlavně knihovny akademické a vysokoškolské. Jejich kompletní přehled v rámci ČR lze nalézt na adrese <http://platan.vc.cvut.cz/advs> . Podobně existují i mezinárodní seznamy knihoven, např. Online Services of Europe´s National Libraries, Nordic Libraries:Information servess, The World Wide Web Library Directir atd.

Zprostředkovatelé informací (informační brokeři) pomáhají uživateli se orientovat v obrovském množství odborných informací, získat je z tuzemska i ze zahraničí, zajišťovat licence k bázím dat v digitálních knihovnách nebo v databázových centrech, jako je např. STN International, Dialog Corporation atd. Databázovým centrům konkurují zdroje na optických discích, na které se přesunul veliký počet titulů bází dat.

Databázové centrum STN International je tvořeno sítí tří nezávislých, technicky a organizačně spolupracujících center a to CAS (Chemical Abstract Services) v USA, FIZ Karlsruhe v Německu a JICST v Japonsku. Je to největší databázové centrum pro oblast vědecko-technických informací s důrazem na přírodní a technické vědy.