10. Počítačové sítě a internet

Velmi významným zdrojem vědeckých, odborných, finančních a obchodních informací a prostředkem pro odborné komunikace poštovního i diskusního typu je INTERNET, který lze považovat za charakteristický fenomén vývoje poslední doby.

Snaha o dálkový a co nejrychlejší přenos informací doprovází celé dějiny lidstva. Stačí připomenout signalizaci ohněm, kouřem, světlem či zvukem, systém šíření zpráv pomocí běžců v Incké říši v Peru, Chappeův optický telegraf, Morseův telegraf či telefon Grahama Bella. Za základní milníky Internetové prehistorie se považuje položení prvého transatlantického kabelu v roce 1858 a vypuštění družice Sputnik v roce 1957 (obr. 10.1). Hlavní milníky vývoje telekomunikačních technologií obsahuje tabulka 10.1.

Obr. 10.1: Předchůzci Internetu; A - Signalizace ohněm; B - Optický telegraf; C - Kladení podmořského kabelu v roce 1858; D - Sputnik 1 vypuštěný v r. 1957

Tab. 10.1: Vývoj telekomunikačních technologií

časúzemítyp telekomunikace
2900 př.Kr.Egyptská říšepředávání zpráv pomocí holubů
2.tisíciletí př.Kr.Egyptská říšeběžci a kurýři na koních
1250 př.Kr.antické Řeckoohňové signály oznamovaly vítězství Achájů v trojské válce
776 př.Kr.antické Řeckooznamování výsledků olympijských her pomocí holubů
650 př.Kr.Babylonieběžecká štafetová kurýrní pošta
490 př.Kr.antické ŘeckoPhidippides donesl z Maratonu do Athén zprávu o vítězství
5.-4.století př.Kr.antické Řeckosvětelné a vlajkové signály v pozemních a námořních bitvách
5.století př.Kr.Afrika bubnové signály
400 př.Kr.Persievyvolávači krátkých důležitých zpráv
360 př.Kr.antické Řeckovodní telegraf
37 po Kr.Římská říšecísař Tiberius - heliograf
1.stol. po Kr.Římská říšejezdecká štafetová kurýrní pošta (160 km/den)
150 po Kr.Římská říšesíť kouřové signalizace o celkové délce 4500 km
1280 po Kr.MongolskoKublai Chánova jezdecká štafetová kurýrní pošta (až 300 km/den)
2.pol.15.stol.Incká říšeběžecká štafetová kurýrní pošta o délce 5000 km (až 250 km/den)
1794FrancieChappeův optický (mechanický) telegraf
1803Velká Británievlajkové telegrafické signály v námořnictvu
1832USASamuel Morse - elektrický telegraf a abeceda
1858prvý transatlantický podmořský kabel
1876Velká BritánieAlexander Graham Bell - telefon
1895ItálieGuglielmo Marconi - bezdrátová telegrafie
1901transatlantická bezdrátová telegrafie
1902Arthur Korn - fax
1904radiový projev - Reginald A. Fessender
1927USAprvý dálkový radiový a televizní přenos (projev H. Hoovera)
1957SSSRprvý satelit Sputnik I
1962prvý telekomunikační satelit Telstar
1969USAARPANET - předchůdce Internetu
1971e-mail
1991Internet - World Wide Web

10.1 Vývoj internetu

Koncem 60. let minulého století americké ministerstvo obrany počalo realizovat projekt výměny dat mezi velmi vzdálenými počítači ARPA (Advanced Research Project Agency). Cílem bylo vybudovat takový systém strategického velení, který by přežil nukleární válku (tento cíl vlastně postavil president Eisenhower po vypuštění Sputniku). V roce 1969 byla realizována prvá sít ARPANET (obr. 10.2), spojující Standfordský výzkumný institut (SRI) a univerzity v Los Angeles (UCLA), Santa Barbaře (UCSB) a v Salt Lake City (UUSLC).

Obr. 10.2: Schema první sítě ARPANET z roku 1969 (IMP - Interface message processor, v kroužcích typ počítače)

K této síti se svými počítačovými systémy postupně připojily americké univerzity, úřady a další instituce (obr. 10.3) a nakonec i průmyslové a obchodní organizace. Síť se šířila do dalších států, zejména zemí západní Evropy.

Obr. 10.3: Logická mapa sítě ARPANET v roce 1971

Postupnou standardizací (Internet Networking Group v r. 1972), transformací a komercionalizací (TELNET v r. 1974) se vytvořila celosvětová sít. Uvedená koordinační skupina vyvinula do roku 1982 soubor protokolů TCP/IP (Transmission Control Protocol and Internet Protocol), který prvně definoval Internet jako soubor propojených sítí. V roce 1983 došlo k oddělení vojenské počítačové sítě nazvané MILNET od civilní sítě ARPANET, která začala od roku 1990 vystupovat pod současným názvem INTERNET. Počet jejich uživatelů obrovským způsobem vzrostl zejména v 90. letech a každým dnem se prudce zvětšuje (obr. 1.9 a 1.10). Připomeňme, že do roku 1993 ve sféře prezentace textů se prakticky bezkonkurenčně uplatňovala služba Gopher, která ale pracovala pouze s textovým rozhraním.

Po technické stránce jádro sítě tvoří síť superpočítačů, které jsou propojeny linkami s vysokou rychlostí přenos (páteřní sítě). Na páteřní sítě jsou přes uzlové body (SPB) připojeny regionální sítě, které jsou propojeny s menšími sítěmi, ty s dalšími, až k počítačům jednotlivých uživatelů (obr. 10.4). Lokální sítě označované někdy jako Intranet mohou mít různou topologii (hvězda, kruh, bus) podle dispozic příslušných organizací. Jde tedy o decentralizovanou celosvětovou strukturu se svobodným přístupem, do které lze vstoupit prostřednictvím poskytovatelů služeb (providerů). Počítač zajišťující připojení k Internetu se nazývá hostitel. Někteří hostitelé jsou internetovými servery, které udržují informace o dalších serverech a tak vytvářejí strukturu sítě. Jednou z velkých předností Internetu je právě skutečnost, že jej nikdo nevlastní. Poznámka: každý počítač může v závislosti na programovém vybavení plnit různou funkci (koncového uživatele – klienta, serveru, hostitele či směrovače).

Obr. 10.4: Logická struktura Internetu s víceúrovňovou architekturou

Nástup síťových komunikací v bývalém Československu začal ve druhé polovině 80. let, připojení ČR k Internetu se datuje k listopadu 1991. Vzhledem ke špatnému stavu komunikační sítě bylo nejprve nutno vybudovat páteřní síť CESNET, která propojila nejvýznamnější akademická střediska (koncem března 1993 to bylo 11 měst). V rozvoji Internetu sehrálo paradoxně svoji pozitivní úlohu uvedené zpoždění, neboť se v praxi projevilo v relativně modernějším technickém vybavení.

Každý počítač v síti Internetu je jednoznačně určen pomocí číselné IP adresy (Internet Protocol), např.

216.27.61.137
uložené v počítači v binární formě
11011000.00011011.00111101.10001001
které se převádějí do symbolických doménových adres. Ty vycházejí ze systému práce s tzv. doménami DNS (Domain Name System). Symbolická adresa se skládá ze jména počítače a výčtu názvů domén oddělených tečkami, které upřesňují umístění počítače, ve tvaru jméno_počítače. doména_n. ….. . doména_2. doména_1, tedy v uspořádání do sledu od domény nejnižší úrovně k doméně nejvyšší úrovně (obvykle identifikátoru státu podle ISO 3166, např. cz pro Českou republik, pl pro Polsko, uk pro Velkou Británii, fr pro Francii). U domén nejvyšší úrovně se často uvádějí označení oborových domén, např.

komerční institucecom
nekomerční instituceorg
vzdělávací instituceedu
vládní institucegov
vojenské organizacemil
organizace provozující sítěnet

V praxi je třeba postoupit dále a mít možnost určit jméno uživatele, název hledané stránky atd. K tomu slouží univerzální adresy URL (Uniform Resource Locator). Jejich obecné schéma je

protokol://[jméno[:heslo]@]adresa_serveru[:port][cesta],
ve které:

10.2 Služby internetu

Internet poskytuje v současné době uživatelům řadu služeb, z nichž lze z odborného hlediska považovat za nejdůležitější získávání a šíření vědeckých a odborných informací a možnost rychlé a snadné komunikace formou elektronické pošty a diskusí v rámci odborných diskusních fór.

10.2.1 World Wide Web (WWW)

Je nejznámější a nejzajímavější služba Internetu. Jde o distribuovaný informační a vyhledávací systém typu klient – server, který poskytuje jednoduché prostředky pro vyhledávání a stahování hypertextových a multimediálních dokumentů mezi počítačovými systémy. Vznikl v Laboratořích fyziky částic vysokých rychlostí CERN (Conseil Européen pour la Recherche Nucléaire) v Ženevě v roce 1991, ideu zveřejnil v roce 1990 Berners - Lee.

WWW používá standardní komunikační protokol http (Hypertext Transfer Protocol), nezávislý na použité platformě, pro zajištění komunikace a přenosu stránek mezi prohlížečem a serverem, na kterém jsou uloženy internetové stránky obsahující požadované informace (pod pojmem internetová stránka se zhruba rozumí soubor informací uložený na jedné URL adrese).

WWW stránka se skládá z textového souboru ve formátu html a případných dalších souborů s obrázky a animacemi. Dokument ve formátu html je v principu textový soubor, který je doplněn speciálními znaky jazyka HTML (HyperText Markup Language – hypertextový značkovací jazyk). Tento jazyk slouží pro popis, formátování a doplňování textového souboru dalšími prvky a ke sledování odkazů na dokumenty uložené kdekoliv na Internetu. Zdroj WWW má tedy např. adresu

http://www.usgs.gov
(hlavní stránka Geologické služby USA).
Poznámka: soubory se stránkami HTML mají v unixovském prostředí příponu html a v prostředí Novellovského typu htm.

Pro ilustraci jsou dále uvedeny příklady zdrojů informací z oblasti geověd:

  1. Geologické informace:
  2. Mapové servery a zdroje GIS:
  3. Satelitová data:

Značkovací jazyky definují jednoduchý, pevně stanovený typ dokumentu, používaný nejčastěji na Webu, upravený značkováním do standardní formy. Text a grafiku dokumentu doplňují speciální znaky (tagy), které specifikují příkazy jazyka. Značkovací jazyky se stále rozvíjejí a zvětšují své možnosti (obr.10.5). Jazyk XML (eXtensible Markup Language), který navazuje na principy a konvence HTML a SGML (Standard Generalized Markup Language), představuje standard pro popis strukturovaného a semi-strukturovaného textu určeného pro šíření a publikaci na celé řadě médií (Bradley, 2000). Zároveň je užíván v prostředí nově zaváděných verzí relačních databází, při komunikaci mezi aplikacemi různých výrobců apod. Jazyk XML je rozvíjen do aplikací pro různé oblasti, např. GML (Geography Markup Language pro geodata či XMML (Exploration and Mining Markup Language) pro data z průzkumného a těžebního průmyslu).

Obr. 10.5: Schema vývoje zančkovacích jazyků (Bradley, 2000)

Pro vytváření vlastních stránek existuje řada nástrojů. Nejjednodušší jsou Microsoft Internet Assistant, lepší možnost představuje Microsoft Front Page a pro profesionální účely slouží Microsoft Internet Studio.

K nalezení hledaných informací jsou určeny různé vyhledávací systémy (Search engines) – např. Excite, AltaVista, Infoseek, WebCrawler, HotBot, Yahoo!, Google atd. – které pracují na principu automaticky obhospodařovaných indexových databází. Tyto databáze spravují vyhledávací servery.

Vyhledávání probíhá na základě dotazu, tedy požadavku na vyhledání stránek obsahujících žádanou informaci či informace. Dotaz se sestavuje podle následujících pravidel:

požadované informaceforma dotazu
jedno slovogeostatistika
alespoň jedno ze zadaných slov pravděpodobnost statistika geostatistika
pravděpodobnost OR statistika OR geostatistika
všechna zadaná slovapravděpodobnost + statistika + geostatistika
pravděpodobnost AND statistika AND geostatistika
zadaná slova v daném pořadí„matematická statistika”
poblíž stojící zadaná slovastatistika NEAR geostatistika
příbuzná slovageo*

(Požadavky lze seskupovat pomocí závorek a logických operátorů). Vyhledávací servery sdružují nástroje pro vyhledávání informací a prostředky pro jejich aktivní nabídku. Nejkomplexnější stránky tohoto typu se nazývají portály.

Vyhledání požadovaných informací je vzhledem k obrovskému počtu stránek obtížné. Proto jsou v současné době rozvíjeny sofistikovanější technologie vyhledávání. Velmi efektivní je přístup firmy H5 Technologies. Je založen na generovaných profilech vytvářených porovnáváním slov ve vyhledávaném textu s odpovídajícími hesly ve slovníku obsahujícím 400 000 hesel a přiřazením kategorií informací k dokumentům. Výsledný kód je porovnáván s ostatními dokumenty k cílenému vyhledávání. Firma Inxight nabízí nástroj Star Tree, který graficky imituje „pavučinu” sítí ikon dat, v níž se můžeme pohybovat mnohem rychleji, než v případě konvenčních vyhledávačů. Nástroj Table Lens téže firmy zobrazuje přehledy ve formě velkých tabulek, ve kterých lze hledat dokumenty k požadovaným datům.

Pro zobrazení, přenos a tisk nalezených stránek jsou určeny prohlížeče (browsery), např. Internet Explorer, Netscape Navigator, Mozilla, Opera, Konqueror atd. Poslední verze prohlížečů podporují velmi dobře webovské standardy vzhledu (HTML a CSS – Cascading Style Sheets) a funkčnosti (ECMAScript a CSS DOM). V případě pomalé odezvy při přenosu lze stránky automaticky stáhnout pomocí speciálního programu.

10.2.2 Přenos souborů

Přenos souborů je další velmi užitečnou službou Internetu, neboť umožňuje komukoliv kopírovat volně přístupné materiály a materiály poskytované za úplatu a naopak zveřejňovat vlastní práce (jak už bylo uvedeno v kapitole 4, jde o novou formu publikování, která je rovnocenná klasickým způsobům). I když je méně populární než hypertextové surfování (brouzdání), má hlavní význam v případě, že potřebujeme manipulovat s většími objemy dat.

Tato komplexní práce se soubory se provádí pomocí protokolu FTP (File Transfer Protocol), který zajišťuje přenos jednotlivých souborů ze souborového archivu na serverech FTP nebo anonymních serverech na počítač uživatele a naopak. Protokol FTP je schopen přenosu mezi počítači používajícími různé operační systémy a různé způsoby kódování znaků. Obecný tvar FTP adresy může být

ftp://uživatel:heslo@název_počítače/
nebo
ftp://uživatel@název_počítače/
Práce přenosu je podobná jako např. při použití Průzkumníka (Exploreru) Windows. Pro přenos stejných souborů na řadu míst určení se používá Multicasting Protocol. Trasy v páteřních sítich, po kterých je takový přenos realizován, se označují Mbone (Munzner et al., 1996).

Důležitou vlastností FTP serverů je podpora přístupových práv. Touto cestou lze také snadno získat volně přístupné programové produkty, u kterých je ale nutno se seznámit s podmínkami používání (tab.10.2).

Tab. 10.2: Podmínky používání volného softwaru

podmínkafreewaresharewarePublic domain
bezplatný přenos do počítačeanoanoano
bezplatné používáníanove zkušební doběano
chráněný autorským právemanoanone
povinnost registracenepo zkušební doběne
možnost změn programuneneano
Přehled o dostupných souborech lze získat pomocí databáze serverů FTP nazývané Archie, která je přístupná prohlížečem WWW.

10.2.3 Výpočty na vzdálených počítačích

Výpočty na vzdálených velmi výkonných počítačích, které byly jednou z původních inspirací sítě ARPANET, představují stále užitečnou službu zvláště pro vědecké účely. V obecném povědomí výpočty na superpočítačích jsou spojovány s řešením meteorologických problémů, projektováním letadel a letadlových lodí apod. či s vojenskými operacemi. V současné době se tyto výpočty výrazně přesouvají do oblasti chemických a biologických věd (modelování rozsáhlých buněčných struktur, DNA apod.). V souvislosti s tím vznikla a postupně se realizuje velmi perspektivní myšlenka supervýpočtů na distribuované síti počítačů spojených velmi výkonnými optickými páteřemi – gridech (v podstatě jde o virtuální počítače – metapočítače). Příkladem je projekt Národní vědecké nadace USA Teragrid, který umožní výpočty v rozsahu 13.6 teraflopů (trilionů operací za sekundu). V této síti budou převážně IBM servery spojeny optickou sítí s přenosem 40 gigabitů a v budoucnu 50 - 80 gigabitů za sekundu. Dalšími pdobnými projekty jsou UKGrid spojující 11 britských univerzit a CERN, evropský DataGrid, AstraGrid atd. V souvislosti s tímto trendem začíná být nejasné pojetí superpočítače. Jde totiž o multiprocesorové systémy /clustery) na bázi standardních procesorů spojených do sítě. Příkladem je japonský NEC Earth Simulátor s výkonem 35.7 teraflopů, počítač ASCI White s 8192 procesory, resp. v roce 2004 do provozu uvedený systém ASCI Purple s 16384 procesoru Power 5, výkonem 100 teraflopů a pamětí 2 petabyty, o váze 197 tun na ploše 828 m2. Gridy a distribuované výpočty jsou pokládány za velmi perspektivní technologii, což dokládá produkce dodavatelů velkých systémů pracujících s distribuovanými databázemi.

Obr. 10.6: Schéma počítačové sítě Teragrid

10.2.4 Elektronická pošta

Elektronická pošta (e-mail) je komunikační služba, která umožňuje zasílat jiným uživatelům Internetu zásilky či zprávy ve formě datových souborů. Vychází z koncepce jednotného přenosového protokolu SMTP (Simple Mail Transfer Protocol), který zaručuje globální kompatibilitu. Tento protokol byl původně určen jen pro přenos krátkých textových zpráv zapisovaných sedmibitově. To přinášelo problémy hlavně při přenosu doprovodných souborů. Proto byl vypracován standard MIME (Multipurpose Internet Multimedia Extensions). Výhodami elektronické pošty jsou neporovnatelně vyšší rychlost, spolehlivost, pohodlí a efektivita, levný provoz a možnost dávkového způsobu práce. Univerzální přenosový mechanismus, který využívá klasický model klient – server, umožňuje k textovým dopisům připojovat přílohy ve formě datových souborů libovolného typu. Poštovní zásilka elektronické pošty má několik částí:

Struktura adresy je následující:

adresát@doménová specifikace počítače, resp. organizace

10.2.5 Diskuse, debaty a konference

Internetové diskusní skupiny (newsgroups) umožňují zveřejňovat dotazy a příspěvky (tzv. „vyvěšování zpráv„) na dané téma, které jsou k dispozici všem členům diskusní skupiny. Vzniklé společenství diskusních skupin se označuje USENET. Newsgroups jsou v této síti klasifikovány hierarchicky podle témat do cca dvaceti kategorií (hlavních témat), např. SCI (věda, vývoj, výzkum), COMP (počítačově orientované skupiny), SOC (společenské, kulturní a náboženské problémy) atd. Ve sféře geověd existuje celá řada diskusních skupin, např. sci.geo.geology, sci.geo.tectonics, sci.geo.mineralization, sci.geo.hydrology atd. (tab.10.3).

Debaty v počítačové síti probíhající psanou formou v reálném čase mezi dvěmi či více účastníky se označují chat. Mohou probíhat prostřednictvím elektronické pošty, přes stránky WWW nebo pomocí speciálních programů IRC (Internet Relay Chat), ICQ (I Seek You) nebo NetMeeting, který je součástí rozšířené instalace prohlížeče Internet Explorer.

Tab.10.3: Charakteristika diskusní skupiny geologie

označeníadresanáplň
sci.geo.geologyhttp://tile.net/news/scigeology.htmlDesková tektonika, tektonofyzika, petrologie, mineralogie, vulkanologie, strukturní geologie, paleontologie, sedimentologie, seismologie, seismický průzkum, stratigrafie, geologie ropy, geochemie, hydrologie, geochronologie, paleomagnetismus, paleoklimatologie

10.3 Internet jako součást kyberprostoru

V souvislosti s explozivním růstem informačních technologií a komunikačních systémů se často mluví o vzniku kybernetického prostoru (kyberprostoru). Pod tímto pojmem se chápe digitálně vytvořená nebo zprostředkovaná skutečnost, která zahrnuje Internetovou počítačovou síť, telekomunikační sítě, síť optických komunikačních kabelů a systémy satelitů. Jde tedy o technologie virtuální reality. Tento proces je doprovázen vznikem kyberprostorové topografie (Kapoun, 2001), která se zabývá sestavováním map síťové infrastruktury (zobrazení tras optických kabelů, rozmístění serverů, rozmístění a trasy satelitů), map zachycujích možnosti připojení či hustotu výměny dat v různých zónách, map internetového trhu, nárůstu IP adres apod. Všechny tyto materiály se vyznačují vysokou dynamikou změn.

Obr. 10.7: Mapy kyberprostoru (Dodge, 2003);
A - globální topologie sítě pro násobný přenos; B – intenzita telekomunikačních spojení

Kyberprostorová topografie poskytuje informace jak telekomunikačním odborníkům, tak manažérům komerčních společností, pracovníkům územního plánování, vojenským odborníkům apod.

Struktura kyberprostoru (kyberstruktura) popisuje rozložení, integraci a koordinaci informačních technologií a lidských zdrojů pro podporu studia a řešení vědeckých a inženýrských problémů. Krátce řečeno, kyberstruktura poskytuje technologickou „osnovu” a základy infrastruktury pro moderní vědu (Berman 2001). Příkladem je kyberstruktura pro vědy o Zemi GEON (GEOsciences Network), která je připravovaná superpočítačovým střediskem v San Diegu v Kalifornii ve spolupráci s odborníky, zabývajícími se výzkumem Země, resp. jednotlivých geosystémů (Tooby 2003).