Zahlavi

Kauzální vztahy a šíření informace ve složitých časoprostorových systémech

Kauzální vztahy a šíření informace ve složitých časoprostorových systémech

Tue Aug 16 10:45:04 CEST 2016

Jak jsou změny v teplotě, v množství srážek či v síle větru na jednom místě na Zemi spjaty s obdobnými změnami na jiném, vzdáleném místě, je klíčová znalost potřebná k posouzení rizik souvisících se změnami klimatu. Vědci Ústavu informatiky AV ČR ve spolupráci s německými kolegy vyvinuli soubor matematických a výpočetních metod k odhalení kauzálních souvislostí změn meteorologických veličin v různých částech na Zemi. Je jimi možné identifikovat oblasti efektivně propojené se zbytkem světa, jejichž regionální změny klimatu můžou mít globální dopady na celou planetu. Vyvinuté matematické postupy lze použít k posouzení dopadu geoinženýrských zásahů nebo globálních následků lokálních extrémů počasí. Stejný matematický aparát a počítačové algoritmy mohou být využity ke studiu šíření informací ve finančních trzích nebo šíření vzruchů v lidském mozku.

Složité systémy (complex systems) je termín, který se stále častěji vyskytuje v odborných či populárně-naučných textech vznikajících v různých oblastech přírodních, technických i společenských věd. Používání termínu v různých kontextech často mění jeho význam a znesnadňuje jeho jednoznačnou definici. Obecně můžeme za složitý systém považovat ten, který se skládá z velkého množství částí, složek či subsystémů a jehož chování jako celku nelze popsat pouhou extrapolací chování jednotlivých složek nebo několika málo komponent.

Uvedená definice poukazuje na to, že „složitost“ (complexity) složitého systému pochází z interakcí mezi jeho komponentami. Chceme-li pochopit netriviální dynamiku, vznik tzv. emergentních jevů či důvody a projevy extrémních událostí ve složitých systémech, musíme pochopit interakce jejich komponent. Musíme jednak poznat, jak vznikají jednotlivé interakce dvojic či menších skupin komponent, ale také dokázat popsat složité struktury interakcí velkého počtu prvků. V popisu této nejvyšší úrovně pomáhá teorie složitých sítí, ve které si matematická teorie grafů podává ruku se statistickou fyzikou. Komponenty či subsystémy složitého systému chápeme jako uzly složité sítě; interakce mezi komponentami pak představují vazby mezi uzly (složité sítě). Vezměme si jako příklad složitého systému určité hospodářské odvětví. Firmy v něm představují komponenty, čili uzly sítě. Pokud firma A obchoduje s firmou B, uzly A a B jsou propojeny vazbou. Analýza takové sítě může přinést podnětné poznatky o postavení určitých firem na trhu, najít ty, které jsou nejvíce propojeny, nebo ty, jež představují mezistupně ve vzdálených, nepřímých vazbách. (Může třeba přispět k odhalení daňových podvodů.) Investor či obchodník na akciovém trhu se může dívat na stejnou množinu firem jinak. Neví, kdo s kým obchoduje, ale zná ceny akcií jednotlivých firem a jejich vývoj v čase. (Ano, nyní se musíme omezit na ty, jejichž akcie se obchodují na burze.) Cena za akcii firmy A v čase t je X(t), cena za akcii firmy B je Y (t). Jak běží čas, registrujeme datové soubory vyvíjející se v čase, takzvané časové řady. Uvedená situace je příkladem obecného problému, kdy komponentami složitého systému (a tedy uzly složité sítě) jsou dynamické systémy vyvíjející se v čase. Předpokládejme, že každý takový subsystém poskytuje alespoň jednu měřitelnou veličinu, jejíž vývoj v čase odráží časová řada. Nejjednodušším způsobem, jak zkonstruovat síť dynamických komponent, je výpočet korelací mezi časovými řadami příslušnými jednotlivým uzlům sítě. Pokud korelace mezi uzly A, B (například korelace mezi časovými řadami kurzu akcií firmy A a firmy B) je dostatečně velká (statisticky významná), uzly A a B jsou propojeny vazbou.


Obr. 1 – Schéma jednotlivých kroků analýzy složitého časoprostorového systému. Dynamický vývoj měřitelné veličiny (například teplota nebo tlak vzduchu) zaznamenávají časové řady příslušné bodům diskrétní mřížky. V procesu redukce dimenzionality se identifikují funkční subsystémy, které v určitém přiblížení charakterizují dynamiku celého systému. Časové řady charakterizující hlavní subsystémy jsou podrobeny analýze kauzality a je zkonstruována kauzální síť, ve které zůstanou jenom přímé vazby (plné čáry). Nepřímé vazby (čárkované) se dále neuvažují. Síla přímých vazeb je kvantifikována, vzniká vážený orientovaný graf, který lze dále analyzovat. Podle síly vazeb se ohodnotí důležitost jednotlivých uzlů (subsystémů) vzhledem k jejich schopnosti přijímat externí vzruchy a šířit je dál v celém systému. Odhalené subsystémy a jejich interakce se identifikují se známými jevy a zkoumají se jejich fyzikální mechanismy.

Složité sítě, zkonstruované z korelací časových řad, lze analyzovat metodami teorie grafů, a tudíž je možné nalézat uzly, které jsou nejvíce propojeny s ostatními, nebo takové, jež nejčastěji slouží jako mediátoři nepřímých vazeb. Vazba odvozená od korelací nemusí být nutně spojena s existencí fyzické vazby nebo komunikačního kanálu mezi dvěma uzly. Vysoká korelace znamená, že dynamika nebo vývoj dvou uzlů v čase jsou něčím podobné, že dva uzly podobně „fungují“. Takovému propojení se říká funkční konektivita. Termín pochází z oblasti neurověd, v níž je funkční konektivita odlišena od strukturní, anatomické konektivity. Je třeba si rovněž uvědomit, že korelace nemusí znamenat kauzalitu. Otázkou, jak nalézat kauzální vztahy pomocí časových řad, jsme se zabývali v AB 6/2014. Zavedli jsme pojem Grangerova kauzalita, jež představuje matematicky dobře definovaný, vyčíslitelný vztah založený na vzájemné prediktabilitě časových řad. Vysvětlili jsme si zobecnění principu Grangerovy kauzality pro nelineární systémy pomocí nástrojů teorie informace. Výpočetním nástrojem, který umožňuje rozhodnout, jestli jeden systém nebo proces kauzálně ovlivňuje jiný proces, je funkcionál zvaný podmíněná vzájemná informace (PVI). Připomeňme si, že „podmiňování“ v této terminologii znamená výpočet čisté závislosti dvou proměnných s vyloučením vlivu další, podmiňovací proměnné. K identifikaci kauzálního vlivu potřebujeme vypočítat množství informace o budoucnosti ovlivňovaného systému obsažené v přítomnosti ovlivňujícího systému, od které je podmiňováním „odečtena“ informace o budoucnosti ovlivňovaného systému obsažená v jeho vlastní přítomnosti, případně ve společné minulosti obou systémů. Ve výkladu jsme se omezili na vztahy dvou systémů, ale v současnosti studujeme složité systémy složené z velkého množství komponent, subsystémů. Kauzální vztahy nalezené analýzou dvojic subsystémů mohou obsahovat jak přímé, tak nepřímé vazby, zprostředkované jinými subsystémy. Pokud chceme odhalit jenom přímé kauzální vazby, musíme v analýze každé dvojice komponent zahrnout všechny ostatní komponenty do podmínky při výpočtu PVI. Avšak výpočty informačních funkcionálů vysoké dimenze jsou prakticky neproveditelné. Proto bylo nutné vyvinout algoritmus, který postupně analyzuje menší podmnožiny komponent a iterativním způsobem identifikuje kauzální síť ve formě orientovaného grafu.


Obr. 2 – Příklad komponenty – subsystému globálního klimatického systému získaného z teplotních polí (10 224 časových řad přízemních teplot). Mapa ukazuje lokalizaci této komponenty v tropickém Pacifiku, v oblasti známé jako východní větev fenoménu El Niño; křivka ilustruje reprezentativní průběh teplotních anomálií (odchylek od sezonních průměrů). Maxima této křivky určují epizody silného El Niña, například roky 1972–1973, 1982–1983, 1986–1987 nebo 1997–1998.

Výše jsme předpokládali, že ve studovaném složitém systému jsou jeho komponenty nějak přirozeně definované (například firmy v určitém ekonomickém systému). V mnoha složitých systémech tomu tak není. Představme si atmosféru Země. Teplotu nebo tlak vzduchu můžeme měřit v kterémkoli místě nebo čase. Říkáme, že studujeme spojitý časoprostorový systém. Jakékoli měření však představuje jenom diskrétní přiblížení spojitého systému. K dispozici máme jen omezený počet měřících senzorů na různých místech Země a měření provádíme v diskrétních časových okamžicích. Navzdory tomu získáváme velké množství měření. Ve studiích klimatu se měření z meteorologických stanic zpracovávají numerickým modelem a poskytují se jako časové řady na pravidelné mřížce, která pokrývá povrch Země. Takových časových řad je přibližně 10 000. Otázka je, jestli můžeme popsat spojitý časoprostorový systém jako složitou síť. Výzkumy ukazují, že ano, a korelační sítě jsou konstruovány i pro tak velký počet uzlů. Avšak konstrukce kauzální sítě je prakticky nemožná. Otázkou také zůstává, jestli má smysl hledat kauzální vztahy mezi uzly, které nereprezentují fyzikálně smysluplné subsystémy. Proto je potřeba najít v souboru přibližně 10 000 časových řad pokrývajících celou Zemi jakési hlavní komponenty, které reprezentují fyzikálně smysluplné subsystémy klimatického systému. Jde o první krok analýzy (obr. 1) složitého časoprostorového systému, který také představuje redukci dimenzionality dat. Z datového souboru 10 224 časových řad rovnoměrně rozmístěných po zeměkouli získáme 60 hlavních komponent (obr. 3) znázorňujících subsystémy klimatického systému, které obvykle představují známé klimatické jevy, jako je například jižní oscilace – El Niño (obr. 2) nebo severoatlantická oscilace. Na takto definovaných subsystémech lze uskutečnit analýzu kauzality a vytvořit kauzální síť neboli orientovaný graf. V dalším kroku kvantifikujeme kauzální vazby podle toho, jak velkou změnu v uzlu B způsobí změna určité velikosti v uzlu A. Tímto způsobem identifikujme ty uzly, které jsou důležité pro vstup a šíření perturbací ve studovaném systému.


Obr. 3 – Systém 60 komponent získaných z tlakových polí (10 224 časových řad přízemního tlaku vzduchu), číslovaných 0–59. Komponenty (subsystémy) slouží jako uzly klimatické sítě, jejichž vztahy jsou podrobeny kauzální analýze.

O výzkumu viz také: J. Runge, V. Petoukhov, J. F. Donges, J. Hlinka, N. Jajcay, M. Vejmelka, D. Hartman, N. Marwan, M. Paluš & J. Kurths: Identifying causal gateways and mediators in complex spatio-temporal systems. Nature Communications 6, 2015.

Tento soubor matematických a výpočetních metod (schematicky ilustrovaný na obr. 1) jsme aplikovali v analýze tlakových polí ve spolupráci s vědci z postupimského Ústavu pro výzkum dopadu klimatu (Potsdam Institute for Climate Impact Research, Postupim, SRN). Kromě identifikace citlivých oblastí Země, jejichž lokální změny můžou ovlivnit globální klima (tzv. tipping elements klimatického systému), byly objasněny interakce mezi oblastmi v Tichém a Indickém oceánu, které ovlivňují dobu a intenzitu monzunového období na indickém subkontinentu (obr. 4).


Obr. 4 – Příklad kauzálního propojení mezi subsystémem 1 (východní větev fenoménu El Niño) a komponentou 33 v Arabském moři, která je známá svým vlivem na průběh monzunového období na indickém subkontinentu. Barevná škála určuje sílu vazby, kladné, resp. záporné znaménko (červená, respektive modrá barva) směr účinku (snížení tlaku v 1 vede k jeho zvýšení v 0 a následně k zvýšení v 33). Číslo u vazby určuje časové zpoždění efektu nebo dobu trvání přenosu informace z jednoho uzlu do druhého (v týdnech).

Popsaný soubor metod lze aplikovat i v jiných vědních disciplínách, například ve výzkumu mozku. I když je mozek sítí diskrétních elementů – neuronů, v klinické praxi se registruje dynamika podstatně větších oblastí mozku. Například elektroencefalogram (EEG) představuje diskrétní záznam spojitého elektrického pole tvořeného sumací elektrické aktivity velkého počtu neuronů. Mozek se tak jeví jako spojitý časoprostorový systém a všechny kroky popsané analýzy jsou relevantní. V současnosti tyto přístupy testujeme ve výzkumu vzniku a šíření epileptických záchvatů ve spolupráci s vědci z Fyziologického ústavu a Neurologické kliniky FN Motol.
(Autor děkuje Jakobu Rungemu, Nikolovi Jajcayovi a Naděždě Palušové za pomoc s přípravou obrázků.)

MILAN PALUŠ,
Ústav informatiky AV ČR, v. v. i.