Kniha Přírody
 
autor: Milan Kunz

V Bibli se tvrdí, že na počátku bylo slovo. Moderní kosmologie se domnívá, že to počáteční slovo byla singularita, ve které se soustředil celý budoucí vesmír. Tato singularita se při velkém třesku rozprskla a od té doby se neustále rozpíná. Počátku se říká podle prvého písmena řecké abecedy alfa, a jestli se bude Vesmír jednou smršťovat, potom koncem bude slovo omega, jediné písmeno ve kterém se soustředí veškerá energie i informace. Také se mluví o knize Přírody, kterou se máme naučit číst.

V Bibli chybí jakékoliv údaje, jak to singulární slovo znělo a jak bylo velké, i když pro slovo je přesnějším výrazem dlouhé nebo hlasité. Při troše dobré vůle by bylo možné to tajemné slovo ztotožnit s knihou Přírody.

Knihu Přírody si můžeme představit v mnoha měřítcích. Když začneme s tím největším, tak se jedná o atlas galaxií, kde na x-tém listu na y-tém řádku je 5 galaxií a dva oblaky prachu, na dalším řádku je 10 galaxií a podobně.

V menším měřítku by se jako slova nebo písmena v knize Přírody vyskytovaly hvězdy různého typu a v tom nejmenším měřítku by to byly nukleony, elektrony a fotony či kvarky a jiné trosky získané rozbitím elementárních částic.

Vzhledem k tomu, že ve všech měřítcích se písmena neustále pohybují, tak se kniha Přírody neustále přepisuje. V každém okamžiku je ta kniha jiná. Pokud si představíme okamžitý stav jako svazek knihy, potom vlastně neexistuje jediná kniha Přírody, ale celá knihovna. Vesmír přeskakuje z jednoho svazku na druhý. Lze předpokládat, že při tom přeskakování se Vesmír musí pohybovat vždy k některému nejbližšímu svazku.

Knihy známe jako listy papíru, na které se podle určitých pravidel láme posloupnost slov. Posloupnost slov se může zapisovat vodorovně či svisle. Vodorovné psaní může začínat vlevo nebo vpravo s tím, že sekáme posloupnost slov na přibližně stejné kousky, řádky. Kdysi se zkoušelo skládat slova na stránku souvisle, střídavě odleva a pak odprava a opět odleva. Když si uvědomíme, že kniha je jediný řádek, pak různé texty jsou jako Adrianina nit, nebo odborněji vektor, který vede od počátku k určitému bodu.
 

Počty slov

Po trochu lyrickém úvodu si pro jednoduchost vezměme k ruce čtverečkovaný papír, na kterém si můžeme snadno nakreslit všechny vektory, posloupnosti slov, z abecedy dvou symbolů. Všechna slova délky m budou končit na úhlopříčných přímkách. Pro m = 2 to budou slova:

    aaa (aab, aba, baa) (bba, bab, abb) bbb.

Posloupnosti slov si můžeme zobrazit ještě pro tři symboly, ale pro více písmen nám chybí místo a musíme se spolehnout jen na úsudek. Posloupnosti slov si symbolicky představíme jako matici s n sloupci a m řádky. Sloupce označíme alfabetickým indexem (písmeny abecedy) a řádky budou souhlasit s pořadím symbolu v posloupnosti.

Pro abecedu n symbolů máme v každém řádku n možností výběru symbolu, který označíme jednoduše jednotkou. Ostatní sloupce zůstanou prázdné, tomu odpovídá nula. Jednotlivé možnosti jsou na sobě nezávislé, takže možnosti se vzájemně násobí n x n x n x ... Počet různých posloupností je tedy m-tou mocninou n.

Posloupnosti se mohou měnit dvěma operacemi symetrie. Substitucemi, které zaměňují symboly:

    aaa > bbb
    aab > bba
    aba > bab
    baa > abb.

Vzhledem k formálnímu zápisu symbolů do matice, lze substituce dosáhnout permutacemi sloupců matice. Proto můžeme mluvit o n-permutacích, které jsme už probrali [1].

Zápis:

    1 0 > 0 1
    0 1 > 1 0
    1 0 > 0 1

    odpovídá substituci aba - bab.

Pořadí symbolů mění permutace řádků matice. Proto to jsou m-permutace. Všechna slova, která lze získat m-permutacemi vedou ke stejnému bodu v prostoru. n-permutace přesunují slova v prostoru na sférických orbitách.

Permutacemi nelze dosáhnout přeměnu slova aaa na slovo aab. Oba typy slov patří na různé orbity.

Oba typy permutací jsou nezávislé a proto se násobí. Počty posloupností na jednotlivých orbitách se určí pomocí polynomických koeficientů pro n-permutace a m-permutace.

Posloupnosti pro m = 7 a n = 7 na orbitě (3, 2, 1, 1, 0, 0, 0), tedy třeba aaabbcd, mají oba polynomické koeficienty stejné. Polynomický koeficient pro n-permutace počítá se 3 symboly s nulovou frekvencí, se 2 symboly s jednotkovou frekvencí a po jednom symbolu s frekvencí 2 a 3: 7!/3!2!1!1! = 420. Polynomický koeficient pro m-permutace počítá frekvenci 3 jednoho symbolu, frekvenci 2 jednoho symbolu a frekvenci 1 dvou symbolů: 7!/3!2!1!1! = 420. Ve výrazu by se měly objevit i tři faktoriály 0! pro symboly s nulovou frekvencí. Vzhledem k tomu, že 0! = 1, nemění se hodnota a tak se tyto faktoriály vynechávají.

Pro n-permutace je tento polynomický koeficient maximálně dosažitelný pro m = 7 a n = 7. Pro m-permutace je maximálně dosažitelný polynomický koeficient 7!, pokud se každý symbol v posloupnosti objeví pouze jedenkrát: abcdefg.

Pokud by nebyla hodnota m omezená nebo daná, potom by se dosáhla stejná hodnota i u tohoto polynomického koeficientu, ovšem hodnota m by musela být alespoň 18.

Počty sekvencí na jednotlivých orbitách se opět dají seřadit do tabulek (viz přílohy ESO [E1] nebo TEX [T1]). Součty dávají mocniny n na m-tou. Jsou to velmi rychle rostoucí čísla, která se dají rozložit na součin dvou matic. Jednu tvoří matice binomických koeficientů, druhou maticí jsou diference, které se získávají operátorovou algebrou. S odpovídajícími čísly se opět dají provádět různé operace a tak se získají různé kombinatorické identity, jako jsou třeba Lahova čísla.

Identity spojené s mocninami jsou známy v literatuře jako rozdělení m rozlišitelných věcí do n buněk. Toto označení je nepřesné. Ve skutečnosti jsou věci, lépe řečeno objekty, nerozlišitelné. Pouze víme, že na i-tém místě je objekt v j-té buňce (poli matice). Samotné objekty nejsou nijak označeny a proto jejich vzájemné permutace nemají význam. Pokud objekty opravdu označíme, nejlépe třetím indexem k, potom dostaneme jiné rozdělení a místo mocnin dostaneme rostoucí faktoriál, což je podíl dvou faktoriálů.
 

Nadbytečnost informace

Pro elektronický přenos zpráv by bylo optimální, kdyby se všechny symboly vyskytovaly v textu stejně často. Tehdy by přenos mohl být nejekonomičtější.

Shannon [2] nazval rozdíl mezi optimálním stavem, teoreticky maximální možností, a skutečnou četností symbolů, měřenou pomocí informační entropie, nadbytečností (redundancí). Přirozené soustavy se však vůbec neřídí teorií komunikace. V přirozených jazycích se některá písmena vyskytují v textu velmi často jiná jsou poměrně řídká.

Tato vlastnost není charakteristická jen pro lidskou řeč. I v DNA se různé kombinace nukleových kyselin kódující sekvence aminokyselin se vyskytují s různou frekvencí. To umožňuje vytvoření daleko většího počtu kombinací.

Faktoriál sedmi je 5040. To je počet slov vzniklých permutacemi abcdefg. Jak jsme už ukázali, slov se sedmi písmeny typu aaabbcd je 176400 (při substitucích na různé kombinace, třeba eeeffgb). A na orbitě (2, 2, 1, 1, 1, 0, 0) je slov se sedmi písmeny (typu aabbcde) dokonce 264600. Nadbytečnost je spojena s větší rozmanitostí.

Tuto skutečnost využil jako prvý Morse. Při kódování abecedy kombinacemi teček a čárek přidělil nejčastěji se vyskytujícím písmenům nejkratší kombinace. Pro anglickou abecedu vystačil maximálně se čtyřmi tečkami či čárkami. Kdyby se snažil, aby všechny kódy byly stejně dlouhé, musel by použít kódování s pěti tečkami či čárkami.

Počty posloupností jsou nepředstavitelně velké. Vezmeme-li jako knihu jen dvě stě stran textu s asi 2000 symboly na stránce, vychází jako počet knih číslo s 700 tisíci nulami. Mezi těmito knihami by byly všechny knihy (delší rozdělené do svazků) ve všech jazycích psané nebo transkribované latinkou. Nebo jinak, ke každé knize by existovalo asi 24 milionů výtisků, které by se lišily jedinou tiskovou chybou od originálu, pokud by se vůbec mohlo rozhodnout, co je originál.

Mocninová funkce se obvykle spojuje s představou krychlí a jejich objemem. S touto formou této funkce si budeme hrát jako s Rubikovou kostkou příště.

Literatura:

[1] Kunz, Milan:. Hyperprostor. Natura 3/1999.

[2] Kunz, Milan: How to distinguish distinguishability: Physical and combinatorial definitions, Physics Letters A 135 (1989) 421-424.

[E1] Combinatorics of natural vectors.

[T1] Combinatorics of natural vectors.


časopis o přírodě, vědě a civilizaci