Informace a její přenos

Informace a její přenos

Míra informace

Vhodné struktury:

  • Nositel informace – výpovědi v telekomunikačních přenosech, signály atd.
  • Výrok nesoucí informaci můžeme zkoumat z různých hledisek: schematické – významové, kvantitativní – objemové, pravdivostní …
  • Z kvantitativního hlediska můžeme hovořit o množství informace
  • Hlavně z pohledu kapacitních přenosových možností sítí zajímá kvantitativní hledisko
  • Protože výrok hovoří o určitém jevu, existuje zde korespondence mezi výroky a jevy
  • Stačí nám kvalifikovat jevy z hlediska množství informace, tj. výroků nebo jevů

Vznikají otázky:

  • Jak měřit informaci, výrok, jev?
  • Můžeme měřit všechny jevy?
  • Co je to obecně míra?

Ze zkušenosti víme, že všechny systémy objektů měřitelných v určitěm smyslu tvoří různou strukturu. Struktura je množina prvků, při kterých platí určité vlastnosti.
Definice míry informace:

  1. – okruh
  2. – okruh
  3. 3.

X={{1}, {2}, …, {6}} elementární jevy při hodu kostkou
Věta: je vždy algebra
Věta:
Důkaz:
Věta: Neprázdný systém podmnožin množiny X je algebra
Důkaz:
Věta1: Pokud je okruh g-okruh nebo – okruh
Věta2: Každý – okruh je okruh
Každý okruh je g – okruh
Věta3: Pokud je okruh
Věta4: Pokud
Definice:V5, V6 Okruh e podmnožin množiny X (s – okruh) nazýváme algebra (s – algebra), jestliže X EURe
Definice: Nechť e je systém podmnožin množiny X. Funkce definovaná na e, která nabývá hodnot v R (včetně )
Nazýváme množinovou funkcí.
Definice: Říkáme, že množinová funkce j definovaná na systému e je konečná pokud „E EURe j(E) EURR
Definice: Množinovou funkcí j definovanou na systému e, kde Æ EURe nazýváme aditivní, pokud j(Æ)=0 a „E, F EURe kde EÇF=Æ, EÈF EURe platí j(EÈF) = j(E) + j(F).
Definice: Nechť U je systém podmnožin množiny X, kde Æ EURU. Množinovou funkci j definujeme na U a nazýváme ji s – aditivní, pokud j(Æ)=0 a takovou funkci, že
Definice: Nezápornou s-aditivní funkci definovanou na okruhu R pro E, F EURR nazýváme mírou.
Věta6: Neprázdný systém e podmnožin množiny X je s-algebra {En} EURe È En EURe
„E EURe E‘ EURe
(důkaz stejný jako k Větě5)

Míra informace

Je zřejmé, že není aditivní.
E – při hodu kostkou padla sudá hodnota
F – při hodu kostkou padla hodnota 3
j(EÈF) < j(E), j(EÈF) < j(F)
Z analogie víme, že můžeme pokusit nahradit vlastnost aditivity.
Definujeme si pseudoaditivitu za stejných podmínek jako aditivitu:
j(EÈF) = j(E) + j(F)
Míra informace j (množství informace( x ) není aditivní množinová funkce.
Její vlastnosti:

  • klesající funkce
  • operace je komutativní i asociativní i distributivní
  • j(W) = 0 (celý prostor = 0)
  • j(A) + j(B) = 0
  • spojitá funkce
  • j(EÇF) = j(E) + j(F) pro nezávislé jevy

Operace °

k > 0, k = 1 a – rozhoduje v jakých jednotkách budeme pracovat
pokud a = 2 [bit] v Shannonově teorii
a = e = 2,7 [nat]
Čím větší je jev, tím menší množství informace {2} < {2, 4, 6}
j{2} > j{2, 4, 6}
Definice míry informace vyplývá z definice operace °.
!!! j(E) = – k.logaP(E), k = 1 ⇒ j(E) = – logaP(E) – elementární !!!
V závislosti na volbě a rozlišujeme jednotky klasicky (?)
Pokud porovnáme míru informace s klasickou mírou:
P(EÈF) = P(E) + P(F)

Entropie (neurčitost)

– je střední hodnota množství informace (ze statistického hlediska)

Entropie – míra informační výdatnosti pokusu, neurčitost pokusu
Hodnota j(A) představuje množství informace, které získáme, pokud víme, že nastane jev A. Touto úvahou přisuzujeme příjemci informace pasivní roli. Příjemce může být aktivní, pokud hodlá provést pokus, pomocí kterého zjistí, která z jisté konečné množiny možností nastane. Množinu možností jevů – výsledků pokusu obvykle můžeme zvolit vhodným výběrem otázky, pokusu, … V teorii informace definujeme pokus P jako konečný měřitelný rozklad určitého jevu X ⇒ P = {A1, …, An} přes Ai ∈ e, přičemž Ai ∩ Aj = Ø pro i ≠ j.
Pokus je tím nevýhodnější, čím více poskytuje informace, ale jaké je kritérium vhodnosti daného pokusu? Hodnoty j(Ai) to nemohou být, protože mohou být různé a tedy při jednom výsledku pokusu P dostaneme více informace, při jiném méně. Musíme přiřadit pokusu P nezáporné číslo H(P) vyjadřující průměr čísel j(A1)…j(An). Čím je hodnota H(P) vyšší, tím je pokus P informačně výhodnější. Hodnotu H(P) nazýváme entropií.

Entropie jako střední hodnota náhodné veličiny

Máme-li pravděpodobnostní prostor (X, e, j) a informaci j(A) = – log P(A), můžeme uvažovat entropii H(P) pokusu P = {A1, …, An} s pravděpodobností P(A1)…P(An), pak Shannonova formula je
H(P) = ∑ j(Ai)·P(Ai) = – ∑ P(Ai)·log P(Ai)

Axiomatická definice entropie v pravděpodobnostním prostoru

Mnozí, kteří nezavádějí pojem j(A) v jevu A, chtějí také pokusu P = {A1, …, An} přiřadit H(P). Víme, že H(P) je funkcí pravděpodobností p1 = P(A1), …, pn = P(An), tedy H(P) = H(p1, …, pn). Funkce H(P) by měla mít určité vlastnosti vyplývající z jejího významu. Z nich můžeme sestavit soustavu axiomů, ze kterých lze určit funkci H. Shannon definoval funkci (soustavu) axiomů, my použijeme Fadejevovu z roku 1956:
A0: H(p1, …, pn) je definovaná pro „n pi ≥ 0″, i ∈ {1, …, n}, ∑ pi = 1 a nabývá reálných hodnot.
A1: H(p1, 1 – p) je spojitá funkce proměnné p ∈ ⟨0, 1⟩.
A2: H(p1, …, pn) je symetrická funkce, tj. pro permutace S₁,…,Sₙ čísel 1,…,n platí
H(pS1, …, pSn) = H(p1, …, pn)
A3: Pokud pn = g1 + g2 > 0, g1 ≥ 0, g2 ≥ 0, pak platí
H(p1, …, pn-1, g1, g2) = H(p1, …, pn) + pn·H(g1/pn, g2/pn).
Axiomy A0 – A2 jsou přirozené. Axiom A3, tzv. princip větvení, hodnotí přírůstek entropie, když od rozkladu P = {A1…An} s pravděpodobnostmi p1…pn přejdeme k rozkladu P’ = {A1…An-1; B1, B2}, kde přírůstek by měl být tím menší, čím menší je pn. Je zřejmé, že pokud nastane jev An (pravděpodobnost pn), tak stále máme dostatečnou neurčitost při pokusu P’ zda nastane B1 s podmíněnou pravděpodobností q1 / pn nebo B2 s q2 / pn. Tuto neurčitost vyjadřuje entropie.

Shannonova entropie

Ukážeme, že funkce H je jediná funkce Shannonova typu H(P) = – ∑ P(Ai)·log P(Ai)
Lema 1: H(1, 0) = 0
Lema 2: H(p1,…,pn, 0) = H(p1,…,pn) Definice: (pro diskrétní signály) H(P) = – ∑ P(Ai)·log₂ P(Ai)
Lema 3: Nechť pn = q1 + … + qm > 0 ⇒ H(p1,…,pn-1; q1,…,qm) = H(p1,…,pn) + pn·H(q1/pn,…,qm/pn)
Lema 4: Nechť pro i = 1…n platí pi = ∑ qi,j > 0, potom
H({qi,j}) = H(p1,…,pn) + ∑ pi H(qi,·)
Lema 5: Pro n → ∞ platí An = F(n) – F(n – 1) → 0
Lema 6: F(n) = c·log n, kde c je konstanta
Věta: Nechť „i = 1…n; pi > 0, qi > 0, ∑ pi = 1, ∑ qi = 1 ⇒ -∑ pi log pi = -∑ pi log qi
Důsledek: Pro dané n funkce H(p1,…,pn) nabývá maxima log n pro p1 =…= pn = „1/n“.
max H(P) =

  1. a) p(X0) = 2/3 H(P) = -(2/3·log 2/3 + 1/3