Statistická nezávislost

Vrhneme-li zároveň dvě hrací kostky, lze čísla, která padnou, považovat za nezávislá, protože znalost čísla na jedné kostce nic neříká o tom, co padlo na druhé z nich

Nezávislost je základní pojem teorie pravděpodobnosti, matematické statistiky a teorie stochastických procesů. Dva náhodné jevy jsou nezávislé, statisticky nezávislé nebo stochasticky nezávislé,^[1] pokud výskyt jednoho nemá vliv na pravděpodobnost výskytu druhého (ekvivalentně řečeno, nemá vliv na šance výskytu druhého jevu). Podobně jsou dvě náhodné veličiny nezávislé, pokud realizace jedné neovlivní rozdělení pravděpodobnosti druhé. Definiční a často využívanou vlastností nezávislých jevů je, že pravděpodobnost jejich společného výskytu se rovná součinu pravděpodobností jejich výskytů. Opakem nezávislosti je statistická závislost, například korelace.

Pokud jde o soubor více než dvou jevů, je třeba rozlišovat slabé a silné pojetí nezávislosti. Jevy se nazývají po dvou nezávislé, pokud jsou jakékoli dva jevy v souboru nezávislé, a nezávislé (nebo kolektivně nezávislé), pokud každý jev je nezávislý na jakékoli kombinaci dalších jevů v souboru. Podobná definice platí pro soubory náhodných proměnných. Z (kolektivní) nezávislosti plyne nezávislost po dvou, ale naopak to neplatí.

Obecnějším konceptem je podmíněná nezávislost, která vyjadřuje, že dva náhodné jevy či veličiny A a B jsou nezávislé ve smyslu pravděpodobností podmíněných třetím náhodným jevem či veličinou Z. To neformálně řečeno znamená, že jakmile máme k dispozici informaci obsaženou v Z, není už další informace A užitečná pro přesnější poznání B ani znalost B nepřidá nic pro pochopení A, i kdyby A a B byly vzájemně závislé.

Příklady[editovat | editovat zdroj]

Házení hrací kostkou: Jev, že padne 6 při prvním hodu kostkou a jev padnutí 6 při druhém hodu jsou nezávislé. Naproti tomu jev, že padne 6 při prvním hodu kostkou a jev, že součet čísel zaznamenaných v prvním a druhém pokusu je 8, nejsou nezávislé jevy.

Tahání náhodných karet z promíchaného balíčku: Pokud jsou z balíčku karet vytaženy dvě karty s vracením (první vytažená karta se vrátí do balíčku před tažením druhé karty), jsou jevy vytažení červené karty v prvním pokusu a vytažení červené karty ve druhém pokusu nezávislé. Naproti tomu pokud jsou dvě karty vytaženy bez vracení, událost tažení červené karty v prvním pokusu a událost tažení červené karty ve druhém pokusu nejsou nezávislé, protože po vytažení první červené karty balíček už obsahuje o jednu červenou kartu méně.

Definice[editovat | editovat zdroj]

Náhodné jevy[editovat | editovat zdroj]

Viz též Pravděpodobnost#Nezávislé jevy.

Dva náhodné jevy $A$ a $B$ jsou nezávislé (zapsáno $A\perp B$ nebo $A\perp \!\!\!\perp B$ ) právě tehdy, pokud se pravděpodobnost jejich společného výskytu rovná součinu pravděpodobností jejich výskytů:^[2] ^{:s.p. 29} ^[3] ^{:s.p. 10}

\mathrm {P} (A\cap B)=\mathrm {P} (A)\mathrm {P} (B)

Proč se nezávislost definuje takto, je jasné po přepsání s použitím podmíněných pravděpodobností:

\mathrm {P} (A\cap B)=\mathrm {P} (A)\mathrm {P} (B)\iff \mathrm {P} (A)={\frac {\mathrm {P} (A\cap B)}{\mathrm {P} (B)}}=\mathrm {P} (A\mid B)

.

a podobně

\mathrm {P} (A\cap B)=\mathrm {P} (A)\mathrm {P} (B)\iff \mathrm {P} (B)=\mathrm {P} (B\mid A)

.

To znamená, že výskyt $B$ nemá vliv na pravděpodobnost $A$ a naopak. Ačkoli se odvozené výrazy mohou zdát intuitivnější, nejedná se o upřednostňovanou definici, protože podmíněné pravděpodobnosti nemusejí být definované, pokud $\mathrm {P} (A)$ nebo $\mathrm {P} (B)$ jsou 0. Kromě toho upřednostňovaná definice je zjevně symetrická, takže je z ní vidět, že když $A$ je nezávislý na $B$ , tak $B$ je také nezávislý na $A$ .

\mathrm {P} (A)=\mathrm {P} (A\cap A)=\mathrm {P} (A)\cdot \mathrm {P} (A)\Leftrightarrow \mathrm {P} (A)=0{\text{ or }}\mathrm {P} (A)=1

.

Zobecnění na více jevů: Konečná množina jevů $\{A_{i}\}_{i=1}^{n}$ je po dvou nezávislá, pokud je každá dvojice jevů nezávislá — to znamená, že pro všechny vzájemně odlišné páry indexů $m,k$

\mathrm {P} (A_{m}\cap A_{k})=\mathrm {P} (A_{m})\mathrm {P} (A_{k})

Konečná množina jevů je nezávislá, pokud je každý jev nezávislý na libovolném průniku ostatních jevů^[3] ^{:s.p. 11} — to znamená, že pro každé $k\leq n$ a pro každou $k$ -prvkovou podmnožina jevů $\{B_{i}\}_{i=1}^{k}$ z $\{A_{i}\}_{i=1}^{n}$ platí

\mathrm {P} \left(\bigcap _{i=1}^{k}B_{i}\right)=\prod _{i=1}^{k}\mathrm {P} (B_{i})

Toto se nazývá pravidlo násobení pravděpodobností pro nezávislé jevy. Všimněte si, že nejde o jedinou podmínku zahrnující pouze součin všech pravděpodobností všech jednotlivých jevů; vzorec musí platit pro všechny podmnožiny dané množiny jevů.

Pro více než dva jevy je nezávislá množina jevů (podle definice) také nezávislá po dvou; ale opak nemusí nutně platit.^[2]^{:s.p. 30}

Náhodné veličiny[editovat | editovat zdroj]

Dvě reálné náhodné veličiny $X$ a $Y$ jsou nezávislé tehdy a právě tehdy, jsou-li prvky jimi generovaného π systému nezávislé; to znamená, že pro každé $x$ a $y$ jsou jevy $\{X\leq x\}$ a $\{Y\leq y\}$ nezávislé (jak je definováno výše). Z toho plyne, že $X$ a $Y$ s distribučními funkcemi $F_{X}(x)$ a $F_{Y}(y)$ jsou nezávislé, pokud kombinovaná náhodná proměnná $(X,Y)$ má kumulativní distribuční funkci^[3]^{:s.p. 15}

F_{X,Y}(x,y)=F_{X}(x)F_{Y}(y)\quad \forall x,y

,

z čehož plyne, že pokud existují hustoty pravděpodobnosti $f_{X}(x)$ a $f_{Y}(y)$ a společná hustota pravděpodobnosti $f_{X,Y}(x,y)$ , tak

f_{X,Y}(x,y)=f_{X}(x)f_{Y}(y)\quad \forall x,y

.

Zobecnění na více než dvě náhodné veličiny: Konečná množina $n$ náhodných veličin $\{X_{1},\ldots ,X_{n}\}$ je po dvou nezávislá, jestliže je každá dvojice náhodných veličin z této množiny nezávislá.

Konečná množina $n$ náhodných veličin $\{X_{1},\ldots ,X_{n}\}$ je nezávislá, jestliže pro jakoukoli posloupnost čísel $\{x_{1},\ldots ,x_{n}\}$ jsou jevy $\{X_{1}\leq x_{1}\},\ldots ,\{X_{n}\leq x_{n}\}$ vzájemně nezávislé (jak je definováno výše). To je ekvivalentní následující podmínce o společné distribuční funkci $F_{X_{1},\ldots ,X_{n}}(x_{1},\ldots ,x_{n})$ : množina $\{X_{1},\ldots ,X_{n}\}$ je nezávislý právě tehdy, když^[3]^{:s.p. 16}

F_{X_{1},\ldots ,X_{n}}(x_{1},\ldots ,x_{n})=F_{X_{1}}(x_{1})\cdot \ldots \cdot F_{X_{n}}(x_{n})\quad \forall x_{1},\ldots ,x_{n}

Všimněte si, že zde není nutné vyžadovat, aby rozdělení pravděpodobnosti faktorizovalo pro všechny možné podmnožiny $k$ prvků jako v případě pro $n$ jevů. Je to proto, že např. $F_{X_{1},X_{2},X_{3}}(x_{1},x_{2},x_{3})=F_{X_{1}}(x_{1})\cdot F_{X_{2}}(x_{2})\cdot F_{X_{3}}(x_{3})$ totiž implikuje $F_{X_{1},X_{3}}(x_{1},x_{3})=F_{X_{1}}(x_{1})\cdot F_{X_{3}}(x_{3})$ atp.

Náhodné vektory[editovat | editovat zdroj]

Dva reálné náhodné vektory $\mathbf {X} =(X_{1},...,X_{m})^{T}$ a $\mathbf {Y} =(Y_{1},...,Y_{n})^{T}$ jsou nezávislé, pokud^[4]^{:s.p. 187}

F_{\mathbf {X,Y} }(\mathbf {x,y} )=F_{\mathbf {X} }(\mathbf {x} )\cdot F_{\mathbf {Y} }(\mathbf {y} )\quad \forall \mathbf {x} ,\mathbf {y}

,

kde $F_{\mathbf {X} }(\mathbf {x} )$ a $F_{\mathbf {Y} }(\mathbf {y} )$ jsou distribuční funkce $\mathbf {X}$ a $\mathbf {Y}$ a $F_{\mathbf {X,Y} }(\mathbf {x,y} )$ označuje jejich společnou distribuční funkci. Nezávislost $\mathbf {X}$ a $\mathbf {Y}$ se často označuje $\mathbf {X} \perp \!\!\!\perp \mathbf {Y}$ . Rozepsáno po komponentách:

F_{X_{1},\ldots ,X_{m},Y_{1},\ldots ,Y_{n}}(x_{1},\ldots ,x_{m},y_{1},\ldots ,y_{n})=F_{X_{1},\ldots ,X_{m}}(x_{1},\ldots ,x_{m})\cdot F_{Y_{1},\ldots ,Y_{n}}(y_{1},\ldots ,y_{n})\quad \forall x_{1},\ldots ,x_{m},y_{1},\ldots ,y_{n}

.

Stochastické procesy[editovat | editovat zdroj]

Definici nezávislosti lze rozšířit z náhodných vektorů na stochastické procesy. Nezávislý stochastický proces je takový, u kterého náhodné veličiny získané jeho vzorkováním v libovolných $n$ časových okamžicích $t_{1},\ldots ,t_{n}$ (pro libovolné přirozené $n$ ) jsou nezávislé náhodné veličiny.^[5]^{:s.p. 163}

Formálně zapsáno se stochastický proces $\left\{X_{t}\right\}_{t\in {\mathcal {T}}}$ nazývá nezávislý, právě když pro všechna $n\in \mathbb {N}$ a pro všechny $t_{1},\ldots ,t_{n}\in {\mathcal {T}}$

F_{X_{t_{1}},\ldots ,X_{t_{n}}}(x_{1},\ldots ,x_{n})=F_{X_{t_{1}}}(x_{1})\cdot \ldots \cdot F_{X_{t_{n}}}(x_{n})\quad \forall x_{1},\ldots ,x_{n}

,

kde $F_{X_{t_{1}},\ldots ,X_{t_{n}}}(x_{1},\ldots ,x_{n})=\mathrm {P} (X(t_{1})\leq x_{1},\ldots ,X(t_{n})\leq x_{n})$ . Nezávislost stochastického procesu je jeho vnitřní vlastnost, nikoli vztah mezi dvěma různými stochastickými procesy.

Vzájemná nezávislost dvou stochastických procesů je vztah mezi dvěma stochastickými procesy $\left\{X_{t}\right\}_{t\in {\mathcal {T}}}$ a $\left\{Y_{t}\right\}_{t\in {\mathcal {T}}}$ definovanými na stejném pravděpodobnostním prostoru $(\Omega ,{\mathcal {F}},P)$ . Formálně dva stochastické procesy $\left\{X_{t}\right\}_{t\in {\mathcal {T}}}$ a $\left\{Y_{t}\right\}_{t\in {\mathcal {T}}}$ jsou považovány za nezávislé, pokud pro všechna $n\in \mathbb {N}$ a pro všechny $t_{1},\ldots ,t_{n}\in {\mathcal {T}}$ jsou náhodné vektory $(X(t_{1}),\ldots ,X(t_{n}))$ a $(Y(t_{1}),\ldots ,Y(t_{n}))$ navzájem nezávislé,^[6]^{:s.p. 515} tj. pokud

F_{X_{t_{1}},\ldots ,X_{t_{n}},Y_{t_{1}},\ldots ,Y_{t_{n}}}(x_{1},\ldots ,x_{n},y_{1},\ldots ,y_{n})=F_{X_{t_{1}},\ldots ,X_{t_{n}}}(x_{1},\ldots ,x_{n})\cdot F_{Y_{t_{1}},\ldots ,Y_{t_{n}}}(y_{1},\ldots ,y_{n})\quad \forall x_{1},\ldots ,x_{n}

\mathrm {P} (X=x|Y=y,Z=z)=\mathrm {P} (X=x|Z=z)

Vlastnosti[editovat | editovat zdroj]

Nezávislost na sobě samém[editovat | editovat zdroj]

Všimněte si, že jev je na sobě nezávislý právě tehdy, když

\mathrm {P} (X\leq x,Y\leq y\;|\;Z=z)=\mathrm {P} (X\leq x\;|\;Z=z)\cdot \mathrm {P} (Y\leq y\;|\;Z=z)

Jev je tedy na sobě nezávislý, právě když k němu skoro jistě dojde nebo skoro jistě nedojde (dojde k jeho doplňku); tato skutečnost je užitečná při dokazování různých vět, které tvrdí, že nějaký jev má buď pravděpodobnost jedna nebo nula, nic mezi (anglicky tzv. zero-one laws).

Střední hodnota a kovariance[editovat | editovat zdroj]

Pokud $X$ a $Y$ jsou nezávislé náhodné veličiny, pak operátor střední hodnoty $\operatorname {E}$ má vlastnost

\operatorname {E} [XY]=\operatorname {E} [X]\operatorname {E} [Y],

a kovariance $\operatorname {cov} [X,Y]$ je nula, jak vyplývá z

\operatorname {cov} [X,Y]=\operatorname {E} [XY]-\operatorname {E} [X]\operatorname {E} [Y]

.

Opačné tvrzení neplatí: pokud dvě náhodné proměnné mají kovarianci 0, stále nemusejí být nezávislé.

Podobně pro dva stochastické procesy $\left\{X_{t}\right\}_{t\in {\mathcal {T}}}$ a $\left\{Y_{t}\right\}_{t\in {\mathcal {T}}}$ : Pokud jsou nezávislé, pak jsou nekorelované.^[7]^{:s.p. 151}

Charakteristická funkce[editovat | editovat zdroj]

Dvě náhodné proměnné $X$ a $Y$ jsou nezávislé právě tehdy, pokud charakteristická funkce náhodného vektoru $(X,Y)$ splňuje

\varphi _{(X,Y)}(t,s)=\varphi _{X}(t)\cdot \varphi _{Y}(s)

.

Konkrétně charakteristická funkce jejich součtu je produktem jejich marginálních charakteristických funkcí:

\varphi _{X+Y}(t)=\varphi _{X}(t)\cdot \varphi _{Y}(t),

ačkoli obrácená implikace neplatí.

Testování nezávislosti[editovat | editovat zdroj]

Častou úlohou v matematické statistice je testování hypotézy, že naměřené veličiny jsou vzájemně nezávislé. Pro nominální znaky se k tomu účelu používá test nezávislosti nominálních znaků, jeden z rodiny chí kvadrátových testů. Pro znaky vyšších typů se obvykle používá testování nulovosti korelačních koeficientů (typicky Spearmanovy či Pearsonovy korelační koeficienty), i když je nutno mít na paměti, že nekorelovanost je nutným, ale nikoli dostatečným předpokladem stochastické nezávislosti, takže se může stát, že veličiny jsou nekorelované, ale přitom vzájemně závislé.

Podmíněná nezávislost[editovat | editovat zdroj]

Pro jevy je podmíněná nezávislost definována takto: Jevy $A$ a $B$ jsou podmíněně nezávislé vzhledem k jevu $C$ , když

$\mathrm {P} (A\cap B\mid C)=\mathrm {P} (A\mid C)\cdot \mathrm {P} (B\mid C)$ .

Pro náhodné veličiny je definice podobná. Neformálně řečeno jsou dvě náhodné veličiny $X$ a $Y$ podmíněně nezávislé vzhledem k $Z$ , pokud platí, že jakmile je známa hodnota $Z$ , tak $Y$ už nepřidá žádné další informace o $X$ . Například dvě měření $X$ a $Y$ stejné hodnoty $Z$ nejsou nezávislé, ale jsou podmíněně nezávislé vzhledem k $Z$ (pokud chyby v obou měřeních nejsou nějakým způsobem spojeny).

Formální definice podmíněné nezávislosti je založena na myšlence podmíněného rozdělení Pokud $X$ , $Y$ a $Z$ jsou diskrétní náhodné veličiny, pak definujeme $X$ a $Y$ jako podmíněně nezávislé vzhledem k $Z$ , pokud

\mathrm {P} (X\leq x,Y\leq y\;|\;Z=z)=\mathrm {P} (X\leq x\;|\;Z=z)\cdot \mathrm {P} (Y\leq y\;|\;Z=z)

pro všechny $x$ , $y$ a $z$ takové, že $\mathrm {P} (Z=z)>0$ . Dále pokud jsou náhodné proměnné spojité a mají společnou funkci hustoty pravděpodobnosti $f_{XYZ}(x,y,z)$ , pak $X$ a $Y$ jsou podmíněně nezávislé vzhledem k $Z$ , pokud

f_{XY|Z}(x,y|z)=f_{X|Z}(x|z)\cdot f_{Y|Z}(y|z)

pro všechna reálná čísla $x$ , $y$ a $z$ taková, že $f_{Z}(z)>0$ .

Je-li diskrétní $X$ a $Y$ jsou podmíněně nezávislé vzhledem k $Z$ , pak

\mathrm {P} (X=x|Y=y,Z=z)=\mathrm {P} (X=x|Z=z)

pro všechny $x$ , $y$ a $z$ při podmínce $\mathrm {P} (Z=z)>0$ . To znamená, že rozdělení $X$ podmíněné $Y$ a $Z$ je stejné jako rozdělení podmíněné jen samotným $Z$ . Podobná rovnice platí pro podmíněné funkce hustoty pravděpodobnosti v spojitém případě.

Nezávislost lze chápat jako zvláštní druh podmíněné nezávislosti, protože na pravděpodobnost lze pohlížet jako na zvláštní případ podmíněné pravděpodobnosti, pokud ji nepodmiňujeme žádným jevem.

Pro statistické testování podmíněné nezávislosti se používají chí-kvadrát testy a testy parciálních korelací.

Příklad podmíněné nezávislosti: Teplota a intenzita osvětlení na nějakém místě bývají korelovány, protože v noci a v zimě je obvykle méně světla a zároveň nižší teplota. Ze znalosti teploty tedy můžeme pomocí regresní analýzy upřesnit odhad intenzity osvětlení a naopak. Kdybychom však k pozorování teploty a intenzity osvětlení přidali ještě údaj o přesném čase, tak se může stát, že znalost teploty již (příliš) nevylepší odhad intenzity osvětlení nad rámec odhadu založeného na čase, takže osvětlení a teplota budou (téměř) statisticky nezávislé podmíněno časem.

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Independence (probability theory) na anglické Wikipedii.

↑ RUSSELL, STUART J. (STUART JONATHAN). Artificial intelligence : a modern approach. Second edition. vyd. Upper Saddle River, N.J.: [s.n.] xxviii, 1081 pages s. Dostupné online. ISBN 0-13-790395-2, ISBN 978-0-13-790395-5. OCLC 51325314
↑ ^a ^b FLORESCU, IONUŢ, 1973-. Probability and stochastic processes. Hoboken, New Jersey: [s.n.] 1 online resource s. Dostupné online. ISBN 978-1-118-59320-2, ISBN 1-118-59320-0. OCLC 879851902
↑ ^a ^b ^c ^d GALLAGER, ROBERT G. Stochastic processes : theory for applications. Cambridge, United Kingdom: [s.n.] xx, 536 pages s. Dostupné online. ISBN 978-1-107-03975-9, ISBN 1-107-03975-4. OCLC 833145212
↑ PAPOULIS, ATHANASIOS, 1921-2002. Probability, random variables, and stochastic processes. 3rd ed. vyd. New York: McGraw-Hill xvii, 666 pages s. Dostupné online. ISBN 0-07-048477-5, ISBN 978-0-07-048477-1. OCLC 22704249
↑ HSU, HWEI P. (HWEI PIAO), 1930-. Schaum's outline of theory and problems of probability, random variables, and random processes. New York: McGraw-Hill 1 online resource (vii, 306 pages) s. Dostupné online. ISBN 0-585-26729-4, ISBN 978-0-585-26729-6. OCLC 45728870
↑ LAPIDOTH, AMOS,. A foundation in digital communication. Second edition. vyd. Cambridge, U.K.: [s.n.] 1 online resource s. Dostupné online. ISBN 978-1-316-82270-8, ISBN 1-316-82270-2. OCLC 981922787
↑ PARK, KUN IL, 1942-. Fundamentals of probability and stochastic processes with applications to communications. Cham: Springer 1 online resource (277 pages) s. Dostupné online. ISBN 978-3-319-68075-0, ISBN 3-319-68075-7. OCLC 1013827417

Externí odkazy[editovat | editovat zdroj]

Obrázky, zvuky či videa k tématu Nezávislost na Wikimedia Commons

[1] RUSSELL, STUART J. (STUART JONATHAN). Artificial intelligence : a modern approach. Second edition. vyd. Upper Saddle River, N.J.: [s.n.] xxviii, 1081 pages s. Dostupné online. ISBN 0-13-790395-2, ISBN 978-0-13-790395-5. OCLC 51325314

[#1-2] FLORESCU, IONUŢ, 1973-. Probability and stochastic processes. Hoboken, New Jersey: [s.n.] 1 online resource s. Dostupné online. ISBN 978-1-118-59320-2, ISBN 1-118-59320-0. OCLC 879851902

[#2-3] GALLAGER, ROBERT G. Stochastic processes : theory for applications. Cambridge, United Kingdom: [s.n.] xx, 536 pages s. Dostupné online. ISBN 978-1-107-03975-9, ISBN 1-107-03975-4. OCLC 833145212

[4] PAPOULIS, ATHANASIOS, 1921-2002. Probability, random variables, and stochastic processes. 3rd ed. vyd. New York: McGraw-Hill xvii, 666 pages s. Dostupné online. ISBN 0-07-048477-5, ISBN 978-0-07-048477-1. OCLC 22704249

[5] HSU, HWEI P. (HWEI PIAO), 1930-. Schaum's outline of theory and problems of probability, random variables, and random processes. New York: McGraw-Hill 1 online resource (vii, 306 pages) s. Dostupné online. ISBN 0-585-26729-4, ISBN 978-0-585-26729-6. OCLC 45728870

[6] LAPIDOTH, AMOS,. A foundation in digital communication. Second edition. vyd. Cambridge, U.K.: [s.n.] 1 online resource s. Dostupné online. ISBN 978-1-316-82270-8, ISBN 1-316-82270-2. OCLC 981922787

[7] PARK, KUN IL, 1942-. Fundamentals of probability and stochastic processes with applications to communications. Cham: Springer 1 online resource (277 pages) s. Dostupné online. ISBN 978-3-319-68075-0, ISBN 3-319-68075-7. OCLC 1013827417

[1]

[2]

[3]

[4]

[5]

[6]

[7]