Centrální limitní věta

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Centrální limitní věta v teorii pravděpodobnosti označuje tvrzení, podle něhož se (za určitých podmínek diskutovaných níže) rozdělení výběrového průměru po vhodné normalizaci blíží k normálnímu rozdělení. O náhodné veličině s uvedeným chováním říkáme, že má asymptoticky normální rozdělení.

Centrální limitní větu lze vyjádřit různými způsoby.

K důkazu se dnes nejčastěji používají charakteristické funkce.

Moivreova-Laplaceova věta[editovat | editovat zdroj]

Nejjednodušším vyjádřením centrální limitní věty je Moivreova-Laplaceova věta. Podle této věty platí, že pokud součtem n\,\! nezávislých náhodných veličin X_i\,\! s alternativním rozdělením (s parametrem \pi\,\!) vytvoříme veličinu X\,\!, která má binomické rozdělení s parametry n\,\! a \pi\,\!, pak pro normovanou náhodnou veličinu

U = \frac{X-n\pi}{\sqrt{n\pi (1-\pi)}}\,\!

platí vztah

\lim_{n\to\infty} P(U<u) = \Phi(u)\,\!

pro -\infty<u<\infty\,\!, kde \Phi(u)\,\! je distribuční funkce normovaného normálního rozdělení \operatorname{N}(0,1)\,\!.

Podle Moivreovy-Laplaceovy věty tedy při velkém počtu nezávislých pokusů konverguje binomické rozdělení k rozdělení normálnímu.

Lévyho-Lindebergova věta[editovat | editovat zdroj]

Moivreovu-Laplaceovu větu lze zobecnit na větu Lévyho-Lindebergovu. Pokud je podle této věty náhodná veličina X\,\! součtem n\,\! vzájemně nezávislých náhodných veličin X_1, X_2, ..., X_n\,\! se shodným rozdělením libovolného typu, s konečnou střední hodnotou \operatorname{E}(X_i)=\mu\,\! a konečným rozptylem D(X_i)=\sigma^2\,\!, pak pro normovanou náhodnou veličinu

U = \frac{X-n\mu}{\sqrt{n\sigma^2}}\,\!

platí opět vztah

\lim_{n\to\infty} P(U<u) = \Phi(u)\,\!

pro -\infty<u<\infty\,\!, kde \Phi(u)\,\! je distribuční funkce normovaného normálního rozdělení \operatorname{N}(0,1)\,\!. Veličina U\,\! má tedy asymptoticky normální rozdělení.

Porovnejte toto chování se zákonem velkých čísel, který pro tento případ dává

Y = \frac{X-n\mu}{n} = \frac{\sum_{i=1}^n \left(X_i-\operatorname{E}(X_i)\right)}{n} \to 0\,\! skoro jistě.

Ljapunovova věta[editovat | editovat zdroj]

Nejobecnějším vyjádřením centrální limitní věty pro součet nezávislých náhodných veličin je věta Ljapunovova. Ta říká, že rozdělení součtu vzájemně nezávislých veličin X_i\,\! konverguje k normálnímu rozdělení i v případě, že veličiny X_i\,\! nemají stejné rozdělení pravděpodobnosti.

Nechť náhodná veličina X\,\! je součtem vzájemně nezávislých veličin X_i\,\!, které mají konečné střední hodnoty \operatorname{E}(X_i) < \infty \,\! a konečné třetí centrální momenty \operatorname{E}\left({\left|X_i-\operatorname{E}(X_i)\right|}^3\right) < \infty\,\!. Nechť dále platí Ljapunovova podmínka

\lim_{n\to\infty} \frac{\sqrt[3]{\sum_{i=1}^n \operatorname{E}\left({\left|X_i-\operatorname{E}(X_i)\right|}^3\right)}}{\sqrt{\sum_{i=1}^n D(X_i)}} = 0\,\!.
Pak pro normovanou náhodnou veličinu
U = \frac{X - \sum_{i=1}^n \operatorname{E}(X_i)}{\sqrt{\sum_{i=1}^n D(X_i)}}\,\!

platí vztah

\lim_{n\to\infty} P(U<u) = \Phi(u)\,\!

pro -\infty<u<\infty\,\!, kde \Phi(u)\,\! je distribuční funkce normovaného normálního rozdělení \operatorname{N}(0,1)\,\!.

Využití ve výpočtech[editovat | editovat zdroj]

Zde následuje typický příklad použití CLV. Máme náhodnou veličinu X se známou střední hodnotou a rozptylem (rozdělení znát nemusíme), a chceme zjistit, s jakou pravděpodobností je menší než dané x.

\lim_{n\to\infty} P(X<x) = \lim_{n\to\infty} P\left(\frac{X-EX}{\sqrt{var X}} < \frac{x-EX}{\sqrt{var X}}\right) = \Phi\left(\frac{x-EX}{\sqrt{var X}}\right) = \alpha \,\!

Hodnota \Phi(x) je tabelována.

Můžeme chtít i opačný postup - ptáme se jaké hodnoty nabude náhodná veličina X s danou pravděpodobností \alpha. V takovémto případě stačí použít inverzní distribuční funkci normovaného normálního rozdělení:

\Phi\left(\frac{x-EX}{\sqrt{var X}}\right) = \alpha => \frac{x-EX}{\sqrt{var X}} = \Phi^{-1}(\alpha) => x = EX + \sqrt{var X}*\Phi^{-1}(\alpha)\,\!

Hodnota \Phi^{-1} je také tabelována a nazývá se kvantilová funkce.

Tyto výpočty jsou sice všechny asymptotické, ale v praxi funguje CLV dobře už pro velmi malá n (stačí okolo 30).

Související články[editovat | editovat zdroj]