Rozptyl (statistika)

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Rozptyl (též střední kvadratická odchylka, střední kvadratická fluktuace, variance nebo také disperze) se používá v teorii pravděpodobnosti a statistice. Je to druhý centrální moment náhodné veličiny. Jedná se o charakteristiku variability rozdělení pravděpodobnosti náhodné veličiny, která vyjadřuje variabilitu rozdělení souboru náhodných hodnot kolem její střední hodnoty.

Rozptyl náhodné veličiny X se označuje \sigma^2(X), S^2(X), D(X) nebo \operatorname{var}(X).

Definice[editovat | editovat zdroj]

Rozptyl je definován jako střední hodnota kvadrátů odchylek od střední hodnoty. Odchylku od střední hodnoty, která má rozměr stejný jako náhodná veličina, zachycuje směrodatná odchylka.

Pro diskrétní náhodnou veličinu jej můžeme definovat vztahem

\sigma^2 = \sum_{i=1}^n {\left[x_i - \operatorname{E}(X)\right]}^2 p_i = \sum_{i=1}^n x_i^2 p_i - {[\operatorname{E}(X)]}^2,

kde x_i jsou hodnoty, kterých může náhodná veličina X nabývat (s pravděpodobnostmi p_i) a \operatorname{E}(X) je střední hodnota veličiny X.

Je-li pravděpodobnost všech diskrétních hodnot stejná, pak se předchozí vztah zjednoduší na

\sigma^2=\frac{1}{n}\sum_{i=1}^n (x_i-\operatorname{E}(x))^2

kde n je počet prvků souboru.


Pro spojitou náhodnou veličinu definujeme rozptyl vztahem

\sigma^2 = \int_{-\infty}^\infty {\left[x-\operatorname{E}(X)\right]}^2 f(x)\mathrm{d}x = \int_{-\infty}^\infty x^2 f(x)\mathrm{d}x - {[\operatorname{E}(X)]}^2,

kde f(x) je hustota pravděpodobnosti veličiny X.

Vlastnosti[editovat | editovat zdroj]

Pro rozptyl součinu náhodné veličiny X a konstanty a platí

\sigma^2(aX) = a^2 \sigma^2(X) \,

Rozptyl náhodné veličiny je invariantní vůči posunu b, tedy

\sigma^2(aX+b) = a^2 \sigma^2(X) \,

Rozptyl součtu i rozdílu náhodných veličin X, Y je roven

\sigma^2(X\pm Y) = \sigma^2(X) + \sigma^2(Y)\pm 2 \operatorname{Cov}(X,Y)
\sigma^2(aX\pm bY) = a^2\sigma^2(X) + b^2\sigma^2(Y)\pm 2ab \operatorname{Cov}(X,Y),

kde \operatorname{Cov}(X,Y) značí kovarianci veličin X a Y.

Pokud jsou náhodné veličiny nezávislé, jejich kovariance je nulová, a tedy rozptyl součtu (rozdílu) je roven součtu rozptylů jednotlivých náhodných veličin.

Obdobná tvrzení platí také pro rozptyl součtu většího počtu náhodných veličin.

Pro výpočet rozptylu se často používá následující vztah

\sigma^2(X) = \operatorname{E}(X^2) - {[\operatorname{E}(X)]}^2

Příklad u kostky[editovat | editovat zdroj]

Mějme kostku a náhodnou veličinu X, která přiřadí každému z šesti možných jevů takové číslo, kolik puntíků je v daném jevu na horní straně kostky (čísla 1 až 6). Máme 6 jevů s pravděpodobností \frac{1}{6} a střední hodnota (průměr) je 3,5.

\sigma^2=\frac{1}{6}\sum_{i=1}^6 (x_i-3,5)^2 = \frac{1}{6}( {(1-3,5)}^2 + {(2-3,5)}^2 + {(3-3,5)}^2 + {(4-3,5)}^2 + {(5-3,5)}^2 + {(6-3,5)}^2 )  = \frac{17,5}{6}  \doteq  2,92

Související články[editovat | editovat zdroj]