Směrodatná odchylka

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání
Příklad dvou populací hodnot se stejným aritmetickým průměrem a s rozdílnou směrodatnou odchylkou. Červená populace má průměr 100 a směrodatnou odchylku 10; modrá populace má průměr taktéž 100 a směrodatnou odchylku 50.

Směrodatná odchylka je v teorii pravděpodobnosti a statistice často používanou mírou statistické disperze. Jedná se o kvadratický průměr odchylek hodnot znaku od jejich aritmetického průměru.

Zhruba řečeno vypovídá o tom, jak moc se od sebe navzájem liší typické případy v souboru zkoumaných čísel. Je-li malá, jsou si prvky souboru většinou navzájem podobné, a naopak velká směrodatná odchylka signalizuje velké vzájemné odlišnosti. Pomocí pravidel 1σ a 2σ (viz níže) lze přibližně určit, jak daleko jsou čísla v souboru vzdálená od průměru, resp. hodnoty náhodné veličiny vzdálené od střední hodnoty. Směrodatná odchylka je nejužívanější míra variability.

Definice a výpočet[editovat | editovat zdroj]

Směrodatná odchylka, značená řeckým písmenem σ, se obvykle definuje jako odmocnina z rozptylu náhodné veličiny X, tzn.

\sigma = \sqrt{D(X)} = \sqrt{\operatorname{var}(X)},

kde D(X) označuje rozptyl náhodné veličiny X. Směrodatnou odchylku lze vypočítat pomocí střední hodnoty E(X) a případně i E(X²).

\sigma = \sqrt{\operatorname{E}((X-\operatorname{E}(X))^2)} = \sqrt{\operatorname{E}(X^2) - (\operatorname{E}(X))^2}
\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2} = \sqrt{ \left( \frac{1}{N} \sum_{i=1}^N x_i^2 \right) - \overline{x}^2 }

Pro důkaz posledně uvedené rovnosti viz [p 1]

Výběrová směrodatná odchylka[editovat | editovat zdroj]

Pro skutečný výpočet odhadu směrodatné odchylky na empiricky zjištěné řadě čísel (tento odhad se nazývá výběrová směrodatná odchylka a jedná se o odmocninu z výběrového rozptylu) lze použít následující postup:

Mějme soubor reálných čísel x1, …, xN. Aritmetický průměr souboru lze vypočítat jako:

\overline{x}=\frac{1}{N}\sum_{i=1}^N x_i.

Potom výběrová směrodatná odchylka těchto dat může být vypočítána jako

s = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - \overline{x})^2}.

Pro praktické výpočty se častěji používá ekvivalentní vzorec,


s = \sqrt{\frac{1}{N-1} \left( \sum_{i=1}^N{x_i^2} - N\overline{x}^2 \right) }

který nevyžaduje předběžný výpočet průměru. Druhý sčítanec pod odmocninou totiž lze počítat průběžně zároveň s výpočtem sumy čtverců xi během jediného programového cyklu procházejícího vstupní data. Pokud je N velké, redukuje se tím doba výpočtu zhruba na polovinu. Za určitých okolností však tato metoda zároveň může zvýšit vliv zaokrouhlovacích chyb na přesnost výsledku.

Pravidlo 1σ a 2σ[editovat | editovat zdroj]

Jedná se o empirické pravidlo, jehož platnost závisí na konkrétním případu, proto je formulováno obecně. Lze je však velmi dobře použít pro základní orientaci v rozložení hodnot souboru nebo náhodné veličiny.

Graf normálního (Gausova) rozdělení. Každý pruh v grafu reprezentuje jednotku směrodatné odchylky.

Směrodatná odchylka[editovat | editovat zdroj]

Jde-li o náhodnou veličinu, pak pravděpodobnost, že se hodnota náhodné veličiny bude od střední hodnoty lišit nejvýše o jednu směrodatnou odchylku, je výrazně vyšší než 0,5 (za předpokladu normálního rozdělení je to 68%); pravděpodobnost, že se hodnota bude lišit nejvýše o dvě směrodatné odchylky, je velmi vysoká (při normálním rozdělení cca 95%).

Výběrová směrodatná odchylka[editovat | editovat zdroj]

Jde-li o soubor hodnot, pak se většina hodnot neodlišuje od průměru o více než jednu směrodatnou odchylku a skoro všechny hodnoty jsou v pásmu do dvou směrodatných odchylek od průměru.

Variační koeficient[editovat | editovat zdroj]

Chceme-li posoudit, je-li variabilita malá nebo velká, porovnáme směrodatnou odchylku s průměrem

v_x = \frac{s_x} {\overline{x}} \cdot 100 \, [%]

Variační koeficient je použitelný i při porovnávání var. proměnných, které jsou v různých měrných jednotkách.

Související články[editovat | editovat zdroj]

Poznámky[editovat | editovat zdroj]

  1. \sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}=\sqrt{\frac{1}{N}\left(\sum_{i=1}^N x_i^2 - \sum_{i=1}^N  2x_i\overline{x}+\sum_{i=1}^N \overline{x}^2\right)}=
    =\sqrt{\frac{1}{N}\sum_{i=1}^N x_i^2 - 2\overline{x}\cdot\frac{\sum_{i=1}^N x_i}N  +\frac{N\overline{x}^2}N}=\sqrt{\frac{1}{N}\sum_{i=1}^N x_i^2 - 2\overline{x}^2  +\overline{x}^2}=
    = \sqrt{ \left( \frac{1}{N} \sum_{i=1}^N x_i^2 \right) - \overline{x}^2 }