Směrodatná odchylka

Z Wikipedie, otevřené encyklopedie

Skočit na: Navigace, Hledání

Směrodatná odchylka je v teorii pravděpodobnosti a statistice často používanou mírou statistické disperze. Jedná se o kvadratický průměr odchylek hodnot znaku od jejich aritmetického průměru.

Zhruba řečeno vypovídá o tom, jak moc se od sebe navzájem liší typické případy v souboru zkoumaných čísel. Je-li malá, jsou si prvky souboru většinou navzájem podobné, a naopak velká směrodatná odchylka signalizuje velké vzájemné odlišnosti. Pomocí pravidel 1σ a 2σ (viz níže) lze přibližně určit, jak daleko jsou čísla v souboru vzdálená od průměru, resp. hodnoty náhodné veličiny vzdálené od střední hodnoty. Směrodatná odchylka je nejužívanější míra variability.

Obsah

[editovat] Definice a výpočet

Směrodatná odchylka, značená řeckým písmenem σ, se obvykle definuje jako odmocnina z rozptylu náhodné veličiny X, tzn.

\sigma = \sqrt{D(X)} = \sqrt{\operatorname{var}(X)},

kde D(X) označuje rozptyl náhodné veličiny X. Směrodatnou odchylku lze vypočítat pomocí střední hodnoty E(X) a případně i E(X²).

\sigma = \sqrt{\operatorname{E}((X-\operatorname{E}(X))^2)} = \sqrt{\operatorname{E}(X^2) - (\operatorname{E}(X))^2}
\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2} = \sqrt{ \left( \frac{1}{N} \sum_{i=1}^N x_i^2 \right) - \overline{x}^2 }

[editovat] Výběrová směrodatná odchylka

Pro skutečný výpočet odhadu směrodatné odchylky na empiricky zjištěné řadě čísel (tento odhad se nazývá výběrová směrodatná odchylka a jedná se o odmocninu z výběrového rozptylu) lze použít následující postup:

Mějme soubor reálných čísel x1, …, xN. Aritmetický průměr souboru lze vypočítat jako:

\overline{x}=\frac{1}{N}\sum_{i=1}^N x_i.

Potom výběrová směrodatná odchylka těchto dat může být vypočítána jako

s = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - \overline{x})^2}.

Pro praktické výpočty se častěji používá ekvivalentní vzorec,


s = \sqrt{\frac{1}{N-1} \left( \sum_{i=1}^N{x_i^2} - N\overline{x}^2 \right) }

který nevyžaduje předběžný výpočet průměru. Druhý sčítanec pod odmocninou totiž lze počítat průběžně zároveň s výpočtem sumy čtverců xi během jediného programového cyklu procházejícího vstupní data. Pokud je N velké, redukuje se tím doba výpočtu zhruba na polovinu. Za určitých okolností však tato metoda zároveň může zvýšit vliv zaokrouhlovacích chyb na přesnost výsledku.

[editovat] Pravidlo 1σ a 2σ

Jedná se o empirické pravidlo, jehož platnost závisí na konkrétním případu, proto je formulováno obecně. Lze je však velmi dobře použít pro základní orientaci v rozložení hodnot souboru nebo náhodné veličiny.

[editovat] Směrodatná odchylka

Jde-li o náhodnou veličinu, pak pravděpodobnost, že se hodnota náhodné veličiny bude od střední hodnoty lišit nejvýše o jednu směrodatnou odchylku, je výrazně vyšší než 0,5; pravděpodobnost, že se hodnota bude lišit nejvýše o dvě směrodatné odchylky, je velmi vysoká.

[editovat] Výběrová směrodatná odchylka

Jde-li o soubor hodnot, pak se většina hodnot neodlišuje od průměru o více než jednu směrodatnou odchylku a skoro všechny hodnoty jsou v pásmu do dvou směrodatných odchylek od průměru.

[editovat] Variační koeficient

Chceme-li posoudit, je-li variabilita malá nebo velká, porovnáme směrodatnou odchylku s průměrem

v_x = \frac{s_x} {\overline{x}} \cdot 100 \, [%]

Variační koeficient je použitelný i při porovnávání var. proměnných, které jsou v různých měrných jednotkách

[editovat] Související články