Směrodatná odchylka

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání
Příklad dvou populací hodnot se stejným aritmetickým průměrem a s rozdílnou směrodatnou odchylkou. Červená populace má průměr 100 a směrodatnou odchylku 10; modrá populace má průměr taktéž 100 a směrodatnou odchylku 50.

Směrodatná odchylka je v teorii pravděpodobnosti a statistice často používanou mírou statistické disperze. Jedná se o kvadratický průměr odchylek hodnot znaku od jejich aritmetického průměru.

Zhruba řečeno vypovídá o tom, jak moc se od sebe navzájem liší typické případy v souboru zkoumaných čísel. Je-li malá, jsou si prvky souboru většinou navzájem podobné, a naopak velká směrodatná odchylka signalizuje velké vzájemné odlišnosti. Pomocí pravidel 1σ a 2σ (viz níže) lze přibližně určit, jak daleko jsou čísla v souboru vzdálená od průměru, resp. hodnoty náhodné veličiny vzdálené od střední hodnoty. Směrodatná odchylka je nejužívanější míra variability.

Definice a výpočet[editovat | editovat zdroj]

Směrodatná odchylka, značená řeckým písmenem σ, se obvykle definuje jako odmocnina z rozptylu náhodné veličiny , tzn.

,

kde označuje rozptyl náhodné veličiny . Směrodatnou odchylku lze vypočítat pomocí střední hodnoty E(X) a případně i E(X²).

Pro důkaz posledně uvedené rovnosti viz [p 1]

Výběrová směrodatná odchylka[editovat | editovat zdroj]

Pro skutečný výpočet odhadu směrodatné odchylky na empiricky zjištěné řadě čísel (tento odhad se nazývá výběrová směrodatná odchylka a jedná se o odmocninu z výběrového rozptylu) lze použít následující postup:

Mějme soubor reálných čísel x1, …, xN. Aritmetický průměr souboru lze vypočítat jako:

.

Potom výběrová směrodatná odchylka těchto dat může být vypočítána jako

Pro praktické výpočty se častěji používá ekvivalentní vzorec,

který nevyžaduje předběžný výpočet průměru. Druhý sčítanec pod odmocninou totiž lze počítat průběžně zároveň s výpočtem sumy čtverců xi během jediného programového cyklu procházejícího vstupní data. Pokud je N velké, redukuje se tím doba výpočtu zhruba na polovinu. Za určitých okolností však tato metoda zároveň může zvýšit vliv zaokrouhlovacích chyb na přesnost výsledku.

Pravidlo 1σ a 2σ[editovat | editovat zdroj]

Graf normálního (Gaussova) rozdělení. Každý pruh v grafu reprezentuje jednotku směrodatné odchylky.
Související informace naleznete také v článku Pravidlo tří sigma.

Jedná se o empirické pravidlo, jehož platnost závisí na konkrétním případu, proto je formulováno obecně. Lze je však velmi dobře použít pro základní orientaci v rozložení hodnot souboru nebo náhodné veličiny.

Směrodatná odchylka[editovat | editovat zdroj]

Jde-li o náhodnou veličinu, pak pravděpodobnost, že se hodnota náhodné veličiny bude od střední hodnoty lišit nejvýše o jednu směrodatnou odchylku, je výrazně vyšší než 0,5 (za předpokladu normálního rozdělení je to 68 %); pravděpodobnost, že se hodnota bude lišit nejvýše o dvě směrodatné odchylky, je velmi vysoká (při normálním rozdělení cca 95 %).

Výběrová směrodatná odchylka[editovat | editovat zdroj]

Jde-li o soubor hodnot, pak se většina hodnot neodlišuje od průměru o více než jednu směrodatnou odchylku a skoro všechny hodnoty jsou v pásmu do dvou směrodatných odchylek od průměru.

Variační koeficient[editovat | editovat zdroj]

Chceme-li posoudit, je-li variabilita malá nebo velká, porovnáme směrodatnou odchylku s průměrem

Variační koeficient je použitelný i při porovnávání var. proměnných, které jsou v různých měrných jednotkách.

Související články[editovat | editovat zdroj]

Poznámky[editovat | editovat zdroj]