Medián

Medián (označován Me nebo ) je hodnota, jež dělí řadu vzestupně seřazených výsledků na dvě stejně početné poloviny. Ve statistice patří mezi míry centrální tendence. Platí, že nejméně 50 % hodnot je menších nebo rovných a nejméně 50 % hodnot je větších nebo rovných mediánu. Medián má smysl definovat pouze pro jednorozměrnou reálnou veličinu, jako je např. výška, hmotnost, výše mzdy atd.[1]
Pro nalezení mediánu daného souboru stačí hodnoty seřadit podle velikosti a vzít hodnotu, která se nalézá uprostřed seznamu. Pokud má soubor sudý počet prvků, obvykle se za medián označuje aritmetický průměr hodnot na místech n/2 a n/2+1.
Obecně se za medián dá označit více čísel. V už zmíněném případě sudého počtu prvků neexistuje jedinečná hodnota. Platí však, že polovina hodnot je menší nebo rovna a polovina prvků je větší nebo rovna, ať už se za medián zvolí libovolné z obou prostředních čísel. Totéž dokonce platí i pro libovolné číslo, jehož velikost leží mezi těmito dvěma čísly. Proto se jako medián takového souboru může vzít libovolné z obou prostředních čísel i libovolné z čísel mezi nimi.
Výhody a nevýhody mediánu[editovat | editovat zdroj]
Základní výhodou mediánu jako statistického ukazatele je fakt, že není ovlivněn extrémními hodnotami. Proto se často používá v případě šikmých rozdělení, u kterých aritmetický průměr dává obvykle nevhodné výsledky. Např. u souboru { 1, 2, 2, 3, 9 } je medián (stejně jako modus) roven dvěma, což je zřetelně vhodnější míra polohy než aritmetický průměr, který je zde roven 3,4.[2]
Další výhodou je, že medián lze definovat na každém souboru uspořádaném relací „menší nebo rovno“, i když se nejedná o soubor čísel. Například medián souboru {bez základního vzdělání, absolvent ZŠ, vyučen, vyučen s maturitou, vysokoškolák} je roven hodnotě „vyučen“, pokud kategorie vzdělání považujeme za seřazené podle náročnosti školy.
Nevýhodné je obvykle použití mediánu u souborů, ve kterých sledovaný znak nabývá jen dvou možných hodnot. Tam se medián chová stejně jako modus: je hrubým měřítkem vlastností rozdělení a v případě, že obě kategorie jsou zastoupeny zhruba stejně, je velmi nestabilní.
Teoretické vlastnosti[editovat | editovat zdroj]
V případě rozdělení pravděpodobnosti je mediánem číslo m, které splňuje rovnost P(X ≤ m) ≥ 0,5 a P(X ≥ m) ≥ 0,5. V případě spojité reálné jednorozměrné náhodné veličiny s hustotou pravděpodobnosti f pro medián platí:
Medián nemusí být výše uvedenou rovností určen jednoznačně.
Medián je také odhad hodnoty, který minimalizuje odchylku. U předchozího příkladu je tato chyba při použití mediánu rovna 1 + 0 + 0 + 1 + 7 = 9, zatímco při použití aritmetického průměru by byla rovna 2,4 + 1,4 + 1,4 + 0,4 + 5,6 = 11,2. To znamená, že číslo m, které minimalizuje výraz E(|X − m|), je mediánem rozdělení náhodné veličiny X.
Pro rozdělení náhodné veličiny, které mají konečnou střední hodnotu a medián platí, že absolutní hodnota rozdílu mezi mediánem a aritmetickým průměrem daného rozdělení je menší nebo rovna jedné směrodatné odchylce.[zdroj?]
Dá se ukázat, že (výběrový) medián je maximálně věrohodným odhadem střední hodnoty Laplaceova rozdělení.
Medián jako kvantil[editovat | editovat zdroj]
Medián je nejspíš nejpoužívanější kvantil. Kromě mediánu se velmi často používají kvartily (soubor se dělí na čtyři části), decily (na deset částí) a percentily (na sto částí).[3]
Reference[editovat | editovat zdroj]
- ↑ Výpočet mediánu (statistika). www.hackmath.net [online]. [cit. 2021-08-16]. Dostupné online.
- ↑ Medián — Matematika polopatě. www.matweb.cz [online]. [cit. 2021-08-16]. Dostupné online.
- ↑ BEDÁŇOVÁ, Iveta. BIOSTATISTIKA , Multimediální výukový text pro studenty [online]. VFU Brno, 2017 [cit. 2021-08-16]. Dostupné online.
Související články[editovat | editovat zdroj]
Externí odkazy[editovat | editovat zdroj]
Obrázky, zvuky či videa k tématu medián na Wikimedia Commons