Testování statistických hypotéz

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Testování statistických hypotéz umožňuje posoudit, zda experimentálně získaná data vyhovují předpokladu, který jsme před provedením testování učinili. Můžeme například posuzovat, zda platí předpoklad, že určitý lék je účinnější než jiný; nebo například, zda platí, že úroveň matematických dovedností žáků 9. tříd je nezávislá na pohlaví a na regionu.

Statistická hypotéza[editovat | editovat zdroj]

Jako statistickou hypotézu chápeme určitý předpoklad o rozdělení náhodných veličin. Jestliže se tyto předpoklady týkají hodnot parametrů rozdělení náhodné veličiny, pak hovoříme o parametrických hypotézách. V opačném případě se jedná o hypotézy neparametrické.

Jsou-li hypotézou specifikovány všechny parametry rozdělení sledované veličiny, tzn. rozdělení je určeno jednoznačně, pak říkáme, že hypotéza je jednoduchá. Pokud není některý parametr rozdělení specifikován jednoznačně, např. je vymezen intervalem, pak hovoříme o složené hypotéze.

Statistický test[editovat | editovat zdroj]

Při testování statistických hypotéz vždy porovnáváme dvě hypotézy. Jedna hypotéza, tzv. nulová (testovaná), je hypotéza, kterou testujeme. Značíme ji obvykle H_0. Druhou hypotézou je tzv. alternativní hypotéza, kterou obvykle značíme H_1.

Posuzování nulové hypotézy H_0 je založeno na následující úvaze:

  • Předpokládáme, že hypotéza H_0 platí.
  • Rozhodneme se, kterým náhodným pokusem (například založeném na náhodném výběru) hypotézu ověříme. Určíme, která náhodná veličina bude výsledkem pokusu.
  • Stanovíme si hladinu spolehlivosti \alpha neboli pravděpodobnost (míru rizika) toho, že hypotézu H_0 neoprávněně zamítneme, ačkoliv platí (viz též dále chyba I. druhu). \alpha se přitom stanovuje jako malé, obvykle 0,05 a nižší (tuto hodnotu zavedl do statistiky v roce 1925 Ronald Fisher [1]).
  • V oboru možných hodnot použité náhodné veličiny určíme takovou část, do níž za platnosti H_0 padne výsledek veličiny s pravděpodobností \alpha. Tato část oboru možných hodnot se nazve kritický obor.
  • Pokud nyní hodnota náhodné veličiny padne do kritického oboru, hypotézu zámítáme, neboť nastal jev, který by za platnosti H_0 měl jen velmi malou pravděpodobnost a jehož výskyt tudíž svědčí proti platnosti nulové hypotézy.

Výsledkem testu je rozhodnutí o nulové hypotéze. Přijetí hypotézy H_0 znamená, že ji považujeme za možnou. Zamítnutí hypotézy H_0 je ekvivalentní přijetí hypotézy H_1. Testování hypotéz je tedy proces, při němž se na základě náhodného výběru rozhodneme pro testovanou nebo alternativní hypotézu.


Samotný postup testování hypotéz označujeme jako statistický test (test významnosti).


Testujeme-li neznámý parametr \Theta pak testovanou (nulovou) hypotézu zapisujeme jako

H_0:\Theta=\Theta_0 \,

Alternativní hypotézu pak formulujeme jedním z následujících způsobů

H_1:\Theta=\Theta_1 \,
H_1:\Theta>\Theta_0 \,
H_1:\Theta<\Theta_0 \,
H_1:\Theta\neq\Theta_0 \,

První formulaci alternativní hypotézy H_1 používáme pouze v případě, kdy rozhodujeme mezi dvěma hodnotami \Theta_0 a \Theta_1. Další dva případy se používají tehdy, chceme-li dokázat, že odchylka od \Theta je pouze v jednom směru. Alternativní hypotéza formulovaná posledním vztahem pouze popírá testovanou hypotézu H_0.

Testovací kritérium[editovat | editovat zdroj]

K otestování nulové hypotézy H_0 proti alternativní hypotéze H_1 použijeme statistiku T, kterou označujeme jako testovací kritérium. Testovací kritérium je funkce náhodného výběru, která má vztah k nulové hypotéze, a jejíž rozdělení za předpokladu platnosti nulové hypotézy známe. Obor možných hodnot testovacího kritéria rozdělíme na dva neslučitelné obory. Jedním z nich je obor přijetí testované hypotézy \mathbf{V} a druhým je kritický obor \mathbf{W}. Pokud výběrová hodnota testovacího kritéria padne do oboru přijetí testované hypotézy, pak nezamítáme nulovou hypotézu. Padne-li tato hodnota do kritického oboru, nulovou hypotézu zamítáme.

Kritický obor oddělují od oboru přijetí tzv. kritické hodnoty, což jsou kvantily rozdělení testovacího kritéria při platnosti H_0.

Místo porovnání hodnoty testovacího kritéria s kritickými hodnotami se pro rozhodování o nulové hypotéze používá též p-hodnota, zejména při použití statistického software. Význam p-hodnoty objasní následující postup.

  1. Nechť testovací kritérium T nabylo při testování hodnoty t.
  2. Obor možných hodnot testovacího kritéria se číslem t rozdělí na dvě části:
    • obor \mathbf{V'}, v němž jsou všechny takové hodnoty testovacího kritéria T, jež svědčí pro platnost H_0 více než nebo stejně jako číslo t
    • obor \mathbf{W'}, v němž jsou všechny takové hodnoty testovacího kritéria T, jež svědčí proti platnosti H_0 více než číslo t
  3. P-hodnota je pravděpodobnost, že výsledek testovacího kritéria T za platnosti H_0 padne do oboru \mathbf{W'}.
  4. Je-li p-hodnota menší než předem stanovené \alpha, nulovou hypotézu zamítáme.

P-hodnota tedy znamená, zjednodušeně řečeno, jaká je pravděpodobnost, že by testovací kritérium dosáhlo své hodnoty, případně hodnot ještě více svědčících proti H_0, pokud by H_0 opravdu platila. Čím menší p-hodnota, tím nepravděpodobnějšího výsledku (za předpokladu platnosti H_0) bylo dosaženo.

Výhoda p-hodnoty je v tom, že její výpočet nezávisí na konkrétní volbě \alpha. Není tak nutné znát kritické hodnoty pro různé volby \alpha, p-hodnota obsahuje dostatečnou informaci sama o sobě.

Chyby testu[editovat | editovat zdroj]

Uvedený postup může také vést k chybnému zamítnutí testované hypotézy (tzv. chyba I. druhu) nebo k chybnému přijetí testované hypotézy (tzv. chyba II. druhu).


Pravděpodobnost chyby I. druhu je označována jako hladina významnosti testu.

\alpha = P(T\in\mathbf{W}|H_0)

Pravděpodobnost, že hodnota testovacího kritéria padne do oboru přijetí H_0, jestliže platí H_1, tzn. pravděpodobnost chyby II. druhu, je

\beta = P(T\in\mathbf{V}|H_1)

Doplněk k \beta se nazývá síla testu (hovoříme také o silofunkci), a jako dostatečná hodnota se zpravidla uvažuje 0,8 a vyšší:

1-\beta = P(T\in\mathbf{W}|H_1)

Postup při testování[editovat | editovat zdroj]

Při volbě testovacího postupu je naším cílem, aby chyby byly co nejmenší. Lze dokázat, že za daných podmínek vede snižování \alpha k růstu \beta a naopak.

Při testování obvykle postupujeme tak, že nejdříve formulujeme nulovou a alternativní hypotézu. Poté volíme hladinu významnosti \alpha (obvykle se volí \alpha=0,05 a nižší). Nalezneme vhodné testovací kritérium a jeho pravděpodobnostní rozdělení při platnosti H_0. Dále vymezíme kritický obor s ohledem na formulaci hypotézy H_1. Vypočteme testovací kritérium T a určíme kritické hodnoty testovacího kritéria. Jestliže T\in\mathbf{W}, pak hypotézu H_0 zamítáme a říkáme, že s pravděpodobností 1-\alpha platí hypotéza H_1. Pokud T\in\mathbf{V}, pak hypotézu H_1 považujeme za neprokázanou. V takové případě neprovádíme úsudek o platnosti H_0, nechceme-li se zabývat sílou testu.

Moderní statistické programy při výpočtech předkládají přímo pravděpodobnost chyby I. řádu, označovanou jako „Sig.“ nebo „P-value“, kterou porovnáváme se zvolenou hladinou pravděpodobnosti (typicky 0,05). Tyto programy hodnoty pro vyšší přehlednost často označují hvězdičkami, jedna hvězdička pro pravděpodobnost nižší než 0,05, dvě pro p-value nižší než 0,01 a tři pro 0,001.

Odkazy[editovat | editovat zdroj]

Související články[editovat | editovat zdroj]

Reference[editovat | editovat zdroj]

  1. SOUKUP, Petr. Nesprávná užívání statistické významnosti a jejich možná řešení. Data a výzkum - SDA Info [online]. 2010, roč. 4, čís. 2 [cit. 31. 7. 2012], s. 77-104. Dostupné online. ISSN 1802-8152.