Test dobré shody

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Test dobré shody (taky Pearsonův chí-kvadrát test) je metoda matematické statistiky, která umožňuje ověřit, zda má náhodná veličina určité předem dané rozdělení pravděpodobnosti. Takové rozdělení může být dáno včetně parametrů, nebo s neznámými parametry. Test se mimo jiné často používá pro ověřování hypotéz v kontingenční tabulce.

Princip testu dobré shody[editovat | editovat zdroj]

Test dobré shody je založen na tom, že náhodnou veličinu s multinomickým rozdělením lze transformovat na veličinu mající přibližně rozdělení chí kvadrát.

Postup při testu dobré shody[editovat | editovat zdroj]

  1. Obor všech možných hodnot náhodné veličiny se rozdělí na k nepřekrývajících se částí.
  2. Pro každou část se stanoví pravděpodobnost p_i, že náhodná veličina nabyde hodnoty z ité části.
  3. Provede se N pokusů a zjistí se, kolikrát z těchto pokusů nabyla náhodná veličina hodnoty z 1., 2., … k-té části. Tyto četnosti se označí X_1, X_2, ..., X_k.
  4. Porovnají se očekávané četnosti v jednotlivých částech (Np_i) se skutečnými četnostmi (X_i) pomocí vzorce:

\chi^2 = \sum_{i=1}^k \frac{(X_i-Np_i)^2}{Np_i}

Pokud má testovaná náhodná veličina předpokládané rozdělení, má náhodná veličina \chi^2 přibližně rozdělení chí kvadrát. Jestliže bylo rozdělení dáno včetně všech parametrů, je počet stupňů volnosti k-1; jestliže byl některý parametr rozdělení neznámý, snižuje se počet stupňů volnosti za každý neznámý parametr (bylo jej nutno nejprve z dat odhadnout a pak teprve stanovit pravděpodobnosti p_i).

Hodnotu veličiny \chi^2 porovnáme s kritickou hodnotou příslušného rozdělení chí kvadrát na požadované hladině významnosti. Test lze použít za předpokladu, že všechny hodnoty Np_i jsou aspoň 5.

Příklad[editovat | editovat zdroj]

Chceme ověřit, zda je hrací kostka pravidelná. Hodíme kostkou 60krát a budeme sledovat četnosti jednotlivých hodnot. Při pravidelné kostce je pravděpodobnost každého čísla 1/6, tedy všechny hodnoty od 1 do 6 mají očekávanou četnost 10.
Následující tabulka uvádí skutečné a očekávané četnosti jednotlivých hodnot.

Hodnota 1 2 3 4 5 6 \sum_{i=1}^k
Skutečné četnosti 5 14 4 10 14 13 60
Očekávané četnosti 10 10 10 10 10 10 60
\chi^2 2.5 1.6 3.6 0 1.6 0.9 10.2

Dosadíme-li do vzorce, výsledná hodnota \chi^2 je 10,2 a kritická hodnota chí-kvadrát s 5 stupni volnosti na nejpoužívanější 5% hladině významnosti je 11,07. Nelze tedy prohlásit, že by předpoklad byl porušen, kostka může být pravidelná. Je však možné, že provedení většího počtu pokusů by již mohlo odchylku od pravidelnosti prokázat.

Poznámky[editovat | editovat zdroj]

  • Test dobré shody testuje shodu očekávaných a skutečných četností v částech oboru možných hodnot. Jeho síla tedy závisí na vhodném rozdělení tohoto oboru na části. Čím víc částí, tím je test přesnější, ale na druhou stranu je nutné zachovat pro všechny části aspoň minimální požadovanou očekávanou četnost 5.
  • Pro některá rozdělení existují vedle testu dobré shody ještě speciální testy, například shodu s normálním rozdělením lze testovat pomocí testů normality.

Literatura[editovat | editovat zdroj]

Anděl, J.: Matematická statistika, SNTL 1985

Externí odkazy[editovat | editovat zdroj]

Analýza kategoriálních dat, příklady