Chí-kvadrát test

Z Wikipedie, otevřené encyklopedie
Skočit na navigaci Skočit na vyhledávání

Chí-kvadrát test, chí kvadrátový test neboli χ2 test je v matematické statistice jakýkoli test statistické hypotézy, jehož testovací kritérium má za předpokladu platnosti nulové hypotézy rozdělení chí kvadrát. Často se chí-kvadrát testy objevují při testování hypotéz o diskrétních rozděleních, kdy se pracuje s četnostmi různých hodnot pozorovaných znaků. První chí-kvadrát test navrhl roku 1900 Karl Pearson.[1] Testy chí-kvadrát obvykle vyžadují znát počet stupňů volnosti, který roste s počtem zkoumaných kategorií pozorovaných veličin, a spočívají v porovnání vypočítané testovacího kritéria s kritickou hodnotou (kvantilem) rozdělení chí kvadrát s tímto počtem stupňů volnosti: překročí-li napočítaná testovací statistika kritickou hodnotu, zamítneme nulovou hypotézu. V moderní praxi se ovšem testy obvykle počítají pomocí statistického počítačového programu, který přímo vypíše p-hodnotu, již interpretujeme stejně jako při každém jiném testu. Chí kvadrátové testy jsou často asymptotické, což znamená, že je lze používat až od jisté četnosti naměřených dat, jinak budou výsledky velmi nepřesné.

Nejčastěji používané chí kvadrátové testy jsou:

  • Pearsonův test dobré shody, který testuje, zda empiricky naměřené četnosti realizací nějakého multinomického rozdělení odpovídají hypotéze o tomto rozložení. Ta se vyjadřuje pravděpodobnostmi výskytů jednotlivých hodnot. Klasický příklad je testování toho, zda hrací kostka hází všechny čísla 1 až 6 se stejnou pravděpodobností.
  • Test nezávislosti dvou diskrétních znaků. Vychází se z kontingenční tabulky těchto znaků, tedy obdélníkové nebo čtvercové tabulky četností jednotlivých kombinací výskytu hodnot znaků. Nulová hypotéza říká, že obě veličiny jsou na sobě statisticky nezávislé. Příklad může být test na datech sociologického výzkumu, kdy nás zajímá, zda kraj respondenta (14 možností) souvisí s tím, zda volí pravici, levici nebo nepřijde k volbám vůbec (3 možnosti). Počet stupňů volnosti je součin rozměrů tabulky zmenšených o jednu, tedy zde (14 – 1) × (3 – 1) = 26.
  • Test homogenity porovnává rozložení diskrétních veličin v dvou nebo více populacích a testuje, zda se toto rozložení populaci od populace neliší. Příkladem může být zkoumání vztahu pohlaví a rodinného stavu v rámci populací definovaných regiony Česka.

Chí-kvadrát test nezávislosti (χ2 test) v epidemiologii[editovat | editovat zdroj]

Chí-kvadrát test nezávislosti (chi-square test, χ2 statistic) počítá asociaci mezi dvěma jevy. Jeden jev může být epidemiologické riziko, druhý nemoc. Jedním může být lék, druhým jeho účinnost. Zda je spojitost mezi příčinou a následkem statisticky průkazná, odhalí test.

Nulová hypotéza (null hypothesis) předpokládá, že není žádná spojitost dvěma jevy (mezi rizikem a nemocí). Chí-kvadrát test nezávislosti počítá chybu nulové hypotézy. Čím je chyba větší, tím méně je pravděpodobná nulová hypotéza, tím více platí opak.

Alternativní hypotéza je pravý opak nulové hypotézy (existuje spojitost mezi rizikem a nemocí). U epidemiologických studií tedy potvrzujeme alternativní hypotézu, spojitost mezi příčinou a následkem musí platit, jinak byla studie od počátku koncipována chybně. Jinými slovy chí-kvadrát test musí vyjít významně (hodnota musí být dostatečně vysoká).

Na výpočet existují statistické kalkulátory, přesto je třeba znát princip a hlavně interpretaci testu.

Epidemiologická tabulka 2x2 pro výpočet spojitosti mezi příčinou a následkem (hodnota rizikového faktoru) počítá pro každou buňku v tabulce chybu. Součtem všech čtyř chyb získáme výslednou hodnotu chí-kvadrát testu.

Test předpokládá, že není žádná spojitost mezi řádky a sloupci!

χ2 = ∑ i (Oi −Ei)2/Ei

E (expectation) očekávaná hodnota v buňce tabulky (součet řádků lomeno celkovým počtem v poměru k součtu sloupců)

O (observed) pozorovaná hodnota (naměřené číslo v buňce tabulky)

r (rows) počet buněk v řádcích tabulky (vodorovně)

c (columns) počet buněk ve sloupcích tabulky (svisle)

Stupeň volnosti (degree of freedom) DF:  DF=(r-1)*(c-1)

Tabulka 2x2 pro chí kvadrát test
Nemocní (+) Zdraví (-) Celkem
v riziku (+) a           37

50/120 x 54 = 22.5

(a+b/n) * (a+c)

b           13

50/120 x 66 = 27.5

(a+b/n) *(b+d)

a+b     50
bez rizika (-) c            17

70/120 x 54 = 31.5

(c+d/n) * (a+c)

d             53

70/120 x 66 = 38.5

(c+d/n) *(b+d)

c+d      70
Celkem a+c          54 b+d       66 n         120


[(37-22,5)2/ 22,5] + [(13-27,5)2/ 27,5] + [(17-31,5)2/ 31,5] + [(53-38,5)2/ 38,5] = =29,1

χ2 = 29,1 se stupněm volnosti 1.

Ke stejnému výsledku dojdeme podle vzorce:

χ2 = [n(ad–bc)2 ] / [ (a+c)(b+d)(a+b)(c+d) ]

Hodnotu chí-kvadrát testu lze převést na pravděpodobnost. Slouží k tomu kalkulátory (p-value calculator) nebo tabulka distribuce chí kvadrátu.

Čím je hodnota chí-kvadrát testu větší, tím je pravděpodobnost nulové hypotézy (p-value) menší.

Při použití kalkulátoru zadáme hodnoty testu a stupně volnosti, získáme pravděpodobnost, s jakou nulová hypotéza platí (p-value).

Distribuce Chí kvadrátu pro epidemiologickou tabulku 2x2

Pro námi vypočítanou hodnotu chí-kvadrát testu 29,1 a stupeň volnosti 1DF (degree of freedom) je pravděpodobnost nulové hypotézy (p-value) menší než 0,0001. To je velice nízká p-value, tedy platí alternativní hypotéza. Námi změřené hodnoty potvrzují spojitost mezi rizikem a nemocí (chí-kvadrát test vyšel).

Kritická hodnota je hraniční číslo, které dělí výsledky testu. Pravděpodobnost větší než kritická hodnota potvrzuje nulovou hypotézu,

p-value menší než kritická hodnota potvrzuje alternativní hypotézu.

Obecně je za kritickou hodnotu pro dva nezávislé jevy považována pravděpodobnost jedno promile (p-value=0,001).

U epidemiologických studií se žádá větší jistota, kritická hodnota byla přeměněna na hladinu významnosti 0,05 (5%). To odpovídá CI=95% ( Interval spolehlivosti =CI; Conficence interval), tedy pravděpodobnosti 95%, že výsledek platí.

Pokud je pravděpodobnost p-value<0,05, pak existuje spojitost mezi epidemiologickým rizikem a nemocí. Chí-kvadrát test nezávislosti potvrdil alternativní hypotézu. Epidemiologové řeknou, že test vyšel.

Naopak pokud je p-value>0,05, pak není žádná spojitost mezi rizikem a nemocí (posuzované riziko není rizikem, nemá na nemoc vliv). Chí-kvadrát test nezávislosti potvrdil nulovou hypotézu. Epidemiologové řeknou, že test nevyšel.

Reference[editovat | editovat zdroj]

  1. PEARSON, Karl. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. Philosophical Magazine. 1900, s. 157–175. Dostupné online. DOI:10.1080/14786440009463897. (anglicky) 

Související články[editovat | editovat zdroj]