Simpsonův paradox

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání
Simpsonův paradox pro kontinuální data: Pozitivní trend pro obě oddělené skupiny dat (modrá a červená), negativní trend (černá čárkovaná) pro kombinovanou množinu dat

Simpsonův paradox je statistický paradox při porovnání úspěšností dvou individuí (skupin) během více období, přičemž v jednotlivých obdobích je úspěšnější skupina A, ale celkově je úspěšnější skupina B. Paradox je pojmenovaný podle Edwarda Simpsona, který jej publikoval v roce 1951.[1] Protože jde o matematickou trivialitu, je prakticky jisté, že tento paradox byl pozorovaný možná staletí před ním, ale kvůli nepředstavitelné trivialitě ho nikdo nepublikoval.

Lidé jsou často zmateni, když se poprvé setkají s tímto paradoxem, což je způsobeno z interpretačního hlediska nevhodným příkladem.

Příklad paradoxu[editovat | editovat zdroj]

1. semestr 2. semestr spolu
Student A 2/8 25% 2/2 100% 4/10 40%
Student B 1/5 20% 4/5 80% 5/10 50%

Je zřejmé, že student A byl úspěšnější v obou semestrech, avšak celkově byl úspěšnější student B, přičemž celkový počet zkoušek byl pro oba stejný.

Podstata paradoxu[editovat | editovat zdroj]

Podstata paradoxu spočívá v tom, že B měl poměrně vysokou úspěšnost během 5 zkoušek, tedy dlouhodobě. Student A, který v tomto semestru měl sice úspěšnost 100 %, avšak aplikovanou pouze na dvě zkoušky.

Jelikož nepředpokládáme rozdílnost nároků v první a druhém semestru, byl opravdu lepším studentem B. Právě uvedený příklad je však velmi zavádějící, je totiž statisticky velmi nepravděpodobné, že mohou existovat takové rozdíly mezi semestry. Pravděpodobně to muselo být něčím způsobené, např. změnou zkoušejícího. V tomto případě je třeba jednoznačně za lepšího studenta označit A, neboť byl úspěšnější u obou profesorů, jen měl smůlu, že většinu zkoušek měl u toho přísnějšího.

Skutečný příklad z praxe[editovat | editovat zdroj]

Jako skutečný a dobrý příklad na ukázku správné a jednoduché interpretace je možné uvést porovnání úspěšnosti léčby ledvinových kamenů klasickou chirurgickou cestou a perkutánní nefrolitotomií.[2] Při hodnocení úspěšnosti bez ohledu na velikost kamene vychází perkutánní nefrolitotomie jako úspěšnější. Tento závěr jev však mylný, neboť při hodnocení zvlášť malých a velkých kamenů vychází úspěšnější klasická (chirurgická) léčba.

Příčina paradoxu je v tom, že perkutánní nefrolitotomie se používala hlavně pro malé kameny a pravděpodobnost úspěšnosti léčby je víc ovlivněná velikostí kamene než použitou metodou léčby.

malé kameny velké kameny spolu
Klasické operační postupy 81/87 93% 192/263 73% 273/350 78%
Perkutánní nefrolitotomie 234/270 87% 55/80 69% 289/350 83%

Za velké se v této práci považovaly kameny větší než 2 cm. Jako kritérium úspěšnosti bylo použité nepozorování výskytu kamenů po třech měsících od léčby, resp. redukce velikosti kamene na maximální velikost 2 mm.

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Simpsonov paradox na slovenské Wikipedii.

  1. Simpson, Edward H. (1951). "The Interpretation of Interaction in Contingency Tables". Journal of the Royal Statistical Society, Ser. B 13: 238–241
  2. C. R. Charig, D. R. Webb, S. R. Payne, O. E. Wickham (March 1986). "Comparison of treatment of renal calculi by operative surgery, percutaneous nephrolithotomy, and extracorporeal shock wave lithotripsy". British Medical Journal vol. 292 (1986), str. 879–882