Statistika

Z Wikipedie, otevřené encyklopedie
Skočit na navigaci Skočit na vyhledávání

Statistika je vědní obor, který se zabývá sběrem, organizací, analýzou, interpretací a prezentací empirických dat za účelem prohloubení znalostí určité oblasti, obvykle hromadného jevu.[1][2][3] Při použití statistiky na vědecký, technický nebo společenský problém se zpravidla vychází ze statistické populace nebo statistického modelu. Populace mohou být různé skupiny lidí nebo objektů, např. „všichni lidé žijící v určité zemi“ nebo „všechny atomy tvořící určitý krystal“. Protože často není možné zkoumat celé populace, odhadují se jejich vlastnosti na základě výběrů, což je náplní inferenční statistiky, která modeluje náhodnost výběrů a neurčitost dat pomocí teorie pravděpodobnosti. Statistika se zabývá všemi aspekty práce s daty, včetně plánování jejich sběru v podobě průzkumů a experimentů.[4] Cílem statistiky je získat „nejlepší“ informace z dostupných dat, proto ji někteří autoři označují jako součást teorie rozhodování.

Statistické metody[editovat | editovat zdroj]

Popisná (deskriptivní) statistika[editovat | editovat zdroj]

Podrobnější informace naleznete v článku Popisná statistika.

Zabývá se popisem stavu nebo vývoje hromadných jevů, které vykazují vliv náhody. Nejprve vymezí soubor entit, na nichž se bude uvažovaný jev zkoumat. Pak se všechny entity vyšetří z hlediska studovaného jevu. Výsledky šetření – kvalitativní i kvantitativní, vyjádřeny především číselným popisem – tvoří obraz studovaného hromadného jevu vzhledem k vyšetřovanému souboru.[5]

Inferenční statistika[editovat | editovat zdroj]

Zatímco popisná statistika zkoumá soubory entit přímo, inferenční statistika je zkoumá prostřednictvím výběrů s využitím teorie pravděpodobnosti. Na získané údaje se pohlíží jako na výsledky určitého náhodného pokusu, který mohl dát i jiné výsledky. Všechny závěry inferenční statistiky tak mají pravděpodobnostní charakter.[6]

Statistické postupy lze zhruba rozdělit na metody konfirmační analýzy (např. intervaly spolehlivosti, regresní analýza ap.) a explorační analýzy, jako jsou např. shluková analýza, explorační faktorová analýza, metoda hlavních komponent (PCA), metoda GUHA (kombinační analýza dat), explorační analýza dat aj.

Základní rozdíl těchto dvou přístupů lze charakterizovat takto:

  1. V KA formulujeme hypotézu a metody KA použijeme k tomu, abychom ji potvrdili či vyvrátili.
  2. V EA máme k dispozici množství dat a od EA požadujeme, aby nám z nich vygenerovala nějaké hypotézy.

Jiné[editovat | editovat zdroj]

Jako statistiku také označujeme hodnoty, které získáme provedením náhodného výběru,[7] chápané jako hodnoty náhodné funkce definované na výběrovém prostoru.

Historie[editovat | editovat zdroj]

Karl Pearson, zakladatel matematické statistiky

První použití záznamů a jejich vývoje, a tedy i statistiky, můžeme nalézt v záznamech o hospodářekém a společenském životě starověkých kultur, které žily například v oblasti Mezopotámie, Sumeru, na Krétě, v Řecku, Egyptě a Číně. Ty úplně nejstarší zápisy, které vykazují známky sčítání lidu, pak nalezneme právě v Sumeru. Ve starověkém Egyptě se pak konal každé dva roky soupis dobytka[8].

První díla vztahovaná k pravděpodobnosti a statistikám se datují k arabským matematikům a kryptografům. Ti je vytvářeli v době Islámského zlatého věku. Al-Khalil (717–786) v tomto období napsal Knihu kryptografických myšlenek, která obsahuje první použití permutací a kombinací za cílem popsat co nejvíce arabských slov se samohláskami i bez nich.[9]

Ve středověku vznikaly takzvané Urbáře, což je obdoba novodobých statistických ročenek. Roku 1381 proběhlo první sčítáni lidu v Číně. Roku 1427 pak ve Florencii vznikl první soupis obyvatelstva.[10]

První evropskou publikací byla Natural and Political Observations upon the Bills of Mortality napsaná Johnem Grauntem v roce 1663.[11]

Matematické základy moderní statistiky položil rozvojem teorie pravděpodobnosti v 17. století, na které se podílel kupříkladu Gerolamo Cardano, Blaise Pascal či Pierre de Fermat.[12] Na přelomu 17. a 18. století byla vymyšlena metoda nejmenších čtverců. Její první použití v roce 1795 se připisuje Carlu Friedrichovi Gaussovi, i když k její publikaci došlo až v roce 1805 díky Adrienovi-Marie Legendremu.[13]

Zakladatelem matematické statistiky je Karl Pearson, který mimo jiné založil v roce 1911 na londýnské University College historicky první katedru statistiky.[14]

Použití moderních počítačů na konci 20. a začátku 21. století pomohlo vývoji statistické vědy. Statistika je i nadále oblastí výzkumu; příkladem toho je například problém s analýzou velkých dat.[15]

Odkazy[editovat | editovat zdroj]

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Statistics na anglické Wikipedii.

  1. Oxford Reference [online]. [cit. 2021-01-18]. Dostupné online. (anglicky) 
  2. ROMIJN, Jan-Willem. Stanford Encyclopedia of Philosophy [online]. 2014 [cit. 2021-01-18]. Kapitola Philosophy of statistics. Dostupné online. (anglicky) 
  3. Cambridge Dictionary [online]. [cit. 2021-01-18]. Dostupné online. (anglicky) 
  4. DODGE, Y. The Oxford Dictionary of Statistical Terms [online]. Oxford University Press, 2006. ISBN 0-19-920613-9. (anglicky) 
  5. HOMOLA, Vladimír. Úvod do statistiky [online]. [cit. 2020-02-15]. Dostupné online. 
  6. kolektiv autorů. Aplikovaná matematika. Praha: SNTL, 1978. 2386 s. (Oborové encyklopedie SNTL). S. 1899. (český) 
  7. CLIL - Content and Language Integrated Learning, Statistika
  8. KAČEROVÁ, Eva. Historie statistiky [online]. Praha: český statistický úřad, 28. dubna 2014 [cit. Chyba: neplatný čas]. Dostupné online. 
  9. Natural and Political Observations upon the Bills of Mortality Dostupné online
  10. KAČEROVÁ, Eva. Historie statistiky [online]. Praha: ČSÚ, 2014, 28. duben [cit. Chyba: neplatný čas]. Dostupné online. 
  11. WILLCOX, Walter (1938) "The Founder of Statistics".Dostupné online
  12. FRANKLIN, J. The Science of Conjecture: Evidence and Probability before Pascal, Johns Hopkins. [s.l.]: [s.n.], 2002. (anglicky) 
  13. STIGLER, Stephen. Gauss and the Invention of Least Squares. Annals of Statistics. 1981-05, roč. 9, čís. 3, s. 465–474. MR615423 Zbl: 0477.62001. Dostupné online [cit. 2020-05-14]. ISSN 0090-5364. DOI:10.1214/aos/1176345451. (anglicky) 
  14. Karl Pearson [online]. University of St Andrews, Scotland: School of Mathematics and Statistics University of St Andrews, Scotland [cit. 2020-05-15]. Dostupné online. (anglicky) 
  15. Science in a Complex World - Big Data: Opportunity or Threat? | Santa Fe Institute. www.santafe.edu [online]. [cit. 2020-05-14]. Dostupné online. (anglicky) 

Související články[editovat | editovat zdroj]

Externí odkazy[editovat | editovat zdroj]