Analýza dat

Z Wikipedie, otevřené encyklopedie
Skočit na navigaci Skočit na vyhledávání

Analýza dat je široká oblast aktivit a technik zpracování a využívání hromadných dat s cílem odhalit užitečné informace a podpořit rozhodování. Používá se ve vědě i v aplikovaných oblastech a její důležitost stále narůstá s tím, jak postupuje digitalizace a automatizace mnoha oblastí. Zahrnuje mimo jiné přípravu, kontrolu, čištění, transformaci, modelování, popis a vizualizaci dat.

K oblastem analýzy dat patří:

  • Statistická analýza dat, která se dále dělí na popisnou statistiku (sumarizace dat), explorační analýzu (EDA, hledá v datech dosud neznámé souvislosti) a konfirmační analýzu (CDA, testuje statistické hypotézy a odhaduje modely).
  • Business intelligence (BI) je analýza dat komerčních organizací, zaměřená na monitorování (Business reporting) a řízení jejich činnosti.
  • Vytěžování dat (data mining) a blízce příbuzná datová věda (data science) jsou oblasti zaměřené na průběžné získávání prakticky použitelných informací z dat s tím, že těžiště data miningu je více v prediktivním modelování (tj. předpovídání chování lidí či jiných jednotek) a těžiště datové vědy více ve zpracování velkých dat (Big data) a tvorbě aplikací.