Extract, transform, load

Z Wikipedie, otevřené encyklopedie
Skočit na navigaci Skočit na vyhledávání

Extract, transform, load (zkratka ETL) je extrakce, transformace a nahrání dat do datového skladu, nebo do datového tržiště, přičemž údaje jsou extrahovány z relačních databází, tabulkových procesorů a dalších strukturovaných i nestrukturovaných zdrojů dat. Poté dochází k transformaci do požadovaného formátu. Takto upravená data se následně nahrají do datového skladu, který slouží jako primární zdroj dat pro BI aplikace. Data v datovém skladu jsou ukládaná v historizované podobě, což umožňuje reportovat vývoj metriky v čase.

Budování ETL systému je základním krokem tvorby datového skladu. Proces se skládá ze dvou paralelních pohledů: z pohledu plánování a projektování (angl. Planning and Design) a z pohledu toku dat (angl. Data Flow). Oba tyto pohledy jsou navzájem propojené a navzájem se ovlivňují.[1]

Reference[editovat | editovat zdroj]

  1. BLŠTÁK, Michal. Aplikace procesu ETL na čištění dat v datových skladech [online]. Brno, 2016 [cit. 2018-11-28]. Dostupné z: https://is.muni.cz/th/o9b4k;. Diplomová práce. Masarykova univerzita, Fakulta informatiky. Vedoucí práce Vlastislav Dohnal.