Dataset

Z Wikipedie, otevřené encyklopedie

Dataset je kolekce (shluk) dat.

Nejčastěji dataset odpovídá obsahu jedné databázové tabulky nebo jedné statistické datové matici (např. v CSV), kde každý sloupec tabulky reprezentuje hodnoty jedné proměnné (atributu) a každý řádek odpovídá jedné položce příslušné kolekce dat. Dataset udává hodnoty pro všechny proměnné pro všechny položky v kolekci dat. Dataset poskytuje data pro jednu nebo několik položek, jejichž počet odpovídá počtu řádků.

Volněji se termín dataset používá pro kolekci vzájemně propojených tabulek nebo souborů, které se vztahují k určitému experimentu nebo události.

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Data set na anglické Wikipedii.

Externí odkazy[editovat | editovat zdroj]

  • Slovníkové heslo dataset ve Wikislovníku