Typy proměnných

Z Wikipedie, otevřené encyklopedie
Skočit na navigaci Skočit na vyhledávání

Typy proměnných klasifikují povahu informací obsažených v proměnných statistického datového souboru (datové matice).[1] Psycholog Stanley Smith Stevens vyvinul nejznámější klasifikaci se čtyřmi úrovněmi měření: 1. nominální (kvalitativní, slovní, anglicky nominal), 2. pořadové (ordinální, anglicky ordinal), 3. intervalové (anglicky interval) a 4. poměrové (anglicky ratio).[1] [2] Tato klasifikace je založena na datech používaných v psychologii a jiným disciplínám nemusí stačit,[3] proto byly vyvinuty i jiné, podrobnější klasifikace, například Mostellerova - Tukeyho[4] a Chrismanova.[5]

Stevensova typologie[editovat | editovat zdroj]

Přehled[editovat | editovat zdroj]

Stevens klasifikaci navrhl roku 1946 v časopise Science v článku nazvaném “On the theory of scales of measurement”.[2] Zde napsal, že všechna měření ve vědě se provádějí s použitím čtyř různých typů škál, které nazval nominální, ordinalní, intervalové a poměrové. Tím zahrnul jak kvalitativní měření (u něho nominální typ), tak i kvantitativní (podle kvality získaných dat ostatní typy škál). Jeho typologii později matematicky upřesnili matematičtí psychologové Theodore Alper (1985, 1987), Louis Narens (1981a, b) a R. Duncan Luce (1986, 1987, 2001).

Porovnání[editovat | editovat zdroj]

Pro lepší přehled jsou jako „Matematické operátory“, „Dostupné operace“ a „Střední hodnota“ uvedeny pouze ty, které daná úroveň měření zavádí. Vyšší typ škály umožňuje použít i operace z předchozích úrovní.

Škála Měří Matematické

operátory

Dostupné

operace

Střední hodnota
Nominální Klasifikace, členství =, ≠ Seskupování Modus
Pořadová Srovnání, úroveň >, < Třídění Medián a jiné kvantily
Intervalová Rozdíl, afinita +, - Odstup od jiné hodnoty Průměr a směrodatná odchylka
Poměrová Velikost, množství ×, / Poměr hodnot Geometrický průměr, variační koeficient

Zvláštním případem jsou dichotomická data nabývající dvou možných hodnot (např. pravda / nepravda, nemocný / zdravý, vinný / nevinný). Ta bývají někdy zařazována mezi pořadové škály, ale podle svého charakteru mohou být chápána a zpracovávána také jako nominální nebo i (po překódování na jedničky a nuly) jako intervalová měření s jednotkovým odstupem mezi úrovněmi.

Nominální úroveň měření[editovat | editovat zdroj]

Nominální typ rozlišuje mezi položkami nebo předměty pouze na základě jejich jmen nebo na základě kategorií a dalších kvalitativních klasifikací, do kterých jsou zařazeny. Měření zde zahrnuje konstrukci klasifikací a klasifikaci položek. Nalezení výjimky ze zavedené klasifikace lze považovat za vědecký pokrok (například nalezení živočicha, kterého nelze zařadit k žádnému známému druhu, znamená objev nového živočišného druhu). Čísla lze použít k reprezentaci hodnot proměnných, ale nevyjadřují číselnou hodnotu nebo vztah: například číslo okresu nebo číslo občanského průkazu.

Příklady nominálních klasifikací: pohlaví, státní příslušnost, národnost, jazyk, žánr, styl, název chemické sloučeniny nebo biologický druh.

Nominální škály a odpovídající měření byly často označovány slovem kvalitativní. Rozvoj kvalitativního výzkumu však toto ztotožnění zpochybnil.

Čísla mohou být nominálním měřením přiřazena jako štítky, ale nemají žádnou specifickou číselnou hodnotu nebo význam. Nelze s nimi provádět smysluplné aritmetické výpočty (+, -, ×, aritmetický průměr apod.). Jediné přípustné operace jsou rovnost a nerovnost a z nich odvozené množinové operace (sjednocení, průnik atd.). Jako střední hodnotu lze použít jedině modus, tedy nejčastěji se vyskytující hodnotu; medián ani průměr zde nedávají smysl. Nominální úroveň je ze statistického hlediska nejnižší úroveň měření.

Pořadové škály[editovat | editovat zdroj]

Pořadový typ umožňuje stanovit pořadí (1., 2., 3. atd.), podle kterého lze data třídit, ale stále neumožňuje určit relativní velikost rozdílu mezi položkami. Příklad může být škála odpovědí na likertovské otázky při psychologickém či sociologickém měření postojů: „zcela souhlasím“, „spíše souhlasím“, "ani souhlas, ani nesouhlas" „spíše nesouhlasím“, „zcela nesouhlasím".

Medián, tedy prostřední prvek podle pořadí, lze použít jako míru střední hodnoty vedle modu, nelze však používat aritmetický průměr.

Intervalové škály[editovat | editovat zdroj]

Intervalový typ umožňuje stanovit velikost rozdílu mezi položkami, ale ne poměr mezi nimi. Příklady zahrnují teplotu na Celsiově stupnici, která má dva pevně definované body (bod tání a bod varu vody za určitých podmínek) a prostor mezi nimi dělí na 100 stejných stupňů, datum měřené od libovolného počátku (například od odhadovaného narození Ježíše Krista) nebo směr měřený ve stupních od severního pólu. Poměry nejsou významné: o tělese teplém 20° C nelze říci, že je "dvakrát teplejší" než těleso na 10° C. Ani násobení a dělení nelze provádět přímo mezi dvěma měřeními teploty nebo datumy. Lze však vyjádřit poměry rozdílů; například jeden rozdíl může být dvakrát větší než jiný. Proměnné intervalového typu odpovídají matematickému pojmu afinní prostor (konkrétně afinní přímka u jednorozměrné, skalární škály).

Modus, medián a aritmetický průměr dovolují měřit střední hodnotu intervalových proměnných, zatímco míry statistického rozptylu zahrnují variační rozpětí (rozsah) a směrodatnou odchylku. Nelze definovat statistiky, které vyžadují počítat poměry, například variační koeficient. Z momentů lze použít centrální momenty a lze definovat standardizované momenty, protože poměry rozdílů jsou smysluplné.

Poměrové škály[editovat | editovat zdroj]

Název poměrový vychází z toho, že měření je odhadem poměru mezi velikostí spojité veličiny a jednotkovou velikostí stejného druhu (Michell, 1997, 1999). Poměrová stupnice má významnou (jedinečnou a nikoli libovolně stanovenou) nulovou hodnotu. Většina měření ve fyzikálních vědách a inženýrství se provádí na poměrových stupnicích. Příklady zahrnují hmotnost, délku, trvání v čase, rovinný úhel, energii a elektrický náboj. Poměry hodnot jsou nyní smysluplné, protože pevná nulová hodnota umožňuje říkat, že jeden objekt má například “dvojnásobnou délku” než jiný. Kelvinova stupnice teploty je poměrová, protože má unikátní a významný nulový bod nazvaný absolutní nula.

Kromě již uvedených statistik lze použít i geometrický průměr a harmonický průměr jako míry střední hodnoty. Studentizovaný rozsah a variační koeficient mohou měřit statistickou disperzi. Jsou povoleny všechny statistiky, protože jsou definovány všechny matematické operace.

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Level of measurement na anglické Wikipedii.

  1. a b Encyclopedia of Public Health. Encyclopedia of Public Health. Redakce Kirch Wilhelm. [s.l.]: Springer, 2008. ISBN 978-1-4020-5613-0. DOI:10.1007/978-1-4020-5614-7_1971. Kapitola Level of Measurement, s. 851–852. (anglicky) 
  2. a b STEVENS, S. S. On the Theory of Scales of Measurement. Science. 7 June 1946, s. 677–680. Dostupné online [cit. 7 February 2016]. DOI:10.1126/science.103.2684.677. PMID 17750512. Bibcode:1946Sci...103..677S. (anglicky) 
  3. MICHELL, J. Measurement scales and statistics: a clash of paradigms. Psychological Bulletin. 1986, s. 398–407. DOI:10.1037/0033-2909.100.3.398. (anglicky) 
  4. [s.l.]: [s.n.] ISBN 978-0201048544. 
  5. CHRISMAN, Nicholas R. Rethinking Levels of Measurement for Cartography. Cartography and Geographic Information Science. 1998, s. 231–242. ISSN 1523-0406. DOI:10.1559/152304098782383043. (anglicky) Šablona:Subscription required