Řadicí algoritmus

Řadicí^[1]^[2]^[3] nebo třídicí^[4]^[5]^[6]^[7]^[8]^[9]^[10] algoritmus je algoritmus zajišťující uspořádání dané sady (pole, seznamu, souboru) datových záznamů do požadovaného pořadí. Pro porovnávání se obvykle nepoužívá celý záznam, ale jeho jedna nebo více jeho položek nazývaných klíče. Tyto položky bývají zpravidla numerické, které se řadí podle hodnoty nebo řetězcové, které se řadí abecedně. Řazení je velmi častá úloha, která je také částí mnoha dalších algoritmů; vývoji co možná nejefektivnějších algoritmů řazení se proto věnuje velké úsilí.

Z hlediska řazení se vstupní data chápou jako soubor dvojic klíč–hodnota, přičemž po seřazení je posloupnost klíčů monotónní, zatímco na připojené hodnoty se při řazení nebere zřetel a pouze se přesouvají vždy s odpovídajícím klíčem. Podle toho, zda se zachovává pořadí položek se stejným klíčem, rozlišuje algoritmy řazení na stabilní a nestabilní.

Definice problému

Na vstupu je posloupnost záznamů $S=(S_{1},S_{2},\ldots ,S_{n})$ ; cílem je najít takovou posloupnost $S'=(S_{1}',S_{2}',\ldots ,S_{n}')$ , pro kterou platí dvě základní kritéria:

Tato posloupnost je seřazená:
$S_{1}'\leq S_{2}'\leq \cdots \leq S_{n}'$ .
Posloupnost $S'$ je permutací původní posloupnosti $S$ (obsahuje tedy stejná data, jen v jiném pořadí).

V definici relace uspořádání ≤ se přitom bere ohled pouze na klíče příslušných hodnot. V některých programovacích jazycích (Perl, Tcl, Java) je k dispozici knihovní funkce realizující třídění, které lze předat funkci pro porovnání záznamů. Porovnávací funkce má dva parametry – odkazy na dva záznamy – a vrací hodnotu −1, pokud první záznam má být před druhým; 1 pokud první záznam má být za druhým; 0 pokud na pořadí záznamů nezáleží (u stabilního algoritmu se musí relativní pořadí záznamů zachovat). Tento přístup umožňuje nejen třídění podle klíčů, ale obecněji podle libovolné ohodnocovací funkce.

Název

Pro uspořádávání prvků do posloupnosti podle určitého kritéria se v češtině používá slovo řazení; v informatice byl zaveden termín třídění odpovídající anglickému sort, sorting, který byl takto definován v (již zrušené) názvoslovné normě ČSN 36 9001. Někteří autoři se domnívají, že pro uspořádávání je vhodnější termín řazení, přičemž třídění by se mělo používat pro rozdělování sady prvků do několika skupin podle zadaného kritéria, a to bez potřeby určení vzájemného pořadí tříděných prvků. Pouze někteří autoři však pro uspořádávání prvků do posloupnosti termín řazení skutečně používají.

Pro rozdělování prvků do skupin lze používat jednoznačný název kategorizace, případně klasifikace.

Některé algoritmy uspořádávání záznamů do posloupnosti využívají při své práci jejich rozdělování do několika skupin.

Složitost

Pro seřazení množiny $n$ prvků existuje očividná dolní mez časové asymptotické složitosti $O(n)$ (každý prvek je potřeba alespoň jednou přečíst). Této dolní meze je ale možno dosáhnout jen při předem známé, omezené množině klíčů (např. interval v přirozených číslech). Lze dokázat, že u řazení, které je založeno na porovnávání dvojic klíčů (což je univerzální metoda použitelná pro libovolná data), je minimální časová složitost $O(n\log n)$ .

Pro délku pole v násobcích dvou platí:

O(n\log n)=(\ln(n)/\ln(2)-1)*n+1

Pro představu, jaký je rozdíl mezi řazením 1 000 prvků a 1 000 000 prvků:

n=2^{4}=16,O(n\log n)=49(3*16+1)

n=2^{8}=256,O(n\log n)=1.793(7*256+1)

n=2^{10}=1.024,O(n\log n)=9.217(9*1024+1)

n=2^{20}=1.048.576,O(n\log n)=19.922.945(19*1048576+1)

Klasifikace algoritmů

Podle různých kritérií se algoritmy řazení dají dělit do různých skupin. Dvě základní skupiny algoritmů jsou tzv. vnitřní a vnější řazení. Vnitřní řazení vyžaduje, aby všechna řazená data byla uložena v operační paměti, kde k nim má algoritmus možnost libovolně přistupovat. Pokud je dat tak velké množství, že v jednu chvíli může být v operační paměti jen nějaká část dat (a zbytek je ve vnější paměti, např. na pevném disku), je třeba použít vnější řazení.

Největší část algoritmů řazení je založena na porovnávání dvojic prvků; jedná se o univerzální metodu, kterou lze seřadit libovolná data v libovolné reprezentaci (stačí příslušná relace uspořádání). Pro některé konkrétní reprezentace nějak vymezené množiny dat lze sestrojit algoritmy, které fungují na jiném principu, např. na základě reprezentace řazených čísel v poziční číselné soustavě.

Kromě samotných řazených dat také algoritmus zpravidla potřebuje nějakou dodatečnou pracovní paměť. Pokud je velikost této paměti konstantní (nezávislá na množství řazených dat, označováno jako $O(1)$ ), algoritmus se označuje jako řazení na původním místě (in situ nebo in-place algoritmus), jiné algoritmy však potřebují dodatečnou paměť, například místo o velikosti původních dat (tedy $O(N)$ v asymptotickém vyjádření), ve kterém generují seřazený výsledek.

Vstupní data mohou obsahovat několik prvků se shodným klíčem. Podle vzájemné polohy těchto prvků před a po seřazení (kterou lze detekovat podle přidružených dat, která nejsou součástí klíče) se rozlišují tzv. stabilní a nestabilní třídicí algoritmy: stabilní algoritmus zachovává vzájemné pořadí položek se stejným klíčem, u nestabilního není vzájemné pořadí prvků se stejným klíčem zaručeno. (Ale z libovolného nestabilního algoritmu lze učinit stabilní tím, že se klíč každé položky vstupních dat rozšíří o pozici položky v původním souboru.)

Podle chování na částečně seřazených souborech dat se rozlišují algoritmy přirozené a nepřirozené: přirozený algoritmus rychleji zpracuje seřazenou množinu než neseřazenou.

Ukázka řazení
Výběr	Vkládaní	Záměna
614532
1•64532	6•14532	145326
12•6453	16•4532	143256
123•645	146•532	132456
1234•65	1456•32	123456
12345•6	13456•2
123456

Dále lze algoritmy zhruba rozdělit podle základní myšlenky. Existuje několik základních druhů algoritmů univerzální vnitřního řazení, přičemž některé pokročilejší algoritmy kombinují více postupů.

Řazení výběrem: V souboru se vždy najde nejmenší ze zbývajících položek a uloží na konec postupně budovaného seřazeného souboru.
Řazení vkládáním: Ze souboru neseřazených dat se postupně bere položka po položce a vkládá se na správné místo v seřazeném souboru (zpočátku prázdném).
Řazení záměnou: V souboru se vždy nalezne (nějakou metodou závislou na konkrétním algoritmu) nějaká dvojice prvků, která je ve špatném pořadí, a tyto prvky se navzájem zamění.
Řazení slučováním: Vstupní soubor se rozdělí na části, které se (typicky rekurzivně) seřadí; výsledné seřazené části se poté sloučí takovým způsobem, aby i výsledek byl seřazený.

Neexistuje žádný „dokonalý“ třídicí algoritmus, který by byl ideální pro všechna použití. Různé algoritmy mají různé vlastnosti co se týká jejich očekávané časové a paměťové složitosti, náročnosti implementace a dalších vlastností. Pro konkrétní podmínky se tak často navrhují specifické varianty.

Běžné algoritmy

Přehled běžných univerzálních algoritmů řazení
Název		Časová složitost			Dodatečná paměť	Stabilní	Přirozená	Metoda
Název	Znám jako	Minimum	Průměrně	Maximum	Dodatečná paměť	Stabilní	Přirozená	Metoda
bublinkové řazení	bubble sort	O(n)	O(n²)	O(n²)	O(1)	ano	ano	záměna
řazení haldou	heapsort	O(n log n)	O(n log n)	O(n log n)	O(1)	ne	ne	halda, záměna
řazení vkládáním	insertion sort	O(n)	O(n²)	O(n²)	O(1)	ano	ano	vkládání
řazení slučováním	merge sort	O(n log n)	O(n log n)	O(n log n)	O(log n)	ano	ano	slučování
rychlé řazení	quick sort	O(n log n)	O(n log n)	O(n²)	O(log n)	ne	ne	záměna
řazení výběrem	selection sort	O(n²)	O(n²)	O(n²)	O(1)	zprav. ne	ne	výběr
Shellovo řazení	shell sort	$O(n^{1+{\frac {c}{\sqrt {m}}}})$ ^[11]		O(n log² n)^[11]	O(1)	ne	ano	vkládání
comb sort	(hřebenové řazení)	O(n)	O(n log n)	O(n²)	O(1)	ne	ano	záměna
introspektivní třídění	Introsort	O(n log n)	O(n log n)	O(n log n)	O(log n)	ne	?	záměna, výběr

Běžné algoritmy řazení založené na jiném principu
Název		Časová složitost	Dodatečná paměť	Stabilní	Stručný popis metody
Název	Znám jako	Časová složitost	Dodatečná paměť	Stabilní	Stručný popis metody
přihrádkové řazení	bucket sort	O(n · k)	O(2^k)	ano	podle hodnoty klíče se data roztřídí do připravených přihrádek seřazených podle velikosti
číslicové řazení	radix sort	O(n · 2^k)	O(n)	ano	postupné třídění po jednotlivých cifrách poziční číselné soustavy
Counting sort	Řazení počítáním četností	O(n + k)	O(k)	ano	umístění do správného pořadí po spočítání četností jednotlivých hodnot

Reference

↑ RYCHLÍK, Jan. Programovací techniky. 2., upravené vyd. České Budějovice: KOPP, 1995. 188 s. ISBN 80-85828-05-7. Kapitola 6 – Řazení.
↑ SATRAPA, Pavel. Perl pro zelenáče. 1. vyd. Praha: Neokortex, spol. s r.o., 1995. 224 s. S. 66.
↑ HEROUT, Pavel. Java – Bohatství knihoven. České Budějovice: Kopp, 2003. 242 s. S. 65, 101.
↑ KRIŠTOUFEK, Karel. Výpočetní a řídicí technika. Praha: SNTL, 1982-01-01. 372 s. (Oborové encyklopedie SNTL). S. 309.
↑ KUČERA, Luděk. Kombinatorické algoritmy. 2. vyd. Praha: SNTL, 1989. 287 s. (Matematický seminář SNTL). S. 89–103.
↑ MINIHOFER, Oldřich; KRATOCHVÍLOVÁ, Jindra. Anglicko-český slovník výpočetní techniky. 1. vyd. Praha: SNTL, 1986. 287 s. S. 494.
↑ TÖPFER, Pavel. Algoritmy a programovací techniky. 1. vyd. Praha: Prometheus, s.r.o., 1995. 299 s. S. 190 (178–213).
↑ VALLA, Tomáš; MAREŠ, Martin; KRÁĽ, Dan. Recepty z programátorské kuchařky – Třídění [online]. 2011. Dostupné online.
↑ HOŘEJŠ, Jiří; BRODSKÝ, Jan; STAUDEK, Jan. Struktura počítačů a jejich programového vybavení. Praha, Bratislava: SNTL, Alfa, 1982. 446 s. S. 139–140.
↑ Martin Mareš, Tomáš Valla, Průvodce labyrintem algoritmů, http://pruvodce.ucw.cz/ pdf
↑ ^a ^b Robert Sedgewick: Analysis of Shellsort and Related Algorithms, Fourth Annual European Symposium on Algorithms, Barcelona, září 1996

Literatura

(anglicky) Donald E. Knuth: The Art of Computer Programming, Volume 3: Sorting and Searching. Second Edition. Reading, Massachusetts: Addison-Wesley, 1998. ISBN 0-201-89685-0

Externí odkazy

Obrázky, zvuky či videa k tématu řadicí algoritmus na Wikimedia Commons
(anglicky) Algoritmy řazení ve slovníku algoritmů a datových struktur NIST
Třídění ve výukových materiálech k předmětu Základy algoritmizace
Animace některých algoritmů a datových struktur
(anglicky) Sorting Algorithms Visualized

[Rychlík_Techniky-1] RYCHLÍK, Jan. Programovací techniky. 2., upravené vyd. České Budějovice: KOPP, 1995. 188 s. ISBN 80-85828-05-7. Kapitola 6 – Řazení.

[Satrapa_Perl-2] SATRAPA, Pavel. Perl pro zelenáče. 1. vyd. Praha: Neokortex, spol. s r.o., 1995. 224 s. S. 66.

[Java_bohatstvi_knihoven-3] HEROUT, Pavel. Java – Bohatství knihoven. České Budějovice: Kopp, 2003. 242 s. S. 65, 101.

[Kristoufek_Encyklopedie-4] KRIŠTOUFEK, Karel. Výpočetní a řídicí technika. Praha: SNTL, 1982-01-01. 372 s. (Oborové encyklopedie SNTL). S. 309.

[Kucera_Kombinatoricke_algoritmy-5] KUČERA, Luděk. Kombinatorické algoritmy. 2. vyd. Praha: SNTL, 1989. 287 s. (Matematický seminář SNTL). S. 89–103.

[AC_slovnik_VT-6] MINIHOFER, Oldřich; KRATOCHVÍLOVÁ, Jindra. Anglicko-český slovník výpočetní techniky. 1. vyd. Praha: SNTL, 1986. 287 s. S. 494.

[Topfer_Algoritmy-7] TÖPFER, Pavel. Algoritmy a programovací techniky. 1. vyd. Praha: Prometheus, s.r.o., 1995. 299 s. S. 190 (178–213).

[Recepty-8] VALLA, Tomáš; MAREŠ, Martin; KRÁĽ, Dan. Recepty z programátorské kuchařky – Třídění [online]. 2011. Dostupné online.

[Struktura_pocitacu-9] HOŘEJŠ, Jiří; BRODSKÝ, Jan; STAUDEK, Jan. Struktura počítačů a jejich programového vybavení. Praha, Bratislava: SNTL, Alfa, 1982. 446 s. S. 139–140.

[PLA-10] Martin Mareš, Tomáš Valla, Průvodce labyrintem algoritmů, http://pruvodce.ucw.cz/ pdf

[sedgewick96-11] Robert Sedgewick: Analysis of Shellsort and Related Algorithms, Fourth Annual European Symposium on Algorithms, Barcelona, září 1996

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]