Asymptotická složitost

Při řešení úloh pomocí výpočetní techniky musíme mít nástroj, kterým dokážeme porovnat efektivitu a rychlost vykonávání jednotlivých algoritmů. Pro tento účel byly zavedeny pojmy asymptotická složitost a operační náročnost algoritmu.

Asymptotická složitost je způsob klasifikace počítačových algoritmů. Určuje operační náročnost algoritmu tak, že zjišťuje, jakým způsobem se bude chování algoritmu měnit v závislosti na změně velikosti (počtu) vstupních dat. Zapisuje se pomocí Landauovy notace (též „Omikron notace“, nebo „velké O notace“) jako $O(f(N))$ (např. $O(N)$ ). Obvykle se používá asymptotická časová a prostorová složitost.

Používaný zápis znamená, že náročnost algoritmu je menší než $A+B\cdot f(N)$ , kde $A$ a $B$ jsou vhodně zvolené konstanty a $N$ je veličina popisující velikost vstupních dat. Zanedbáváme tedy multiplikativní i aditivní konstanty, tzn. $O(N+1000)=O(1000\cdot N)=O(N)$ . Zajímá nás jen chování funkce pro velké hodnoty $N$ .

Například časová složitost $O(N)$ (lineární) říká, že doba trvání práce algoritmu se zvýší přibližně tolikrát, kolikrát se zvýší velikost vstupu. Na druhou stranu u složitosti $O(N^{2})$ se doba trvání průběhu zvyšuje kvadraticky, tedy pokud se zvýší délka vstupu dvakrát, potřebný čas se zvýší přibližně čtyřikrát. U časové složitosti $O(1)$ naopak na délce vstupu vůbec nezáleží a potřebný čas nepřevýší nějakou pevnou mez. Podobně je tomu i u prostorové složitosti, jen s tou změnou, že se jedná o potřebné paměťové (prostorové) nároky v závislosti na délce vstupních dat.

Třídy složitosti[editovat | editovat zdroj]

Algoritmy můžeme podle hodnot $f(N)$ nějakého kritéria rozřadit do tříd. Kritéria jsou časová a paměťová složitost, dále pro paralelní a distribuované algoritmy komunikační složitost. Rozlišuje se složitost v nejhorším případě (která se odhaduje jednodušeji) a složitost v průměrném případě. Nejčastěji, tedy implicitně, se uvažuje o časové složitosti algoritmu v nejhorším případě.

Složitost problému je složitost nejlepšího algoritmu, který ho řeší. Každý konkrétní algoritmus poskytuje horní odhad složitosti.

Velikost dat $N$ se obvykle měří v bitech, bytech anebo buňkách pevné velikosti (z hlediska asymptotické složitosti je rozdíl jen v multiplikativní konstantě), ale někdy se pro zjednodušení uvažuje jiné $N$ . Například v grafových algoritmech se uvažuje graf o $N$ vrcholech a takový graf může (a v některých případech musí) mít až $N^{2}$ hran. Jiný příklad je čtvercová matice o straně $N$ , která ve skutečnosti obsahuje až $N^{2}$ položek.

V případě algoritmu rychlého řazení je časová složitost při obvyklé implementaci v nejhorším případě $O(N^{2})$ a v průměrném případě $O(N\log {N})$ . Algoritmus násobení čtvercových matic velikosti $N\times N$ podle definice má kubickou složitost $O(N^{3})$ , tj. problém násobení matic má složitost nejhůř kubickou. Strassenův algoritmus násobení matic má složitost přibližně $O(N^{2{,}89})$ a jsou známy algoritmy s ještě lepší asymptotickou složitostí. Podobně diskrétní Fourierova transformace počítaná přímočaře podle definice má složitost $O(N^{2})$ a algoritmus rychlé Fourierovy transformace má složitost $O(N\log {N})$ .

Časová složitost a třídy P a NP[editovat | editovat zdroj]

Pokud je časová složitost f(N) polynom, hovoříme o polynomiálně omezených algoritmech. Takové problémy, které řeší nějaký polynomiální algoritmus, patří do třídy složitosti P.

Pokud pro daný problém existuje polynomiálně omezený algoritmus, který ověří správnost řešení (dodaného někým jiným), hovoříme o nedeterministicky polynomiálním problému (polynomiálně omezený algoritmus, který řešení tohoto problému dokáže nalézt, zde obecně existovat nemusí). Tyto problémy tvoří třídu složitosti NP. Ekvivalentně lze tuto třídu definovat jako množinu problémů, které lze řešit na nedeterministickém Turingově stroji v polynomiálně omezeném čase. Do třídy NP patří například problém obchodního cestujícího, splnitelnost formule výrokové logiky a mnoho dalších, včetně všech problémů z třídy P.

Jednou z největších současných otevřených otázek teoretické informatiky je problém, zda se třídy P a NP rovnají. Vše nasvědčuje tomu, že to pravda není (viz NP-úplnost a problém P versus NP).^[zdroj?]

Složitost algoritmů a složitost problémů[editovat | editovat zdroj]

Je dobré rozlišovat dvě věci uvedené v nadpisu i v tomhle článku. Složitost algoritmu je odhad složitosti konkrétního algoritmu. Obvykle nás zajímá horní odhad, případně průměrný případ. Složitost problému je složitost nejlepšího algoritmu, který problém řeší. Zde je zajímavý dolní odhad, který se dokazuje pomocí teoretických nástrojů. Přitom každý konkrétní algoritmus poskytuje horní odhad složitosti problému.

Typické příklady časové složitosti[editovat | editovat zdroj]

Některé asymptotické složitosti (v proměnné $n$ s konstantou $k$ ) mají i své triviální pojmenování. V následující tabulce jsou seřazeny od nejmenší po největší.

Notace	Název	Příklad algoritmu
${\mathcal {O}}(1)$	konstantní	Skok na prvek v poli dle indexu
${\mathcal {O}}(\log {\log {n}})$	dvojitě logaritmická	Interpolační vyhledávání
${\mathcal {O}}(\log {n})$	logaritmická	Binární vyhledávání
${\mathcal {O}}(\log ^{k}{n})$	polylogaritmická	K-server problém
${\mathcal {O}}({\sqrt {n}})$	odmocninová	Vyhledávání v k-d stromu
${\mathcal {O}}(n)$	lineární	Hledání prvku v neseřazeném poli
${\mathcal {O}}(n\log {n})$	linearitmická	Řazení slučováním
${\mathcal {O}}(n^{2})$	kvadratická	Diskrétní Fourierova transformace, přímočaře podle definice
${\mathcal {O}}(n^{3})$	kubická	Násobení matic, přímočaře podle definice
${\mathcal {O}}(n^{4})$	kvartická	Nalezení podmatice s největším součtem pomocí dynamického programování, naivně
${\mathcal {O}}(n^{k})$	polynomiální	Karmarkův algoritmus
${\mathcal {O}}(k^{n})$	exponenciální	Problém obchodního cestujícího pomocí dynamického programování
${\mathcal {O}}(n!)$	faktoriálová	Problém obchodního cestujícího hrubou silou
${\mathcal {O}}(2^{2^{n}})$	dvojitě exponenciální	Ověření pravdivosti tvrzení zapsaného v Presburgově aritmetice

Existují i funkce, u nichž nelze složitost vůbec shora rozumně omezit. Příkladem budiž Ackermannova funkce.

Snižování výpočetní složitosti algoritmů[editovat | editovat zdroj]

Snahou programátorů, ale i teoretiků, je asymptotickou složitost dostat alespoň na polynomiální úroveň, horší složitosti jsou v reálných aplikacích (tedy u vyšších N) nepoužitelné. Typickým příkladem je diskrétní Fourierova transformace, která v obecném tvaru má asymptotickou složitost O(N²), proto je nevhodná pro transformaci vektorů větších délek. Existuje rychlá verze této transformace označovaná jako rychlá Fourierova transformace, která využívá skutečnosti, že pro délky vektorů N=K^M (kde K je určeno radixem transformace 2,4,8,… a M je přirozené číslo), lze tento problém spočítat se složitostí O(N log N).

Pro opravdu velká data jsou často i nelineární algoritmy příliš náročné, vizte velká data. Když nemáme vhodný algoritmus, poskytující přesné výsledky, tak použijeme jiný algoritmus a pak se musíme spokojit s přibližným řešením, pravděpodobně správným řešením, heuristickým řešením, anebo vhodnými technikami zmenšit zpracovávaná data.

Běžné implementační až hackerské triky obvykle zrychlí konkrétní složitost algoritmu, tj. sníží multiplikativní konstantu v asymptotické složitosti, ale nezmění asymptotickou složitost. Sem patří inline funkce, rozvíjení těla cyklu a převedení rekurze na iteraci. Na druhé straně, když takové optimalizace vynecháme, ignorujeme, nebo nemáme ve svém kompilátoru, tak to asymptotickou složitost nezhorší. Pomůže tak použití výkonnějšího hardwaru.

Amortizovaná časová složitost[editovat | editovat zdroj]

Amortizovaná časová složitost je průměrný čas potřebný pro vykonání určité operace v sekvenci operací v nejhorším případě. Na rozdíl od časové složitosti v průměrném případě nevyužívá pravděpodobnosti a předpokladů o rozložení dat. U amortizované složitosti je průměrný čas na operaci skutečně zaručený.

Tato metoda vyžaduje znalost toho, které sekvence operací jsou vůbec možné. Nejčastěji se to týká analýzy datových struktur, které si mezi jednotlivými operacemi udržují určitý stav. Některé datové struktury mají totiž takovou vnitřní organizaci, že na ní závisí složitost, a organizovanost dat se může během posloupnosti operací měnit. Základní myšlenka amortizované analýzy tkví v tom, že operace s velkou složitostí změní stav struktury tak, že tento nejhorší případ nemůže nastat po dlouhý čas, tudíž amortizuje svou cenu.

Amortizovaná složitost se používá v případě, kdy některá konkrétní operace (typicky na datové struktuře) má v nejhorším případě velkou složitost, ale na vykonání této operace si dokážeme našetřit z předchozích operací v (libovolné) posloupnosti.

Jako jednoduchý příklad můžeme uvést specifickou implementaci dynamického pole, která zdvojnásobuje velikost pole pokaždé, když dojde k jeho naplnění. V tomto případě je tedy nutná realokace, v nejhorším případě tato operace potřebuje čas až O(N). Samotné vkládání prvků (bez nutnosti realokace) vyžaduje čas O(1), pro N prvků tedy také O(N). Pro vložení N prvků (včetně realokace) je tedy potřeba O(N) + O(N) = O(N), amortizovaný čas na jedno vložení prvku je pak O(N)/N = O(1).

Příklad výpočetní náročnosti[editovat | editovat zdroj]

Jedna operace zde trvá jednu nanosekundu.

Asymptotická složitost	Velikost vstupních dat
Asymptotická složitost	10	20	50	100	1 000	1 000 000	1 000 000 000	10²⁰
$\log {\log {n}}$	2 ns	3 ns	3 ns	3 ns	4 ns	5 ns	5 ns	7 ns
$\log {n}$	4 ns	5 ns	6 ns	7 ns	10 ns	20 ns	30 ns	67 ns
${\sqrt {n}}$	4 ns	8 ns	8 ns	10 ns	32 ns	1 μs	32 μs	10 s
$n$	10 ns	20 ns	50 ns	100 ns	1 μs	1 ms	1 s	3 171 let
$n\log {n}$	34 ns	87 ns	283 ns	665 ns	10 μs	20 ms	30 s	210 675 let
$n^{2}$	100 ns	400 ns	3 μs	10 μs	1 ms	16 min 40 s	32 let
$n^{3}$	1 μs	8 μs	125 μs	1 ms	1 s	32 let
$n^{4}$	10 μs	160 μs	6 ms	100 ms	16 min 40 s	31 688 088 let
$2^{n}$	1 μs	1 ms	13 dní	40×10¹² let
$3^{n}$	59 μs	4 s	22 760 000 let
$n!$	4 ms	77 let
$n^{n}$	10 s	3,32×10⁹ let
$2^{2^{n}}$	5,7×10²⁹¹ let

Nebezpečí používání asymptotické složitosti[editovat | editovat zdroj]

Multiplikativní konstanta nějakého algoritmu může být příliš velká (např. $O(2^{100}N)$ ) a tedy algoritmus prakticky nepoužitelný. Takovéto algoritmy se nazývají galaktické. Typickým příkladem jsou algoritmy pro násobení matic, kde se pro praktické použití hodí Strassenův algoritmus, ačkoli jsou známy algoritmy s asymptoticky lepší složitostí.

Podobný případ je, když asymptoticky lepší algoritmus A má větší multiplikativní konstantu než alg. A*, ale v důsledku toho je pro reálně používané, tj. dostatečně malé, velikosti dat výhodnější A*, protože A* má menší režii.