Rekurzivní Bayesův odhad

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Rekurzivní Bayesův odhad (též Bayesův filtr) je v informatice označení pro obecný pravděpodobnostní rekurzivní přístup v čase k odhadu neznámé funkce míry pravděpodobnosti využívající měření příchozích dat a matematického modelování tohoto procesu.

V robotice[editovat | editovat zdroj]

Bayesův filtr je algoritmus využívaný v informatice pro výpočet možností na základě pravděpodobnosti, které dovolují robotovi odvodit jeho polohu a orientaci. V podstatě umožňuje Bayesův filtr robotům neustále aktualizovat jejich nejpravděpodobnější pozici v systému souřadnic na základě nejaktuálnějších dat získaných ze senzorů. Je to rekurzivní algoritmus a sestává ze dvou částí: předpovědi a aktualizace. Pokud jsou hodnoty proměnných lineární a normálně rozděleny, je Bayesův filtr shodný s Kalmanovým filtrem.

Zjednodušeně řečeno, robot pohybující se po celé ploše (mřížce) může mít několik různých senzorů, které mu poskytují informace o jeho okolí. Robot tedy může začít s jistotou, že je na pozici (0, 0). Avšak se zvětšující se vzdáleností od jeho výchozí pozice má robot stále menší jistotu ohledně jeho polohy. Za pomoci Bayesova filtru se může robot rozhodnout o jeho pravděpodobné aktuální poloze a tato pravděpodobná pozice může být neustále aktualizována na základě dodatečných dat ze senzorů.

Model[editovat | editovat zdroj]

Jako skutečný stav x se předpokládá nepozorovaný Markovův proces, měřením z jsou pozorovány stavy skrytého Markovova modelu (HMM). Následující obrázek znázorňuje Bayesovu síť skládající se z HMM.

Hidden Markov Model

Vzhledem k Markovovu předpokladu, je pravděpodobnost aktuálního skutečného stavu dána pouze bezprostředně předcházejícím stavem a není závislá na ostatních předešlých stavech.

p(\textbf{x}_k|\textbf{x}_{k-1},\textbf{x}_{k-2},\dots,\textbf{x}_0) = p(\textbf{x}_k|\textbf{x}_{k-1} )

Obdobně, měření v k-tém čase je závislé pouze na současném stavu a nikoli na ostatních předešlých stavech vzhledem k tomu současnému.

p(\textbf{z}_k|\textbf{x}_k,\textbf{x}_{k-1},\dots,\textbf{x}_{0}) = p(\textbf{z}_k|\textbf{x}_{k} )

Pomocí těchto předpokladů lze rozdělení pravděpodobnosti pro všechny stavy zapsat jednoduše jako:

p(\textbf{x}_0,\dots,\textbf{x}_k,\textbf{z}_1,\dots,\textbf{z}_k) = p(\textbf{x}_0)\prod_{i=1}^k p(\textbf{z}_i|\textbf{x}_i)p(\textbf{x}_i|\textbf{x}_{i-1}).

Avšak při využití Kalmanova filtru k odhadu stavu x je rozložení pravděpodobnosti zájmu spojeno s aktuálními stavy, které jsou podmíněny měřeními v aktuálním čase (toho je dosaženo odsunutím předchozích stavů a vydělením pravděpodobnosti počtem měření).

Toto vede k předpovědi a změně kroků v Kalmanově filtru pravděpodobnostním zápisem. Rozdělení pravděpodobnosti spojené s předpokládaným stavem je součet (integrál) součinů rozdělení pravděpodobnosti spojené s přechodem z (k - 1)-tého stavu do k-tého a rozdělení pravděpodobnosti spojené s předchozím stavem pro všechna možná x_{k_-1}.

 p(\textbf{x}_k|\textbf{z}_{k-1}) = \int p(\textbf{x}_k | \textbf{x}_{k-1}) p(\textbf{x}_{k-1} | \textbf{z}_{k-1} )  \, d\textbf{x}_{k-1}

Změna rozložení pravděpodobnosti je úměrná součinu měření pravděpodobnosti a předpovídaného stavu.

 p(\textbf{x}_k|\textbf{z}_{k}) = \frac{p(\textbf{z}_k|\textbf{x}_k) p(\textbf{x}_k|\textbf{z}_{k-1})}{p(\textbf{z}_k|\textbf{z}_{k-1})} 
= \alpha\,p(\textbf{z}_k|\textbf{x}_k) p(\textbf{x}_k|\textbf{z}_{k-1})

Jmenovatel

p(\textbf{z}_k|\textbf{z}_{k-1}) = \int p(\textbf{z}_k|\textbf{x}_k) p(\textbf{x}_k|\textbf{z}_{k-1}) d\textbf{x}_k

je konstantně relativní k x, takže ho vždy můžeme nahradit koeficientem \alpha, který může být obvykle v praxi ignorován. Čitatele je pak možné vypočítat a jednoduše normalizovat, jelikož jeho nedílnou součástí musí být jednotka.

Aplikace[editovat | editovat zdroj]

  • Kalmanův filtr využívá rekurzivní Bayesiánský filtr pro multivariační normální rozdělení
  • Particle filter na základě sekvenční techniky Monte Carlo metody (SMC), která modeluje PDF za pomoci sady diskrétních bodů
  • Grid-based odhady, které rozdělí PDF do diskrétní mřížky

Sekvenční Bayesiánské filtrování[editovat | editovat zdroj]

Sekvenční Bayesiánské filtrování je rozšíření Bayesianova odhadu v případě, kdy se pozorované hodnoty s časem mění. Je to způsob, jak odhadnout reálnou hodnotu pozorované proměnné, která se vyvíjí v čase.

Metoda se nazývá:

filtrování
když odhadujeme aktuální hodnotu danou předchozími měřeními,
vyhlazování
při odhadování minulých hodnot daných současnými a minulými měřeními,
předpovídání
při odhadu pravděpodobné budoucí hodnoty.

Pojem Sekvenční Bayesiánské filtrování je velmi využíván v řízení a robotice.

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Recursive Bayesian estimation na anglické Wikipedii.

Externí odkazy[editovat | editovat zdroj]