Metoda maximální věrohodnosti
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech.
Odhad v kontextu statistiky sestává ze dvou částí
- formulace pravděpodobnostního modelu, který popisuje danou reálnou situaci
- ověření shody daného modelu se skutečností na základě pozorovaných dat.
Z těchto dat se dále odhadují hodnoty volných parametrů modelu. [1] Metoda maximální věrohodnosti je univerzální metoda pro konstrukci odhadů parametrů.
Obsah |
Definice [editovat]
Pozorovaná data se uvažují jako soubor nezávislých náhodných veličin
stejně rozdělených s neznámou distribuční funkcí
. Dostupnou informací je, že tato funkce je členem parametrické množiny
, jejíž prvky se liší pouze hodnotou
. Jinými slovy existuje hodnota
taková, že
. Protože hodnota
je neznámá, je potřeba se jí pomocí nějakého odhadu
co nejlépe přiblížit.
Pro soubor stejně rozdělených, nezávislých náhodných veličin platí, že jejich sdruženou distribuci lze faktorizovat (tj. rozdělit na součin jednotlivých rozdělení)
Chceme-li odhadovat hodnoty
, pak získáme přepsáním předchozí rovnice vztah pro odhad 
Funkci
nazýváme věrohodnostní funkce[2].
Velmi často se setkáváme s logaritmem věrohodnostní funkce
, tj.
Jednou z výhod logaritmu je převod součinu na součet, se kterým se v některých případech lépe pracuje.
Jestliže existuje hodnota
taková, že pro všechny možné hodnoty parametru
platí
pak nazveme
maximálním věrohodným odhadem.
Alternativní formulace je
Příklady [editovat]
Diskrétní rozdělení [editovat]
Uvažujme náhodný výběr
z alternativního rozdělení, tj.
nabývá pouze hodnot 0 a 1 a sice s pravděpodobností
a
. Získaná data jsou (0,0,1,0). Úkol je odhadnout hodnotu parametru
, přičemž náš model předpokládá hodnoty buď
nebo
.
Pro pravděpodobnost pozorovaných dat máme podle alternativního rozdělení:
což je pro
rovno 0,1024 a pro
rovno 0,0064. Princip maximálního věrohodného odhadu spočívá v tom, že za odhad
vezmeme tu hodnotu, pro kterou je výsledek nejpravděpodobnější, tedy
[1].
Spojité rozdělení [editovat]
Uvažujme situaci popsanou normálním rozdělením
s distribuční funkcí
kde parametr
je znám. Pro odhad parametru
metodou maximální věrohodnosti dostáváme vztah
Pro výpočet maximálního věrohodného odhadu
postačuje pomocí první derivace určit maxima funkce na pravé straně, tj. najít řešení rovnice
které je
tedy výběrový průměr
Vlastnosti [editovat]
Statistické odhady lze charakterizovat pomocí několika základních vlastností.
- odhad
parametrické funkce
nazveme nestranný odhad, jestliže kvalita odhadu závisí pouze na náhodě a neobsahuje systematickou chybu, což lze vyjádřit pomocí střední hodnoty
. - odhad
parametrické funkce
na základě náhodného výběru
nazveme konzistentní odhad, jestliže zvyšováním počtu pozorování lze chybu odhadu udělat libovolně malou, tj. platí 
Přednosti [editovat]
V některých případech odhadu parametrů založeném na malém počtu pozorování se maximálně věrohodný odhad nechová nestranně, má ale na druhou stranu více důležitých vlastností[3]
- je konzistentní
- pro dostatečně velká
má přibližně normální rozdělení, tj. pro odhad
a parametr
platí
- přičemž se jedná o tzv. konvergenci v distribuci. Veličina
označuje Fisherovu informaci, kterou lze chápat jako míru informace o parametru
obsažené v jednom pozorování.[1]
- přičemž se jedná o tzv. konvergenci v distribuci. Veličina
- je asymptoticky (pro počet pozorování
) efficientní, tj. odhaduje neznámý parametr nejlepším možným způsobem. - pro spojité parametrické funkce
je maximální věrohodný odhad roven 
Nedostatky [editovat]
- Základním kamenem maximálního věrohodnostního odhadu je přesný a správný popis pravděpodobnostního modelu, resp. pravděpodobnostní funkce. Je-li tento popis reálné situace nepřesný pak jsou získané odhady nekonzistentní se získanými daty.
- Věrohodnostní funkce mohou být na základě zvoleného modelu a neznámých parametrů libovolně komplikované. Důsledkem jsou funkce, pro které nemusí existovat analytické řešení a při hledání maxima je pak nutné použít numerické metody.
- Přednosti maximálního věrohodnostního odhadu vycházejí z asymptotických vlastností. Pro nízké počty pozorování je tedy vhodnější použít jiné metody odhadu.[3]
Využití [editovat]
Metoda maximální věrohodnosti má široké využití ve statistice, například
- ve výpočtech při testování hypotéz
- ve faktorové analýze
Navíc je tato metoda rozšířená a v jiných oborech, například
- při rozpoznávání objektů v obrazových datech
- v ekonometrii a modelování finančních trhů
- při přesné lokalizaci (pomocí GPS apod.)
Reference [editovat]
- ↑ a b c DUPAČ, Václav; HUŠKOVÁ, Marie. Pravděpodobnost a matematická statistika. Praha : Nakladatelství Karolinum, 2005. 162 s. ISBN 80-246-0009-9. (česky)
- ↑ KOHOUT, Václav. Teorie odhadu, Skriptum ZCU [online]. ZČU Plzeň: 22.04.2004. Kapitola 10. Dostupné online. (česky)
- ↑ a b STOCKER, Herbert. Angewandte Ökonometrie, Skriptum [online]. Univ. Innsbruck: . Kapitola Maximum-Likelihood. Dostupné online. (německy)










parametrické funkce
nazveme nestranný odhad, jestliže kvalita odhadu závisí pouze na náhodě a neobsahuje systematickou chybu, což lze vyjádřit pomocí střední hodnoty
.
parametrické funkce 
má přibližně
platí
označuje
) efficientní, tj. odhaduje neznámý parametr nejlepším možným způsobem.