Rozdělení pravděpodobnosti

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Rozdělení pravděpodobnosti nebo rozložení pravděpodobnosti (někdy také distribuce pravděpodobnosti) náhodné veličiny je pravidlo, kterým každému jevu popisovanému touto veličinou přiřazujeme určitou pravděpodobnost. Rozdělení pravděpodobnosti náhodné veličiny tedy získáme, pokud každé hodnotě diskrétní náhodné veličiny, popř. intervalu hodnot spojité náhodné veličiny, přiřadíme pravděpodobnost.

Rozdělení pravděpodobnosti lze také chápat jako zobrazení, které každému elementárnímu jevu přiřazuje určité reálné číslo, které charakterizuje pravděpodobnost tohoto jevu.

Rozdělení pravděpodobnosti diskrétní náhodné veličiny[editovat | editovat zdroj]

Pravděpodobnost, že diskrétní náhodná veličina X bude mít po provedení náhodného pokusu hodnotu x značíme P(X=x), P[X=x] nebo stručně P(x).

Výsledkem jednoho náhodného pokusu je to, že náhodná veličina bude mít právě jednu hodnotu. Všechny hodnoty definičního oboru náhodné veličiny tedy představují úplný systém neslučitelných jevů, což znamená, že součet pravděpodobností všech možných hodnot x diskrétní náhodné proměnné X je roven 1, tzn.

\sum_x P[X=x]=1

Pravděpodobnostní funkce[editovat | editovat zdroj]

Rozdělení pravděpodobnosti diskrétní náhodné veličiny tedy vyjádříme tak, že určíme pravděpodobnost P(x) pro všechna x definičního oboru veličiny X. Pravděpodobnosti jednotlivých hodnot x jsou tedy vyjádřeny funkcí P(x), kterou označujeme jako pravděpodobnostní funkci.

Demonstrace diskrétního rozdělení pravděpodobnosti.

Hodnoty pravděpodobností funkce vyjadřujeme obvykle tabulkou, např.

x P(x)
x_1 P(x_1)
x_2 P(x_2)
x_n P(x_n)

Nebo se také používá vyjádření ve formě grafu (viz obrázek). V některých případech lze také použít vyjádření pomocí matematického vzorce.

Znalost pravděpodobnostní funkce lze použít k výpočtu pravděpodobnosti. Např. pravděpodobnost, že náhodná veličina X leží mezi hodnotami x_1 a x_2 určíme jako

P[x_1\leq X\leq x_2] = \sum_{x=x_1}^{x_2} P(x)

Distribuční funkce diskrétní veličiny[editovat | editovat zdroj]

Pomocí pravděpodobnostní funkce můžeme zavést tzv. distribuční funkci vztahem

F(x) = P[X \le x]

Distribuční funkce je neklesající a je spojitá zprava. Hodnoty distribuční funkce leží v rozsahu 0\leq F(x)\leq 1. Pro diskrétní náhodnou veličinu X lze pro libovolné reálné číslo x vyjádřit distribuční funkci vztahem

F(x) = \sum_{t \le x} P(t)

Vlastnosti[editovat | editovat zdroj]

Jestliže hodnoty náhodné veličiny leží v intervalu ( a, b \rangle, pak F(a)=0 a F(b)=1.

Distribuční funkci lze, podobně jako pravděpodobnostní funkci, použít k výpočtu pravděpodobnosti, neboť

P[x_1 < X\leq x_2] = F(x_2)-F(x_1)

Důležitá diskrétní rozdělení[editovat | editovat zdroj]

Rozdělení pravděpodobnosti spojité náhodné veličiny[editovat | editovat zdroj]

Distribuční funkce několika normálních rozdělení s různými charakteristikami. Červenou čárou je vyznačeno normované normální rozdělení.
Hustota pravděpodobnosti několika normálních rozdělení.

Spojitá náhodná veličina má spojitou distribuční funkci F(x). Rozdělení spojité náhodné veličiny nelze popsat pravděpodobnostní funkcí v určitém bodě.

Hustota pravděpodobnosti[editovat | editovat zdroj]

Rozdělení pravděpodobnosti spojité náhodné veličiny se určuje prostřednictvím funkce, kterou označujeme jako hustota rozdělení pravděpodobnosti (hustota pravděpodobnosti, anglicky Probability Density Function, PDF). Pro spojitou náhodnou veličinu obecně neplatí, že také hustota pravděpodobnosti je spojitá.

Je-li \rho(x) hustota pravděpodobnosti spojité náhodné veličiny X, pak platí

\int_\Omega \rho(x)\mathrm{d}x = 1 \,,

kde \Omega je definiční obor veličiny X. Pro hodnoty x mimo definiční obor \Omega je hustota pravděpodobnosti nulová, tzn. \rho(x)=0 pro x\notin \Omega.


Ze znalosti hustoty pravděpodobnosti \rho(x) lze určit pravděpodobnost, že náhodná veličina X nabývá hodnotu z intervalu \langle x_1,x_2\rangle, tedy

P[x_1\leq X\leq x_2] = \int_{x_1}^{x_2} \rho(x)\mathrm{d}x

Pravděpodobnost, že spojitá náhodná veličina nabývá určité (přesně dané) hodnoty, je nulová, což plyne z předchozího vztahu. Důsledkem toho je, že pro spojitou náhodnou veličinu platí vztahy

P[x_1\leq X\leq x_2] = P[x_1<X\leq x_2] = P[x_1\leq X<x_2] = P[x_1<X<x_2]

Distribuční funkce spojité veličiny[editovat | editovat zdroj]

Distribuční funkce F(x) jednorozměrné reálné náhodné veličiny X se definuje jako pravděpodobnost, že realizace této náhodné veličiny nepřekročí x:

F(x) = P[X \le x]

Distribuční funkce je neklesající, zprava spojitá, její limita  -\infty je nula, v  \infty pak jedna.

Komplementární distribuční funkce se pak definuje jako 1 - F(x).

Pro spojitou náhodnou veličinu s hustotou pravděpodobnosti \rho(x) lze distribuční funkci spočítat také podle vztahu

F(x) = \int\limits_{-\infty}^x \rho(t)\mathrm{d}t

Vlastnosti[editovat | editovat zdroj]

Platí, že F(-\infty)=0 a F(\infty)=1.

Distribuční funkci lze použít k výpočtu pravděpodobnosti, neboť

P[x_1\leq X \leq x_2] = F(x_2)-F(x_1)

Lze dokázat, že mezi hustotou pravděpodobnosti \rho(x) a distribuční funkcí F(x) platí vztah

\rho(x)=\frac{\mathrm{d}F(x)}{\mathrm{d}x},

pokud derivace distribuční funkce v daném bodě x existuje.

Důležitá spojitá rozdělení[editovat | editovat zdroj]

Vícerozměrné rozdělení pravděpodobnosti[editovat | editovat zdroj]

Sdružená a marginální pravděpodobnost[editovat | editovat zdroj]

Mějme n-rozměrný náhodný vektor \mathbf{X}, jehož složkami jsou diskrétní náhodné veličiny X_i. Jejich rozdělení lze popsat tzv. sdruženou (simultánní) pravděpodobností

P(\mathrm{x}) = P(x_1,x_2,...,x_n) = P[X_1=x_1\cap X_2=x_2\cap\cdots\cap X_n=x_n]

Tento vztah udává pravděpodobnost, že náhodná veličina X_1 nabude hodnotu x_1, náhodná veličina X_2 nabude hodnoty x_2, atd. pro všechna X_i a x_i.


Pro n=2 zobrazujeme sdružené pravděpodobnosti v tzv. korelační tabulce

x y_1 y_2 y_s Součet
x_1 P(x_1,y_1) P(x_1,y_2) P(x_1,y_s) P_1(x_1)
x_2 P(x_2,y_1) P(x_2,y_2) P(x_2,y_s) P_1(x_2)
x_r P(x_r,y_1) P(x_r,y_2) P(x_r,y_s) P_1(x_r)
Součet P_2(y_1) P_2(y_2) P_2(y_s) 1

Pravděpodobnosti P_1(x_i) a P_2(y_j) jsou tzv. marginální (okrajové) pravděpodobnosti. Platí tedy

P_1(x) = \sum_y P(x,y)
P_2(y) = \sum_x P(x,y)

Dále platí

\sum_x \sum_y P(x,y) = \sum_x P_1(x) = \sum_y P_2(y) = 1

Sdružená a marginální distribuční funkce[editovat | editovat zdroj]

Sdruženou (simultánní) distribuční funkci lze pro n-rozměrný náhodný vektor \mathbf{X} diskrétních veličin X_i definovat jako

F(x) = F(x_1,x_2,..,x_n) = F(X_1\leq x_1\cap X_2\leq x_2\cap \cdots\cap X_n\leq x_n)

Sdružená distribuční funkce (pro dvě proměnné X, Y) splňuje podmínky

F(-\infty,y) = F(x,-\infty)=F(-\infty,-\infty)=0
F(\infty,\infty)=1

Podobné podmínky platí také pro vícerozměrné náhodné vektory.


Marginální (okrajové) distribuční funkce lze pro vektor dvou proměnných X a Y zapsat vztahy

F_1(x)=F(x,\infty)
F_2(y)=F(\infty,y)

Podobně lze marginální distribuční funkce určit také v případě vícerozměrných náhodných vektorů.

Sdružená a marginální hustota pravděpodobnosti[editovat | editovat zdroj]

Rozdělení dvou spojitých náhodných veličin je možné popsat sdruženou hustotou pravděpodobnosti f(x,y). Sdružená hustota pravděpodobnosti musí splňovat podmínku

\int_\Omega  \left[\int_\Omega f(x,y)\mathrm{d}x\right]\mathrm{d}y = 1

Marginální hustoty pravděpodobnosti určíme jako

f_1(x) = \int_\Omega f(x,y)\mathrm{d}y
f_2(y) = \int_\Omega f(x,y)\mathrm{d}x

Sdruženou distribuční funkci pak dostaneme jako

F(x,y) = \int_{-\infty}^x\left[\int_{-\infty}^yf(t,u)\mathrm{d}t\right]\mathrm{d}u

Ze sdružené distribuční funkce lze naopak získat sdruženou hustotu pravděpodobnosti

f(x,y) = \frac{\part^2 F(x,y)}{\part x\part y}


Podobně lze postupovat také v případě n-rozměrných vektorů spojitých náhodných veličin. Sdruženou hustotu pravděpodobnosti pak můžeme získat jako

f(\mathbf{x})=f(x_1,x_2,...,x_n) = \frac{\part^n F(x_1,x_2,...,x_n)}{\part x_1\part x_2\cdots\part x_n}

Marginální pravděpodobnost lze definovat pro libovolnou skupinu m veličin (m<n) daného n-rozměrného náhodného vektoru. Rozdělení je závislé pouze na daných m veličinách a na zbývajících n-m veličinách nezávisí. Pro m>2 je nutno rozlišovat podvojnou nezávislost a nezávislost vzájemnou.

Jsou-li veličiny X_i vzájemně nezávislé, pak platí

F(\mathbf{x}) = F_1(x_1)F_2(x_2)\cdots F_n(x_n)
P(\mathbf{x}) = P_1(x_1)P_2(x_2)\cdots P_n(x_n)
f(\mathbf{x}) = f_1(x_1)f_2(x_2)\cdots f_n(x_n)

Podmíněné rozdělení pravděpodobnosti[editovat | editovat zdroj]

Podmíněným rozdělením náhodné veličiny X vzhledem k veličině y rozumíme rozdělení veličiny X za podmínky, že náhodná veličina Y nabyla hodnoty y.

Podmíněné rozdělení je definováno jako podíl rozdělení sdruženého a marginálního.


Pro dvě diskrétní náhodné veličiny X, Y můžeme zapsat podmíněnou pravděpodobnost veličiny X vzhledem k Y jako

P(x|y)= \frac{P(x,y)}{P_2(y)}

pro P_2(y)\neq 0, kde P_2(y) je marginální pravděpodobnost a P(x,y) je pravděpodobnost sdružená.


Obdobně dostaneme pro podmíněnou pravděpodobnost veličiny Y vzhledem k X vztah

P(y|x) = \frac{P(x,y)}{P_1(x)}

pro P_1(x)\neq 0, kde P_1(x) je marginální pravděpodobnost a P(x,y) je opět sdružená pravděpodobnost.

Podmíněná distribuční funkce[editovat | editovat zdroj]

Podmíněné distribuční funkce zapsat zapsat jako

F(x|y) = \sum_{t \leq x} \frac{P(t,y)}{P_2(y)}
F(y|x) = \sum_{t \leq y} \frac{P(x,t)}{P_1(x)}

Podmíněná hustota pravděpodobnosti[editovat | editovat zdroj]

Máme-li dvourozměrný náhodný vektor, jehož složkami jsou spojité náhodné veličiny X a Y, pak můžeme vyjádřit podmíněné hustoty pravděpodobnosti

f(x|y) = \frac{f(x,y)}{f_2(y)}

pro f_2(y)\neq 0 a

f(y|x) = \frac{f(x,y)}{f_1(x)}

pro f_1(x)\neq 0, kde f(x,y) je sdružená hustota pravděpodobnosti a f_1(x) a f_2(y) jsou marginální hustoty pravděpodobnosti.

Pro podmíněné distribuční funkce spojitých náhodných veličin X, Y pak platí

F(x|y) = \frac{\int_{-\infty}^x f(t,y)\mathrm{d}t}{f_2(y)}
F(y|x) = \frac{\int_{-\infty}^y f(x,t)\mathrm{d}t}{f_1(x)}

Charakteristiky rozdělení náhodné veličiny[editovat | editovat zdroj]

Související informace naleznete také v článku Charakteristika náhodné veličiny.

Charakteristiky náhodné veličiny jsou vhodně vybrané číselné údaje, které shrnují základní informace o rozdělení pravděpodobnosti náhodné veličiny. Charakteristiky nám o náhodné veličině poskytují pouze základní a hrubou představu, neboť charakteristiky (obvykle) nepostačují k jednoznačnému popisu rozdělení pravděpodobnosti. Naproti tomu rozdělení pravděpodobnosti sice poskytuje jednoznačný popis náhodné veličiny, obvykle však není dostatečně přehledné.

Důležitými charakteristikami rozdělení jsou střední hodnota a rozptyl.


Související články[editovat | editovat zdroj]