Pseudoinverze matice

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Pseudoinverzní matice nebo též zobecněná inverze se používá ke zobecnění pojmu inverzní matice v případech, kdy matice \mathbf{A} je čtvercová singulární, nebo obdélníková, tedy v případech, kdy klasická inverze neexistuje. Pojem inverze lze zobecnit mnoha různými způsoby. V praxi se nejčastěji setkáme s tzv. Moore-Penroseovou pseudoinverzí, kterou poprvé zavedli Moore (1920) a Penrose (1955) a obvykle se značí \mathbf{A}^{+}.

Moore-Penroseova pseudoinverze[editovat | editovat zdroj]

Definice[editovat | editovat zdroj]

Moore-Penroseovou pseudoinverzí matice \mathbf{A} nazveme matici, která je jednoznačným řešením soustavy čtyř (nelineárních) rovnic

(1) \mathbf{A}\mathbf{X}\mathbf{A} = \mathbf{A},
(2) \mathbf{X}\mathbf{A}\mathbf{X} = \mathbf{X},
(3) (\mathbf{A}\mathbf{X})^T = \mathbf{A}\mathbf{X},
(4) (\mathbf{X}\mathbf{A})^T = \mathbf{X}\mathbf{A},

tzv. Moore-Penroseových podmínek. Moore-Penroseovu pseudoinverzi značíme \mathbf{A}^{+}. (Všimněme si, že pro čtvercovou regulární matici a její inverzi jsou všechny podmínky splněny triviálně.)

Výpočet, alternativní definice[editovat | editovat zdroj]

Nechť \mathbf{A}\in\mathbb{R}^{m\times n}, \mathrm{rank}(\mathbf{A})=r. Uvažujme singulární rozklad

\mathbf{A}=\mathbf{U}\mathbf{\Sigma}\mathbf{V}^T=[\mathbf{U}_r|\mathbf{U}_0]\left[\begin{array}{c|c}\mathbf{\Sigma}_r&0\\\hline0&0\end{array}\right][\mathbf{V}_r|\mathbf{V}_0]^T = \mathbf{U}_r\mathbf{\Sigma}_r\mathbf{V}_r^T,

kde

 \mathbf{U}^{-1}=\mathbf{U}^T,\;\mathbf{V}^{-1}=\mathbf{V}^T,\;\mathbf{\Sigma}_r=\mathrm{diag}(\sigma_1,\ldots,\sigma_r),\;\sigma_1\geq\ldots\geq\sigma_r>0,

pak

\mathbf{A}^+= \mathbf{V}_r\mathbf{\Sigma}_r^{-1}\mathbf{U}_r^T.

Snadno ověříme, že takto zvolená matice splňuje všechny čtyři podmínky.

Vlastnosti[editovat | editovat zdroj]

Chápeme-li původní matici jako lineární zobrazení \mathbb{R}^n\longrightarrow\mathbb{R}^m a provedeme-li jeho restrikci na [\mathcal{N}(\mathbf{A})]^\perp\equiv\mathcal{R}(\mathbf{V}_r)\longrightarrow\mathcal{R}(\mathbf{A})\equiv\mathcal{R}(\mathbf{U}_r), kde je bijektivní, pak Moore-Penroseova pseudoinverze reprezentuje jeho inverzi.

Má-li matice \mathbf{A} lineárně nezávislé sloupce, pak \mathbf{A}^T\mathbf{A} je regulární a

\mathbf{A}^+ = (\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^T,

má-li naopak lineárně nezávislé řádky, pak \mathbf{A}\mathbf{A}^T je regulární a

\mathbf{A}^+ = \mathbf{A}^T(\mathbf{A}\mathbf{A}^T)^{-1}.

Zřejmě, je-li matice regulární (speciálně má lineárně nezávislé řádky i sloupce), pak

\mathbf{A}^+ = \mathbf{A}^{-1}.

Využití[editovat | editovat zdroj]

Uvažujme lineární aproximační problém

\mathbf{A}\mathbf{X}\approx \mathbf{B}, \qquad \text{kde} \qquad \mathbf{A}\in\mathbb{R}^{m\times n}, \; \mathrm{rank}(\mathbf{A})=r, \; \mathbf{X}\in\mathbb{R}^{n\times d}, \; \mathbf{B}\in\mathbb{R}^{m\times d},

pak

\mathbf{X}_{LS}\equiv\mathbf{A}^+\mathbf{B}

je řešení ve smyslu nejmenších čtverců, má-li matice \mathbf{A} lineárně závislé sloupce, pak je to navíc řešení minimální v normě. Tedy,

\min_{\mathbf{X}}\|\mathbf{B}-\mathbf{A}\mathbf{X}\|_F=\|\mathbf{B}-\mathbf{A}\mathbf{X}_{LS}\|_F,

navíc \mathbf{X}_{LS} má minimální normu mezi všemi \mathbf{X}, které výraz vlevo minimalizují.


Další zobecněné inverze odvozené od Moore-Penroseových podmínek[editovat | editovat zdroj]

Uvažujme Moore-Penroseovy podmínky očíslované tak jak je uvedeno výše. Pro zobecnění pojmu inverzní matice není nezbytně nutné vyžadovat splnění všech čtyř podmínek. Následující zobecněné inverze jsou pojmenované a označené podle toho, které z podmínek splňují:

  • (1)-inverze, značíme \mathbf{A}^{(1)},
  • (1,2)-inverze, značíme \mathbf{A}^{(1,2)},
  • (1,2,3)-inverze, značíme \mathbf{A}^{(1,2,3)},
  • (1,2,4)-inverze, značíme \mathbf{A}^{(1,2,4)},
  • (1,2,3,4)-inverze, značíme \mathbf{A}^{(1,2,3,4)}\equiv\mathbf{A}^+.

Uvažujeme-li shora uvedený singulární rozklad matice \mathbf{A}, pak platí

\mathbf{A}^{(1)}=[\mathbf{V}_r|\mathbf{V}_0]\left[\begin{array}{c|c}\mathbf{\Sigma}_r^{-1}&\mathbf{K}\\\hline\mathbf{L}&\mathbf{M}\end{array}\right][\mathbf{U}_r|\mathbf{U}_0]^T,

pro libovolné matice \mathbf{K}\in\mathbb{R}^{r\times(m-r)}, \mathbf{L}\in\mathbb{R}^{(n-r)\times  r}, \mathbf{M}\in\mathbb{R}^{(n-r)\times(m-r)}.

(1,2)-inverze je taková (1)-inverze, pro kterou platí \mathbf{M}=\mathbf{L}\mathbf{\Sigma}\mathbf{K}.

\mathbf{A}^{(1,2)}=[\mathbf{V}_r|\mathbf{V}_0]\left[\begin{array}{c|c}\mathbf{\Sigma}_r^{-1}&\mathbf{K}\\\hline\mathbf{L}&\mathbf{L}\mathbf{\Sigma}\mathbf{K}\end{array}\right][\mathbf{U}_r|\mathbf{U}_0]^T,

(1,2,3)-inverze je taková (1,2)-inverze, pro kterou \mathbf{K}=0, tedy

\mathbf{A}^{(1,2,3)}=[\mathbf{V}_r|\mathbf{V}_0]\left[\begin{array}{c|c}\mathbf{\Sigma}_r^{-1}&0\\\hline\mathbf{L}&0\end{array}\right][\mathbf{U}_r|\mathbf{U}_0]^T.

(1,2,4)-inverze je taková (1,2)-inverze, pro kterou \mathbf{L}=0, tedy

\mathbf{A}^{(1,2,3)}=[\mathbf{V}_r|\mathbf{V}_0]\left[\begin{array}{c|c}\mathbf{\Sigma}_r^{-1}&\mathbf{K}\\\hline0&0\end{array}\right][\mathbf{U}_r|\mathbf{U}_0]^T.

(1,2,3,4)-inverze je výše zmíněná Moore-Penroseova pseudoinverze.

V obecném případě je zřejmě (1,2,3,4)-inverze jediná zobecněná inverze z výše uvedených, která je dána jednoznačně.

Drazinova, grupová a spektrální zobecněná inverze[editovat | editovat zdroj]

Je-li navíc matice \mathbf{A}\in\mathbb{R}^{n\times n} čtvercová (singulární), lze zobecnit i další vztahy, které klasická inverze přirozeně splňuje, například

(1k) \mathbf{A}^k\mathbf{X}\mathbf{A} = \mathbf{A}^k,
(5)   \mathbf{A}\mathbf{X} = \mathbf{X}\mathbf{A},
(5k) \mathbf{A}^k\mathbf{X} = \mathbf{X}\mathbf{A}^k,
(6k) \mathbf{A}\mathbf{X}^k = \mathbf{X}^k\mathbf{A}.

Drazinova inverze[editovat | editovat zdroj]

Zobecněná inverzní matice, dle předchozí konvence (1k,2,5)-inverze, je tzv. Drazinova inverze. Podmínky (1k), (2) a (5) jsou ekvivalentní podmínkám

\mathbf{A}^{k+1}\mathbf{X}=\mathbf{A}^k,\quad \mathbf{A}\mathbf{X}=\mathbf{X}\mathbf{A},\quad \mathbf{A}\mathbf{X}^2=\mathbf{X}.

Grupová inverze[editovat | editovat zdroj]

Drazinova inverze pro k=1, tedy (1,2,5)-inverze, se nazývá grupová inverze a značí se \mathbf{A}^{\#}.

Spektrální inverze[editovat | editovat zdroj]

Je-li čtvercová singulární matice \mathbf{A} diagonalizovatelná, tj. \mathbf{A}=\mathbf{P}\mathbf{\Lambda}\mathbf{P}^{-1}, kde \mathbf{\Lambda}=\mathrm{diag}(\lambda_1,\ldots,\lambda_r,0,\ldots,0) je diagonální s vlastními čísly na diagonále. Zobecněnou inverzi můžeme definovat pomocí vztahu

\mathbf{X}=\mathbf{P}\mathbf{\Lambda}^+\mathbf{P}^{-1}, \qquad \text{kde}\qquad \mathbf{\Lambda}^+=\mathrm{diag}\left(\frac{1}{\lambda_1},\ldots\frac{1}{\lambda_r},0,\ldots,0\right).

Tato inverze zřejmě splňuje podmínky (1), (2), (5), je tedy grupovou inverzí, a nazývá se spektrální inverze.

Je-li navíc matice \mathbf{A} normální, tj. \mathbf{A}^T\mathbf{A}=\mathbf{A}\mathbf{A}^T, \mathbf{P}^{-1}=\mathbf{P}^T pak její spektrální inverze a Moore-Penroseova pseudoinverze splývají.

Související články[editovat | editovat zdroj]

Externí odkazy[editovat | editovat zdroj]

Moore-Penrose Inverse

Literatura[editovat | editovat zdroj]

  • Adi Ben-Israel, Thomas N. E. Greville, Generalized inverses, Theory and a applications, Springer Verlag, Berlin, 2003 (Second Edition).
  • M. Zuhair Nashed (Ed.), Generalized inverses and applications, Academic Press, New York, 1976.