Autokorelace

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Autokorelace náhodných složek je jev, kterým v ekonometrii označujeme porušení Gauss-Markovova požadavku pro možnost odhadu regresních parametrů metodou nejmenších čtverců.

Matice kovariancí \Sigma, která má při splnění nekorelovanosti náhodných složek tvar: \Sigma = \sigma^2 * I_n, při autokorelaci vykazuje nenulové kovariance (tedy nediagonální prvky jsou nenulové). (Platí, že \sigma je nám neznámý rozptyl náhodných složek a I_n je jednotková matice řádu n.

Příčiny vzniku autokorelace[editovat | editovat zdroj]

  1. chybná specifikace modelu - tzv. kvaziautokorelace
  2. přílišná aproximace v modelu (např. místo x^2 použijeme x apod.
  3. použití časově zpožděných proměnných v modelu
  4. zahrnutí chyb měření do vektoru u
  5. použití upravených dat - např. extrapolovaných, centrovaných, interpolovaných apod.

Důsledky autokorelace[editovat | editovat zdroj]

  1. ztráta vydatnosti odhadu i asymptotické vydatnosti odhadu regresních parametrů
  2. \sigma^2 i standardní chyby s_{b_j} jsou vychýlené, R2 je nadhodnoceno, zatímco t-testy jsou slabé a rezidua jsou podhodnocená

Autokorelace prvního řádu[editovat | editovat zdroj]

Tzv. autoregresní struktura prvního řádu:

u_t = \rho * u_{t-1} + \epsilon_t

zároveň platí následující vztah:

E(u^T_t u_s) = \rho^{t-s} * \sigma^2

kde \rho je tzv. autokorelační koeficient prvního řádu. Platí pro něj \left| \rho \right| \leq 1, protože jinak by měla rovnice explozivní charakter a byla by tak narušena homoskedasticita v matici \Sigma. Nejsilnější korelace je vždy mezi dvěma sousedními vektory náhodných složek.

  • Pokud je \rho > 0, pak se jedná o pozitivní autokorelaci.
  • Pokud je \rho < 0, pak se jedná o negativní autokorelaci.
  • Pokud je \rho = 1, pak jsou složky vektorů u a u_t sériově nezávislé.

Testování výskytu autokorelace[editovat | editovat zdroj]

Protože neznáme přesnou podobu vektoru náhodných složek u, pracujeme s vektory reziduí e_i.

Durbin - Watsonova statistika[editovat | editovat zdroj]

Předpoklady použití testu[editovat | editovat zdroj]

  1. úrovňová konstanta v modelu
  2. regresory nejsou stochastické proměnné

Testovací statistika[editovat | editovat zdroj]

 d = \frac{\sum_{t=2}^T (e_t - e_{t-1})^2} {\sum_{t=1}^T e_t^2}

Pro výslednou charakteristiku nelze určit kritickou hodnotu, při které bychom odmítli hypotézu H0 při testování proti d-statistice. Postup vyhodnocení je následující:

  1. statistika d má střední hodnotu E(d) = 2 a nachází se v intervalu <0;4>
  2. stanovíme tabulkové hodnoty dD (dolní mez d) a dH (horní mez d) podle stupňů volnosti modelu
  3. porovnáme hodnotu d s následujícími intervaly a na základě pozice d vyhodnotíme autokorelaci:


  • Interval <0;dD> značí pozitivní autokorelaci
  • V intervalu <dD;dH> nemůžeme rozhodnout, zda se jedná o korelaci, či nikoliv
  • Interval <dH;2> poukazuje na statisticky nevýznamnou pozitivní autokorelaci
  • Interval <2;4-dH> poukazuje na statisticky nevýznamnou negativní autokorelaci
  • V intervalu <4-dH;4-dD> nemůžeme rozhodnout, zda se jedná o korelaci, či nikoliv
  • Interval <4-dD;4> poukazuje na statisticky významnou negativní autokorelaci

Watsonova statistika

Durbinovo h[editovat | editovat zdroj]

  • použijeme právě tehdy, pokud se v modelu nachází zpožděná vysvětlovaná proměnná

Statistika h má následující podobu:

h = (1 - 0,5*d) \sqrt{\frac{T} {1-T_{s^2_{b_j}}} }, kde j značí j-tou vysvětlující zpožděnou proměnnou za podmínky, že s^2_{b_j} < 0 .

Statistiku h testujeme přes normované normální rozdělení U (0;1), kdy pro

  • h < \left| U_{1-\alpha} \right| předpokládáme sériovou nezávislost náhodných složek
  • h \geq \left| U_{1-\alpha} \right| usuzujeme na autokorelaci

Postup v případě identifikování autokorelace náhodných složek[editovat | editovat zdroj]

  1. ověřit správnost modelu (jestli se nejedná o kvaziautokorelaci)
  2. logaritmování nebo semilogaritmování dat
  3. transformace dat v matici pozorování X pomocí matice T - tzv. Praisova-winstenova transformace

T = \frac{1} {\sqrt{1 - \rho^2}} * 
\begin{pmatrix}
\sqrt{1-\rho^2} & 0 & \dots & 0 & 0\\ -\rho & 1 & \dots & 0 & 0\\ 0 & -\rho & 1 & \dots & 0\\ \vdots & 0 & \ddots & \ddots & 0\\0 & 0 & \dots & -\rho & 1\\    
\end{pmatrix}

což vyústí v následující podobu modelu, který již bude poskytovat při použití metody zobecněných nejmenších čtverců vydatné i asymptoticky vydatné odhady regresních parametrů:

y_t - \rho y_{t-1} = \alpha(1-\rho)+\beta(X_t - \rho X_{t-1}) + e_t. \,

Reference[editovat | editovat zdroj]

  • [1] Cochrane a Orcutt. 1949. "Application of least squares regression to relationships containing autocorrelated error terms". Journal of the American Statistical Association 44, str. 32–61

Literatura[editovat | editovat zdroj]