Úplná prostorová náhodnost

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Úplná prostorová náhodnost (anglicky Complete spatial randomness - CSR) popisuje bodový proces, při kterém se bodové události vyskytují v rámci dané sledované oblasti zcela náhodně. CSR je synonymem pro homogenní Poissonův prostorový proces.[1] Takový proces je často modelován pouze jednou proměnnou, tj. hustotou bodů \rho ve vymezené oblasti. Termín úplná prostorová náhodnost je běžně používán v aplikované statistice v rámci zkoumání určitých bodových modelů, zatímco ve většině ostatních statistických kontextech odkazuje na koncept Poissonova prostorového procesu.[1]

Model[editovat | editovat zdroj]

Data v podobě sady bodů, nepravidelně rozmístěných v dané oblasti, se vyskytují v mnoha různých kontextech; například jako umístění stromů v lese, ptačích hnízd, jader v tkáni nebo poloha nemocných lidí. Jakýkoliv takový souboru dat nazýváme prostorový bodový model a odkazujeme jím na umístění jako na události, k odlišení od jakýchkoli jiných bodů příslušné oblasti. Hypotéza úplné prostorové náhodnosti prostorového bodového modelu tvrdí, že počet událostí jakékoli oblasti je dán Poissonovým rozdělením o daném průměru při jednotném rozdělení. Události modelu jsou nezávisle a rovnoměrně rozložené v prostoru. Jinými slovy, pro jednotlivé události je stejně pravděpodobné, že se vyskytnou kdekoli a bez vzájemných interakcí.

"Rovnoměrný" se používá ve smyslu stejnoměrného rozdělení pravděpodobnosti v celé studované oblasti, nikoli ve smyslu "rovnoměrného" rozptýlení ve sledované oblasti.[2] Mezi událostmi nedochází k žádným interakcím, jelikož intenzita událostí v rovině se nemění. Předpoklad nezávislosti by byl porušen například v případě, že by existence jedné události buď podnítila, nebo potlačila výskyt jiných událostí v okolí.

Rozdělení[editovat | editovat zdroj]

Pravděpodobnost nalezení právě k bodů v oblasti V s hustotou jevu \rho je tedy:

P(k,\rho,V) = \frac{(V\rho)^k e^{-(V\rho) }}{k!} . \,\!

Prvním momentem, kterým je průměrný počet bodů v této oblasti, je \rho V. Tato hodnota je intuitivní, tak jako Poissonův parametr.

Pravděpodobnost s jakou se v určité radiální vzdálenosti r nachází N-tý soused daného bodu, je:

P_N(r) = \frac{D}{(N-1)!}  {\lambda}^N r^{DN-1} e^{- \lambda r^D} ,

kde D je počet rozměrů, \lambda je intenzita daná vztahem \lambda = \frac{\rho \pi ^{\frac{D}{2}}}{\Gamma (\frac{D}{2} +1)} a \Gamma je gama funkce, která je faktoriální funkcí, jestliže je jeho argumentem integrál.

Předpokládanou hodnotu  P_N(r) je možné odvodit pomocí funkce gama, využívající statistické momenty. Prvním momentem je průměrná vzdálenost náhodně rozmístěných bodů v D rozměrech.

Aplikace[editovat | editovat zdroj]

Studie CSR je nezbytná pro porovnávání naměřených bodových dat z výzkumných zdrojů. Jako statistická testovací metoda, má testování CSR mnoho aplikací v oblasti společenských věd a v astronomických výzkumech.[3] CSR je standard, na kterému jsou často testovány datové soubory. Zde je zhruba popsán jeden z přístupů testování hypotézy CSR:[4]

  1. Použijte statistiky, které jsou funkcí vzdálenosti každé události od další nejbližší události.
  2. Nejdříve se zaměřte na konkrétní událost a zformulujte metodu testování, zda jsou si událost a další nejbližší událost významně blízké (nebo vzdálené).
  3. Poté vezměte v úvahu všechny události a zformulujte metodu testování, zda je průměrná vzdálenost každé události od další nejbližší události významně krátká (nebo dlouhá).

V případech, kdy je výpočet statistik analyticky obtížný, jsou numerické metody, jako je metoda Monte Carlo, použity k simulaci náhodného procesu s velkým počtem opakování.[4]

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Complete spatial randomness na anglické Wikipedii.

  1. a b O. Maimon, L. Rokach, Data Mining and Knowledge Discovery Handbook , Second Edition, Springer 2010, pages 851-852
  2. L. A. Waller, C. A. Gotway, Applied Spatial Statistics for Public Health Data, volume 1 Wiley Chichester, 2004, pages 119–121, 123–127, 137, 139–141, 146–148, 150–151, 157, 203.
  3. Statistics on Venus: Craters and Catastrophes [online]. . Dostupné online. (anglicky) 
  4. a b A. Okabe, K. Sugihara, "Spatial Analysis along Networks- Statistical and Computational Methods", volume 1 Wiley Chichester, 2012, pages 135-136

Literatura[editovat | editovat zdroj]

  • Diggle, P. J.(2003). Statistical Analysis of Spatial Point Patterns, 2nd, New York:Academic Press. ISBN 0340740701. 

Externí odkazy[editovat | editovat zdroj]