Diskriminační analýza hlavních komponent

Z Wikipedie, otevřené encyklopedie
Skočit na navigaci Skočit na vyhledávání

Diskriminační analýza hlavních komponent (DAPC - z anglického Discriminant Analysis of Principal Components) je mnohorozměrná statistická analýza využívána pro určení počtu skupin či klastrů ve studované populaci[1]. Jedná se o statistickou metodu využívanou pro populace s částečným zastoupením geneticky příbuzných jedinců nebo přímo populace klonů. Jedinci v populaci jsou rozdělení do skupin na základě své genetické informace.

Metoda zohledňuje mezipopulační variabilitu stejně tak jako vnitropopulační variabilitu. Jako první krok jsou všechna data transformována pomocí analýzou hlavních komponent (PCA) a následně jsou data rozdělena do skupin/klastrů za pomocí diskriminační analýzy (DA). PCA zajistí, že data použitá diskriminační analýzou nejsou na počátku nijak korelovatelná a zárověň zajistí podmínku DA, že počet vstupních dat (genetických dat, např.: jednonukleotidových polymorfismusů - SNP ) musí být nižší než počet jedinců v populaci. Proto je tato metoda využívána ke zpracování velkých datasetů molekulárních dat z velmi početných populací. DAPC je alternartiva k jiným shlukovým analýzám dat jako je Bayesianské shlukování či K-means shlukování, s rozdílem, že výše uvedené metody nejsou použitelné pro populace geneticky příbuzných jedinců či dokonce populace klonů[2].

Jeden z výsledků DAPC může být obrazové uspořádání mezipopulačních genetických struktur a to i se zohledněním komplexních struktur jako je například hierarchické shlukování[1].

DAPC analýza je součástí balíčku adegent v programovacím jazyce R a je hojně využívána molekulárními biology.

Reference[editovat | editovat zdroj]

  1. a b JOMBART, Thibaut; DEVILLARD, Sébastien; BALLOUX, François. Discriminant analysis of principal components: a new method for the analysis of genetically structured populations. BMC Genetics. 2010-10-15, roč. 11, s. 94. Dostupné online [cit. 2018-02-12]. ISSN 1471-2156. DOI:10.1186/1471-2156-11-94. 
  2. Discriminant analysis of principal components (DAPC). grunwaldlab.github.io [online]. [cit. 2018-02-12]. Dostupné online.