Analýza cytometrických dat

Analýza cytometrických dat (dnes již výhradně digitálních) je zpracování více parametrů (dimenzí) na úrovni jednotlivých buněk získaných průtokovou cytometrií. Cytometrické techniky rozdělujeme podle použité technologie detekce na hmotnostní, fluorescenční a spektrální. Z rozboru naměřených hodnot fyzikálních vlastností lze vyvozovat biologické vlastnosti buněk v suspenzi. Na základě konkrétních parametrů je možné určit např. počet a homogenitu obsahu, případně velikost buněk, množství DNA, nebo identifikovat jednotlivé populace buněk v heterogenním vzorku. U fluorescenčních technik patří mezi měřené parametry boční rozptyl světla (SSC, "side scatter"), přímý rozptyl (FSC, "forward scatter"), intenzita fluorescence (to vše ve třech hodnotách po zpracování pulzu signálu každé buňky - výška, šířka a plocha pulzu) a čas. Fluorescence buněk je zprostředkovaná vazbou různých fluoroforů. Fluorofor je často navázán na protilátku, kterou jsou označené konkrétní molekuly uvnitř nebo na povrchu buňky. Nejběžnějším příkladem analyzovaných dat je aplikace cytometrie v hematologii – analýza heterogenního vzorku zlyzované krve (bez erytrocytů). Podle SSC a FSC se dají leukocyty rozdělit na populaci lymfocytů, monocytů a granulocytů. Pro bližší stanovení subpopulací s určitými znaky se používá značení protilátkami. Moderní cytometry dnes mohou měřit desítky dimenzí na velkém počtu buněk.

Pojem analýzy dat zahrnuje veškeré nakládání s daty po vlastním změření vzorku. Tedy například transformaci, normalizaci, škálování, eliminaci šumu z mrtvých buněk nebo jejich částí ("debris"), nebo naopak z agregátů buněk, vlastní označení populací ("gating"), ale také jejich statistické vyhodnocení.

Ohraničení populace ("gating")

Vizualizace a úprava dat pro jejich interpretaci probíhá v prostředí počítačového softwaru. Pro zobrazení cytometrických dat existuje několik možností: jednodimenzionální histogram, dvoudimenzionální dotplot, nebo 3D zobrazení tří dimenzí najednou. Na každém z těchto zobrazení lze uměle označit určitý prostor, respektive populaci buněk. Takovéto označení populace buněk se anglicky nazývá "gating". Tyto podmnožiny jsou charakteristické intenzitou signálu zobrazeného na příslušné ose. Zobrazení na osách je pro SSC a FSC většinou lineární, pro intenzitu fluorescence logaritmické nebo biexponenciální. Tvary ohraničení ("gate") jsou různé: polygon, elipsa, obdélník, nebo rozdělení vzorku do kvadrantů.^[1]

Ohraničení populací je subjektivní, protože podléhá individuálnímu úsudku. Pro kontrolu analýzy slouží postup zvaný „backgating“^[2], kdy je poslední označená subpopulace promítnuta do předešlých zobrazení dimenzí a ohraničení. Touto metodou lze rozpoznat chybně ohraničenou populaci buněk.

Kompenzace

Během analýzy multiparametrických dat je nutná tzv. kompenzace fluorescence. Při značení buněk několika fluorofory dochází ke spektrálnímu překryvu emisních spekter. Vyzářené fotony jsou detekovány filtrem pro určitou vlnovou délku, ale menší část emisního spektra zasahuje s nižší intenzitou i do jiných vlnových délek, tedy jiných detektorů. Za kompenzaci se označuje matematická oprava tohoto spektrálního překryvu na základě jednofluoroforových kontrolních vzorků. Správná kontrola kompenzace pomocí FMO kontrol ("fluorescence minus one") je klíčová pro následné přesné ohraničení a interpretaci dat.^[3]

Softwarové nástroje

Pro klasickou analýzu ručním ohraničením populace existuje mnoho softwaru. Příkladem volně dostupného základního softwaru je FCSalyzer^[4], mezi hodně používané komerční SW patří např. FlowJo^[5] a Kaluza^[6]. Tato manuální analýza má ovšem značné nevýhody. Populace jsou označeny na základě subjektivního rozhodnutí, což vede k omezené reprodukovatelnosti. Dalším problémem je analýza vzácných populací. Tyto potíže jsou zřejmé především při analýze multiparametrických dat.^[7]

V posledních letech došlo k vývoji softwaru pro automatickou analýzu, většinou volně dostupného. Nesupervizované automatické metody tvoří pomocí shlukové analýzy tzv. klastry, tedy populace buněk o stejných hodnotách v měřených dimenzích. Při porovnání několika automatických softwarů^[7] se jako nejlepší ukázaly FlowSOM^[8], X-shift^[9], Rclusterpp^[10]. Dále můžeme buňky uspořádat do trajektorií nebo redukovat celkovou dimenzionalitu do pouhých dvou. Výhodou nesupervizované analýzy je reprodukovatelnost, schopnost rozpoznání vzácných populací a rychlost analýzy velkých dat.

Reference

↑ SHAPIRO, Howard M. Practical flow cytometry. Hoboken, New Jersey: John Wiley & Sons, 2003. ISBN 978-0-471-41125-3. S. 27–43.
↑ LOKEN, M. R. Establishing optimal lymphocyte gates for immunophenotyping by flow cytometry. Cytometry. 1990, roč. 11, čís. 4, s. 453–459. ISSN 0196-4763. DOI 10.1002/cyto.990110402.
↑ ROEDERER, Mario. Spectral compensation for flow cytometry: Visualization artifacts, limitations, and caveats. Cytometry. 2001, roč. 45, čís. 3, s. 194–205. ISSN 1097-0320. DOI 10.1002/1097-0320(20011101)45:3<194::AID-CYTO1163>3.0.CO;2-C.
↑ https://sourceforge.net/projects/fcsalyzer/
↑ https://www.flowjo.com/
↑ https://www.beckman.com/flow-cytometry/software/kaluza
↑ ^a ^b WEBER, Lukas M.; ROBINSON, Mark. Comparison of clustering methods for high-dimensional single-cell flow and mass cytometry data. Cytometry Part A. 2016, roč. 89, čís. 12, s. 1084–1096. ISSN 1552-4930. DOI 10.1002/cyto.a.23030.
↑ VAN GASSEN, Sofie. FlowSOM: Using self-organizing maps for visualization and interpretation of cytometry data. Cytometry. Part A: The Journal of the International Society for Analytical Cytology. 2015, roč. 87, čís. 7, s. 636–645. ISSN 1552-4930. DOI 10.1002/cyto.a.22625.
↑ SAMUSIK, Nikolay. Automated mapping of phenotype space with single-cell data. Nature Methods. 2016, roč. 13, čís. 6, s. 493–496. ISSN 1548-7105. DOI 10.1038/nmeth.3863.
↑ Linderman M. Rclusterpp: Linkable C++ clustering. R package version 0.2.3.; 2013

[1] SHAPIRO, Howard M. Practical flow cytometry. Hoboken, New Jersey: John Wiley & Sons, 2003. ISBN 978-0-471-41125-3. S. 27–43.

[2] LOKEN, M. R. Establishing optimal lymphocyte gates for immunophenotyping by flow cytometry. Cytometry. 1990, roč. 11, čís. 4, s. 453–459. ISSN 0196-4763. DOI 10.1002/cyto.990110402.

[3] ROEDERER, Mario. Spectral compensation for flow cytometry: Visualization artifacts, limitations, and caveats. Cytometry. 2001, roč. 45, čís. 3, s. 194–205. ISSN 1097-0320. DOI 10.1002/1097-0320(20011101)45:3<194::AID-CYTO1163>3.0.CO;2-C.

[4] ttps://sourceforge.net/projects/fcsalyzer/

[5] ttps://www.flowjo.com/

[6] ttps://www.beckman.com/flow-cytometry/software/kaluza

[#1-7] WEBER, Lukas M.; ROBINSON, Mark. Comparison of clustering methods for high-dimensional single-cell flow and mass cytometry data. Cytometry Part A. 2016, roč. 89, čís. 12, s. 1084–1096. ISSN 1552-4930. DOI 10.1002/cyto.a.23030.

[8] VAN GASSEN, Sofie. FlowSOM: Using self-organizing maps for visualization and interpretation of cytometry data. Cytometry. Part A: The Journal of the International Society for Analytical Cytology. 2015, roč. 87, čís. 7, s. 636–645. ISSN 1552-4930. DOI 10.1002/cyto.a.22625.

[9] SAMUSIK, Nikolay. Automated mapping of phenotype space with single-cell data. Nature Methods. 2016, roč. 13, čís. 6, s. 493–496. ISSN 1548-7105. DOI 10.1038/nmeth.3863.

[10] Linderman M. Rclusterpp: Linkable C++ clustering. R package version 0.2.3.; 2013

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]