Bioinformatika

Z Wikipedie, otevřené encyklopedie
Informatika

Bioinformatika je vědní disciplína, která se zabývá metodami pro shromažďování, analýzu a vizualizaci rozsáhlých souborů biologických dat, zejména dat molekulárně-biologických.

Předmětem zájmu a používanými metodami se bioinformatika prolíná s dalšími příbuznými obory, např. molekulární biologií, genomikou, proteomikou, genetikou, výpočetní biologií, matematickou biologií, systémovou biologií, teoretickou biologií, biomedicínskou informatikou, biomedicínským inženýrstvím, výpočetní chemií, informatikou a počítačovou lingvistikou.

Typická data

Práce bioinformatika

Mapa lidského chromozomu X (z webu NCBI). Bioinformatika přispěla značnou měrou k tomuto zmapování.
  • in silico, tj. práce či simulace na počítači, na rozdíl od práce na živých organismech v přirozených (in vivo) či laboratorních (in vitro) podmínkách
  • práce s velkými objemy dat
  • vyhledávání subsekvencí v datech
  • srovnávání podobných sekvencí, analýza sekvencí
  • snaha předpovídat strukturu a funkci proteinů
  • výsledky analýz zobrazovat graficky
  • dynamické modelování
  • užitečná pro biology, lékaře, právníky, policisty, konzumenty GMO

Dostupné bioinformatické nástroje a databáze jsou shromážděny v Tools and Data Services Registry[1] (bio.tools) evropské bioinformatické infrastruktury ELIXIR. České bioinformatické nástroje a databáze v bio.tools sdružuje konsorcium ELIXIR-CZ.

Oblasti bioinformatického výzkumu

Anotace genomu

Snaha o nacházení genů, míst interakce s proteiny a dalších významných oblastí v sekvenci DNA je nazývána anotací genomu. Zabývá se jí více vědních oborů, především molekulární biologie. Bioinformatika se snaží na základě vlastností laboratorně (např. sekvenováním mRNA) nalezených oblastí předpovědět pozice dalších oblastí výpočetními metodami. U prokaryot lze s úspěchem použít metody založené na znalostech vlastností promotorů a dalších hraničních oblastí genů, tzv. ab initio metody. U eukaryot je použití těchto metod náročnější, protože mají mnohem složitější strukturu genomu. Dalšími často volenými nástroji jsou pravděpodobnostní modely (např. Skryté Markovovy Modely (Hidden Markov modelss) či metody strojového učení (Vhodné jsou např. support vector machines).

Sekvenční analýzy

Srovnání sekvencí různých proteinů

Základním úkonem, potřebným v mnoha bioinformatických aplikacích, je zarovnání sekvencí a analýza jejich podobnosti (sequence alignment), povětšinou se jedná o sekvence nukleových kyselin či aminokyselin v bílkovině. Několik sekvencí je třeba nejdříve přiložit k sobě tak, aby si prvky na jednotlivých pozicích co nejvíce odpovídaly a bylo tak možné vyhodnotit míru podobnosti. Základními algoritmy pro tento úkon jsou Smith-Waterman a Needleman-Wunsch. Při hledání a porovnávání dlouhých sekvencí na úrovni genomu je třeba využívat jisté heuristiky, protože základní algoritmy jsou příliš pomalé. Příkladem programu pro rychlé vyhledávání na dlouhých sekvencích s využitím heuristiky je BLAST.

Analýzy úrovně genové exprese

Molekulární biologové laboratorními metodami měří úroveň exprese jistých genů, tedy jaké množství mRNA je z daného genu v daném období transkribováno. Často používanými metodami jsou reverzní transkripce do cDNA (metoda EST), microarray či SAGE (serial analysis of gene expression). Výsledky těchto analýz jsou rozsáhlé soubory dat s velkou úrovní šumu, bioinformatika data upravuje do použitelné podoby.

Analýzy genové regulace

Reakce buňky na změny v prostředí jsou z velké části založeny na genové regulaci. Komplexním systémem informačních drah je informace o podnětu z vnějšího prostředí (např. hormon nebo podnět z chemoreceptoru) přenesena do jádra, kde ovlivní míru exprese jednotlivých genů. Buňka tak začne produkovat proteiny, potřebné v dané situaci. Bioinformatika zkoumá principy této regulace. Je například možné porovnat microarray data z buňky v běžném stavu a buňky vystavené vlivu léčiva a zjistit tak přesně, které geny byly léčivem ovlivněny. Analýza genové regulace je velmi důležitou součástí výzkumu rakoviny.

Předpověď struktury proteinů

Struktura proteinu z velké části determinuje její funkci, proto je jeho znalost důležitá. Experimentální zjištění tohoto tvaru (např. pomocí rentgenové krystalografie) je však drahé, pomalé a ne vždy možné. Proto se bioinformatika snaží získat prostorové uspořádání proteinů jinak.

Primární strukturu proteinu (pořadí aminokyselin) lze jednoduše získat například sekvenací mRNA pro daný protein. Sekundární, terciární (popř. kvarterní) strukturu se bioinformatika a teoretická chemie snaží předpovědět na základě znalosti primární struktury. Používaných technik je mnoho, základní přístupy jsou tyto:

  • Využití fyzikálně-chemických vlastností jednotlivých aminokyselin či molekul - tzv. ab initio metody (například snaha určit celkovou energii, jakou molekula potřebuje pro zaujetí určitého tvaru a najít tvar s minimální potřebnou energií)
  • Využití biologických znalostí - například předpověď struktury proteinu na základě znalosti struktury proteinu z homologního genu či proteinu s podobnou funkcí
  • Využití experimentálně zjištěných tvarů proteinů - především metody strojového učení
  • Kombinace několika z těchto přístupů

Zatímco při předpovědi sekundární struktury bývá dosaženo poměrně dobrých výsledků, (Současné metody mají úspěšnost přes 70%) předpověď terciární struktury je náročnější a méně přesná.

Srovnávací genomika

Srovnávací genomika se snaží porozumět vztahům genů či jiných částí genomu napříč organismy a lépe tak porozumět procesu evoluce, případně přispět k anotaci genomů na základě znalostí vztahů mezi nimi. Jelikož genomy jsou rozsáhlé a mají složitou strukturu, vyžaduje tvorba srovnávacích syntenických map hlubší analýzu a automatizaci výpočtů.

Vědecké časopisy

  • Applied Bioinformatics
  • Bioinformatics
  • BMC Bioinformatics
  • Briefings in Bioinformatics
  • In Silico Biology
  • Nucleic Acids Research - hlavně pravidelná speciální čísla o bioinformatických nástrojích, či databázích
  • Journal of Bioinformatics, Biology and Computational Biology
  • PLoS Computational Biology

Vědecké a zájmové společnosti

  • ISCB(International Society for Computational Biology)
  • Národní bioinformatická infrastruktura ELIXIR-CZ (vzniklá z komunity kolem dřívější společnosti FOBIA, sekce ČSBMB)

Bioinformatika v České republice

Obor Bioinformatiky lze studovat na několika vysokých školách:

Paranormální jevy

Pojem bioinformatika lze najít i literatuře zabývající se paranormálními jevy, kde je tímto termínem myšleno mimosmyslové vnímání.[10]

Literatura

  • Fatima Cvrčková, Úvod do praktické bioinformatiky, Academia, ISBN 80-200-1360-1, 2006 (1. vydání)
  • Marketa Zvelebil, Jeremy Baum, Understanding Bioinformatics, Garland Science, ISBN 978-0-8153-4024-9, 2007 (1. vydání)
  • Dan E. Krane, Fundamental concepts of Bioinformatics, Benjamin Cummings, ISBN 0-8053-4633-3
  • Jean-Michel Claverie, Bioinformatics for dummies, ISBN 0-7645-1696-5

Reference

Související články

UniFrac