Bioinformatika

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání
Informatika
Obory informatiky
Programování
Matematická informatika
Teoretická informatika
Teorie složitosti
Umělá inteligence
Teorie grafů
Teorie informace
Informační technologie
Bioinformatika
Chemoinformatika
Geoinformatika
Lékařská informatika
Neuroinformatika
Sociální informatika
Informatici
Charles Babbage
Alan Turing
Donald Knuth
další...
Dějiny informatiky

Bioinformatika je vědní disciplína, která se zabývá metodami pro shromážďování, analýzu a vizualizaci rozsáhlých souborů biologických dat, zejména dat molekulárně-biologických.

Předmětem zájmu a používanými metodami se bioinformatika prolíná s dalšími příbuznými obory, např. molekulární biologií, genomikou, proteomikou, genetikou, výpočetní biologií, matematickou biologií, systémovou biologií, teoretickou biologií, biomedicínskou informatikou, biomedicínským inženýrstvím, výpočetní chemií, informatikou a počítačovou lingvistikou.

Typická data[editovat | editovat zdroj]

Práce bioinformatika[editovat | editovat zdroj]

Mapa lidského chromozomu X (z webu NCBI). Bioinformatika přispěla značnou měrou k tomuto zmapování.
  • in silico, tj. práce či simulace na počítači, na rozdíl od práce na živých organismech v přirozených (in vivo) či laboratorních (in vitro) podmínkách
  • práce s velkými objemy dat
  • vyhledávání subsekvencí v datech
  • srovnávání podobných sekvencí, analýza sekvencí
  • snaha předpovídat strukturu a funkci proteinů
  • výsledky analýz zobrazovat graficky
  • dynamické modelování
  • užitečná pro biology, lékaře, právníky, policisty, konzumenty GMO

Oblasti bioinformatického výzkumu[editovat | editovat zdroj]

Anotace genomu[editovat | editovat zdroj]

Snaha o nacházení genů, míst interakce s proteiny a dalších významných oblastí v sekvenci DNA je nazývána anotací genomu. Zabývá se jí více vědních oborů, především molekulární biologie. Bioinformatika se snaží na základě vlastností laboratorně (např. sekvenováním mRNA) nalezených oblastí předpovědět pozice dalších oblastí výpočetními metodami. U prokaryot lze s úspěchem použít metody založené na znalostech vlastností promotorů a dalších hraničních oblastí genů, tzv. ab initio metody. U eukaryot je použití těchto metod náročnější, protože mají mnohem složitější strukturu genomu. Dalšími často volenými nástroji jsou pravděpodobnostní modely (např. Skryté Markovovy Modely (Hidden Markov models) či metody strojového učení (Vhodné jsou např. support vector machines).

Sekvenční analýzy[editovat | editovat zdroj]

Srovnání sekvencí různých proteinů

Základním úkonem, potřebným v mnoha bioinformatických aplikacích, je zarovnání sekvencí a analýza jejich podobnosti (sequence alignment), povětšinou se jedná o sekvence nukleových kyselin či aminokyselin v bílkovině. Několik sekvencí je třeba nejdříve přiložit k sobě tak, aby si prvky na jednotlivých pozicích co nejvíce odpovídaly a bylo tak možné vyhodnotit míru podobnosti. Základními algoritmy pro tento úkon jsou Smith-Waterman a Needleman-Wunsch. Při hledání a porovnávání dlouhých sekvencí na úrovni genomu je třeba využívat jisté heuristiky, protože základní algoritmy jsou příliš pomalé. Příkladem programu pro rychlé vyhledávání na dlouhých sekvencích s využitím heuristiky je BLAST.

Analýzy úrovně genové exprese[editovat | editovat zdroj]

Molekulární biologové laboratorními metodami měří úroveň exprese jistých genů, tedy jaké množství mRNA je z daného genu v daném období transkribováno. Často používanými metodami jsou reverzní transkripce do cDNA (metoda EST), microarray či SAGE (serial analysis of gene expression). Výsledky těchto analýz jsou rozsáhlé soubory dat s velkou úrovní šumu, bioinformatika data upravuje do použitelné podoby.

Analýzy genové regulace[editovat | editovat zdroj]

Reakce buňky na změny v prostředí jsou z velké části založeny na genové regulaci. Komplexním systémem informačních drah je informace o podnětu z vnějšího prostředí (např. hormon nebo podnět z chemoreceptoru) přenesena do jádra, kde ovlivní míru exprese jednotlivých genů. Buňka tak začne produkovat proteiny, potřebné v dané situaci. Bioinformatika zkoumá principy této regulace. Je například možné porovnat microarray data z buňky v běžném stavu a buňky vystavené vlivu léčiva a zjistit tak přesně, které geny byly léčivem ovlivněny. Analýza genové regulace je velmi důležitou součástí výzkumu rakoviny.

Předpověď struktury proteinů[editovat | editovat zdroj]

Struktura proteinu z velké části determinuje její funkci, proto je jeho znalost důležitá. Experimentální zjištění tohoto tvaru (např. pomocí rentgenové krystalografie) je však drahé, pomalé a ne vždy možné. Proto se bioinformatika snaží získat prostorové uspořádání proteinů jinak.

Primární strukturu proteinu (pořadí aminokyselin) lze jednoduše získat například sekvenací mRNA pro daný protein. Sekundární, terciární (popř. kvarterní) strukturu se bioinformatika a teoretická chemie snaží předpovědět na základě znalosti primární struktury. Používaných technik je mnoho, základní přístupy jsou tyto:

  • Využití fyzikálně-chemických vlastností jednotlivých aminokyselin či molekul - tzv. ab initio metody (například snaha určit celkovou energii, jakou molekula potřebuje pro zaujetí určitého tvaru a najít tvar s minimální potřebnou energií)
  • Využití biologických znalostí - například předpověď struktury proteinu na základě znalosti struktury proteinu z homologního genu či proteinu s podobnou funkcí
  • Využití experimentálně zjištěných tvarů proteinů - především metody strojového učení
  • Kombinace několika z těchto přístupů

Zatímco při předpovědi sekundární struktury bývá dosaženo poměrně dobrých výsledků, (Současné metody mají úspěšnost přes 70%) předpověď terciární struktury je náročnější a méně přesná.

Srovnávací genomika[editovat | editovat zdroj]

Srovnávací genomika se snaží porozumět vztahům genů či jiných částí genomu napříč organismy a lépe tak porozumět procesu evoluce, případně přispět k anotaci genomů na základě znalostí vztahů mezi nimi. Jelikož genomy jsou rozsáhlé a mají složitou strukturu, vyžaduje tvorba srovnávacích syntenických map hlubší analýzu a automatizaci výpočtů.

Vědecké časopisy[editovat | editovat zdroj]

  • Applied Bioinformatics
  • Bioinformatics
  • BMC Bioinformatics
  • Briefings in Bioinformatics
  • In Silico Biology
  • Journal of Bioinformatics, Biology and Computational Biology

Vědecké a zájmové společnosti[editovat | editovat zdroj]

  • ISCB(International Society for Computational Biology)
  • FOBIA (sekce ČSBMB)

Bioinformatika v České republice[editovat | editovat zdroj]

Bioinformatiku lze studovat na několika vysokých školách:

Paranormální jevy[editovat | editovat zdroj]

Pojem bioinformatika lze najít i literatuře zabývající se paranormálními jevy, kde je tímto termínem myšleno mimosmyslové vnímání.[8]

Literatura[editovat | editovat zdroj]

  • Fatima Cvrčková, Úvod do praktické bioinformatiky, Academia, ISBN 80-200-1360-1, 2006 (1. vydání)
  • Marketa Zvelebil, Jeremy Baum, Understanding Bioinformatics, Garland Science, ISBN 978-0-8153-4024-9, 2007 (1. vydání)
  • Dan E. Krane, Fundamental concepts of Bioinformatics, Benjamin Cummings, ISBN 0805346333
  • Jean-Michel Claverie, Bioinformatics for dummies, ISBN 0764516965

Reference[editovat | editovat zdroj]

  1. Studijní katalog FI MU Brno
  2. Studijní obor Bionformatika a chemoinformatika
  3. http://studuj.bioinformatiku.cz/
  4. Studijní obory Katedry Informatiky UPOL
  5. Studijní obor Bioinformatika a biocomputing na FIT VUT Brno
  6. Propagační web oboru Biomedicínská technika a bioinformatika na FEKT VUT Brno
  7. Biomedicína - Biomedicínské Inženýrství a Informatika na FEL ČVUT Praha
  8. Přehlížené přiznání na esoterické encyklopedii

Související články[editovat | editovat zdroj]