SIMAP

Z Wikipedie, otevřené encyklopedie

Skočit na: Navigace, Hledání

Similarity Matrix of Proteins nebo častěji SIMAP je BOINC projekt, který slouží k výzkumu funkcí proteinů. Aplikace simap hledá pomocí FASTA heuristiky (jejíž výsledky jsou zpřesňěny pomocí Smith-Watermanova algoritmu[1] [2]) podobnosti v primární struktuře proteinů, aplikace hmmer využívající skryté Markovovy modely (Hidden Markov Models) lokalizuje v proteinu jednotlivé domény.[3] Zdroje dat pro SIMAP@home představují veřejně přístupné vědecké databáze jako UniProt, RCSB PDB, GenBank nebo RefSeq shromažďující informace o struktuře a funkci dosud objevených proteinů. Pro odhad proteinových domén se využívá informací o známých doménách a sekvenčních vzorech z databáze InterPro.[4] Výsledky výpočtů se ukládají do veřejně přístupné vědecké databáze.

Obsah

[editovat] Význam projektu

Studium proteinů je základem pro pochopení biologických procesů v živých organismech. Má uplatnění v medicíně a farmaceutickém průmyslu, molekulární biologii, biochemii, genetice, bioinženýrství, nanotechnologiích, atd.[5] Počet každoročně objevených proteinů velmi rychle roste, avšak jen u zlomku z nich je známo jejich působení v organismu.[6] Experimentální ověřování funkcí proteinů je zdlouhavé a velmi nákladné. Velké množství proteinů má však podobné funkce.[7]SIMAP@home vytváří databázi, v které jsou uloženy informace o vzájemné podobnosti známých i nově objevených proteinů. Tato databáze pak slouží jako základ k dalšímu výzkumu.

[editovat] Proteiny

[editovat] Obecná charakteristika

Proteiny (bílkoviny) jsou základní stavební jednotkou organismu. Jsou tvořeny řetězci aminokyselin (tj. molekul obsahující funkční skupiny -NH2 a -COOH) spojených navzájem peptidickou vazbou. V organismu plní důležité funkce[8], mimo jiné:

  • transportní (např. hemoglobin v červených krvinkách váže kyslík)
  • regulační (např. insulin - snižuje koncentraci glukózy v krvi)
  • strukturní (např. kolagen v pojivových tkáních),
  • katalytickou (např. enzym DNA polymeráza při replikaci DNA)
  • ochranné (různé protilátky)
  • skladovací (např. ferritin sladující železo)

[editovat] Struktura proteinů

[9][10]

[editovat] Primární struktura

proteinů je tvořena pořadím aminokyselin, které protein tvoří. Pořadí aminokyselin je zakódováno v DNA. SIMAP@home se snaží pomocí shody v pořadí aminokyselin (=sekvenční shoda) u proteinů najít tzv.homologní proteiny. Sekvence jsou homologní, jestliže jsou odvozeny od stejné původní sekvence. Například pokud se nějaká linie živočichů v průběhu evoluce rozdělí na dvě vývojové větve, bude každá vývojová větev zprvu obsahovat podobné geny kódující podobné proteiny s podobnou nebo stejnou funkcí.[11]Pokud je sekvenční shoda dvou proteinů vyšší než 45%[12], lze předpokládat, že proteiny budou mít podobnou i prostorovou strukturu a funkci.

[editovat] Sekundární struktura

proteinů vzniká lokálním "sbalením" částí proteinů v důsledku vytváření vodíkových můstků mezi karbonylovými a imidovými skupinami v proteinu. Je určena typickým tvarem částí proteinů, nejčastěji:

  • α-helix, 310-helix nebo π-helix (vypadají jak šroubovice)
  • β-struktura neboli struktura skládaného listu (vypadá jak harmonika, zpřekládaný list papíru)
  • ohyby (vypadají jak šňůrka), které mění směr aminokyselinového řetězce

[editovat] Terciální struktura

Terciální strukturu proteinů v SIMAP@home počítá aplikace hmmer. Rozlišují se supersekundární struktura a proteinové domény.

  • supersekundární struktura (sekvenční motivy) - prostorové uspořádání po sobě jdoucích elementů sekundární struktury. Např.: alfa-alfa motiv (dva protiběžné alfa helixy spojené smyčkou, která mění směr polypeptidového řetězce o 180 stupňů), beta-beta motiv (dvě protiběžná beta vlákna spojená smyčkou), beta-alfa-beta motiv (dvě rovnoběžná beta vlákna oddělená alfa helixem, který je vůči nim kolmý), atd.
  • proteinové domény (proteinové sbalení) - opakovaně se vyskytující kombinace superseundární struktury. Domény tvoří navzájem propojené a více či méně strukturně a funkčně nezávislé části proteinu. Na rozdíl od kvartérní struktury je zatím vše v rámci jednoho aminokyselinového (polypeptidického) řetězce.

[editovat] Kvartérní struktura

vzniká když je protein tvořen dvěma nebo více polypeptidickými řetězci, které jsou spojeny nekovalentními vazbami. Příkladem může být hemoglobin, který je tvořen čtyřmi vlákny (viz obrázek - otevře se po kliknutí na odkaz u hemoglobinu).

[editovat] Databáze SIMAP

Databáze obsahovala v roce 2007 více než 17 milionů proteinů. Databáze SIMAP je aktualizována každý měsíc, a proto jsou nové jednotky pro SIMAP@home připraveny obvykle vždy k začátku nového měsíce. V současnosti má projekt dostatečnou počítačovou kapacitu, avšak potřeba výpočetního času (především pro aplikaci hmmer) se postupně stále zvyšuje.

[editovat] Systémové požadavky k SIMAP@home

  • pro Windows

Windows 98 a pozdější, Windows 2000 se Servis Packem 4

Pentium 233 MHz (Doporučený: Pentium 500 MHz nebo vyšíí)

64 MB RAM (Doporučeno: 128 MB RAM a víc)

20 MB místa na disku


  • pro Macintosh

Mac OS X 10.3 a pozdější

počítač Macintosh s procesorem Intel x86 nebo PowerPC G3, G4 nebo G5

128 MB RAM (Doporučeno: 256 MB RAM a víc)

200 MB místa na disku


  • pro Linux

Linux kernel 2.2.14 nebo vyšší; glibc 2.3.2 nebo vyšší; pro manažera BOINC a grafické aplikace doporučeno: XFree86-3.3.6 nebo vyšší či gtk+2.0 nebo vyšší

Pentium 500 MHz nebo vyšší

64 MB RAM

50 MB místa na disku

[editovat] Reference

  1. Roland Arnold, Thomas Rattei, Patrick Tischler, Minh-Duc Truong, Volker Stümpflen and Werner Mewes: SIMAP—The similarity matrix of proteins, Bioinformatics 2005 21(Suppl 2):ii42-ii46; doi:10.1093/bioinformatics/bti1107
  2. C. Miccio, T. Ratter: Global statistical analysis of the protein homology network, arXiv:q-bio/0703053v1
  3. Similarity Matrix of Proteins: Frequently asked questions about the BOINCSIMAP project
  4. Thomas Rattei, Patrick Tischler, Roland Arnold, Franz Hamberger, Jörg Krebs, Jan Krumsiek, Benedikt Wachinger, Volker Stümpflen and Werner Mewes: SIMAP—structuring the network of protein similarities, Nucleic Acids Res., 36, D289–D292.
  5. NordProt: Importance of protein science
  6. Antonín Pavelka: Funkční anotace proteinových segmentů, Masarykova Univerzita, bakalářská práce
  7. Similarity Matrix of Proteins: About SIMAP
  8. Bílkoviny=proteiny, ÚSTAV BIOCHEMIE A MIKROBIOLOGIE, Vysoká škola chemicko-technologická v Praze
  9. RNDr. Tomáš Obšil, PhD.: Struktura proteinů a funkce enzymů, Katedra fyzikální a makromulekulární chemie, Přírodovědecká fakulta UK v Praze
  10. Vladimír Kopecký Jr.: Úvod do struktury proteinů I, Fyziklní ústav Matematicko-fyzikální fakulty UK
  11. Similarity Matrix of Proteins: Glossary
  12. Bioinformatika a funkční studie, Fakulta vojenského zdravotnictví UO v Hradci Králové
V jiných jazycích