SIMAP

Z Wikipedie, otevřené encyklopedie

Similarity Matrix of Proteins nebo častěji SIMAP je BOINC projekt, který slouží k výzkumu funkcí proteinů. Aplikace simap hledá pomocí FASTA heuristiky (jejíž výsledky jsou zpřesněny pomocí Smith-Watermanova algoritmu[1][2]) podobnosti v primární struktuře proteinů, aplikace hmmer využívající skryté Markovovy modely (Hidden Markov Models) lokalizuje v proteinu jednotlivé domény.[3] Zdroje dat pro SIMAP@home představují veřejně přístupné vědecké databáze jako UniProt, RCSB PDB, GenBank nebo RefSeq shromažďující informace o struktuře a funkci dosud objevených proteinů. Pro odhad proteinových domén se využívá informací o známých doménách a sekvenčních vzorech z databáze InterPro.[4] Výsledky výpočtů se ukládají do veřejně přístupné vědecké databáze.

Význam projektu[editovat | editovat zdroj]

Studium proteinů je základem pro pochopení biologických procesů v živých organismech. Má uplatnění v medicíně a farmaceutickém průmyslu, molekulární biologii, biochemii, genetice, bioinženýrství, nanotechnologiích, atd.[5] Počet každoročně objevených proteinů velmi rychle roste, avšak jen u zlomku z nich je známo jejich působení v organismu.[6] Experimentální ověřování funkcí proteinů je zdlouhavé a velmi nákladné. Velké množství proteinů má však podobné funkce.[7] SIMAP@home vytváří databázi, v které jsou uloženy informace o vzájemné podobnosti známých i nově objevených proteinů. Tato databáze pak slouží jako základ k dalšímu výzkumu.

Proteiny[editovat | editovat zdroj]

Obecná charakteristika[editovat | editovat zdroj]

Proteiny (bílkoviny) jsou základní stavební jednotkou organismu. Jsou tvořeny řetězci aminokyselin (tj. molekul obsahující funkční skupiny -NH2 a -COOH) spojených navzájem peptidickou vazbou. V organismu plní důležité funkce[8], mimo jiné:

  • transportní (např. hemoglobin v červených krvinkách váže kyslík)
  • regulační (např. insulin - snižuje koncentraci glukózy v krvi)
  • strukturní (např. kolagen v pojivových tkáních),
  • katalytickou (např. enzym DNA polymeráza při replikaci DNA)
  • ochranné (různé protilátky)
  • skladovací (např. ferritin skladující železo)

Struktura proteinů[editovat | editovat zdroj]

[9][10]

Primární struktura[editovat | editovat zdroj]

proteinů je tvořena pořadím aminokyselin, které protein tvoří. Pořadí aminokyselin je zakódováno v DNA. SIMAP@home se snaží pomocí shody v pořadí aminokyselin (=sekvenční shoda) u proteinů najít tzv.homologní proteiny. Sekvence jsou homologní, jestliže jsou odvozeny od stejné původní sekvence. Například pokud se nějaká linie živočichů v průběhu evoluce rozdělí na dvě vývojové větve, bude každá vývojová větev zprvu obsahovat podobné geny kódující podobné proteiny s podobnou nebo stejnou funkcí.[11] Pokud je sekvenční shoda dvou proteinů vyšší než 45 %[12], lze předpokládat, že proteiny budou mít podobnou i prostorovou strukturu a funkci.

Sekundární struktura[editovat | editovat zdroj]

Sekundární struktura proteinů vzniká lokálním "sbalením" částí proteinů v důsledku vytváření vodíkových můstků mezi karbonylovými a imidovými skupinami v proteinu. Je určena typickým tvarem částí proteinů, nejčastěji:

Terciární struktura[editovat | editovat zdroj]

Terciární strukturu proteinů v SIMAP@home počítá aplikace hmmer. Rozlišují se supersekundární struktura a proteinové domény.

  • supersekundární struktura (sekvenční motivy) - prostorové uspořádání po sobě jdoucích elementů sekundární struktury. Např.: alfa-alfa motiv (dva protiběžné alfa helixy spojené smyčkou, která mění směr polypeptidového řetězce o 180 stupňů), beta-beta motiv (dvě protiběžná beta vlákna spojená smyčkou), beta-alfa-beta motiv (dvě rovnoběžná beta vlákna oddělená alfa helixem, který je vůči nim kolmý), atd.
  • proteinové domény (proteinové sbalení) - opakovaně se vyskytující kombinace supersekundární struktury. Domény tvoří navzájem propojené a více či méně strukturně a funkčně nezávislé části proteinu. Na rozdíl od kvartérní struktury je zatím vše v rámci jednoho aminokyselinového (polypeptidického) řetězce.

Kvartérní struktura[editovat | editovat zdroj]

vzniká když je protein tvořen dvěma nebo více polypeptidickými řetězci, které jsou spojeny nekovalentními vazbami. Příkladem může být hemoglobin, který je tvořen čtyřmi vlákny (viz obrázek - otevře se po kliknutí na odkaz u hemoglobinu).

Databáze SIMAP[editovat | editovat zdroj]

Databáze obsahovala v roce 2007 více než 17 milionů proteinů. Databáze SIMAP je aktualizována každý měsíc, a proto jsou nové jednotky pro SIMAP@home připraveny obvykle vždy k začátku nového měsíce. V současnosti má projekt dostatečnou počítačovou kapacitu, avšak potřeba výpočetního času (především pro aplikaci hmmer) se postupně stále zvyšuje.

Software[editovat | editovat zdroj]

Aplikace SIMAP@home běží pod systémy Windows, Macintosh a Linux.

Reference[editovat | editovat zdroj]

  1. Roland Arnold, Thomas Rattei, Patrick Tischler, Minh-Duc Truong, Volker Stümpflen and Werner Mewes: SIMAP—The similarity matrix of proteins, Bioinformatics 2005 21(Suppl 2):ii42-ii46; doi:10.1093/bioinformatics/bti1107
  2. C. Miccio, T. Ratter: Global statistical analysis of the protein homology network, arXiv:q-bio/0703053v1
  3. Similarity Matrix of Proteins: Frequently asked questions about the BOINCSIMAP project. boinc.bio.wzw.tum.de [online]. [cit. 2008-07-19]. Dostupné v archivu pořízeném dne 2008-06-19. 
  4. Thomas Rattei, Patrick Tischler, Roland Arnold, Franz Hamberger, Jörg Krebs, Jan Krumsiek, Benedikt Wachinger, Volker Stümpflen and Werner Mewes: SIMAP—structuring the network of protein similarities, Nucleic Acids Res., 36, D289–D292.
  5. NordProt: Importance of protein science. www.nordprot.org [online]. [cit. 2008-07-16]. Dostupné v archivu pořízeném dne 2009-04-21. 
  6. Antonín Pavelka: Funkční anotace proteinových segmentů, Masarykova Univerzita, bakalářská práce
  7. Similarity Matrix of Proteins: About SIMAP. boinc.bio.wzw.tum.de [online]. [cit. 2008-07-19]. Dostupné v archivu pořízeném dne 2008-07-19. 
  8. Bílkoviny=proteiny, ÚSTAV BIOCHEMIE A MIKROBIOLOGIE, Vysoká škola chemicko-technologická v Praze[nedostupný zdroj]
  9. RNDr. Tomáš Obšil, PhD.: Struktura proteinů a funkce enzymů, Katedra fyzikální a makromulekulární chemie, Přírodovědecká fakulta UK v Praze[nedostupný zdroj]
  10. Vladimír Kopecký Jr.: Úvod do struktury proteinů I, Fyzikální ústav Matematicko-fyzikální fakulty UK. biomolecules.mff.cuni.cz [online]. [cit. 2007-08-18]. Dostupné v archivu pořízeném dne 2007-08-18. 
  11. Similarity Matrix of Proteins: Glossary. webclu.bio.wzw.tum.de [online]. [cit. 2008-07-19]. Dostupné v archivu pořízeném z originálu dne 2008-06-02. 
  12. Bioinformatika a funkční studie, Fakulta vojenského zdravotnictví UO v Hradci Králové[nedostupný zdroj]