SIMAP
Z Wikipedie, otevřené encyklopedie
Tento článek potřebuje úpravy. Můžete Wikipedii pomoci tím, že ho vylepšíte. Jak by měly články vypadat, popisuje stránka Vzhled a styl, konkrétní problémy tohoto článku mohou být specifikovány na diskusní stránce.
Similarity Matrix of Proteins nebo častěji SIMAP je BOINC projekt, který slouží k výzkumu funkcí proteinů. Aplikace simap hledá pomocí FASTA heuristiky (jejíž výsledky jsou zpřesňěny pomocí Smith-Watermanova algoritmu[1] [2]) podobnosti v primární struktuře proteinů, aplikace hmmer využívající skryté Markovovy modely (Hidden Markov Models) lokalizuje v proteinu jednotlivé domény.[3] Zdroje dat pro SIMAP@home představují veřejně přístupné vědecké databáze jako UniProt, RCSB PDB, GenBank nebo RefSeq shromažďující informace o struktuře a funkci dosud objevených proteinů. Pro odhad proteinových domén se využívá informací o známých doménách a sekvenčních vzorech z databáze InterPro.[4] Výsledky výpočtů se ukládají do veřejně přístupné vědecké databáze.
Obsah |
[editovat] Význam projektu
Studium proteinů je základem pro pochopení biologických procesů v živých organismech. Má uplatnění v medicíně a farmaceutickém průmyslu, molekulární biologii, biochemii, genetice, bioinženýrství, nanotechnologiích, atd.[5] Počet každoročně objevených proteinů velmi rychle roste, avšak jen u zlomku z nich je známo jejich působení v organismu.[6] Experimentální ověřování funkcí proteinů je zdlouhavé a velmi nákladné. Velké množství proteinů má však podobné funkce.[7]SIMAP@home vytváří databázi, v které jsou uloženy informace o vzájemné podobnosti známých i nově objevených proteinů. Tato databáze pak slouží jako základ k dalšímu výzkumu.
[editovat] Proteiny
[editovat] Obecná charakteristika
Proteiny (bílkoviny) jsou základní stavební jednotkou organismu. Jsou tvořeny řetězci aminokyselin (tj. molekul obsahující funkční skupiny -NH2 a -COOH) spojených navzájem peptidickou vazbou. V organismu plní důležité funkce[8], mimo jiné:
- transportní (např. hemoglobin v červených krvinkách váže kyslík)
- regulační (např. insulin - snižuje koncentraci glukózy v krvi)
- strukturní (např. kolagen v pojivových tkáních),
- katalytickou (např. enzym DNA polymeráza při replikaci DNA)
- ochranné (různé protilátky)
- skladovací (např. ferritin sladující železo)
[editovat] Struktura proteinů
[editovat] Primární struktura
proteinů je tvořena pořadím aminokyselin, které protein tvoří. Pořadí aminokyselin je zakódováno v DNA. SIMAP@home se snaží pomocí shody v pořadí aminokyselin (=sekvenční shoda) u proteinů najít tzv.homologní proteiny. Sekvence jsou homologní, jestliže jsou odvozeny od stejné původní sekvence. Například pokud se nějaká linie živočichů v průběhu evoluce rozdělí na dvě vývojové větve, bude každá vývojová větev zprvu obsahovat podobné geny kódující podobné proteiny s podobnou nebo stejnou funkcí.[11]Pokud je sekvenční shoda dvou proteinů vyšší než 45%[12], lze předpokládat, že proteiny budou mít podobnou i prostorovou strukturu a funkci.
[editovat] Sekundární struktura
proteinů vzniká lokálním "sbalením" částí proteinů v důsledku vytváření vodíkových můstků mezi karbonylovými a imidovými skupinami v proteinu. Je určena typickým tvarem částí proteinů, nejčastěji:
- α-helix, 310-helix nebo π-helix (vypadají jak šroubovice)
- β-struktura neboli struktura skládaného listu (vypadá jak harmonika, zpřekládaný list papíru)
- ohyby (vypadají jak šňůrka), které mění směr aminokyselinového řetězce
[editovat] Terciální struktura
Terciální strukturu proteinů v SIMAP@home počítá aplikace hmmer. Rozlišují se supersekundární struktura a proteinové domény.
- supersekundární struktura (sekvenční motivy) - prostorové uspořádání po sobě jdoucích elementů sekundární struktury. Např.: alfa-alfa motiv (dva protiběžné alfa helixy spojené smyčkou, která mění směr polypeptidového řetězce o 180 stupňů), beta-beta motiv (dvě protiběžná beta vlákna spojená smyčkou), beta-alfa-beta motiv (dvě rovnoběžná beta vlákna oddělená alfa helixem, který je vůči nim kolmý), atd.
- proteinové domény (proteinové sbalení) - opakovaně se vyskytující kombinace superseundární struktury. Domény tvoří navzájem propojené a více či méně strukturně a funkčně nezávislé části proteinu. Na rozdíl od kvartérní struktury je zatím vše v rámci jednoho aminokyselinového (polypeptidického) řetězce.
[editovat] Kvartérní struktura
vzniká když je protein tvořen dvěma nebo více polypeptidickými řetězci, které jsou spojeny nekovalentními vazbami. Příkladem může být hemoglobin, který je tvořen čtyřmi vlákny (viz obrázek - otevře se po kliknutí na odkaz u hemoglobinu).
[editovat] Databáze SIMAP
Databáze obsahovala v roce 2007 více než 17 milionů proteinů. Databáze SIMAP je aktualizována každý měsíc, a proto jsou nové jednotky pro SIMAP@home připraveny obvykle vždy k začátku nového měsíce. V současnosti má projekt dostatečnou počítačovou kapacitu, avšak potřeba výpočetního času (především pro aplikaci hmmer) se postupně stále zvyšuje.
[editovat] Systémové požadavky k SIMAP@home
- pro Windows
Windows 98 a pozdější, Windows 2000 se Servis Packem 4
Pentium 233 MHz (Doporučený: Pentium 500 MHz nebo vyšíí)
64 MB RAM (Doporučeno: 128 MB RAM a víc)
20 MB místa na disku
- pro Macintosh
Mac OS X 10.3 a pozdější
počítač Macintosh s procesorem Intel x86 nebo PowerPC G3, G4 nebo G5
128 MB RAM (Doporučeno: 256 MB RAM a víc)
200 MB místa na disku
- pro Linux
Linux kernel 2.2.14 nebo vyšší; glibc 2.3.2 nebo vyšší; pro manažera BOINC a grafické aplikace doporučeno: XFree86-3.3.6 nebo vyšší či gtk+2.0 nebo vyšší
Pentium 500 MHz nebo vyšší
64 MB RAM
50 MB místa na disku
[editovat] Reference
- ↑ Roland Arnold, Thomas Rattei, Patrick Tischler, Minh-Duc Truong, Volker Stümpflen and Werner Mewes: SIMAP—The similarity matrix of proteins, Bioinformatics 2005 21(Suppl 2):ii42-ii46; doi:10.1093/bioinformatics/bti1107
- ↑ C. Miccio, T. Ratter: Global statistical analysis of the protein homology network, arXiv:q-bio/0703053v1
- ↑ Similarity Matrix of Proteins: Frequently asked questions about the BOINCSIMAP project
- ↑ Thomas Rattei, Patrick Tischler, Roland Arnold, Franz Hamberger, Jörg Krebs, Jan Krumsiek, Benedikt Wachinger, Volker Stümpflen and Werner Mewes: SIMAP—structuring the network of protein similarities, Nucleic Acids Res., 36, D289–D292.
- ↑ NordProt: Importance of protein science
- ↑ Antonín Pavelka: Funkční anotace proteinových segmentů, Masarykova Univerzita, bakalářská práce
- ↑ Similarity Matrix of Proteins: About SIMAP
- ↑ Bílkoviny=proteiny, ÚSTAV BIOCHEMIE A MIKROBIOLOGIE, Vysoká škola chemicko-technologická v Praze
- ↑ RNDr. Tomáš Obšil, PhD.: Struktura proteinů a funkce enzymů, Katedra fyzikální a makromulekulární chemie, Přírodovědecká fakulta UK v Praze
- ↑ Vladimír Kopecký Jr.: Úvod do struktury proteinů I, Fyziklní ústav Matematicko-fyzikální fakulty UK
- ↑ Similarity Matrix of Proteins: Glossary
- ↑ Bioinformatika a funkční studie, Fakulta vojenského zdravotnictví UO v Hradci Králové

