Přeskočit na obsah

Biologická databáze: Porovnání verzí

Z Wikipedie, otevřené encyklopedie
Smazaný obsah Přidaný obsah
m Mormegil přesunul stránku Biologické databáze na Biologická databáze: singulár
úprava referencí; wikifikace; +Externí odkazy
Řádek 1: Řádek 1:
'''Biologické databáze''' jsou knihovny biologických dat získaných z vědeckých experimentů, publikované literatury, experimentálních technologií a počítačových analýz. Obsahují informace z různých vědeckých oblastí, zejména se jedná o [[Genomika|genomiku]], [[Proteomika|proteomiku]], [[Metabolomika|metabolomiku]], [[microarray]] a [[Fylogenetika|fylogenetiku]]. Biologické databáze obsahují informace o funkcích [[gen]]ů, struktuře, lokalizaci (buněčné i chromozomální), klinickém efektu mutací a podobnosti biologických sekvencí a struktur.
'''Biologické databáze''' jsou knihovny biologických dat získaných z vědeckých experimentů, publikované literatury, experimentálních technologií a počítačových analýz.<ref>{{Citace elektronického periodika
| příjmení1 = Attwood
| jméno1 = T.K.
| příjmení2 = Gisel
| jméno2 = A.
| příjmení3 = Eriksson
| jméno3 = N-E.
| příjmení4 = Bongcam-Rudloff
| jméno4 = E.
| odkaz_na_autora1 = Terri Attwood
| titul = Concepts, Historical Milestones and the Central Place of&nbsp;Bioinformatics in&nbsp;Modern Biology: A&nbsp;European Perspective
| periodikum = Bioinformatics - Trends and&nbsp;Methodologies
| vydavatel = InTech
| datum_vydání = 2011-11-02
| url = https://www.intechopen.com/books/bioinformatics-trends-and-methodologies/concepts-historical-milestones-and-the-central-place-of-bioinformatics-in-modern-biology-a-european-
| datum_přístupu = 2018-07-16
| jazyk = anglicky
| doi = 10.5772/23535
}}</ref> Obsahují informace z různých vědeckých oblastí, zejména se jedná o [[Genomika|genomiku]], [[Proteomika|proteomiku]], [[Metabolomika|metabolomiku]], [[DNA čip|microarray]] a&nbsp;[[Fylogenetika|fylogenetiku]].<ref>{{Citace elektronického periodika
| příjmení1 = Altman
| jméno1 = R. B.
| titul = Editorial: Building successful biological databases
| periodikum = Briefings in Bioinformatics
| ročník = 5
| číslo = 1
| datum_vydání = 2004-01-01
| strany = 4–5
| url = https://watermark.silverchair.com/4.pdf?token=AQECAHi208BE49Ooan9kkhW_Ercy7Dm3ZL_9Cf3qfKAc485ysgAAAZIwggGOBgkqhkiG9w0BBwagggF_MIIBewIBADCCAXQGCSqGSIb3DQEHATAeBglghkgBZQMEAS4wEQQMHylrr-N0uHlreTSsAgEQgIIBRR673z7sqMh6AONvhTpjKQszg-G3t3ArOaiHfiT40HsXHs9j5Q51PBMX0Pez4YTvfI7lKSPMZTDgLqmddN_I2qBWmXQfeiMxW9Pwqj2eP3ScrFNEq__ArqeiqH6vnQoWkOYz3XN-SVpwnmd02Znq8vNoBK78SKPEjQOdVKrgh_HUIzFH-iqkO6YOjv2uzt1q6fT1nSvmOQe2NCpPQyvytCioG4D0HcXPOPFkUeNAslpObnRttL6YD27HnKc-WU6umBP6AMPGTSuR5wpS_WKwpiP6yrydm55FrK-gmOT1jSvBVv0VWaoMVCn_uQgQLS7NJY4Hz1S8S9mGhNbMCCI9SBVs79EJYUols0LxbiL8wLs-k24reZ8k0XX7MjXyPGcA-qtCQTWsA9YnU6LrHxhVimgL29hZ7KtzC6S7mj05Ruo4xnce7_Q
| datum_přístupu = 2018-07-16
| jazyk = anglicky
| doi = 10.1093/bib/5.1.4
}}</ref> Biologické databáze obsahují informace o&nbsp;funkcích [[gen]]ů, struktuře, lokalizaci (buněčné i&nbsp;chromozomální), klinickém efektu mutací a podobnosti biologických sekvencí a struktur.
Biologické databáze představují pro vědce nepostradatelnou pomůcku při jejich vyhodnocování a plánování experimentů. Pomáhají jim k porozumění a vysvětlení velkého množství biologických jevů ze struktury [[Biomolekula|biomolekul]] a jejich interakcí, [[Metabolismus|metabolismu]] organismů a porozumění [[Evoluce|evoluci]] druhů. Tyto znalosti pomáhají v boji proti nemocem, ve vývoji léků a objevení základních vztahů mezi druhy v průběhu evoluce. Biologická data jsou skladována v různých všeobecných i specializovaných databázích.
Biologické databáze představují pro vědce nepostradatelnou pomůcku při jejich vyhodnocování a plánování experimentů. Pomáhají jim k porozumění a vysvětlení velkého množství biologických jevů ze struktury [[Biomolekula|biomolekul]] a jejich interakcí, [[Metabolismus|metabolismu]] organismů a porozumění [[Evoluce|evoluci]] druhů. Tyto znalosti pomáhají v boji proti nemocem, ve vývoji léků a objevení základních vztahů mezi druhy v průběhu evoluce. Biologická data jsou skladována v různých všeobecných i specializovaných databázích.


== Biologická data ==
== Biologická data ==
Biologická data jsou data nebo výsledky různých měření shromážděná z biologických zdrojů. Tato data jsou běžně uchovávána v digitální formě v celé řadě souborů nebo databází. Věda zabývající se hledáním a interpretací biologických dat se nazývá [[bioinformatika]]. Jako příklady biologických dat lze uvést:
Biologická data jsou data nebo výsledky různých měření shromážděná z biologických zdrojů. Tato data jsou běžně uchovávána v digitální formě v celé řadě souborů nebo databází. Věda zabývající se hledáním a interpretací biologických dat se nazývá [[bioinformatika]].<ref>{{Citace elektronického periodika
| příjmení1 = Bourne
| jméno1 = Philip
| titul = Will a Biological Database Be Different from a Biological Journal?
| periodikum = PLoS Computational Biology
| ročník = 1
| číslo = 3
| datum_vydání = 2005
| strany = e34
| url = https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1193993/
| datum_přístupu = 2018-07-16
| jazyk = anglicky
| doi = 10.1371/journal.pcbi.0010034
| pmid = 16158097
}}</ref> Jako příklady biologických dat lze uvést:
* Sekvence (DNA, RNA, proteiny)
* Sekvence (DNA, RNA, proteiny)
* Struktury biologických molekul
* Struktury biologických molekul
Řádek 16: Řádek 61:


== Využití biologických dat ve výzkumu ==
== Využití biologických dat ve výzkumu ==
Biologická data mohou být velmi různorodá. Týkají se prakticky všech vědeckých oborů, např. genetiky, strukturální biologie, microarrays, [[farmakologie]]. Každý z těchto oborů má svou vlastní terminologii, nomenklaturu, pravidla a také biologická data. Je důležité si uvědomit, že laboratorní experimenty v mnoha případech produkují podobná a blízce související, ale ne identická data. Typy dat se mohou lišit ve formátech, ve kterých jsou ukládána. Nejčastěji se biologická data uchovávají jako obrázky, kresby, grafické struktury, nestrukturalizovaný text, sekvence, 3D proteinové struktury apod.
Biologická data mohou být velmi různorodá. Týkají se prakticky všech vědeckých oborů, např. genetiky, strukturální biologie, microarrays, [[farmakologie]]. Každý z těchto oborů má svou vlastní terminologii, nomenklaturu, pravidla a také biologická data. Je důležité si uvědomit, že laboratorní experimenty v mnoha případech produkují podobná a blízce související, ale ne identická data. Typy dat se mohou lišit ve&nbsp;formátech, ve kterých jsou ukládána. Nejčastěji se biologická data uchovávají jako obrázky, kresby, grafické struktury, nestrukturalizovaný text, sekvence, 3D proteinové struktury apod.


== Nejčastější typy biologických dat ==
== Nejčastější typy biologických dat ==
* '''''Experimentální data''''' – data, která byla získána jako výsledky laboratorních experimentů, např. digitální obrázky, výsledky pozorování.
* '''''Experimentální data''''' – data, která byla získána jako výsledky laboratorních experimentů, např. digitální obrázky, výsledky pozorování.
* '''''Fylogenetická data''''' – data o evoluční příbuznosti mezi různými skupinami organismů. Informace jsou získávány prostřednictvím molekulárních sekvenčních dat (multiple sequence alignmenty) a morfologických dat.
* '''''Fylogenetická data''''' – data o evoluční příbuznosti mezi různými skupinami organismů. Informace jsou získávány prostřednictvím molekulárních sekvenčních dat (multiple sequence alignmenty) a&nbsp;morfologických dat.
* '''''Metabolická data''''' – data o metabolických drahách organismů (enzymatické reakce v živých organismech apod.).
* '''''Metabolická data''''' – data o metabolických drahách organismů (enzymatické reakce v živých organismech apod.).
* '''''Nezpracovaná data''''' – data, která nikdy nebyla předmětem manipulace nebo zpracování.
* '''''Nezpracovaná data''''' – data, která nikdy nebyla předmětem manipulace nebo zpracování.
* '''''Sekvence''''' – data z DNA sekvencí nebo proteinových sekvencí, multiple sequence alignmenty.
* '''''Sekvence''''' – data z DNA sekvencí nebo proteinových sekvencí, multiple sequence alignmenty.
* '''''Strukturní data''''' – 3D struktury proteinů, DNA, RNA nebo malých molekul.
* '''''Strukturní data''''' – 3D struktury proteinů, DNA, RNA nebo malých molekul.
* '''''EST (expressed sequence tag)''''' – jsou krátké DNA sekvence (okolo 300 – 1000 bp), které jsou odvozené z cDNA. Reprezentují geny exprimované ve tkáních ze kterých je odvozena cDNA knihovna (transkriptom). Tato data nám umožňují základní srovnávání mezi různými organismy, rozlišování genových rodin, poskytují informace o genech exprimovaných ve specifických tkáních, nebo v závislosti na odpovědi vůči vnějším vlivům, používají se k identifikaci genových transkriptů a pomáhají v objevování genů a determinaci sekvencí, atd.
* '''''EST (expressed sequence tag)''''' – jsou krátké DNA sekvence (okolo 300 – 1000 bp), které jsou odvozené z cDNA. Reprezentují geny exprimované ve&nbsp;tkáních, ze&nbsp;kterých je odvozena cDNA knihovna (transkriptom). Tato data nám umožňují základní srovnávání mezi různými organismy, rozlišování genových rodin, poskytují informace o&nbsp;genech exprimovaných ve specifických tkáních, nebo v&nbsp;závislosti na&nbsp;odpovědi vůči vnějším vlivům, používají se k identifikaci genových transkriptů a&nbsp;pomáhají v&nbsp;objevování genů a&nbsp;determinaci sekvencí, atd.
* '''''SNP (single nucleotide polymorphisms)''''' a jiné variace – jsou odchylky individuálních nukleotidů v sekvenci DNA. Jednonukleotidové polymorfismy jsou nejčastěji nalézanou genetickou změnou v lidské populaci. Každý SNP reprezentuje rozdíl v jednom stavebním bloku DNA. Většina SNP pravděpodobně nemá přímý vliv na lidské zdraví, ale mohou pozměnit účinek léků nebo odpověď organismu na vystavení zátěži chemickým či biologickým škodlivinám v životním prostředí. SNP navíc mohou být použity k vysledování zákonů, kterými se řídí dědičnost v rodinách s vysokým výskytem některých chorob, např.: diabetu, kardiovaskulárních, či nádorových onemocnění.
* '''''SNP (single nucleotide polymorphisms)''''' a jiné variace – jsou odchylky individuálních nukleotidů v sekvenci DNA. Jednonukleotidové polymorfismy jsou nejčastěji nalézanou genetickou změnou v lidské populaci. Každý SNP reprezentuje rozdíl v jednom stavebním bloku DNA. Většina SNP pravděpodobně nemá přímý vliv na lidské zdraví, ale mohou pozměnit účinek léků nebo odpověď organismu na&nbsp;vystavení zátěži chemickým či biologickým škodlivinám v životním prostředí. SNP navíc mohou být použity k vysledování zákonů, kterými se řídí dědičnost v rodinách s vysokým výskytem některých chorob, např.: diabetu, kardiovaskulárních, či nádorových onemocnění.


== Přístup do databází ==
== Přístup do databází ==
Většina biologických databází je přístupná přes webové stránky, biologická data jsou uspořádána tak, že uživatelé je mohou snadno prohlížet online a stahovat je v různých formátech. Biologická data jsou uchovávána v mnoha formátech (např. text, sekvenční data, proteinové struktury). Každý typ formátu je zpravidla nalézán v určitém typu databáze např.:
Většina biologických databází je přístupná přes webové stránky, biologická data jsou uspořádána tak, že uživatelé je mohou snadno prohlížet online a&nbsp;stahovat je v&nbsp;různých formátech. Biologická data jsou uchovávána v mnoha formátech (např. text, sekvenční data, proteinové struktury). Každý typ formátu je zpravidla nalézán v&nbsp;určitém typu databáze např.:
* Textové formáty jsou dostupné na PubMed a OMIM.
* Textové formáty jsou dostupné na PubMed a OMIM.
* Sekvenční data jsou dostupná na GenBank pro DNA a UniProt, Swiss – Prot pro proteiny.
* Sekvenční data jsou dostupná na GenBank pro DNA a UniProt, Swiss – Prot pro proteiny.
Řádek 36: Řádek 81:
== Příklady databází pro základní biologická data ==
== Příklady databází pro základní biologická data ==
'''''Databáze sekvencí DNA a proteinů''''':
'''''Databáze sekvencí DNA a proteinů''''':
* GenBank: http://www.ncbi.nlm.nih.gov/genbank/
* GenBank: https://www.ncbi.nlm.nih.gov/genbank/
* EMBL (Nucleotide Sequence database): http://www.ebi.ac.uk/embl/index.html
* EMBL (Nucleotide Sequence database): http://www.ebi.ac.uk/embl/index.html
* DDBJ (DNA Data Bank of Japan): http://www.ddbj.nig.ac.jp/
* DDBJ (DNA Data Bank of Japan): http://www.ddbj.nig.ac.jp/
Řádek 95: Řádek 140:


== Reference ==
== Reference ==
<references />
* Attwood T.K., Gisel A., Eriksson N-E. and Bongcam-Rudloff E. (2011). "Concepts, Historical Milestones and the Central Place of Bioinformatics in Modern Biology: A European Perspective". Bioinformatics - Trends and Methodologies. InTech. Retrieved 8 Jan 2012.

* Altman RB (2004). "Building successful biological databases". Brief. Bioinformatics 5 (1): 4–5. doi:10.1093/bib/5.1.4. PMID 15153301.
== Externí odkazy ==
* Bourne P. (2005). "Will a biological database be different from a biological journal?" PLoS Comput. Biol. 1 (3): 179 – 81. doi:10.1371/journal.pcbi.0010034. PMC 1193993. PMID 16158097.
* [https://www.oxfordjournals.org/nar/database/c/ interaktivní seznam biologických databází]
* BioInfoBank library: http://lib.bioinfo.pl/courses/view/160
* Jin Xiong, Essential Bioinformatics, Cambridge University Press, ISBN 978-0-521-84098-9, 2006 (1. vydání)
* Jean-Michel Claverie, Ferdic Notredame, Bioinformatics for Dummies, Wiley Publishing, Inc., ISBN 978-0-470-08985-9, 2007 (2. vydání)
* Wooley J. C:, Lin H. S. (eds.) (2005): National Research Council (US) Committee on Frontiers at the Interface of Computing and Biology. Catalyzing Inquiry at the Interface of Computing and Biology. Washington (DC): National Academies Press (US); http://www.ncbi.nlm.nih.gov/books/NBK25464/?report=printable


[[Kategorie:Biologické databáze| ]]
[[Kategorie:Biologické databáze| ]]

Verze z 16. 7. 2018, 10:56

Biologické databáze jsou knihovny biologických dat získaných z vědeckých experimentů, publikované literatury, experimentálních technologií a počítačových analýz.[1] Obsahují informace z různých vědeckých oblastí, zejména se jedná o genomiku, proteomiku, metabolomiku, microarrayfylogenetiku.[2] Biologické databáze obsahují informace o funkcích genů, struktuře, lokalizaci (buněčné i chromozomální), klinickém efektu mutací a podobnosti biologických sekvencí a struktur. Biologické databáze představují pro vědce nepostradatelnou pomůcku při jejich vyhodnocování a plánování experimentů. Pomáhají jim k porozumění a vysvětlení velkého množství biologických jevů ze struktury biomolekul a jejich interakcí, metabolismu organismů a porozumění evoluci druhů. Tyto znalosti pomáhají v boji proti nemocem, ve vývoji léků a objevení základních vztahů mezi druhy v průběhu evoluce. Biologická data jsou skladována v různých všeobecných i specializovaných databázích.

Biologická data

Biologická data jsou data nebo výsledky různých měření shromážděná z biologických zdrojů. Tato data jsou běžně uchovávána v digitální formě v celé řadě souborů nebo databází. Věda zabývající se hledáním a interpretací biologických dat se nazývá bioinformatika.[3] Jako příklady biologických dat lze uvést:

  • Sekvence (DNA, RNA, proteiny)
  • Struktury biologických molekul
  • Biochemické dráhy
  • Genové expresní profily
  • Mapování chromozomů
  • Genomická data
  • Bibliografická data
  • Fylogenetická data
  • EST (expressed sequence tag)
  • SNP (single nucleotide polymorphisms) a jiné variace

Využití biologických dat ve výzkumu

Biologická data mohou být velmi různorodá. Týkají se prakticky všech vědeckých oborů, např. genetiky, strukturální biologie, microarrays, farmakologie. Každý z těchto oborů má svou vlastní terminologii, nomenklaturu, pravidla a také biologická data. Je důležité si uvědomit, že laboratorní experimenty v mnoha případech produkují podobná a blízce související, ale ne identická data. Typy dat se mohou lišit ve formátech, ve kterých jsou ukládána. Nejčastěji se biologická data uchovávají jako obrázky, kresby, grafické struktury, nestrukturalizovaný text, sekvence, 3D proteinové struktury apod.

Nejčastější typy biologických dat

  • Experimentální data – data, která byla získána jako výsledky laboratorních experimentů, např. digitální obrázky, výsledky pozorování.
  • Fylogenetická data – data o evoluční příbuznosti mezi různými skupinami organismů. Informace jsou získávány prostřednictvím molekulárních sekvenčních dat (multiple sequence alignmenty) a morfologických dat.
  • Metabolická data – data o metabolických drahách organismů (enzymatické reakce v živých organismech apod.).
  • Nezpracovaná data – data, která nikdy nebyla předmětem manipulace nebo zpracování.
  • Sekvence – data z DNA sekvencí nebo proteinových sekvencí, multiple sequence alignmenty.
  • Strukturní data – 3D struktury proteinů, DNA, RNA nebo malých molekul.
  • EST (expressed sequence tag) – jsou krátké DNA sekvence (okolo 300 – 1000 bp), které jsou odvozené z cDNA. Reprezentují geny exprimované ve tkáních, ze kterých je odvozena cDNA knihovna (transkriptom). Tato data nám umožňují základní srovnávání mezi různými organismy, rozlišování genových rodin, poskytují informace o genech exprimovaných ve specifických tkáních, nebo v závislosti na odpovědi vůči vnějším vlivům, používají se k identifikaci genových transkriptů a pomáhají v objevování genů a determinaci sekvencí, atd.
  • SNP (single nucleotide polymorphisms) a jiné variace – jsou odchylky individuálních nukleotidů v sekvenci DNA. Jednonukleotidové polymorfismy jsou nejčastěji nalézanou genetickou změnou v lidské populaci. Každý SNP reprezentuje rozdíl v jednom stavebním bloku DNA. Většina SNP pravděpodobně nemá přímý vliv na lidské zdraví, ale mohou pozměnit účinek léků nebo odpověď organismu na vystavení zátěži chemickým či biologickým škodlivinám v životním prostředí. SNP navíc mohou být použity k vysledování zákonů, kterými se řídí dědičnost v rodinách s vysokým výskytem některých chorob, např.: diabetu, kardiovaskulárních, či nádorových onemocnění.

Přístup do databází

Většina biologických databází je přístupná přes webové stránky, biologická data jsou uspořádána tak, že uživatelé je mohou snadno prohlížet online a stahovat je v různých formátech. Biologická data jsou uchovávána v mnoha formátech (např. text, sekvenční data, proteinové struktury). Každý typ formátu je zpravidla nalézán v určitém typu databáze např.:

  • Textové formáty jsou dostupné na PubMed a OMIM.
  • Sekvenční data jsou dostupná na GenBank pro DNA a UniProt, Swiss – Prot pro proteiny.
  • Proteinové struktury jsou dostupné na PDB, SCOP a CATH.

Příklady databází pro základní biologická data

Databáze sekvencí DNA a proteinů:

Strukturní databáze:

Databáze zabývající se klasifikací proteinových rodin a proteinových domén:

Databáze SNP:

Databáze odborné literatury:

Databáze interakcí protein-protein, metabolické dráhy, proteinové dráhy:

Genetické databáze (mutace, geneticky podmíněné nemoci, genetické mapování):

Databáze datových center (zahrnující sekvence, struktury, funkce, literaturu atd.):

Genomové databáze (kompletní genomové sekvence a příbuzné informace pro specifické organismy):

Databáze expresních profilů (microarray a genová exprese cDNA):

Reference

  1. ATTWOOD, T.K.; GISEL, A.; ERIKSSON, N-E.; BONGCAM-RUDLOFF, E. Concepts, Historical Milestones and the Central Place of Bioinformatics in Modern Biology: A European Perspective. Bioinformatics - Trends and Methodologies [online]. InTech, 2011-11-02 [cit. 2018-07-16]. Dostupné online. DOI 10.5772/23535. (anglicky) 
  2. ALTMAN, R. B. Editorial: Building successful biological databases. S. 4–5. Briefings in Bioinformatics [online]. 2004-01-01 [cit. 2018-07-16]. Roč. 5, čís. 1, s. 4–5. Dostupné online. DOI 10.1093/bib/5.1.4. (anglicky) 
  3. BOURNE, Philip. Will a Biological Database Be Different from a Biological Journal?. S. e34. PLoS Computational Biology [online]. 2005 [cit. 2018-07-16]. Roč. 1, čís. 3, s. e34. Dostupné online. DOI 10.1371/journal.pcbi.0010034. PMID 16158097. (anglicky) 

Externí odkazy