Přeskočit na obsah

Otevřená vědecká data

Z Wikipedie, otevřené encyklopedie
Kresba k otevřené vědě vyjadřující, že podoba vědy 21. století je postavena na otevřených datech, které je možné volně zpracovávat a rozvíjet nad nimi diskusi. Obrázek zároveň vyjadřuje, že otevřená data nejsou to samé co otevřený přístup (anglicky)

Otevřená vědecká data je koncept, který zahrnuje data pocházející z vědeckého výzkumu, tedy data dostupná pod otevřenou licencí. Koncept se začal vyvíjet po roce 2010, kdy grantové agentury začaly po žadatelích o granty požadovat zpracování plánů správy dat, které zahrnovalo i nutnost data sdílet pod svobodnými licencemi. Jednalo se tak o reakci na problémy, které se ve vědě vyvinuly v souvislosti s komercionalizací vědy. Mezi ně patří snížená možnost bádání pro chudší jednotlivce i instituce či problém s opakováním metod výzkumu vázaných na podezření z podvodů.[1] Předlohou pro koncept byly podobné snahy programátorů-uživatelů v 80. letech 20. století, kteří kvůli neustálému znepřístupňování softwarů a tvrdých licenčních podmínek nemohli opravit banální chyby. Americký programátor Richard Stallman tak koncem 80. let založil hnutí otevřeného softwaru a vydal první otevřenou licenci GNU General Public License, ze které se vyvinuly další otevřené koncepty.

V současnosti se tak například v Evropské unii připravují členské státy na začlenění směrnice o  otevřených datech do svých legislativních systémů a Evropská komise bude požadovat po vědcích čerpajících podporu z grantu Horizone Europe, aby svá data poskytovali volně pod svobodnou licencí a v rámci FAIR přístupu.

Vysvětlení pojmu

[editovat | editovat zdroj]
Kresba vědce hledajícího použitelná data v širokém poli odborných článků (anglicky)

Na datech je postaven vědecký výzkum, jehož úkolem je jejich sběr a analýza.[2] Po jejich analýze dochází k uložení lokálně u výzkumníka nebo do online depozitáře, a část může být publikována v rámci odborných článků ve vědeckých časopisech či studijních pracích. Velké množství vědeckých dat je po čase nenávratně ztraceno, některá jsou dostupná k dalšímu využití pod svobodnými licencemi.[3] Data jsou údaje využívané pro popis nějakého jevu; často jsou představované čísly a textem zapsaným do tabulek; dále jde o videa, fotografie, přepisy rozhovorů a další údaje sloužící k vědecké analýze.[4] Data mohou být jak digitální, tak fyzická. Přívlastek otevřená pak znamená, že jsou dostupná pod otevřenými licencemi. Principem otevřených licencí je odbourávat bariéry, které vznikají, pokud data nejsou otevřená. Otevřená data je tak často možné volně přebírat, dále zpracovávat, míchat s dalšími daty, kopírovat a archivovat. Jednotlivé licence stanoví, za jakých podmínek je možné data využívat. Tyto podmínky ale kladou uživateli o mnoho méně bariér než uzavřené licence.[5]

Za vznikem otevřených vědeckých dat stojí jak vznik svobodných licencí, tak hlavně vznik autorského práva, ke kterému došlo v 18. století po rozmachu knihtisku, který působil vydavatelům původních děl ztráty. Autorské právo tak bylo východiskem, jak zabránit volnému šíření děl bez přispění původním autorům. Stejně tak o dvě století později vyřešily svobodné licence v oblasti softwaru problém s přílišným uzavíráním autorským právem, kdy si vývojáři nemohli program ani opravit. Tento koncept otevřeného zdrojového kódu se pak přenesl jako řešení i do jiných oblastí včetně vědy.

Vznik autorského práva a omezení volného šíření

[editovat | editovat zdroj]
Logo autorského práva

Vznik autorského práva v moderním pojetí sahá do počátku 18. století. Konkrétně v roce 1710 vydal anglický parlament první autorskoprávní zákon známý jako Zákon královny Anny.[6] Předcházelo mu několik pokusů o omezení kopírování a volného tištění knih.[7] Podstata problému spočívala v rozšíření knihtisku v Evropě v 17. století.[8] Ten nejprve zlevnil prodejní cenu knih, protože rozmnoženiny šlo na rozdíl od opisů rukopisů vyrábět mnohem rychleji a levněji.[9] To vedlo ke zvýšené poptávce po knihách, ke kterým se takto dostalo více lidí. Podnikavci nakupovali knihtiskové stroje a vyráběli kopie, aniž by byli původními objednateli díla. To působilo finanční ztráty původním nakladatelům, kteří museli platit autorům knih.[9] Proto již v roce 1662 uzákonil anglický Parlament zákon, který omezil možnost vyžívání tiskařských lisů a zavedl povinnost žádat Cech papírníků o zřízení tiskárny a právo tisknout kopie. Nový licenční zákon byl uzákoněn na dva roky. Následně byla jeho platnost několikrát prodloužena, a tak platil až do roku 1692.[10][11] Po nátlaku Cechu papírníků anglický Parlament přišel v roce 1710 s Autorským zákonem.[6]

Po zavedení autorského zákona ve Velké Británii došlo k zavedení obdobných zákonů i v dalších zemích. Pro americký Copyright Act, který byl schválen v roce 1790, byl předlohou britský zákon.[12] V německých zemích došlo k zavedení autorského zákona ve 40. letech 19. století.[9] Aby byla chráněna práva britských autorů v zahraničí, byla v roce 1886 ustavena Bernská mezinárodní úmluva o autorských právech. Tato mezinárodní smlouva chránila všechny autory, kteří ji podepsali, a fungovala v zemích, které ji ratifikovaly.[12]

Zavedení autorského práva tak omezilo volné šíření děl a položilo základ moderní autorskoprávní ochraně.[12]

Příchod otevřeného přístupu

[editovat | editovat zdroj]
Maskot projektu GNU, odvážná GNU hlava

Otevřené licence se zrodily v prostředí softwaru a zdrojových kódů. První programy, které vznikaly v průběhu 50. a 60. let 20. století, byly velmi jednoduché a jejich autory byli vysokoškolští pracovníci. Distribuovaly se jako volné dílo umožňující libovolné nakládání.[13] S příchodem prvních operačních systémů a kompilátorů však začala narůstat náročnost a komplexnost softwaru a tím se zvyšovaly náklady na jejich vývoj.[14] Některé firmy vyvíjecí software v 60. a 70. letech začaly užívat různé omezující licence a nechaly si za svůj software platit.[15] V průběhu 70. a na začátku 80. let přišla americká vláda s tím, že pokud je ve zdrojovém kódu autorský vnos, jedná se o literární dílo, které je chráněno autorským zákonem.[16] To vedlo k dalšímu rozšíření licencování softwaru a jeho zpoplatňování.[15] Firmy přestávaly nabízet volně čitelný zdrojový kód a přecházely na spustitelné soubory typu exe. To programátorům znemožnilo zdrojáky upravovat.[17]

V důsledku těchto omezení založil americký programátor Richard Stallman v roce 1983 projekt GNU následovaný v roce 1985 organizací Free Software Foundation.[13] Cílem těchto aktivit bylo umožnit lidem používat počítač, na kterém bude pouze otevřený software, v té době nazývaný bezplatný (anglicky free software nebo freeware).[17] Projekt GNU začal vyvíjet vlastní operační systém[18] a Free Software Foundation vydala v roce 1989 svobodnou licenci nazvanou GNU General Public License.[19] Ta v sobě kromě jiného zahrnovala i copyleft, který měl za následek, že i odvozeniny svobodných děl byly šířeny pod svobodnou licencí.[13] Cílem snah Richarda Stallmana nebylo pouze získat software zdarma, ale především mít svobodu tento software volně upravovat a vytvářet z něj odvozeniny. Programátoři-uživatelé v té době naráželi na problém, kdy si nemohli opravit banální chyby právě kvůli omezením firem spojeným s licencí.[20] Richard Stallman tak položil základy svobodného softwaru a svobodných licencí.[21]

GNU licence umožnily software spouštět, zkoumat a upravovat.[22] Fakt, že odvozená díla musí být šířena pod stejnou licencí, neznamená,[23] že by se dílo nemohlo prodávat.[24] U svobodných licencí má uživatel často jen dvě povinnosti. A sice uvést autora či autory a zachovat licenci (copyleft).[25]

K zavedení současného termínu Open source (volně přeloženo jako otevřený zdrojový kód) došlo až v roce 1998, kdy toto označení zvítězilo v hlasování na Freeware Summit, který uspořádal nakladatel Tim O'Reilly v kalifornském Palo Alto.[26][27] Nový termín navrhla skupina vývojářů, která chtěla upozornit na to, že hlavní předností otevřeného softwaru není fakt, že je zdarma.[28]

Od otevřeného softwaru k otevřeným vědeckým datům

[editovat | editovat zdroj]
Logo licencí Creative Commons

Stallman položil základy otevřených licencí i základy celé otevřené kultury. Skutečný rozvoj otevřených konceptů přišel až s dílem Richarda Stallmana,[29] byť bylo možné najít snahy o sdílení vědeckých dat již dříve. Záznamy dějů přírody nejsou autorským vnosem a neměly by být uzavřeny striktní licencí.[30] Důvody pro pronikání konceptů otevřenosti do nových sfér jsou především představovány schopností odstraňovat určité problémy, které mohou souviset se striktními licencemi.[31] Není tedy náhodou, že otevřená encyklopedie Wikipedie vznikla v roce 2001 ve Spojených státech amerických (USA), tedy v zemi, kde byl velmi drahý přístup ke vzdělávání a informacím. Naproti tomu, když Aliance pro otevřené vzdělávání definovala v roce 2015 své priority, uvedla, že prioritou otevřeného vzdělávání v České republice je možnost vzdělávat se a učit způsobem, který vyhovuje každému jednotlivému učiteli či žáku. Narážela tak na fakt, že český vzdělávací systém a přístup k odborným informacím netrpí vysokou cenou jako v USA, ale například striktně danou koncepcí výuky ve školách.[32]

Ve vědě se objevovaly myšlenky o otevřených datech zhruba od konce 70. let 20. století.[33][34][35] Skutečný rozvoj však přišel až se zaváděním otevřených přístupů, které byly postaveny na svobodných licencích Creative Commons a specializovaných licencích určených pro databáze, které se začaly objevovat kolem roku 2005. K vědcům se přidali i zástupci konceptu e-Governement, digitalizace státu, kteří požadovali, aby vše, co vzniká za veřejné peníze, bylo svobodné.[30]

Termín otevřená data tak obsahoval všechny možné druhy dat uložené v repozitářích a databázích, které byly dostupné pod svobodnými licencemi.[30] Zlomovým rokem pro oblast otevřených vědeckých dat se stal rok 2010, kdy americká Národní vědecká nadace oznámila, že bude po žadatelích o granty požadovat plán správy dat. V následujících letech se tento trend přenesl i do dalších států včetně zemí Evropské unie. Jednotlivé národní a nadnárodní grantové agentury začaly po příjemcích podpor vyžadovat otevírání vědeckých dat.[36]

Současnost

[editovat | editovat zdroj]

V českém prostředí nabyl pojem významu až kolem roku 2020 v souvislosti s přípravou evropského grantu Horizon Europe a se směrnicí 2019/1024. Povinnou součástí programu Horizon Europe, který byl spuštěn v průběhu roku 2021, totiž bude vypracovat plán správy dat a uvolnit data pod svobodnou licenci.[37] Předchozí grant Horizon 2020, který byl spuštěn v roce 2014, měl tento přístup jen jako volitelný. Evropská komise tak mohla připravit nová pravidla nutící příjemce evropských dotací otevírat svá vědecká data.[36] V případě směrnice 2019/1024 se nejedná pouze o vědecká data, ale obecně o všechna data. Tuto směrnici musí členské státy zapracovat do svého právního systému do roku 2022.[38] Dlouhodobým zájmem evropského společenství totiž je, aby vše, co vzniká z veřejných zdrojů, bylo veřejně přístupné.[36]

Sama Evropská unie ale termín otevřená vědecká data přímo neuvádí.[38][39] Dokumenty hovoří pouze o otevřených datech v oblasti vědy.[38] Nevyjasněné definice otevřených vědeckých dat zmiňuje i Vera Liptom ve své knize Open Scientific Data z roku 2020.[40]

  1. AINSWORTH, Rachael. Research Culture is Broken; Open Science can Fix It | Rachael Ainsworth | TEDxMacclesfield [online]. TEDx Talks, 2019-06-07 [cit. 2021-10-28]. Dostupné online. (anglicky) 
  2. Data Management Plan [online]. NewMedia Centre, 2020-11-24 [cit. 2021-10-28]. Dostupné online. (anglicky) 
  3. Basics of Research Data Management [online]. OpenAIRE_eu, 2018-10-17 [cit. 2021-10-28]. Dostupné online. (anglicky) 
  4. Data Management Plans in 3 minutes [online]. Moore Library, 2020-02-04 [cit. 2021-10-28]. Dostupné online. (anglicky) 
  5. MURRAY-RUST, Peter. Open Data in Science. Serials Review. 2013-12-06, roč. 34, čís. 1, s. 52–64. (anglicky) 
  6. a b PATTERSON, Lyman Ray. Copyright in Historical Perspective. 1. vyd. Nashville: Vanderbilt University Press, 1968. ISBN 0-585-22298-3. S. 136–137. (anglicky) 
  7. An Act for promoting the Revision of Statue Law by repealing certain Enactments which have ceased to be in force or become unnecessary. [s.l.]: [s.n.], 1863. 22 s. Dostupné online. (anglicky) 
  8. KOSTYLO, Joanna. 1. From gunpowder to print: the common origins of copyright and patent. Cambridge: Open Book Publishers (OBP collection). Dostupné online. ISBN 978-1-906924-20-1. S. 21–50. (anglicky) 
  9. a b c THADEUSZ, Frank. No Copyright Law: The Real Reason for Germany's Industrial Expansion?. Der Spiegel. 2010-08-18. Dostupné online [cit. 2021-10-19]. ISSN 2195-1349. (anglicky) 
  10. PATTERSON, Lyman Ray. Copyright and the "exclusive right" of authors. The Journal of Intellectual Property Law. 1993, roč. 1, čís. 1. Dostupné online. (anglicky) 
  11. ASTBURY, Raymond. The Renewal of the Licensing Act in 1693 and its Lapse in 1695. The Library. 1978-12-01, roč. 33, čís. 4. DOI 10.1093/library/s5-XXXIII.4.296. (anglicky) 
  12. a b c DAY O'CONNOR, Sandra. Copyright law from an American perspective. Irish Jurist. 2002, roč. 37, s. 16–22. Dostupné online. (angličtina) 
  13. a b c HIPPEL, Eric von; KROGH, Georg von. Open Source Software and the “Private-Collective” Innovation Model: Issues for Organization Science. Organization Science. 2003-04, roč. 14, čís. 2, s. 209–223. Dostupné online [cit. 2021-10-20]. ISSN 1047-7039. DOI 10.1287/orsc.14.2.209.14992. (anglicky) 
  14. FISHER, Franklin M. IBM and the U.S. data processing industry : an economic history. New York, N.Y., U.S.A.: Praeger xii, 532 pages s. Dostupné online. ISBN 0-275-90979-4, ISBN 978-0-275-90979-6. OCLC 9324977 S. 176. 
  15. a b WEBER, Steve. The success of open source. Cambridge, MA: Harvard University Press viii, 312 pages s. Dostupné online. ISBN 0-674-01292-5, ISBN 978-0-674-01292-9. OCLC 53287658 
  16. Rob Landley's blog thing for 2009.. landley.net [online]. [cit. 2021-10-20]. Dostupné online. 
  17. a b BRASSEUR, Vicky. Forge your future with open source : build your skills, build your network, build the future of technology. [s.l.]: [Place of publication not identified] : The Pragmatic Bookshelf 232 s. Dostupné online. ISBN 978-1-68050-301-2. 
  18. new UNIX implementation. groups.google.com [online]. [cit. 2021-10-20]. Dostupné online. 
  19. GNU General Public License [online]. Boston: Free Software Foundation, 1989-02-01 [cit. 2021-10-28]. Dostupné online. (angličtina) 
  20. STALLMAN, Richard. Free Software: Freedom and Cooperation [online]. New York: 2001-05-29 [cit. 2021-10-28]. Dostupné online. (angličtina) 
  21. Open Source Initiative OSI - OSI History:Documents. web.archive.org [online]. 2002-10-01 [cit. 2021-10-20]. Dostupné v archivu pořízeném z originálu dne 2002-10-01. 
  22. Top Open Source Licenses | Black Duck Software. web.archive.org [online]. 2016-07-19 [cit. 2021-10-20]. Dostupné v archivu pořízeném z originálu dne 2016-07-19. 
  23. DE LAAT, Paul B. Copyright or copyleft?. Research Policy. 2005-12, roč. 34, čís. 10, s. 1511–1532. Dostupné online [cit. 2021-10-20]. DOI 10.1016/j.respol.2005.07.003. (anglicky) 
  24. Často kladené otázky o GNU GPL v2.0 - Projekt GNU - Free Software Foundation. www.gnu.org [online]. [cit. 2021-10-20]. Dostupné v archivu pořízeném dne 2021-10-21. 
  25. GNU General Public License [online]. Free Software Foundation, 2007-06-29 [cit. 2021-10-28]. Dostupné online. (anglicky) 
  26. FREEWARE LEADERS MEET IN FIRST-EVER SUMMIT O'Reilly Brings Together Creators of Perl, Apache,Linux and Netscape's Mozilla. www.oreilly.com [online]. [cit. 2021-10-20]. Dostupné online. (anglicky) 
  27. Open Source Summit LG #28. linuxgazette.net [online]. [cit. 2021-10-19]. Dostupné online. 
  28. INC, InfoWorld Media Group. InfoWorld. [s.l.]: InfoWorld Media Group, Inc. 96 s. Dostupné online. (anglicky) Google-Books-ID: yy8EAAAAMBAJ. 
  29. ADAMSON, Greg. Richard Stallman and the free software movement. Green Left [online]. 2016-09-06 [cit. 2021-10-22]. Dostupné online. (anglicky) 
  30. a b c MURRAY-RUST, Peter. Open Data in Science. Serials Review. 2008-03, roč. 34, čís. 1, s. 52–64. Dostupné online [cit. 2021-10-19]. ISSN 0098-7913. DOI 10.1080/00987913.2008.10765152. (anglicky) 
  31. Research Culture is Broken; Open Science can Fix It | Rachael Ainsworth | TEDxMacclesfield. [s.l.]: [s.n.] Dostupné online. 
  32. Charta Aliance pro otevřené vzdělávání [online]. EDUin, 2015 [cit. 2021-10-28]. Dostupné online. 
  33. Q109124537. www.wikidata.org [online]. [cit. 2021-10-23]. Dostupné online. (anglicky) 
  34. L, Stevens. The Open Data Center. Datamation. 1989-08-01, s. 55–56. QID: Q109124588. Dostupné online [cit. 2021-10-23]. (English) 
  35. P, Rubel; JL, Williems; C, Zywietz. Towards Open Data Interchange and Processing of Serial ECGS. www.wikidata.org. 1992-01-01, s. 79–82. QID: Q109124930. Dostupné online [cit. 2021-10-23]. 
  36. a b c LIPTON, Vera. Introduction: Opening Up Data in Scientific Research. [s.l.]: IntechOpen Dostupné online. ISBN 978-1-83880-985-0. (anglicky) DOI: 10.5772/intechopen.91719. 
  37. MÍŠEK, Jakub. Otevřená vědecká data, jejich právní úprava a výzvy. ITlib [online]. Centrum vedecko-technických informácií SR [cit. 2021-10-29]. Dostupné online. 
  38. a b c L_2019172CS.01005601.xml. eur-lex.europa.eu [online]. [cit. 2021-10-23]. Dostupné online. 
  39. Horizon 2020 projects working on the 2019 coronavirus disease (COVID-19), the severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2), and related topics: Guidelines for open access to publications, data and other research outputs [online]. Evropská Unie, 2020-04-24 [cit. 2021-10-29]. Dostupné online. (anglicky) 
  40. LIPTON, Vera J. Open Scientific Data - Why Choosing and Reusing the RIGHT DATA Matters. [s.l.]: [s.n.] Dostupné online. ISBN 978-1-83880-985-0. (anglicky) DOI: 10.5772/intechopen.87201. 

Externí odkazy

[editovat | editovat zdroj]
  • re3data.org – databázek repozitářů vědeckých dat