Český národní korpus

Z Wikipedie, otevřené encyklopedie
Jump to navigation Jump to search

Český národní korpus (ČNK) je soubor jazykových korpusů, různě vybraných a uspořádaných sbírek elektronicky zaznamenaných textů pro češtinu. Slouží jako datová základna pro vědecké studium psané i mluvené češtiny, pro tvorbu jazykových slovníků, počítačových překladačů a korektorů a podobně. ČNK buduje a spravuje Ústav Českého národního korpusu při Filozofické fakultě UK v Praze.[1] Ředitelem ústavu je Mgr. Michal Křen, Ph.D.

Software[editovat | editovat zdroj]

Jako korpusový manažer je užíván otevřený software NoSketch Engine, jehož autorem je docent Pavel Rychlý z Centra zpracování přirozeného jazyka na Fakultě informatiky Masarykovy univerzity.[2] Tento software dovoluje prohledávání a správu korpusů a skládá se ze dvou hlavních modulů – korpusového manažeru Manatee a jeho webového grafického rozhraní Bonito. ČNK ovšem místo Bonita využívá vlastní software KonText[3] (původně odvozený od Bonita).

Odkazy[editovat | editovat zdroj]

Reference[editovat | editovat zdroj]

  1. https://wiki.korpus.cz/doku.php/cnk:uvod#kdo_tvori_cesky_narodni_korpus
  2. RYCHLÝ, Pavel. Manatee/Bonito - A Modular Corpus Manager. 1st Workshop on Recent Advances in Slavonic Natural Language Processing (RASLAN 2007). 2007, roč. První, s. 65–70. Dostupné online. ISBN 978-80-210-4471-5. (anglicky) 
  3. ZÁCHOVÁ, Kristina. Korpusy a jejich využití ve výuce českého jazyka na ZŠ a SŠ. , 2015 [cit. 2018-06-28]. 75 s. bakalářská práce. Univerzita Palackého v Olomouci, Filozofická fakulta. Vedoucí práce PhDr. Petr Pořízka, Ph.D.. s. 20. Dostupné online.

Související články[editovat | editovat zdroj]

Externí odkazy[editovat | editovat zdroj]