Selekční jazyk

Z Wikipedie, otevřené encyklopedie

Selekční jazyk je uměle vytvořený informační jazyk, který je určený k vyjádření obsahu a formy informačního zdroje nebo informačního dotazu. Česká terminologická databáze knihovnictví a informační vědy TDKIV definuje selekční jazyk (indexing language) jako „umělý informační jazyk používaný k vyjádření identifikačních nebo obsahových selekčních údajů za účelem pořádání, ukládání a vyhledávání dokumentů.“[1]

Dělení selekčních jazyků[editovat | editovat zdroj]

Selekční jazyky lze na nejvyšší úrovni rozdělit na identifikační selekční jazyky a věcné selekční jazyky. Identifikační selekční jazyky slouží pro popis a vyhledávání podle formálních charakteristik dokumentu – např. jméno či identifikátor autora, počet stran, místo nebo rok vydání dokumentu atd. Příkladem identifikačního selekčního jazyka jsou např. Jmenné autority ČR spadající spolu s věcnými autoritami (viz dále) pod Národní autority České republiky. Věcné selekční jazyky slouží pro popis a vyhledávání podle věcných / obsahových charakteristik dokumentu, tj. tématu. Věcné selekční jazyky lze podle typu používaných lexikálních jednotek dále rozdělit na předmětové selekční jazyky (jazyky na bázi přirozeného jazyka, formulují obsah pomocí jednoho nebo více slov, např. předmětová hesla, klíčová slova nebo tezaury) a systematické selekční jazyky (umělé jazyky založené na klasifikačním systému, slovník je tvořen klasifikačními znaky (notací), ne slovy; klasifikační znaky jsou pouze doplněny jazykovými ekvivalenty v rámci tzv. klasifikačních tabulek, např. Mezinárodní desetinné třídění). Věcné selekční jazyky lze dále dělit podle způsobu organizace lexikálních jednotek v procesu ukládání a vyhledávání, a to na věcné selekční jazyky prekoordinované a postkoordinované.[2]

Základní dělení selekčních jazyků lze tedy schematicky vyjádřit následovně:

  • Selekční jazyky
    • Identifikační selekční jazyky
    • Věcné selekční jazyky
      • podle typu používaných lexikálních jednotek
        • Předmětové (věcné) selekční jazyky
        • Systematické (věcné) selekční jazyky
      • podle způsobu organizace lexikálních jednotek v procesu ukládání a vyhledávání
        • Prekoordinované (věcné) selekční jazyky
        • Postkoordinované (věcné) selekční jazyky

Struktura selekčního jazyka[editovat | editovat zdroj]

Selekční jazyk vzniká zjednodušením přirozeného jazyka, redukuje počet užitých výrazů. Je tvořen tak, aby se zabránilo konstruování homonym a synonym.

Základní lexikální jednotkou selekčního jazyka je lexém. Lexém vyjadřuje „určitý pojem ve formě termínu odvozeného z přirozeného jazyka, nejlépe substantiva či substantivního spojení nebo klasifikačního znaku“[3]

Mezi lexikálními jednotkami jsou vztahy prekoordinace a postkoordinace.

Předmětové selekční jazyky[editovat | editovat zdroj]

Předmětový selekční jazyk je selekční jazyk používaný "při realizaci procesu předmětového pořádání informací jako jeho výrazový a vyjadřovací prostředek. Při předmětovém pořádání je obsah dokumentu poměrně stručně formulován pomocí jednoho slova nebo skupiny slov.“[4] Podle Česká terminologická databáze knihovnictví a informační vědy TDKIV lze předmětové selekční jazyky rozdělit podle charakteru lexikálních jednotek, které jsou "založené na použití klíčových slov (např. klíčová slova z názvu dokumentů, rotované rejstříky), předmětová hesla (jazyk předmětových hesel) a deskriptorové selekční jazyky."[5]

Deskriptorové selekční jazyky[editovat | editovat zdroj]

Deskriptorové selekční jazyky jsou postkoordinované selekční jazyky, které jsou určené pro zpracování a vyhledávání prostřednictvím řízeného slovníku (tezauru).

Tezaurus[editovat | editovat zdroj]

Tezaurus je soubor lexikálních jednotek používaný ke zpracování a vyhledávání dokumentů. "Mezi prvky tezauru jsou explicitně definovány vztahy ekvivalence, hierarchie (zpravidla nepříliš hluboké) a asociace.“[3] Lexikálními jednotkami tezauru jsou deskriptory a nedeskriptory. Deskriptory se používají "ke zpracování a vyhledávání informací. Nedeskriptor je ekvivalent nebo kvaziekvivalent deskriptoru, slouží jako uživatelský vstup do tezauru, uživatel je odkázán (slovem viz nebo zkratkou ekv) k příslušnému deskriptoru.“[6]

Předmětová hesla[editovat | editovat zdroj]

Předmětová hesla jsou prekoordinované selekční jazyky. TDKIV definuje předmětové heslo jako: „selekční jazyk používaný pro strukturní zpracování dokumentů nebo dat pomocí abecedně uspořádaných termínů nebo jejich kombinací s cílem umožnit předmětový přístup. Jeho lexikum představuje heslář (příp. pouze předmětový katalog). Lexikální jednotkou je předmětové heslo."[7] Tvorba předmětových hesel vychází z normy ČSN ISO 5127-2003.

Klíčová slova[editovat | editovat zdroj]

Klíčová slova jsou postkoordinovaných selekčním jazykem. Jednotlivá slova nebo slovní spojení vyjadřují sémantický obsah dokumentu. Jsou izolovaná. "Mezi první průkopníky klíčových slov patří permutované rejstříky KWIC a KWOC, jejichž základní myšlenky byly formulovány v roce 1959."[8] Podoba klíčového slova není nijak normována a jeho podoba závisí na pravidlech institucí.

Systematické selekční jazyky[editovat | editovat zdroj]

Lexikální jednotky systematického selekčního jazyka jsou vyjádřeny notacemi. Notace je "mezinárodně srozumitelná, podle typu použitých znaků se rozlišuje alfabetická, numerická, alfanumerická, čistá, smíšená notace; podle jejich počtu např. binární notace; podle struktury se vyčleňuje strukturovaná, hierarchická, expanzivní, lineární notace.“[9] "Lexikální jednotky jsou uskupeny do tříd mezi kterými jsou explicitně definovány paradigmatické vztahy."[3]

Deweyho desetinné třídění[editovat | editovat zdroj]

Deweyho desetinné třídění (DDC) vytvořil Melvil Dewey (1851–1931). Tento systém klasifikuje nebeletristická díla do hlavních deseti tříd.

Mezinárodní desetinné třídění[editovat | editovat zdroj]

Mezinárodní desetinné třídění (MDT) je nejvíce využívaným klasifikačním systémem v České republice. MDT je definováno v normě ČSN 01 0180 jako "univerzální, hierarchicky uspořádaná třídící soustava používající desetinné notace pro indexování všech druhů dokumentů, které mají vztah k jednotlivým oblastem lidského vědění".[10]

Třídění Kongresové knihovny[editovat | editovat zdroj]

Třídění Kongresové knihovny (Library of Congress Classification, LCC) je systém, který používá Kongresová knihovna Spojených států amerických pro fyzickou organizaci sbírek. "LCC patří mezi tzv. enumerativní systémy, ve kterých je každé téma nebo dílčí heslo explicitně vyjádřeno v tabulkách třídění. Obecná hesla nebo hesla označující formu dokumentu jsou explicitně vyjmenována v každé třídě či podtřídě. Stejně jako jiné klasifikační systémy i LCC používá pomocné tabulky, které dovolují bližší specifikaci hesla."[11]


Systematických selekčních jazyků existuje celá řada. Jsou mezi nimi:

  • dokumentové klasifikace (např. RVK – Die Regensburger Verbundklassifikation)
  • ekonomické klasifikace (např. NAICS – North American Industry Classification System)
  • klasifikace výrobků a služeb (např. CZ-CPA – Klasifikace produkce)
  • klasifikace území (např. NUTS – Nomenclature of Territorial Units for Statistics (NUTS Statistical Regions of Europe)
  • klasifikace ontologií (např. BIBO – Bibliographic Ontology)
  • katalogy zdrojů na internetu (např. ČRK – Česká radiologická klasifikace).

Reference[editovat | editovat zdroj]

  1. Selekční jazyk. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2013-08-16]. Dostupné z: http://aleph.nkp.cz/F/IEU4E5ISJ1XR627L2S6J9HV3LTYKG2739FHVHUI5XG1NEBSRL4-32855?func=full-set-set&set_number=077531&set_entry=000006&format=999
  2. volně podle KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online databáze]. Praha: Národní knihovna České republiky, 2003- [cit. 2014-09-22]. Dostupný z: http://aleph.nkp.cz/cze/ktd.
  3. a b c KUČEROVÁ, Helena. Selekční jazyky. In: Vyšší odborná škola informačních služeb [online]. Praha, 2013 [cit. 2013-08-15]. Dostupné z: http://web.sks.cz/users/ku/ZIZ/sjazyky.htm Archivováno 1. 7. 2013 na Wayback Machine.
  4. KOVÁŘ, Blahoslav. Věcné pořádání informací a selekční jazyky. 2. vyd. Praha: ÚVTEI, 1984, s. 129
  5. Předmětový selekční jazyk. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2013-08-16]. Dostupné z:http://aleph.nkp.cz/F/F4VYR681YB3Y5T9JSH441GS9CIMGAF44E9Q5H7CVJTI5YJGNNS-53849?func=full-set-set&set_number=074149&set_entry=000002&format=999
  6. PINKAS, Otakar. Zpracování informačních zdrojů – Sešit č. 1. 1. vyd. Praha: Oeconomica, 2002, s. 115. ISBN 80-245-0447-2.
  7. Předmětová hesla. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2013-08-16]. Dostupné z: http://aleph.nkp.cz/F/F4VYR681YB3Y5T9JSH441GS9CIMGAF44E9Q5H7CVJTI5YJGNNS-08632?func=full-set-set&set_number=074474&set_entry=000010&format=999
  8. Klíčová slova a jejich využití v Knihovně Jiřího Mahena v Brně. Inflow [online]. 2008 [cit. 2013-08-15]. Dostupné z: http://www.inflow.cz/klicova-slova-jejich-vyuziti-v-knihovne-jiriho-mahena-v-brne Archivováno 18. 9. 2011 na Wayback Machine.
  9. Notace. In: Vyškola chemicko-technologická v Praze: Vydavatelství [online]. 2013 [cit. 2013-08-15]. Dostupné z: http://vydavatelstvi.vscht.cz/knihy/uid_isbn-80-7080-599-4/hesla/notace.html[nedostupný zdroj]
  10. ČSN 01 0180. Mezinárodní desetinné třídění (MDT). Výběr nejdůležitějších znaků. Praha: Vydavatelství Úřadu pro normalizaci a měření, 1980.
  11. Macháčková, Tereza. Třídění Kongresové knihovny. Ikaros [online]. 2007, roč. 11, č. 6 [cit. 11.08.2013]. Dostupné z: <http://www.ikaros.cz/node/4182>. ISSN 1212-5075.

Literatura[editovat | editovat zdroj]

Externí odkazy[editovat | editovat zdroj]