Mapy námětů

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Mapy námětů (někdy také mapy témat) jsou mezinárodní standard pro reprezentaci a výměnu znalostí. Mapy námětů tak mohou být využity například jako model pro organizaci rozsáhlých informačních zdrojů, agregaci informací v distribuovaném prostředí či jako podpora navigace a vyhledávání v rozsáhlých kolekcích dokumentů [1].

Vývoj[editovat | editovat zdroj]

Počátky prací, jež postupně vedly ke vzniku prvních map námětů, se datují k roku 1991[2], kdy byla vtvořena pracovní skupina Davenport group, jež měla za úkol sjednotit terminologii systémové dokumentace využívanou prodejci systému UNIX s terminologií užívanou v odborných knihách. Cíl bylo vytvoření „živoucího“ indexu, který by bylo možné využít pro nezávisle udržovanou a neustále se měnící dokumentaci[2]. Výsledkem jejich práce byl standard SOFABED (Standard Open Formal Architecture for Browsable Electronic Documents).

V roce 1993 hledala nově vytvořená skupina Convention for the Application of HyTime další možná využití tohoto standardu, původně vytvořeného pro podporu multimediálních a hypertextových funkcí v jazyce SGML. Pro testování byl vybrán právě model SOFABED, jež se díky tomuto vylepšení stal základem první mapy námětů. V roce 1995 byl systém dostatečně propracovaný, že mohl být přijat pracovní skupinou ISO/JTC1/SC18/WG8, jako základ nového mezinárodního standardu. Ten byl dokončen v roce 1999 (publikován v lednu 2000) a nesl označení ISO/IEC 13250:2000 SGML Applications -- Topic Maps. V současné době je platné její druhé vydání ISO/IEC 13250:2003 GML Applications -- Topic Maps a doplněk ISO/IEC 13250-2:2006 Information technology - Topic Maps - Part 2: Data model. Obě verze normy jsou dostupné také v českém jazyce ČSN ISO/IEC 13250 (369830) Informační technologie - Aplikace SGML - Mapy námětů.

Datový model[editovat | editovat zdroj]

Mapy námětů využívají dvouvrstvý model dat, který můžeme rozdělit na spodní vrstvu informační (information layer) a vrchní vrstvu znalostí (knowledge layer)[3]. Původní inspirací pro toto rozdělení byl klasický rejstřík uváděný na konci tištěných knih.

Informační vrstva reprezentuje obsah. Je to souhrn všech informačních zdrojů, dostupných pro konkrétní implementaci. Obvykle se tak jedná o sadu zdrojů, u kterých chceme využitím map námětů zlepšit možnosti navigace a vyhledávání. Tato vrstva může obsahovat jakékoliv dokumenty, bez ohledu na jejich formát (text, video, audio, grafika, atd.) či zápis.

Znalostní vrstvu pak lze považovat za index k vrstvě informační. Skládá se z témat, reprezentujících jednotlivé předměty informační vrstvy a vztahů, které zobrazují spojitosti mezi jednotlivými tématy.

Základní elementy[editovat | editovat zdroj]

Každá mapa námětů obsahuje tři základní elementy - témata (topics), vztahy (associations) a výskyty (occurences). Mapy mohou být rozšířeny ještě o doplňkové prvky popis (type) a oblasti platnosti (scope), jejichž použitím lze zvýšit efektivitu vyhledávání informací.

Témata[editovat | editovat zdroj]

Témata jsou zástupci, kteří ve znalostní vrstvě mapy námětů zastupují objekty reálného světa, o kterých mapa pojednává. Tématy může být prakticky cokoliv od osoby, přes myšlenku, město, dílo, až po téma samotné. Témata mohou mít mnoho různých jmen. Kromě běžného názvu mohou obsahovat ještě nespočet variant, které vedou ke stejnému tématu. Takto se v mapách témat řeší např. synonymie. Každé téma přitom zastupuje právě jeden objekt a naopak každý objekt může být zastupován pouze jedním tématem.

K přesnému určení objektu zájmu slouží ještě identifikátory témat.

Ty jsou dvojího druhu:

  • lokátor předmětu (subject locator)
  • identifikátor předmětu (subject identifier)

Lokátor předmětu se používá tehdy, když samotný odkazovaný zdroj je tématem. Ten je dostupný v určité počítačové síti, je tedy adresovatelný a tato adresa může být použita k jeho přesné identifikaci[1]. Lokátor předmětu může být použit v případě, že chceme například hovořit o konkrétní webové stránce určité firmy a ne přímo o dané firmě. V takovém případě bude lokátorem předmětu URL adresa webové stránky.

Identifikátor předmětu je naopak používán tehdy, pokud odkazujeme na informační zdroj, ve kterém je dané téma popsáno či jinak definováno. Může se tak jednat například o odkaz na záznam určitě osoby na Wikipedii, kde jsou obsaženy základní biografické údaje. Aby bylo možné zajistit globální interoperabilitu mezi mapami a umožnit tak jejich snazší sdílení či slučování, byly vytvořeny seznamy PSI (Published Subject Indicator), spravované organizací OASIS.

Výskyty[editovat | editovat zdroj]

Druhým prvkem v mapách námětů jsou výskyty, jež propojují jednotlivá témata s relevantními dokumenty a informačními zdroji. Výskyty mohou být dvojího druhu – interní a externí. Externí využívají lokátor URI k identifikaci informačního zdroje, který je obsažen v informační vrstvě. Externí výskyty tak propojují obě vrstvy mapy témat. Interní naopak reprezentují a odkazují na určité téma již uložené ve znalostní vrstvě a nepotřebují tudíž žádný další lokátor.

Vztahy[editovat | editovat zdroj]

Vztahy jsou obsaženy ve vrstvě znalostí, kde spojují jednotlivá související témata. Nejedná se však pouze o běžné spojení příbuzných témat, jelikož vztahy zde mohou být volně popsány, a lze jimi tak vyjádřit prakticky jakýkoliv vztah. Vztahy mohou být n-ární. To znamená, že nemusí nutně spojovat pouze dvě témata, ale podle potřeby jimi lze spojit témat víc. Spojením témat tato témata zároveň dostávají roli (role type), kterou zastávají v daném vztahu. Jestliže Picasso „vytvořil“ Tři muzikanty, stává se jejich autorem a Tři muzikanti naopak jeho dílem. Tímto způsobem je dosaženo vytvoření síťové struktury, díky které se mapy témat stávají velmi intuitivním a uživatelsky přátelským nástrojem pro vyhledávání informací.

Typ (type)[editovat | editovat zdroj]

Každý základní prvek může být jednoduše popsán, čímž dojde k upřesnění jeho významu a vztahu k ostatním prvkům. Každý popis (typ) se v dané mapě námětů automaticky stane tématem.

Příklady typů:

  • Typ tématu: “skadatel”, “město”, “autor”
  • Typ vztahu: “narozen v”, “napsáno (kým)”
  • Typ výskytu: “biografie”, “studie”, “videoklip”

Oblasti platnosti[editovat | editovat zdroj]

Oblast platnosti zastupuje kontext, ve kterém je dané téma, vztah či výskyt zasazen. Tento prvek tak umožňuje v jedné mapě témat používat více než jednu terminologii. Oblasti platnosti tak mohou nalézt například při slučování tematických map či při tvorbě vícejazyčných tematických map. Nejčastěji se však využívají pro filtrování . Pokud připojíme oblast platnosti k výskytům, můžeme nalezené materiály třídit například podle náročnosti (začátečník/pokročilý/expert)[4].

Formáty[editovat | editovat zdroj]

Norma ISO/IEC 13250:2003 definuje několik formátů pro syntax, sloužících k pohodlnému importu, exportu a výměně dat[5]:

  • XTM (XML Topic Maps) je značkovací jazyk, který vznikl v roce 2000 na základě jazyka XML (eXtensible Markup Language) a za jeho vývojem stojí organizace TopicMaps.org. V současné době je aktuální jeho třetí verze XTM 3.0 z roku 2010 (XTM 1.0 – 2001, XTM 2.0 – 2006)
  • CTM (Compact topic maps) je syntax pro textový zápis. Aktuální je verze z roku 2010.
  • CXTM (Canonicalization XTM) je formát sloužící pouze pro export do binárního kódu.
  • TMQL (Topic Maps Query Language) je standardizovaný dotazovací jazyk používaný pro extrakci dat z map námětů. Je definován standardem ISO 18048: TMQL - Topic Maps Query Language.
  • TMCL (Topic Maps Constraint Language) je jazyk sloužící k popisu omezení v mapách námětů. Je definován standardem ISO 19756: TMCL - Topic Maps Constraint Language.

Kromě oficiálních standardizovaných formátů však vznikají i jiné formáty, zejména ze strany samotných uživatelů. Jedná se například o formáty TM/XML, JSON Topic Maps, TM/JSON či LTM.

Reference[editovat | editovat zdroj]

  1. a b KOSEK, Jiří. Topic Maps: Tutoriál. VŠE O WWW: Domovská stránka Jirky Koska [online]. 2006 [cit. 2013-04-13]. Dostupné z: http://www.kosek.cz/xml/tmtut/
  2. a b HUNTING, Sam. XML topic maps: creating and using topic maps for the Web. Boston: Addison-Wesley, 2003, 603 s. ISBN 02-017-4960-2.
  3. PEPPER, Steve. The TAO of Topic Maps: Finding the Way in the Age of Infoglut. [online]. 2000, 21 s. Dostupné z: http://www.ontopia.net/topicmaps/materials/tao.html#pep2001
  4. GARSHOL, Lars Marius. Metadata? Thesauri? Taxonomies? Topic Maps!: Making sense of it all. Journal of Information Science. 2004, roč. 30, č. 4, s. 378-391. ISSN 0165-5515
  5. Formats. TOPICMAPS.ORG. Topic Maps [online]. c2010 [cit. 2013-05-26]. Dostupné z: http://topicmaps.org/formats/

Literatura[editovat | editovat zdroj]

  • EDWARD, Iglesias. Topic maps and the ILS: an undelivered promise. Library hi tech. 2008, roč. 26, č. 1, s. 12-18. ISSN 07378831
  • Cournington, Christopher. Topic Maps And Indexing: Greater, More Cost-Effective Search Access. Key Words. 2010, roč. 18, č. 4, s.132-138. ISSN 10641211
  • STRADA, Liliana M. Melgar. Topic Maps from a Knowledge Organization Perspective. Knowledge Organization. 2011, roč. 38, č. 1, s. 43-61. ISSN 09437444.
  • KOSEK, Jiří. Topic Maps: Tutoriál. VŠE O WWW: Domovská stránka Jirky Koska [online]. 2006 [cit. 2013-04-13]. Dostupné z: http://www.kosek.cz/xml/tmtut/
  • ČSN ISO/IEC 13250 (36 9830). Informační technologie - Aplikace SGML - Mapy námětů. Praha: Český normalizační institut, 2004, 40 s.
  • GARSHOL, Lars Marius. Metadata? Thesauri? Taxonomies? Topic Maps!: Making sense of it all. Journal of Information Science. 2004, roč. 30, č. 4, s. 378-391. ISSN 0165-5515.
  • PEPPER, Steve. The TAO of Topic Maps: Finding the Way in the Age of Infoglut. [online]. 2000, 21 s. Dostupné z: http://www.ontopia.net/topicmaps/materials/tao.html#pep2001
  • HUNTING, Sam. XML topic maps: creating and using topic maps for the Web. Boston: Addison-Wesley, 2003, 603 s. ISBN 02-017-4960-2.
  • Scaling topic maps: third international conference on topic maps research and applications, TMRA 2007 Leipzig, Germany, October 11-12, 2007 revised selected papers. 1st ed. New York: Springer, 2008, 253 s. ISBN 35-407-0873-1.
  • YI, Myongho. Topic maps-based ontology and semantic web: ontology-driven information retrieval system. Saarbrücken: VDM Verlag Dr. Müller, 2008, 164 s. ISBN 978-3-8364-3519-2.
  • YI, Myongho. Information organization and retrieval using a topic maps-based ontology: Results of a task-based evaluation. Journal of the American Society for Information Science & Technology. 2008, roč. 59, č. 12, s. 1898-1911.
  • TERGAN, Sigmar-Olaf a Tanja KELLER. Knowledge and information visualization: searching for synergies. New York: Springer, 2005, 384 s. Lecture notes in computer science. ISBN 978-354-0269-212.
  • MILLER, Les a Sree NILAKANTA. Managing Knowledge in Organizational Memory Using Topic Maps. International Journal of Knowledge Management. 2008, roč. 4, č. 1, s. 17-28.
  • GLAWAR, Franz-Peter, et al. Applications of Topic Maps in Knowledge Management Systems. International Journal of Electronic Business, 2004, roč. 2, č. 5, s. 508-518. ISSN 14706067.
  • LINDA, D.P. Using Topic Maps to Improve Searches. Computer, 2005, roč. 38, č. 5, s. 18-18. ISSN 00189162.
  • TRIPPE, B. Taxonomies & Topic Maps: Categorization Steps Forward. EContent, 2001, roč. 24, č. 6, s. 44-49. ISSN 15252531.