Lexikální podobnost

Z Wikipedie, otevřené encyklopedie

V lingvistice je lexikální podobnost míra podobnosti slovní zásoby dvou daných jazyků. Lexikální podobnost hodnoty 1 (nebo 100 %) by znamenala úplné překrytí slovní zásoby, zatímco 0 znamená, že neexistují žádná společná slova.

Existují různé definice lexikální podobnosti, které dávají rozdílné výsledky. Například metoda Etnologue spočívá ve srovnání standardizovaných množin seznamů slov a počítání těch, které jsou si podobné jak formou, tak významem. Podle této metody je podobnost angličtiny s němčinou 60 % a s francouzštinou 27 %.

Lexikální podobnost může být použita k odhadnutí genetické příbuznosti mezi dvěma jazyky. Hodnoty vyšší než 85 % většinou znamenají, že porovnávané jazyky jsou příbuzné dialekty.[1]

Lexikální podobnost je jenom jedním z indikátorů vzájemné srozumitelnosti dvou jazyků, protože ta záleží také na stupni fonetické, morfologické (tvarosloví) a syntaktické (větná skladba) podobnosti. Dlužno podotknout, že je to ovlivněno variacemi ve váze různých seznamů slov. Například lexikální podobnost francouzštiny s angličtinou je velmi vysoká co se lexikálních oblastí souvisejících s kulturou týče, zatímco jejich podobnost je menší co se týče základních (funkčních) slov. Na rozdíl od vzájemné srozumitelnosti je být lexikální podobnost výlučně symetrická.

Indoevropské jazyky[editovat | editovat zdroj]

Tabulka níže ukazuje hodnoty lexikální podobnosti pro dvojice vybraných románských, germánských a slovanských jazyků tak, jak byly publikovány Ethnologuem.

Kód
jazyka
Jazyk 1
Koeficienty lexikální podobnosti
Katalánština Angličtina Francouzština Němčina Italština Portugalština Rumunština Rétorománština Ruština Sardinština Španělština
cat Katalánština 1 - 0,85 - 0,87 0,85 0,73 0,76 - 0,76 0,85
eng Angličtina - 1 0,27 0,60 - - - - 0,24 - -
fra Francouzština 0,85 0,27 1 0,29 0,89 0,75 0,75 0,78 - 0,80 0,75
deu Němčina - 0,60 0,29 1 - - - - - - -
ita Italština 0,87 - 0,89 - 1 - 0,77 0,78 - 0,85 0,82
por Portugalština 0,85 - 0,75 - - 1 0,72 0,74 - - 0,89
ron Rumunština 0,73 - 0,75 - 0,77 0,72 1 0,72 - 0,74 0,71
roh Rétorománština 0,76 - 0,78 - 0,78 0,74 0.72 1 - 0,74 0,74
rus Ruština - 0.24 - - - - - - 1 - -
srd Sardinština 0,76 - 0,80 - 0,85 - 0,74 0,74 - 1 0,76
spa Španělština 0,85 - 0,75 - 0,82 0,89 0,71 0,74 - 0,76 1
Katalánština Angličtina Francouzština Němčina Italština Portugalština Rumunština Rétorománština Ruština Sardinština Španělština
Jazyk 2 → cat eng fra deu ita por ron roh rus srd spa

Poznámky:

  • Jazykové kódy jsou ze standardu ISO 639-3.
  • Ethnologue neuvádí, pro kterou variantu sardinštiny byla lexikální podobnost vypočítána.
  • „-“ značí že data nejsou dostupná.

Související články[editovat | editovat zdroj]

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Lexical similarity na anglické Wikipedii.

  • Ethnologue.com (lexical similarity values available at some of the individual language entries)
  • Definition of lexical similarity at Ethnologue.com
  • Rensch, Calvin R. 1992. "Calculating lexical similarity." In Eugene H. Casad (ed.), Windows on bilingualism , 13-15. (Summer Institute of Linguistics and the University of Texas at Arlington Publications in Linguistics, 110). Dallas: Summer Institute of Linguistics and the University of Texas at Arlington.

Externí odkazy[editovat | editovat zdroj]