Lexikální podobnost

V lingvistice je lexikální podobnost míra podobnosti slovní zásoby dvou daných jazyků. Lexikální podobnost hodnoty 1 (nebo 100 %) by znamenala úplné překrytí slovní zásoby, zatímco 0 znamená, že neexistují žádná společná slova.

Existují různé definice lexikální podobnosti, které dávají rozdílné výsledky. Například metoda Etnologue spočívá ve srovnání standardizovaných množin seznamů slov a počítání těch, které jsou si podobné jak formou, tak významem. Podle této metody je podobnost angličtiny s němčinou 60 % a s francouzštinou 27 %.

Lexikální podobnost může být použita k odhadnutí genetické příbuznosti mezi dvěma jazyky. Hodnoty vyšší než 85 % většinou znamenají, že porovnávané jazyky jsou příbuzné dialekty.^[1]

Lexikální podobnost je jenom jedním z indikátorů vzájemné srozumitelnosti dvou jazyků, protože ta záleží také na stupni fonetické, morfologické (tvarosloví) a syntaktické (větná skladba) podobnosti. Dlužno podotknout, že je to ovlivněno variacemi ve váze různých seznamů slov. Například lexikální podobnost francouzštiny s angličtinou je velmi vysoká co se lexikálních oblastí souvisejících s kulturou týče, zatímco jejich podobnost je menší co se týče základních (funkčních) slov. Na rozdíl od vzájemné srozumitelnosti je být lexikální podobnost výlučně symetrická.

Indoevropské jazyky[editovat | editovat zdroj]

Tabulka níže ukazuje hodnoty lexikální podobnosti pro dvojice vybraných románských, germánských a slovanských jazyků tak, jak byly publikovány Ethnologuem.

Kód jazyka	Jazyk 1 ↓	Koeficienty lexikální podobnosti
		Katalánština	Angličtina	Francouzština	Němčina	Italština	Portugalština	Rumunština	Rétorománština	Ruština	Sardinština	Španělština
cat	Katalánština	1	-	0,85	-	0,87	0,85	0,73	0,76	-	0,76	0,85
eng	Angličtina	-	1	0,27	0,60	-	-	-	-	0,24	-	-
fra	Francouzština	0,85	0,27	1	0,29	0,89	0,75	0,75	0,78	-	0,80	0,75
deu	Němčina	-	0,60	0,29	1	-	-	-	-	-	-	-
ita	Italština	0,87	-	0,89	-	1	-	0,77	0,78	-	0,85	0,82
por	Portugalština	0,85	-	0,75	-	-	1	0,72	0,74	-	-	0,89
ron	Rumunština	0,73	-	0,75	-	0,77	0,72	1	0,72	-	0,74	0,71
roh	Rétorománština	0,76	-	0,78	-	0,78	0,74	0.72	1	-	0,74	0,74
rus	Ruština	-	0.24	-	-	-	-	-	-	1	-	-
srd	Sardinština	0,76	-	0,80	-	0,85	-	0,74	0,74	-	1	0,76
spa	Španělština	0,85	-	0,75	-	0,82	0,89	0,71	0,74	-	0,76	1
		Katalánština	Angličtina	Francouzština	Němčina	Italština	Portugalština	Rumunština	Rétorománština	Ruština	Sardinština	Španělština
Jazyk 2 →		cat	eng	fra	deu	ita	por	ron	roh	rus	srd	spa

Poznámky:

Jazykové kódy jsou ze standardu ISO 639-3.
Ethnologue neuvádí, pro kterou variantu sardinštiny byla lexikální podobnost vypočítána.
„-“ značí že data nejsou dostupná.

Související články[editovat | editovat zdroj]

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Lexical similarity na anglické Wikipedii.

↑ http://www.ethnologue.com/ethno_docs/introduction.asp

Ethnologue.com (lexical similarity values available at some of the individual language entries)
Definition of lexical similarity at Ethnologue.com
Rensch, Calvin R. 1992. "Calculating lexical similarity." In Eugene H. Casad (ed.), Windows on bilingualism , 13-15. (Summer Institute of Linguistics and the University of Texas at Arlington Publications in Linguistics, 110). Dallas: Summer Institute of Linguistics and the University of Texas at Arlington.

Externí odkazy[editovat | editovat zdroj]

Nejvíce si podobné jazyky (anglicky)

[1] ttp://www.ethnologue.com/ethno_docs/introduction.asp

[1]