Lemma (lingvistika)

Z Wikipedie, otevřené encyklopedie

V lingvistice lemma (též lema, mn. č. lemmata) označuje:

  • základní podobu (alolex) lexému (tedy slova nebo fráze), která se uvádí jako reprezentativní ve slovnících (slovníkový tvar), nebo
  • souhrn všech tvarů určité lexikální jednotky (lexému) reprezentovaný jejím základním (heslovým) tvarem (lemmatem v předchozím významu)

V textové analýze se každý konkrétní tvar daného lemmatu označuje jako typ, každá konkrétní realizace slova se nazývá token.

Odlišuje se od kořene slova, ten je nejmenší významovou jednotkou slova; odlišuje se i od tokenu a od stematizace, kdy se hledá kmen slova.

Nástroj (např. počítačový program), který určitému tvaru slova přiřadí jeho lemma, se nazývá lemmatizátor.

Příklady a využití[editovat | editovat zdroj]

Např. ve větě "Netrpěliví zákazníci stáli v obchodě i před obchodem, ovšem před obchodem jich čekalo jen několik." se k lemmatu obchod vyskytují tři tokeny dvou typů (obchodě, obchodem).

Poměrem typů a tokenů lze přibližně odhadnout jazykovou bohatost textu (která je ovšem ovlivněna také délkou a specifikací textu).[1]

Ve funkčním generativním popisu (FGP) se rozlišuje morfologické (syntaktické) m-lema od tektogramatického (sémantického) t-lematu.

V češtině se jako slovníkový tvar zpravidla používá:

V jiných jazycích může být konvence pro výběr lemmatu odlišná. V latině se za verbální lemma považuje první osoba singuláru přítomného času, případně třetí osoba u neosobních sloves jako kupř. ningit (sněží).

Odkazy[editovat | editovat zdroj]

Reference[editovat | editovat zdroj]

  1. ČERMÁK, František. Lexikon a sémantika. Praha: NLN, 2010. S. 232–233. 

Externí odkazy[editovat | editovat zdroj]