Distribuční sémantika

Z Wikipedie, otevřené encyklopedie
Jak spolu slova v daném jazyce souvisejí je demonstrováno v "sémantickém prostoru", který matematicky odpovídá vektorovému prostoru.

Distribuční sémantika je podoblastí zpracování přirozeného jazyka, která se snaží o pochopení významů slovních spojení.[1]

Studuje teorie a metody kvantifikace a kategorizace sémantických podobností mezi jazykovými položkami na základě jejich distribučních vlastností ve velkých vzorcích jazykových dat.

Distribuční hypotéza[editovat | editovat zdroj]

Základní myšlenku distribuční sémantiky lze shrnout do tzv. distribuční hypotézy: jazykové položky s podobnou distribucí mají podobné významy. Zjednodušeně: slova, která se používají a vyskytují ve stejných kontextech, mají tendenci mít podobný význam.[2]

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Distributional semantics na anglické Wikipedii.

  1. Distributional semantics: a light introduction. Aurelie Herbelot [online]. [cit. 2023-08-23]. Dostupné online. (anglicky) 
  2. HARRIS, Zellig S. Distributional Structure. WORD. 1954-08, roč. 10, čís. 2–3, s. 146–162. Dostupné online [cit. 2023-08-23]. ISSN 0043-7956. DOI 10.1080/00437956.1954.11659520. (anglicky)