Matematická lingvistika

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Matematická lingvistika je specializovaný vědní obor na pomezí matematiky, lingvistiky a informatiky.

Matematická lingvistika zahrnuje tři dílčí disciplíny. Jsou to:

  1. lingvistika kvantitativní
  2. lingvistika algebraická
  3. lingvistika počítačová

Kvantitativní lingvistika[editovat | editovat zdroj]

Používá kvantitativní statistické metody ke studiu jazyka. Zkoumá četnost výskytu jazykových jednotek (slovních tvarů, lexémů, morfémů, fonémů, slovních druhů atd.). Jedním z možných výstupů jsou frekvenční slovníky.

Algebraická (formální) lingvistika[editovat | editovat zdroj]

Hledá způsoby, jak popsat jazykový systém formálním a matematicky přesným způsobem. Zahrnuje různé teorie matematických modelů jazyka. Používá metody algebraické a logické.

Počítačová (komputační) lingvistika[editovat | editovat zdroj]

Využívá poznatky kvantitativní i algebraické lingvistiky, jakož i umělé inteligence a strojového učení ke konstrukci algoritmů počítačového zpracování přirozeného jazyka. Nejznámějšími aplikacemi jsou strojový překlad nebo dobývání informací, patří sem však i korektory gramatiky a pravopisu, chytré elektronické slovníky atd.

Obtížně zařaditelným podoborem je korpusová lingvistika. Zabývá se tvorbou jazykových korpusů, tedy rozsáhlých elektronicky čitelných textových nebo mluvených dat, která se dále využívají při strojovém učení algoritmů počítačové lingvistiky, jako datová základna pro kvantitativní lingvistiku, ale i pro většinu ostatních oborů lingvistiky jako soubor reálných jazykových příkladů, na nichž lze ověřovat užití slov a formulace gramatických pravidel.