Korpusová lingvistika

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání
Lingvistika
Teoretická lingvistika
Fonologie
Generativní lingvistika
Kognitivní lingvistika
Kvantitativní lingvistika
Lexikologie
Morfologie
Pragmatika
Sémantika
Syntax
Deskriptivní lingvistika
Etymologie
Fonetika
Historická lingvistika
Komparativní lingvistika
Sociolingvistika
Aplikovaná lingvistika
Forenzní lingvistika
Jazyková akvizice
Komputační lingvistika
Korpusová lingvistika
Matematická lingvistika
Neurolingvistika
Preskriptivní lingvistika
Psycholingvistika
Stylistika

Korpusová lingvistika je odvětví lingvistiky, jehož rozvoj je spjat s příchodem počítačů a informačních technologií. Tato disciplína zkoumá jazyk pomocí elektronických jazykových korpusů a zabývá se i výstavbou těchto korpusů, jejich zpracováním a příslušnou metodologií.

Korpusová lingvistika vznikla v 50. letech 20. století, kdy si američtí lingvisté (Hill a Harris) uvědomili, že korpus je nutným empirickým základem pro vytvoření popisu gramatiky přirozeného jazyka. V 60. letech se rozvíjí korpusová lingvistika v novém pojetí a to vznikem Survey of English Usage (SEU), v jehož rámci se počítalo i se zpracováním mluveného anglického jazyka, toto však nebylo orientováno počítačově. V roce 1967 začali Čech H. Kučera a Američan N. Francis na Brown University v USA pracovat na Computation Analysis of Present-Day American English – počítačovém korpusu současné americké angličtiny obsahující pouze psané texty. Prudký rozkvět tohoto odvětví byl zaznamenán s rychlým rozvojem výpočetní techniky, nejvýrazněji pak v posledních dvou desetiletích 20. století.

Dnes je v jednotlivých jazycích korpusů již mnoho, například British National Corpus obsahující 100 milionů slov a také významnou složku mluvenou.

Korpusová lingvistika není novou teorií jazyka, využívá důsledně jazykových dat, zkoumá texty, které se chápou jako rozsáhlé produkty jazykového systému a schopností jejich tvůrců a skrze ně dospívá k poznání obecnějších jazykových zákonitostí a pravidel.

Související články [editovat]

Externí odkazy [editovat]