Přeskočit na obsah

Rozpoznávání pojmenovaných entit

Z Wikipedie, otevřené encyklopedie

Rozpoznávání pojmenovaných entit (RPE), v angličtině Named-entity recognition (NER), známé také jako identifikace (pojmenovaných) entit či extrakce entit, je dílčí úloha extrakce informací, která se snaží najít a zařadit pojmenované entity uvedené v nestrukturovaném textu do předem definovaných kategorií (klasifikace), jako jsou jména osob, organizace, místa, lékařské kódy, časové výrazy, množství, peněžní hodnoty, procenta atd.[1]

Výše popsaná definice děli RPE/NER na dvě části: lokalizace entit v textu (named entity identification) a jejich klasifikaci (named entity classification). RPE je často používáno pro automatický strojový překlad, vyhledávání informací a dalších klasické úlohy počítačového zpracování přirozeného jazyka.[2]

Princip fungování

[editovat | editovat zdroj]

RPE systém má fungovat tak, že z neanotovaného textu udělá text anotovaný. RPE pro možnost takového anotování potřebuje mít znalosti z již předem kompletně anotovaných datasetů (učení s učitelem), nebo datasety, kde je alespoň část anotovaná (poloviční učení s učitelem / semisupervised learning).[3]

V tomto článku byl použit překlad textu z článku Named-entity recognition na anglické Wikipedii.

  1. AAHILL. Jak provést rozpoznávání pojmenovaných entit (NER) - Azure Cognitive Services. learn.microsoft.com [online]. [cit. 2022-10-26]. Dostupné online. 
  2. ROZPOZNÁVÁNÍ POJMENOVANÝCH ENTIT | Nový encyklopedický slovník češtiny. www.czechency.org [online]. [cit. 2022-04-10]. Dostupné online. 
  3. HAN, Aaron Li-Feng; ZENG, Xiaodong; WONG, Derek F. Chinese Named Entity Recognition with Graph-based Semi-supervised Learning Model. In: Proceedings of the Eighth SIGHAN Workshop on Chinese Language Processing. Beijing, China: Association for Computational Linguistics, 2015-07. Dostupné online. DOI 10.18653/v1/W15-3103. S. 15–20.