Přeskočit na obsah

Head-driven phrase structure grammar

Z Wikipedie, otevřené encyklopedie

Head-driven phrase structure grammar (HPSG, česky frázová gramatika řízená hlavou) je vysoce lexikalizovaná unifikační gramatika (založená na omezeních),[1][2] kterou vytvořil Carl Pollard a Ivan Sag.[3][4] Je jedním z typů frázové gramatiky v protikladu k závislostním gramatikám, a je bezprostředním následníkem Zobecněné frázové gramatiky. HPSG přebírá koncepty z jiných oborů, např. teorii datových typů a reprezentaci znalostí z matematické informatiky a používá pojem znaku zavedený Ferdinandem de Saussurem. Používá jednotný formalismus a modulární organizaci, díky čemuž je atraktivní pro zpracování přirozeného jazyka.

HPSG zahrnuje principy a pravidla gramatiky a lexikální položky, které obvykle nejsou považovány za součást gramatiky. Formalismus vychází z lexikalismu; to znamená, že lexikon je více než jen seznam položek; sám je bohatě strukturovaný. Jednotlivé položky jsou označeny typem. Typy tvoří hierarchii. První verze HPSG byly velmi lexikalizované s málo gramatickými pravidly (schématy). Novější výzkum přidává více bohatších pravidel, čímž se blíží konstrukční gramatice.[5]

Základní typ, se kterým HPSG pracuje, je znak. Slova a fráze jsou dva různé podtypy znaku. Slovo má dvě vlastnosti: [PHON] (fonetickou formu) a [SYNSEM] (syntaktickou a sémantickou informaci), které jsou rozčleněny na dílčí vlastnosti. Znaky a pravidla jsou formalizovány jako typované sestavy rysů.

Ukázka gramatiky

[editovat | editovat zdroj]

HPSG generuje řetězce kombinováním znaků, které jsou definovány svým umístěním v typové hierarchii a svou interní sestavou rysů, reprezentovanou maticemi hodnot atributů (anglicky attribute value matrix, AVM).[4][6] Hodnotami vlastností jsou typy nebo seznamy typů, a tyto hodnoty mohou zase mít své vlastní sestavy rysů. Gramatická pravidla jsou z větší části vyjádřena omezeními, které si znaky vzájemně kladou. Sestava rysů znaku popisuje jeho fonologické, syntaktické a sémantické vlastnosti. V běžném zápisu AVM se vlastnosti píší antikvou velkými písmeny a typy kurzívou malými písmeny. Číslované indexy v AVM reprezentují shodné hodnoty tokenů.

Ve zjednodušené AVM pro slovo (v tomto případě sloveso, ne substantivum jako ve frázi „nice walks for weekend“ „hezké vycházky na víkend“) je kategoriální informace slovesa „walks“ (CAT) rozdělena na vlastnosti, které jej popisují (HEAD) a vlastnosti, které popisují jeho argumenty (VALENCE).

AVM pro walks
AVM pro walks

“Walks“ je znak typu slovo (word) s hlavou typu sloveso (verb). Jako intranzitivní sloveso nemá „walks“ žádné doplnění, vyžaduje však podmět, který je ve třetí osobě jednotného čísla. Sémantická hodnota podmětu (OBSAH) je koindexován s jediným argumentem slovesa (individuem, které provádí walking). Následující AVM pro slovo „she“ reprezentuje znak s hodnotou SYNSEM, který by mohl splňovat tyto požadavky.

Znaky typu fráze se unifikují s jedním nebo více potomky a propagují informace vzhůru. Následující AVM kóduje pravidlo bezprostřední dominance pro head-subj-phrase, která vyžaduje dva potomky: potomka, který je hlavou (sloveso) a potomka, který není hlavou, které vyplňuje SUBJ omezení slovesa.

Konečný výsledek je znak se slovesnou hlavou, prázdnými subkategorizačními vlastnostmi, a fonologickou hodnotou, která řídí dva potomky.

Přestože skutečná HPSG gramatika je zcela složena ze sestav rysů, lingvisté často používají stromy pro reprezentaci unifikace znaků, kde by ekvivalentní AVM byla těžkopádná.

Implementace

[editovat | editovat zdroj]

Byly vytvořeny různé syntaktické analyzátory založené na HPSG formalismu a zkoumají se jejich optimalizace. Příklad systému pro analýzu německých vět byl vytvořen na Svobodné univerzitě Berlín.[7] Projekt CoreGram[8] gramatické skupiny z této univerzity poskytuje gramatiky s otevřeným zdrojovým textem, které byly implementovány v systému TRALE. V současnosti existují gramatiky němčiny,[9] dánštiny,[10] mandarínské čínštiny,[11] maltštiny,[12] a perštiny[13], které sdílí společné jádro a jsou veřejně dostupné.

Velké HPSG gramatiky různých jazyků jsou vyvíjeny v rámci Deep Linguistic Processing with HPSG Initiative (DELPH-IN).[14] Gramatiky angličtiny,[15] němčiny,[16] a japonštiny[17] s velkým pokrytím jsou dostupné pod svobodnou licencí. Tyto gramatiky mohou být používány mnoha kompatibilními HPSG analyzátory s otevřeným zdrojovým kódem: LKB, PET,[18] Ace,[19] a agree.[20] Všechny tyto gramatiky produkují sémantickou reprezentaci ve formátu “Linguistic Knowledge Builder”, MRS.[21] Deklarativní povaha formalismu HPSG znamená, že tyto komputační gramatiky mohou být typicky používány jak pro syntaktickou analýzu tak pro generování přirozeného jazyka (vytváření povrchových řetězců ze sémantických vstupů). Pro vývoj a testování gramatik, a také k trénování modelů rankingu, který při analýze (nebo realizaci při generování) rozhoduje o věrohodnosti jednotlivých interpretací, se používají stromové banky distribuované také jako součást DELPH-IN.

Enju je volně dostupný pravděpodobnostní HPSG analyzátor se širokým pokrytím pro angličtinu vyvinutý v Tsujii Laboratory na Tokijské univerzitě.[22]

V tomto článku byl použit překlad textu z článku Head-driven phrase structure grammar na anglické Wikipedii.

  1. HPSG [online]. Dostupné online. 
  2. MÜLLER, Stefan; ABEILLÉ, Anne; BORSLEY, Robert D.; KOENIG, Jean-Pierre, 2021. Head-Driven Phrase Structure Grammar: The handbook. Příprava vydání Müller S, Abeillé A, Borsley RD, Koenig JP. Berlin: Language Science Press. Dostupné online. ISBN 978-3-96110-255-6. DOI 10.5281/zenodo.5543318. 
  3. Pollard a Sag 1987.
  4. a b Pollard a Sag 1994.
  5. SAG, Ivan A., 1997. English Relative Clause Constructions [online]. 1997. S. 431–484. Dostupné online. [nedostupný zdroj]
  6. Sag, Wasow a Bender 2003.
  7. The Babel-System: HPSG Interactive. hpsg.fu-berlin.de [online]. [cit. 2023-04-21]. Dostupné v archivu pořízeném z originálu dne 2016-07-12. 
  8. The CoreGram Project. hpsg.fu-berlin.de [online]. [cit. 2023-04-21]. Dostupné v archivu pořízeném z originálu dne 2017-02-01. 
  9. Berligram. hpsg.fu-berlin.de [online]. [cit. 2023-04-21]. Dostupné v archivu pořízeném z originálu dne 2016-10-29. 
  10. DanGram. hpsg.fu-berlin.de [online]. [cit. 2023-04-21]. Dostupné v archivu pořízeném z originálu dne 2016-04-09. 
  11. Chinese. hpsg.fu-berlin.de [online]. [cit. 2023-04-21]. Dostupné v archivu pořízeném z originálu dne 2016-04-09. 
  12. Maltese. hpsg.fu-berlin.de [online]. [cit. 2023-04-21]. Dostupné v archivu pořízeném z originálu dne 2016-04-09. 
  13. Persian. hpsg.fu-berlin.de [online]. [cit. 2023-04-21]. Dostupné v archivu pořízeném z originálu dne 2016-04-09. 
  14. DELPH-IN: Open-Source Deep Processing
  15. English Resource Grammar and Lexicon [online]. Dostupné v archivu pořízeném z originálu. 
  16. Berthold Crysmann
  17. JacyTop - Deep Linguistic Processing with HPSG (DELPH-IN)
  18. DELPH-IN PET parser
  19. Ace: the Answer Constraint Engine
  20. agree grammar engineering
  21. COPESTAKE, A.; FLICKINGER, D.; POLLARD, C.; SAG, I. A., 2005. Minimal recursion semantics: An introduction. Research on Language and Computation. Roč. 3, čís. 2–3, s. 281–332. Dostupné online. 
  22. Tsuji Lab: Enju parser home page [online]. Dostupné v archivu pořízeném z originálu dne 2010-03-07. 

Literatura

[editovat | editovat zdroj]
  • POLLARD, Carl; SAG, Ivan A., 1987. Information-based Syntax and Semantics. Volume 1: Fundamentals. Stanford: CSLI Publications. 
  • POLLARD, Carl; SAG, Ivan A., 1994. Head-Driven Phrase Structure Grammar. Chicago: University of Chicago Press. Dostupné v archivu pořízeném z originálu. 
  • SAG, Ivan A.; WASOW, Thomas; BENDER, Emily M., 2003. Syntactic Theory: a formal introduction, Second Edition. Chicago: University of Chicago Press. 
  • LEVINE, Robert D.; W. Detmar Meurers, 2006. Head-Driven Phrase Structure Grammar: Linguistic Approach, Formal Foundations, and Computational Realization. 2. vyd. Oxford: Elsevier. Dostupné v archivu pořízeném dne 2008-09-05.  Archivováno 5. 9. 2008 na Wayback Machine.
  • MÜLLER, Stefan, 2013. Unifying Everything: Some Remarks on Simpler Syntax, Construction Grammar, Minimalism and HPSG. Language. Roč. 89, čís. 4, s. 920–950. Dostupné online. DOI 10.1353/lan.2013.0061. S2CID 55298660.  Archivováno 2. 2. 2017 na Wayback Machine.

Související články

[editovat | editovat zdroj]

Externí odkazy

[editovat | editovat zdroj]