Monotonní gramatika

V teorii formálních jazyků je gramatika monotonní, pokud všechna její přepisovací pravidla jsou tvaru α → β, kde α a β jsou řetězce neterminálních a terminálních symbolů, v nichž délka řetězce α je menší nebo rovna délce řetězce β, |α| ≤ |β|, tj. β není kratší než α. Gramatika je v zásadě monotonní, pokud může obsahovat pravidlo S → ε, kde S je počáteční symbol a ε prázdný řetězec; pokud gramatika toto pravidlo obsahuje, S se nesmí objevit na pravé straně žádného pravidla.

Použitím žádného z pravidel monotonní gramatiky se nezkrátí délka řetězce. Pokud gramatika má pouze pravidla, která striktně zvětšují délku řetězce, mluvíme o rostoucí kontextové gramatice.

Historie[editovat | editovat zdroj]

Chomsky (1963) nazývá monotonní gramatiky gramatikami typu 1; ve stejné práci nazývá kontextové gramatiky „gramatikami typu 2“, a dokázal, že tyto dvě definice jsou slabě ekvivalentní (bezkontextové gramatiky byly v této práci označovány za „typ 4“).^[1] Číslování gramatik v této Chomského práci z roku 1963 se liší od číslování použitého v popisu hierarchie jazyků, známé dnes jako Chomského hierarchie, protože Chomsky se snažil zdůraznit rozdíl mezi slabou [generativní] a silnou [strukturální] ekvivalencí; ve své práci z roku 1959 používal označení „gramatiky typu 1“ pro kontextové gramatiky a „gramatiky typu 2“ pro bezkontextové gramatiky.^[2]^[3]

Příklad[editovat | editovat zdroj]

S	→	abc
S	→	aSBc
cB	→	Bc
bB	→	bb

Tato gramatika s počátečním symbolem S generuje jazyk { aⁿbⁿcⁿ : n ≥ 1 },^[4] který není bezkontextový, jak lze dokázat pomocí pumping lemmatu pro bezkontextové jazyky.

Kontextová gramatika pro stejný jazyk je ukázána níže.

Transformace na kontextovou gramatiku[editovat | editovat zdroj]

Každou monotonní gramatiku (N, Σ, P, S) lze transformovat na kontextovou gramatiku (N’, Σ, P’, S) takto:

Pro každá terminální symbol a ∈ Σ, zavedeme nový neterminální symbol [a] ∈ N’, a nové pravidlo ([a] → a) ∈ P’.
Ve všech pravidlech z množiny P, nahradíme každý terminální symbol a jemu odpovídajícím neterminálním symbolem [a]. Díky tomu všechna tato pravidla přejdou na tvar X₁...X_m → Y₁...Y_n pro neterminály X_i, Y_j a m≤n.
Každé pravidlo X₁...X_m → Y₁...Y_n, kde m>1 nahradíme celkem 2m pravidly:^{[pozn. 1]}

X₁

X₂

...

X_m-1

X_m

→

Z₁

X₂

...

X_m-1

X_m

Z₁

X₂

...

X_m-1

X_m

→

Z₁

Z₂

...

X_m-1

X_m

:

Z₁

Z₂

...

X_m-1

X_m

→

Z₁

Z₂

...

Z_m-1

X_m

Z₁

Z₂

...

Z_m-1

X_m

→

Z₁

Z₂

...

Z_m-1

Z_m

Y_m+1

...

Y_n

Z₁

Z₂

...

Z_m-1

Z_m

Y_m+1

...

Y_n

→

Y₁

Z₂

...

Z_m-1

Z_m

Y_m+1

...

Y_n

Y₁

Z₂

...

Z_m-1

Z_m

Y_m+1

...

Y_n

→

Y₁

Y₂

...

Z_m-1

Z_m

Y_m+1

...

Y_n

:

Y₁

Y₂

...

Z_m-1

Z_m

Y_m+1

...

Y_n

→

Y₁

Y₂

...

Y_m-1

Z_m

Y_m+1

...

Y_n

Y₁

Y₂

...

Y_m-1

Z_m

Y_m+1

...

Y_n

→

Y₁

Y₂

...

Y_m-1

Y_m

Y_m+1

...

Y_n

kde každé Z_i ∈ N’ je nový neterminální symbol, který se neobjevuje nikde jinde.^[5]^[6]^{[pozn. 2]}

Například výše uvedenou monotonní gramatiku generující jazyk { aⁿbⁿcⁿ | n ≥ 1 } lze převést na následující kontextovou gramatiku s počátečním symbolem S, která generuje stejný jazyk:

	[a]	→	a				z kroku 1
	[b]	→	b				z kroku 1
	[c]	→	c				z kroku 1
	S	→	[a]	[b]	[c]		z kroku 2, nezměněno
	S	→	[a]	S	B	[c]	z kroku 2, nezměněno
~~[c]~~	B	→	B	~~[c]~~			z kroku 2, dále změněno níže
[c]	B	→	Z₁	B			změněno z výše uvedeného v kroku 3
Z₁	B	→	Z₁	Z₂			změněno z výše uvedeného v kroku 3
Z₁	Z₂	→	B	Z₂			změněno z výše uvedeného v kroku 3
B	Z₂	→	B	[c]			změněno z výše uvedeného v kroku 3
~~[b]~~	B	→	~~[b]~~	~~[b]~~			z kroku 2, dále změněno níže
[b]	B	→	Z₃	B			změněno z výše uvedeného v kroku 3
Z₃	B	→	Z₃	Z₄			změněno z výše uvedeného v kroku 3
Z₃	Z₄	→	[b]	Z₄			změněno z výše uvedeného v kroku 3
[b]	Z₄	→	[b]	[b]			změněno z výše uvedeného v kroku 3

Expresivní síla[editovat | editovat zdroj]

Podobně existuje snadný postup pro převod libovolné monotonní gramatiky do Kurodovy normální formy.^[7]^[8] Naopak, každá kontextová gramatika a každá gramatika v Kurodově normální formě je triviálně také monotonní gramatikou. Proto monotonní gramatiky, gramatiky v Kurodově normální formě, a kontextové gramatiky mají stejný expresivní sílu. Přesněji, monotonní gramatiky popisují právě kontextové jazyky, které neobsahují prázdný řetězec, zatímco v zásadě monotonní gramatiky popisují právě množinu kontextových jazyků.

Odkazy[editovat | editovat zdroj]

Poznámky[editovat | editovat zdroj]

↑ Pro usnadnění je přepisovaná (nekontextová) část levé a pravé strany zvýrazněna polotučným písmem.
↑ Ve vydání z roku 2003 chybí kapitola o monotonních a kontextových jazycích.

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Noncontracting grammar na anglické Wikipedii.

↑ Chomsky 1963, pp. 360–363 and 367.
↑ CHOMSKY, Noam, 1959. On certain formal properties of grammars. Information and Control 2. S. 137–167. Definice na str. 141–142. Dostupné online.
↑ LEVELT, Willem J. M., 2008. An Introduction to the Theory of Formal Languages and Automata. [s.l.]: John Benjamins Publishing. Dostupné online. ISBN 978-90-272-3250-2. S. 125–126.
↑ Mateescu a Salomaa 1997, Example 2.1, p. 188.
↑ Mateescu a Salomaa 1997, Theorem 2.1, p. 187.
↑ Hopcroft a Ulman 1979, Exercise 9.9, p. 230.
↑ KURODA, Sige-Yuki. Classes of languages and linear-bounded automata. Information and Control. June 1964, roč. 7, čís. 2, s. 207–223. DOI 10.1016/s0019-9958(64)90120-2.
↑ Mateescu a Salomaa 1997, Theorem 2.2, p. 190.

Literatura[editovat | editovat zdroj]

BOOK, R. V., 1973. On the structure of context-sensitive grammars. International Journal of Computer & Information Sciences. Roč. 2, čís. 2, s. 129–139. DOI 10.1007/BF00976059. S2CID 31699138.
MATEESCU, Alexandru; SALOMAA, Arto, 1997. Handbook of Formal Languages. Volume I: Word, language, grammar. [s.l.]: Springer-Verlag. ISBN 3-540-61486-9. Kapitola 4: Aspects of Classical Language Theory, s. 175–252.
HOPCROFT, John E.; ULLMAN, Jeffrey D., 1979. Introduction to Automata Theory, Languages, and Computation. [s.l.]: Addison-Wesley. Dostupné online. ISBN 0-201-02988-X.
NOAM, Chomsky, 1963. Handbook of Mathematical Psychology. New York: Wiley. Dostupné online. S. 323–418.

Související články[editovat | editovat zdroj]

[5] Pro usnadnění je přepisovaná (nekontextová) část levé a pravé strany zvýrazněna polotučným písmem.

[8] Ve vydání z roku 2003 chybí kapitola o monotonních a kontextových jazycích.

[FOOTNOTEChomsky1963pp._360–363_and_367-1] Chomsky 1963, pp. 360–363 and 367.

[2] CHOMSKY, Noam, 1959. On certain formal properties of grammars. Information and Control 2. S. 137–167. Definice na str. 141–142. Dostupné online.

[Levelt2008-126-3] LEVELT, Willem J. M., 2008. An Introduction to the Theory of Formal Languages and Automata. [s.l.]: John Benjamins Publishing. Dostupné online. ISBN 978-90-272-3250-2. S. 125–126.

[FOOTNOTEMateescuSalomaa1997Example_2.1,_p._188-4] Mateescu a Salomaa 1997, Example 2.1, p. 188.

[FOOTNOTEMateescuSalomaa1997Theorem_2.1,_p._187-6] Mateescu a Salomaa 1997, Theorem 2.1, p. 187.

[FOOTNOTEHopcroftUlman1979Exercise_9.9,_p._230-7] Hopcroft a Ulman 1979, Exercise 9.9, p. 230.

[9] KURODA, Sige-Yuki. Classes of languages and linear-bounded automata. Information and Control. June 1964, roč. 7, čís. 2, s. 207–223. DOI 10.1016/s0019-9958(64)90120-2.

[FOOTNOTEMateescuSalomaa1997Theorem_2.2,_p._190-10] Mateescu a Salomaa 1997, Theorem 2.2, p. 190.

[1]

[2]

[3]

[4]

[pozn. 1]

[5]

[6]

[pozn. 2]

[7]

[8]