Skript zur Vorlesung - Institut für Theoretische Informatik an der ...

Skript zur Vorlesung 

Formale Sprachen 

Wintersemester 2007/2008 

Prof. Dr. Heribert Vollmer 

vollmer@thi.uni-hannover.de 

Institut für Theoretische Informatik 

Universität Hannover

Inhaltsverzeichnis i 

Inhaltsverzeichnis 

1 Reguläre Sprachen 1 

1.1 Endliche Automaten: Definitionen und Beispiele . . . . . . . . . . . . . 1 

1.2 Der Satz von Myhill-Nerode . . . . . . . . . . . . . . . . . . . . . . . . . 3 

1.3 Minimalautomaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 

1.4 Automaten und Halbgruppen . . . . . . . . . . . . . . . . . . . . . . . . 9 

1.5 Endliche Automaten mit Ausgabe . . . . . . . . . . . . . . . . . . . . . 11 

1.6 Zwei-Weg-Automaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 

2 Kontextfreie Sprachen 21 

2.1 Chomsky-Normalform und CYK-Algorithmus . . . . . . . . . . . . . . . 23 

2.2 Greibach-Normalform und Kellerautomaten . . . . . . . . . . . . . . . . 27 

2.3 Deterministisch-kontextfreie Sprachen . . . . . . . . . . . . . . . . . . . 34 

2.4 Entscheidbarkeitsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 

3 Kontextsensitive Sprachen und Typ-0-Sprachen 46 

3.1 Maschinenmodelle für Typ-0- und Typ-1-Sprachen . . . . . . . . . . . . 47 

3.2 Entscheidbarkeit und Abschlußeigenschaften . . . . . . . . . . . . . . . . 49

1 Reguläre Sprachen 1 

1 Reguläre Sprachen 

1.1 Endliche Automaten: Definitionen und Beispiele 

Definition: Ein Alphabet ist eine endliche Menge von Symbolen, Buchstaben oder 

Zeichen. Bezeichnung meist: Σ, Γ, ∆, . . ., Bezeichnung für Zeichen: a, b, c . . .. 

Ein Wort (oder eine Zeichenkette) über dem Alphabet Σ ist eine endliche Folge 

von Symbolen aus Σ. Bezeichnung meist mit u, v, w, x, y, z. Schreibweise: w = 

a1a2a3 . . . ak, wobei a1, . . . , ak in dieser Reihenfolge die Folgenwerte sind. 

Die Länge |w| eines Wortes w ist die Anzahl der Elemente in der Folge w. 

Ist Σ ein Alphabet, so ist Σ ∗ die Menge aller Wörter über Σ. 

Ist w ∈ Σ ∗ , a ∈ Σ, so ist |w| a die Anzahl der Vorkommen von a in w. 

Das leere Wort wird mit ε bezeichnet und es gilt |ε| = 0. 

Sind u, v ∈ Σ ∗ , so ist u ◦ v oder uv die Konkatenation (das Hintereinanderschreiben) 

der Wörter u und v. 

Definition: Ein (deterministischer) endlicher Automat (kurz: DEA) ist ein 5-Tupel 

wobei 

M = (Z, Σ, δ, z0, E), 

– Z eine endliche Menge von Zuständen, 

– Σ ein Alphabet, 

– δ : Z × Σ → Z die Überführungsfunktion, 

– z0 ∈ Z der Startzustand und 

– E ⊆ Z die Menge der Endzustände ist. 

Definiere ˆ δ : Z × Σ ∗ → Z, die erweiterte Überführungsfunktion, induktiv durch 

ˆδ(z, ε) = z 

ˆδ(z, ax) = ˆ δ(δ(z, a), x) 

für alle z ∈ Z, a ∈ Σ und x ∈ Σ ∗ . Schreibweise: zx oder z · x für ˆ δ(z, x). 

Die von M akzeptierte Sprache ist L(M) = {x ∈ Σ ∗ | ˆ δ(z0, x) ∈ E}. 

Definition: Ein nichtdeterministischer Automat (kurz: NEA) ist ein 5-Tupel 

wobei 

M = (Z, Σ, δ, z0, E),

1.1 Endliche Automaten: Definitionen und Beispiele 2 

– Z, Σ, z0 und E wie bei DEAen definiert sind und 

– δ : Z × Σ → P(Z) die Überführungsfunktion ist. 

Definiere ˆ δ : P(Z) × Σ ∗ → P(Z) durch 

für alle Y ⊆ Z, a ∈ Σ und x ∈ Σ ∗ . 

ˆδ(Y, ε) = Y 

ˆδ(Y, ax) = 

z∈Y 

ˆδ(δ(z, a), x) 

Die von M akzeptierte Sprache ist L(M) = {x ∈ Σ ∗ | ˆ δ({z0}, x) ∩ E = ∅}. 

Nichtdeterministische und deterministische endliche Automaten sind gleich mächtig: 

Jeder DEA lässt sich als NEA schreiben. Für jeden NEA M = (Z, Σ, δ, z0, E) gibt es 

einen DEA M ′ mit L(M) = L(M ′ ), nämlich 

mit δ ′ (Y, a) = 

z∈Y δ(z, a). 

M ′ = (P(Z), Σ, δ ′ , {z0}, {Y ⊆ Z | Y ∩ E = ∅}) 

Die Syntax von regulären Ausdrücken über Σ ist wie folgt definiert: 

– ∅ ist ein regulärer Ausdruck. 

– Für a ∈ Σ ist a ein regulärer Ausdruck. 

– Sind α und β reguläre Ausdrücke, so sind auch αβ, (α + β) und (α) ∗ reguläre 

Ausdrücke. 

Die von einem regulären Ausdruck α erkannte Sprache L(α) ist wie folgt definiert: 

– L(∅) = ∅. 

– L(a) = {a} für alle a ∈ Σ. 

– L(α + β) = L(α) ∪ L(β) für reguläre Ausdrücke α, β. 

– L(αβ) = L(α) ◦ L(β) für reguläre Ausdrücke α, β, wobei 

L0 ◦ L1 = {w ∈ Σ ∗ | es gibt ein u ∈ L0 und ein v ∈ L1 mit w = uv}. 

– L(α ∗ ) = L(α) ∗ für einen regulären Ausdruck α, wobei 

L ∗ = 

L k mit L 0 = {ε} und L k+1 = L k ◦ L für k ≥ 0. 

k≥0

1.2 Der Satz von Myhill-Nerode 3 

Man betrachtet oft auch L + = 

k≥1 Lk . 

Satz: Sei L eine Sprache. Die folgenden Aussagen sind äquivalent: 

– L ist regulär, d. h. es gibt eine Typ-3-Grammatik, die L erzeugt. 

– Es gibt einen DEA M mit L = L(M). 

– Es gibt einen NEA M mit L = L(M). 

– Es gibt einen regulären Ausdruck α mit L = L(α). 

Satz (Pumping-Lemma für reguläre Sprachen): Sei L regulär. Dann gibt es eine Zahl 

n, sodass sich alle Wörter x ∈ L mit |x| ≥ n zerlegen lassen in x = uvw, sodass 

folgende Eigenschaften gelten: 

(i) |v| ≥ 1 

(ii) |uv| ≤ n 

(iii) Für alle i ∈ N gilt: uv i w ∈ L. 

Beispiel: Sei Σ = {a, b}. 

(i) (aa + ab + ba + bb) ∗ ist die Sprache aller Wörter mit gerader Länge. 

(ii) (a ∗ ba ∗ b) ∗ a ∗ ist die Sprache aller Wörter mit einer geraden Anzahl von b’s. 

(iii) L = {a n b n | n ≥ 0} ist nicht regulär. 

Angenommen L wäre regulär: Wähle n wie im Pumping-Lemma und betrachte 

x = a n b n . Es gilt |x| ≥ n. Wähle u, v und w mit |v| ≥ 1, |uv| ≤ n. Dann ist 

uv 2 w /∈ L und das ist ein Widerspruch zur Annahme, dass L regulär ist. 

(iv) L = {w | |w| a = |w| b } ist nicht regulär. 

Angenommen L wäre regulär: a ∗ b ∗ ist regulär, also auch ist L ′ = L ∩ L(a ∗ b ∗ ) = 

{a n b n | n ≥ 0} regulär. L ′ ist jedoch nach (iii) nicht regulär. 

1.2 Der Satz von Myhill-Nerode 

Definition: Eine Relation ∼ ⊆ M × M auf einer Menge M heißt Äquivalenzrelation, 

falls gilt: 

(i) ∼ ist reflexiv, d. h. für alle x ∈ M gilt x ∼ x, 

(ii) ∼ ist symmetrisch, d. h. es gilt x ∼ y ⇒ y ∼ x für alle x, y ∈ M, 

(iii) ∼ ist transitiv, d. h. es gilt x ∼ y und y ∼ z ⇒ x ∼ z für alle x, y, z ∈ M.


[x]∼ = {y ∈ M | x ∼ y} ist die Äquivalenzklasse von x ∈ M. M/∼ ist die Menge aller 

Äquivalenzklassen von ∼. Der Index von ∼ ist die Kardinalität von M/∼. 

∼ heißt rechtsinvariant, falls aus x ∼ y folgt, dass für alle u ∈ Σ ∗ gilt: xu ∼ yu. 

Beispiel: Σ = {0, 1}. Es sei x ∼ y gdw. |x| ≡ |y| (mod 2) gilt. Der Index von ∼ ist 2 

und ∼ ist rechtsinvariant. 

Definition: Sei L ⊆ Σ ∗ . Die natürliche Äquivalenzrelation von L ist definiert durch 

x ∼L y gdw. für alle u ∈ Σ ∗ gilt: xu ∈ L ⇔ yu ∈ L. 

Satz: Sei L ⊆ Σ ∗ . Die folgenden Aussagen sind äquivalent: 

(i) L ist regulär. 

(ii) Es gibt eine rechtsinvariante Äquivalenzrelation ≈ auf Σ ∗ mit endlichem Index, 

sodass L als Vereinigung von Äquivalenzklassen von ≈ geschrieben werden kann. 

(iii) ∼L hat endlichen Index. 

Beweis: (i) ⇒ (ii): Sei L regulär. Sei L = L(M) für den DEA M = (Z, Σ, δ, z0, E). 

Wir nehmen o. B. d. A. an, dass alle Zustände aus Z vom Startzustand z0 aus erreichbar 

sind. Definiere eine Relation ≈ über Σ ∗ wie folgt: 

x ≈ y ⇔ z0x = z0y, 

d. h. x ≈ y ⇔ ˆ δ(z0, x) = ˆ δ(z0, y) für x, y ∈ Σ ∗ . Wir weisen nach, dass ≈ die gewünschten 

Eigenschaften hat: 

– ≈ ist reflexiv, symmetrisch und transitiv. Die Transitivität gilt, da für x ≈ y und 

y ≈ u, u ∈ Σ ∗ beliebig ⇒ z0x = z0y und z0y = z0u ⇒ z0x = z0u, also x ≈ u. 

– ≈ ist rechtsinvariant: Sei x ≈ y, also z0x = z0y. Sei u ∈ Σ ∗ beliebig. Dann ist 

z0(xu) = (z0x)u = (z0y)u = z0(yu), also xu ≈ yu. 

– Sei x ∈ Σ ∗ . Dann ist [x]≈ = {y ∈ Σ ∗ | z0x = z0y}. Für z ∈ Z definiere Lz = 

{x ∈ Σ∗ | z0x = z}. Dann sind die Mengen Lz Äquivalenzklassen von ≈ und 

für jede Äquivalenzklasse [x]≈ gibt es ein z mit [x]≈ = Lz. Die Anzahl der 

Äquivalenzklassen von ≈ ist höchstens |Z|, also endlich. 

– L kann geschrieben werden als L = 

z∈E Lz. 

Schreibweise für die oben konstruierte Äquivalenzrelation: ≈M . 

(ii) ⇒ (iii): Sei ≈ eine Äquivalenzrelation, die (ii) erfüllt. Wir zeigen, dass ≈ ist eine 

Verfeinerung von ∼L ist, d. h. für jedes Wort x ∈ Σ ∗ gilt: 

[x]≈ ⊆ [x]∼L.


Dann ist der Index von ∼L nicht größer als der Index von ≈, also endlich. Betrachte 

ein [x]≈. Sei y ∈ [x]≈, also x ≈ y. Dann gilt für alle u ∈ Σ ∗ , dass xu ≈ yu, also xu ∈ L 

gdw. yu ∈ L. Also ist x ∼L y und daher y ∈ [x]∼L. Demnach ist [x]≈ ⊆ [x]∼L. 

(iii) ⇒ (i): Wir zeigen zunächst, dass ∼L rechtsinvariant ist. 

Sei x ∼L y und v ∈ Σ ∗ . Zu zeigen ist xv ∼L yv, das heißt, dass für alle w ∈ Σ ∗ gilt: 

xvw ∈ L ⇔ yvw ∈ L. Da jedoch x ∼L y, gilt für alle u ∈ Σ ∗ , dass xu ∈ L ⇔ yu ∈ L. 

Obige Äquivalenz folgt direkt mit u = vw. 

Wir definieren nun einen DEA Mmin = (Zmin, Σ, δmin, z0min, Emin) wie folgt: 

– Zmin = Σ ∗ / ∼L, die Menge der Äquivalenzklassen von ∼L. 

– δmin([x]∼L , a) = [xa]∼L für alle [x]∼L ∈ Zmin, a ∈ Σ. 

δmin ist wohldefiniert, da ∼L rechtsinvariant ist: gilt y ∈ [x]∼L , so ist xu ∼L yu 

für alle u ∈ Σ ∗ , also insbesondere xa ∼L ya und [xa]∼L = [ya]∼L für a ∈ Σ. 

– z0min = [ε]∼L . 

– Emin = {[x]∼L | x ∈ L}. 

Mmin akzeptiert L, denn: 

x ∈ L(Mmin) ⇔ z0minx ∈ Emin ⇔ [ε]∼L · x ∈ Emin ⇔ [x]∼L 

 

=[εx]=[x] 

∈ Emin ⇔ x ∈ L 

Korollar (Satz von Myhill-Nerode, 1957/58): Eine Sprache L ⊆ Σ ∗ ist regulär gdw. 

∼L endlichen Index hat. 

Beispiel: L = {a n b n | n ≥ 0} 

Für i = j ist a i ≁L a j , denn a i b i ∈ L, aber a j b i /∈ L. Somit existieren unendlich viele 

verschiedene Äquivalenzklassen [ε], [a], [aa], [aaa], . . . und L ist nicht regulär. 

Beispiel: L = {x ∈ {0, 1} ∗ | x endet mit 00} 

– [ε]∼L = {x | x endet nicht mit 0} 

Sei x = y1 für ein y ∈ {0, 1} ∗ . Dann gilt x ∼L ε, denn für w ∈ Σ ∗ gilt: 

xw ∈ L ⇔ w = w ′ 00 für ein geeignetes w ′ ⇔ ε · w = w ∈ L. 

Sei x = y0 für ein y ∈ {0, 1} ∗ . Dann gilt x ≁L ε, denn x0 ∈ L und ε · 0 = 0 /∈ L. 

– [0]∼L = {x | x endet mit 0, aber nicht mit 00} 

– [00]∼L = {x | x endet mit 00}

1.3 Minimalautomaten 6 

Da [ε]∼L ∪ [0]∼L ∪ [00]∼L = {0, 1}∗ , sind dies alle Äquivalenzklassen. Damit ist der 

Index von ∼L gleich 3 und L regulär. Der (minimaler) endlicher Automat Mmin für L 

ist: 

1 

0 0 

[ε] [0] 

1 

1 

δ Eingabezeichen 

0 1 

Zustand 

[ε]∼L 

[0]∼L 

[00]∼L 

[0]∼L 

[00]∼L 

[000]∼L 

[ε1]∼L = [1]∼L = [ε]∼L 

[01]∼L = [ε]∼L 

= [00]∼L [001]∼L = [ε]∼L 

1.3 Minimalautomaten 

Satz: Sei L regulär. Dann gibt es einen bis auf Isomorphie eindeutigen deterministischen 

Minimalautomaten (d. h. DEA mit minimaler Anzahl von Zuständen), der L 

akzeptiert. 

Beweis: Wir zeigen, dass der Automat Mmin aus dem letzten Beweis der eindeutige 

Minimalautomat ist. 

(i) Mmin hat minimale Zustandsanzahl. 

Im Beweis zeigte sich folgendes: Aus einem beliebigen DEA M = (Z, Σ, δ, z0, E) 

für L konstruieren wir ≈M mit Index ≤ |Z|. Außerdem gilt: 

[00] 

|Zmin| = Index von ∼L ≤ Index von ≈M ≤ |Z|. 

Mmin hat also nicht mehr Zustände als M. 

(ii) Mmin ist eindeutig. Wir zeigen: 

Ist M = (Z, Σ, δ, z0, E) ein DEA mit L(M) = L(Mmin) und |Z| = |Zmin|, so sind 

M und Mmin isomorph. 

Ist z ∈ Z, dann wähle x ∈ Σ ∗ so, dass z0 · x = z (x muss existieren, da M wegen 

der Minimalität keine nicht erreichbaren Zustände besitzt). z entspricht in Mmin 

dem Zustand zmin = z0min · x = [ε]∼L x. 

0


Der Isomorphismus z ↦→ zmin ist wohldefiniert, denn ist y = x mit z0x = z0y = z, 

dann ist x ≈M y, also auch x ∼L y und damit 

z0min · x = [ε]∼L · x = [x]∼L = [y]∼L = z0min · y. 

Man zeigt leicht, dass die definierte Abbildung bijektiv ist. 

Algorithmus zur Bestimmung des Minimalautomaten: 

Gegeben: DEA M = (Z, Σ, δ, z0, E), o. B. d. A. seien alle Zustände in M vom Startzustand 

aus erreichbar. 

(i) Stelle Tabelle aller Paare {z, z ′ } mit z = z ′ und z, z ′ ∈ Z auf. 

(ii) Markiere alle Paare {z, z ′ } mit z ∈ E und z ′ /∈ E. 

(iii) Wiederhole folgenden Schritt, solange sich Änderungen in der Tabelle ergeben: 

(iv) Falls es ein unmarkiertes Paar {z, z ′ } und ein a ∈ Σ gibt, sodass {δ(z, a), δ(z ′ , a)} 

markiert ist, so markiere {z, z ′ }. 

(v) Verschmelze unmarkierte Paare zu jeweils einem Zustand. 

Der Algorithmus hat eine Laufzeit von O(|Z| 4 · |Σ|), also polynomielle Laufzeit in der 

Länge der Kodierung des Eingabeautomatens. Durch eine geschicktere Implementierung 

mit priorisierten Warteschlangen erreicht man eine Laufzeit von O(|Z| 2 · |Σ|). 

Beispiel: Gegeben sei folgender deterministischer Automat: 

1 1 

Dies führt auf folgende Tabelle: 

0 0 

z0 z1 z4 

z2 

0 

1 

1 

z3 

0 

0, 1


Es ergibt sich folgender Minimalautomat: 

z0, z2 

z1 

z2 

z3 

z4 

0 

z0 

z1 

z1, z3 

1 

1 0, 1 

Korollar: Das Äquivalenzproblem für reguläre Sprachen, also das Problem 

ist in Polynomialzeit entscheidbar. 

Gegeben: DEAs M1, M2 

Frage: Ist L(M1) = L(M2)? 

Beweis: Folgender Algorithmus leistet das Gewünschte: 

(i) M1min := Minimalautomat zu M1. 

(ii) M2min := Minimalautomat zu M2. 

(iii) Ausgabe ” ja“ gdw. M1min isomorph zu M2min. 

Im Falle von nichtdeterministischen endlichen Automaten gilt Folgendes: 

– Die Eindeutigkeit von minimalen nichtdeterministischen Automaten ist nicht gegeben. 

– Das Äquivalenzproblem für NEAs ist PSPACE-vollständig. 

– Das folgende Problem ist ebenfalls PSPACE-vollständig: 

Gegeben: NEA M, k ∈ N 

Frage: Gibt es einen NEA Mmin mit höchstens k Zuständen, sodass 

L(Mmin) = L(M)? 

z2 

0 

z3 

z4

1.4 Automaten und Halbgruppen 9 

1.4 Automaten und Halbgruppen 

Beobachtung: Zu jedem Alphabet Σ bildet Σ ∗ mit der Verknüpfung Konkatenation 

einen Monoid (d. h. das Assoziativgesetz gilt und ein Einselement existiert), und Σ + 

mit der Konkatenation eine Halbgruppe. 

Definition: Sei L ⊆ Σ ∗ . Definiere x ≡L y gdw. für alle u, v ∈ Σ ∗ gilt: 

uxv ∈ L ⇔ uyv ∈ L 

Beobachtung: ≡L ist eine Kongruenz auf Σ ∗ (d. h. x ≡L y ⇒ ∀u, v ∈ Σ ∗ : uxv ≡L 

uyv). 

Definition: Sei L ⊆ Σ ∗ . 

– ≡L heißt syntaktische Kongruenz von L. 

– Mon(L) = (Σ ∗ / ≡L, ◦) heißt syntaktisches Monoid von L mit der Operation 

[x]≡L ◦ [y]≡L = [x · y]≡L. Der zugehörige natürliche Homomorphismus 

heißt syntaktischer Homomorphismus. 

ηL : Σ ∗ → Mon(L), x ↦→ [x]≡L 

Beispiel: L = {w ∈ {0, 1} ∗ | |w| ≡ 0 (mod 2)} 

Es gilt: x ≡L y ⇔ |x| ≡ |y| (mod 2). Es gibt also zwei Äquivalenzklassen: [ε] und [0]. 

◦ [ε] [0] 

[ε] [ε] [0] 

[0] [0] [ε] 

Mon(L) ist isomorph zur Gruppe der Ordnung 2. 

 

[ε], falls |x| gerade ist, 

ηL(x) = 

[0], sonst. 

Beispiel: L = {w ∈ {0, 1} ∗ | |w| 1 ≡ 0 (mod 2)} 

Es gilt: x ≡L y ⇔ |x| 1 ≡ |y| 1 (mod 2). Es gibt also die Äquivalenzklassen [ε] und [1]. 

◦ [ε] [1] 

[ε] [ε] [1] 

[1] [1] [ε] 

Mon(L) ist erneut isomorph zur Gruppe der Ordnung 2. 

 

[ε], falls |x| 1 gerade ist, 

ηL(x) = 

[0], sonst.

1.4 Automaten und Halbgruppen 10 

Satz: Sei L ⊆ Σ ∗ . L ist regulär gdw. Mon(L) ist endlich. 

Beweis: ” ⇒“: Sei L = L(M) und M = (Z, Σ, δ, z0, E). Definiere die Äquivalenzrelation 

∼= auf Σ ∗ wie folgt: 

x ∼ = y ⇔ für alle z ∈ Z gilt: zx = zy 

Die Anzahl der Äquivalenzklassen von ∼ = ist ≤ |Z| |Z| (jede Äquivalenzklasse ist festgelegt 

durch eine Abbildung Z → Z). Wir zeigen: ∼ = ist eine Verfeinerung von ≡L, d. h. 

für jedes x ∈ Σ ∗ gilt: [x]∼ = ⊆ [y]≡L . Dann ist der Index von ≡L nicht größer als der 

von ∼ =, also ist Mon(L) endlich. 

Sei x ∼ = y und seien u, v ∈ Σ ∗ . Ist uxv ∈ L, dann gilt 

z0 · uxv = ((z0u)x)v = ((z0u)y)v = z0(uyv) ∈ E, 

also uyv ∈ L. Genauso kann man zeigen: uyv ∈ L ⇒ uxv ∈ L. Also: x ≡L y. 

” ⇐“: Sei nun Mon(L) endlich. Definiere DEA 

M = (Σ ∗ / ≡L, Σ, δ, [ε]≡L, {[w]≡L | w ∈ L}), 

wobei δ([w]≡L , a) = [wa]≡L . Es gilt also: 

Also ist L regulär. 

w ∈ L(M) ⇔ [ε]≡L · w ∈ E = [w]≡L ∈ E ⇔ w ∈ L. 

Definition: Sei M = (Z, Σ, δ, z0, E) ein DEA. Für w ∈ Σ ∗ definiere fw : Z → Z durch 

fw(z) = z · w. 

Die Menge aller solcher Abbildungen {fw | w ∈ Σ ∗ } bildet zusammen mit der Verknüpfung 

fx · fy = fxy ein Monoid, das so genannnte Transitionsmonoid von M, und wird 

bezeichnet mit Mon(M). 

Satz: Ist M der Minimalautomat für L, so sind Mon(M) und Mon(L) isomorph. 

Beweis: Sei M = (Z, Σ, δ, z0, E) ein Minimalautomat für L. Es reicht zu zeigen: fx = 

fy gdw. x ≡L y. Dann sind Mon(M) und Mon(L) isomorph vermöge des folgenden 

Isomorphismus: 

π : Mon(M) → Mon(L), π(fx) = [x]≡L . 

” ⇒“: Sei fx = fy. Seien u und v beliebig. Dann gilt: 

uxv ∈ L ⇔ z0 · uxv ∈ E 

⇔ ((z0u)x)v ∈ E 

⇔ ((z0u)y)v ∈ E 

⇔ z0(uyv) ∈ E 

⇔ uyv ∈ L,

1.5 Endliche Automaten mit Ausgabe 11 

also x ≡L y. (Man beachte, dass hier die Minimalität von M nicht benötigt wird.) 

” ⇐“: Sei x ≡L y. Wähle z ∈ Z. Sei u ∈ Σ ∗ so, dass z0 · u = z. Existiert kein solches 

u, so ist z nicht erreichbar, also M nicht minimal. Setze z1 = fx(z) = zx = z0ux und 

z2 = fy(z) = zy = z0uy. 

Aus 

 

ux v ∈ L ⇔ uy 

 

v folgt 

=z1=z0ux 

=z2=z0uy 

z1v ∈ E ⇔ z2v ∈ E 

für alle v ∈ Σ ∗ . Da M minimal ist, folgt also z1 = z2. Da z ∈ Z beliebig gewählt war, 

folgt fx = fy. 

Bemerkung: Die Umkehrung des Satzes gilt nicht. Obige Beispiele betreffen verschiedene 

Sprachen, also mit verschiedenen Minimalautomaten, deren syntaktische Monoide 

gleich sind. 

1.5 Endliche Automaten mit Ausgabe 

Definition: Eine Moore-Maschine ist ein 6-Tupel 

wobei 

M = (Z, Σ, ∆, δ, λ, z0), 

– Z, Σ, δ und z0 sind wie bei DEAen definiert sind, 

– ∆ das Ausgabealphabet und 

– λ: Z → ∆ die Ausgabefunktion ist. 

Die Ausgabe von M bei Eingabe eines Wortes w = a1 . . . an ist 

TM (w) = λ(z0)λ(z1) . . . λ(zn), 

wobei zi = δ(zi−1, ai) für 1 ≤ i ≤ n. TM : Σ ∗ → ∆ ∗ heißt die von M berechnete 

Funktion. 

Definition: Eine Mealy-Maschine ist ein 6-Tupel 

wobei 

M = (Z, Σ, ∆, δ, λ, z0), 

– Z, Σ, ∆, δ und z0 sind wie bei Moore-Maschinen definiert sind und 

– λ: Z × Σ → ∆ die Ausgabefunktion ist.


Die Ausgabe von M bei Eingabe eines Wortes w = a1 . . . an ist 

TM (w) = λ(z0, a1)λ(z1, a2) . . . λ(zn−1, an), 

wobei zi = δ(zi−1, ai) für 1 ≤ i ≤ n. TM : Σ ∗ → ∆ ∗ heißt die von M berechnete 

Funktion. 

Bemerkung: – Ist M eine Moore-Maschine, so ist |Tn(w)| = |w| + 1. 

– Ist M eine Mealy-Maschine, so ist |Tn(w)| = |w|. 

Definition: Sei M eine Moore- oder Mealy-Maschine mit Ausgabealphabet ∆ = 

{0, 1}. Ein Wort w heißt von M akzeptiert, falls TM (w) = (0 + 1) ∗ 1. 

Beispiel: Betrachte die Sprache (0 + 1) ∗ (00 + 11). Folgender Minimalautomat akzeptiert 

L: 

z0 

Folgende Mealy-Maschine akzeptiert L: 

Dabei bedeutet die Notation 

0 

1 

z0 

0 

0 

1 

0/0 

1/0 

1 

0 

0 

1 

1 

0 

0/0 1/0 

z z ′ 

a/b 

dass δ(z, a) = z ′ und λ(z, a) = b für z, z ′ ∈ Z, a ∈ Σ, b ∈ ∆. 

Definition: Sei M = (Z, Σ, ∆, δ, λ, z0) eine Moore-Maschine und M ′ = (Z ′ , Σ, ∆, δ ′ , 

λ ′ , z0 ′ ) eine Mealy-Maschine. Sei b = λ(z0) = TM (ε). M und M ′ heißen äquivalent, 

falls für alle w ∈ Σ ∗ gilt: 

b ◦ TM ′(w) = TM (w). 

1 

0/1 

1/1 

00 

11 

0 

1


Satz: Sei M1 = (Z, Σ, ∆, δ, λ, z0) eine Moore-Maschine. Dann gibt es eine äquivalente 

Mealy-Maschine M2. 

Beweis: Wir setzen M2 = (Z, Σ, ∆, δ, λ ′ , z0) mit λ ′ (z, a) = λ(δ(z, a)) für alle z ∈ Z 

und a ∈ Σ. 

Satz: Sei M1 = (Z, Σ, ∆, δ, λ, z0) eine Mealy-Maschine. Dann gibt es eine äquivalente 

Moore-Maschine M2. 

Beweis: Wir setzen M2 = (Z × ∆, Σ, ∆, δ ′ , λ ′ , z0 ′ ), wobei 

– z0 ′ = (z0, b0) für ein beliebiges b0 ∈ ∆, 

– δ ′ ((z, b), a) = (δ(z, a), λ(z, a)) für z ∈ Z, a ∈ Σ, b ∈ ∆ und 

– λ ′ ((z, b)) = b für z ∈ Z, b ∈ ∆. 

Beispiel: Betrachte wieder die Mealy-Maschine aus dem letzten Beispiel: 

z0 

0/0 

1/0 

Die äquivalente Moore-Maschine ist dann: 

(z0, 0) 

0 

1 

1 

(0, 0) 

(1, 0) 

0 

0/0 1/0 

0 

1 

0 

1 

1 

0 

0/1 

1/1 

(0, 1) 

(1, 1) 

Diese Maschine ist isomorph zum Minimalautomaten aus dem vorherigen Beispiel. 

Wir möchten im Folgenden eine Charakterisierung der von Mealy-Maschinen berechenbaren 

Funktionen angeben. 

0 

1


Definition: Sei M = (Z, Σ, ∆, δ, λ, z0) eine Mealy-Maschine. Die erweiterte Ausgabefunktion 

ˆ λ ist definiert durch: 

ˆλ(z, ε) = ε für alle z ∈ Z, 

ˆλ(z, xa) = ˆ λ(z, x) ◦ λ( ˆ δ(z, x), a) für alle z ∈ Z, x ∈ Σ ∗ , a ∈ Σ. 

Bemerkung: Es gilt: TM (w) = ˆ λ(z0, w). 

Definition: Sei f : Σ ∗ → ∆ ∗ . 

– f heißt längenerhaltend, falls |f(w)| = |w| für alle w ∈ Σ ∗ . 

– f heißt sequentiell, falls für alle v, w ∈ Σ ∗ gilt: 

f(wv) hat als Präfix f(w), 

d. h. es existiert ein u ∈ ∆ ∗ , sodass f(wv) = f(w)u. Definiere fw : Σ ∗ → ∆ ∗ so, 

dass f(wv) = f(w) · fw(v), also in obiger Notation: fw(v) = u. 

– Ist f sequentiell, so ist das Gewicht von f die Anzahl der verschiedenen Funktionen 

fw über alle w ∈ Σ ∗ . 

Satz: Eine totale Funktion f : Σ ∗ → ∆ ∗ ist genau dann von einer Mealy-Maschine 

berechenbar, wenn sie längenerhaltend, sequentiell und von endlichem Gewicht ist. 

Beweis: ” ⇒“: Sei M = (Z, Σ, ∆, δ, λ, z0) eine Mealy-Maschine mit f = TM . f ist 

längenerhaltend. 

Es gilt: 

f(wv) = TM (wv) = ˆ λ(z0, wv) Induktion 

= ˆ λ(z0, w) · ˆ λ( ˆ δ(z0, w), v) = f(w) · ˆ λ( ˆ δ(z0, w), v), 

also ist f sequentiell. 

Weiterhin ist fw(v) = ˆ λ( ˆ δ(z0, w) , v), folglich gibt es höchstens |Z| viele Funktionen fw. 

 

∈Z 

” ⇐ “: Sei f längenerhaltend, sequentiell und von endlichem Gewicht. Definiere M = 

(Z, Σ, ∆, δ, λ, z0) wie folgt: 

– Z = {fw | w ∈ Σ ∗ } (endlich, da f von endlichem Gewicht) 

– z0 = fε 

– δ(fw, a) = fwa für alle w ∈ Σ ∗ , a ∈ Σ 

(Für v, w ∈ Σ ∗ , v = w, aber fv = fw gilt: fwa 

– λ(fw, a) = fw(a) für alle w ∈ Σ ∗ und a ∈ Σ 

Induktion 

Induktion 

= (fw)a = (fv)a = fva.)

1.6 Zwei-Weg-Automaten 15 

Behauptung A: Für alle w ∈ Σ ∗ ist ˆ δ(fε, w) = fw. 

Beweis der Behauptung durch Induktion über |w|: 

|w| = 0: ˆ δ(fε, ε) = fε 

|w| > 0, w = xa für x ∈ Σ∗ und a ∈ Σ: 

ˆδ(fε, xa) = δ( ˆ δ(fε, x), a) Definition von ˆ δ 

= δ(fx, a) Nach Induktionsvoraussetzung 

= fxa 

Definition von δ 

Behauptung B: Für alle w ∈ Σ ∗ ist ˆ λ(fε, w) = f(w). 

Beweis der Behauptung durch Induktion über |w|: 

|w| = 0: ˆ λ(fε, ε) = ε = f(ε), nach Definition von ˆ λ und da f längenerhaltend ist. 

|w| > 0, w = xa für x ∈ Σ ∗ und a ∈ Σ: 

ˆλ(fε, xa) = ˆ λ(fε, x) ◦ λ( ˆ δ(fε, x), a) Definition von ˆ λ 

= f(x) ◦ λ( ˆ δ(fε, x), a) Nach Induktionsvoraussetzung 

= f(x) ◦ λ(fx, a) Behauptung A 

= f(x) ◦ fx(a) Definition von M 

= f(xa) f sequentiell 

Insgesamt folgt damit: 

für alle w ∈ Σ ∗ . 

1.6 Zwei-Weg-Automaten 

TM (w) = ˆ λ(z0, w) = ˆ λ(fε, w) = f(w) 

Das Berechnungsmodell der endlichen Automaten lässt nur Kopfbewegungen in eine 

Richtung zu. Ein Zwei-Weg-Automat stellt ein verallgemeinertes Berechnungsmodell 

dar, bei dem der Kopf auf der Eingabe in beiden Richtungen laufen darf. Die Eingabe 

darf links nicht verlassen werden. Die Rechnung endet, falls die Eingabe nach rechts 

verlassen wird. In diesem Fall wird akzeptiert, falls sich der Automat dann in einem 

Endzustand befindet. 

Es stellt sich die Frage, inwiefern diese Verallgemeinerung die Berechnungskraft erhöht. 

Definition: Ein deterministischer Zwei-Weg-Automat (kurz: 2DEA) ist ein 5-Tupel 

wobei 

M = (Z, Σ, δ, z0, E), 

– Z, Σ, z0 und E wie bei DEAen definiert sind und


– δ : Z × Σ → Z × {L, R} die Überführungsfunktion ist. 

Eine Konfiguration von M ist ein Element aus Σ ∗ · Z · Σ ∗ . Eine Konfiguration wzx ∈ 

Σ ∗ · Z · Σ ∗ repräsentiert dabei folgende Situation von M: 

– Eingabewort ist wx, 

– Zustand ist z und 

– der Kopf steht auf dem ersten Zeichen von x. 

Ist x = ε, so hat der Kopf die Eingabe rechts verlassen. 

Wir definieren nun, wie M bei Eingabe w = a1 · · · an in einem Schritt von Konfiguration 

K in Konfiguration K ′ übergeht, in Zeichen K ⊢M K ′ : 

a1 · · · ai−1zaiai+1 · · · an ⊢M a1 · · · ai−1aiz ′ ai+1 · · · an, falls δ(z, ai) = (z ′ , R), 

a1 · · · ai−2ai−1zai · · · an ⊢M a1 · · · ai−2z ′ ai−1ai · · · an, falls δ(z, ai) = (z ′ , L), i ≥ 2. 

Bemerkung: In Konfiguration za1 · · · an ist keine Kopfbewegung nach links, in Konfiguration 

a1 · · · anz gar keine Kopfbewegung mehr möglich. 

Definition: Sei ⊢ ∗ M die reflexive und transitive Hülle von ⊢M . Die von einem 2DEA 

M = (Z, Σ, δ, q0, E) akzeptierte Sprache L(M) ist definiert als 

L(M) = {w ∈ Σ ∗ | z0w ⊢ ∗ M wz für ein z ∈ E}. 

Beispiel: Sei M = ({z0, z1, z2}, {0, 1}, δ, z0, {z0, z1, z2}) ein 2DEA mit δ definiert wie 

folgt: 

δ 0 1 

z0 (z0, R) (z1, R) 

z1 (z1, R) (z2, L) 

z2 (z0, R) (z2, L) 

Bei Eingabe 101001 vollzieht M die Rechnung 

M akzeptiert, da z1 ∈ E. 

z0101001 ⊢M 1z101001 

⊢M 10z11001 

⊢M 1z201001 

⊢M 10z01001 

⊢M 101z1001 

⊢M 1010z101 

⊢M 10100z11 

⊢M 1010z201 

⊢M 10100z01 

⊢M 101001z1


Rechnungen werden visualisiert durch den Pfad des Kopfes über der Eingabe, wobei 

wir für jede Bewegung von einem Symbol zum nächsten den momentanen Zustand 

ausgeben: 

z0 

1 0 1 0 0 1 

z1 

z1 

z2 

z0 z1 z1 z1 

Betrachtet man die Eingabe 101101 so vollzieht M die Rechnung 

z0 

z2 

z0 

1 0 1 1 0 1 

z1 

z1 

z2 

z0 

z2 

z0 

z1 

z2 

M gerät in eine Endlosschleife, da unter der zweiten Zellgrenze von links der gleiche 

Zustand und die gleiche Kopfbewegung wie 4 Schritte zuvor auftreten. 

Bemerkung: Obiger Automat hat nur Endzustände, akzeptiert aber nicht die Sprache 

{0, 1} ∗ , sondern (0 + 1) ∗ 11(0 + 1) ∗ . 

Beobachtung: Ist L regulär, so gibt es einen 2DEA M mit L(M) = L. 

 

 

 

 

Beispiel: Sei Ln = akak−1 · · · an · · · a1 ai ∈ {0, 1} für 1 ≤ i ≤ k und an = 1 für 

0 < n ∈ N. 

– Jeder DEA M mit L(M) = Ln hat mindestens 2 n Zustände. 

(Myhill-Nerode: Für u, v ∈ {0, 1} n mit u = v gilt u ≁Ln v.) 

– Es gibt einen 2DEA M mit 2n − 1 Zuständen mit L(M) = Ln. 

(Übungsaufgabe) 

Wir nennen die Folgen von Zuständen unter einer Zellgrenze eine crossing sequence. 

Eine gültige crossing sequence (kurz: GCS) ist eine crossing sequence, die in einer 

akzeptierenden Rechnung vorkommt. GCS besitzen folgende Eigenschaften: 

z1


– Eine GCS ist von ungerader Länge, wobei die Leserichtung des Kopfes rechts 

für ungerade und links für gerade Positionen ist (insgesamt muss der Kopf nach 

rechts aus der Eingabe herauslaufen). 

– Eine GCS enthält keinen Zustand zweimal auf gerader Position oder zweimal auf 

ungerader Position. Folglich ist die Länge einer GCS < 2|Z|. 

Die Anzahl aller GCS ist damit < |Z| 2|Z| , also endlich! 

Eine crossing sequence c1 heißt rechtsverträglich zur crossing sequence c2 über a ∈ Σ, 

falls folgendes lokal möglich ist: 

Startet M von links über die zu c1 gehörige Zellgrenze, so kann c1 als crossing 

sequence, a als gelesenes Zeichen und c2 als crossing sequence für die nächste 

Zellgrenze auftreten. 

Analog heißt c1 zu c2 über a linksverträglich, wenn M von rechts über die zu c2 gehörige 

a 

a 

Zellgrenze kommt. In Zeichen: c1 ↦→ c2, c1 ← c2. 

Formal: 

(1) Die leere Sequenz ist rechts- und linksverträglich zur leeren Sequenz: Wird die 

linke Zellgrenze nie erreicht, so auch die Rechte nicht. 

() a 

↦→ (), () a ← () 

(2) Falls (z3, . . . , zk) a 

↦→ (z ′ 1, · · · , z ′ l ) und δ(z1, a) = (z2, L), so ist auch 

(z1, . . . , zk) a 

↦→ (z ′ 1, · · · , z ′ l) 

(3) Falls (z2, . . . , zk) a ← (z ′ 2, · · · , z ′ l ) und δ(z1, a) = (z ′ 1, R), so ist auch 

(z1, . . . , zk) a 

↦→ (z ′ 1, · · · , z ′ l) 

(4) Falls (z1, . . . , zk) a ← (z ′ 3, · · · , z ′ l ) und δ(z′ 1, a) = (z ′ 2, R), so ist auch 

(z1, . . . , zk) a ← (z ′ 1, · · · , z ′ l) 

(5) Falls (z2, . . . , zk) a 

↦→ (z ′ 2, · · · , z ′ l ) und δ(z′ 1, a) = (z1, L), so ist auch 

(z1, . . . , zk) a ← (z ′ 1, · · · , z ′ l) 

Satz: Sei L ⊆ Σ ∗ . Gibt es einen 2DEA M mit L(M) = L, so ist L regulär.


z1 

z2 

z3 

zk 

a 

z ′ 1 

z ′ l 

Regel (2) 

z1 

zk 

a 

z ′ z 

3 

′ z 

2 

′ 1 

z ′ l 

Regel (4) 

z1 

z2 

zk 

$z_k$ 

a 

z ′ 1 

z ′ 2 

z ′ l 

Regel (3) 

z1 

z2 

zk 

$z_k$ 

a 

z ′ 1 

z ′ 2 

z ′ l 

Regel (5) 

Beweis: Sei M = (Z, Σ, δ, z0, E). Wir definieren einen NEA M ′ = (Z ′ , Σ, δ ′ , z ′ 0, E ′ ) wie 

folgt: 

– Z ′ = {c | c ist eine GCS}, 

– z ′ 0 = (z0), 

– E ′ = {(z) | z ∈ E}, 

– δ ′ (c, a) = {d | c a 

↦→ d}. 

Behauptung: L(M) = L(M ′ ) 

Beweis der Behauptung: ” ⊆“: Sei w ∈ L(M), w = a1 · · · an, |w| = n. Betrachte die 

Folge c0, c1, . . . , cn aller crossing sequences der akzeptierenden Rechnung von M auf 

w. Es gilt: 

– c0 = (z0), 

– cn = (z) für ein z ∈ E, 

– ci−1 

ai 

↦→ ci für 1 ≤ i ≤ n.


Also ist die Zustandsfolge c0, . . . , cn eine akzeptierende Rechnung von M ′ auf w, also 

w ∈ L(M ′ ). 

” ⊇“: Sei w ∈ L(M ′ ), w = a1 · · · an. Sei c0, c1, . . . , cn die Folge von Zuständen auf einem 

akzeptierenden Pfad von M ′ auf w. Es gilt: 

– c0 = (z0), 

– cn = (z) für ein z ∈ E, 

– ci−1 

ai 

↦→ ci für 1 ≤ i ≤ n. 

Wie beweisen durch Induktion über i: Wenn M ′ durch Lesen von a1 · · · ai den Zustand 

ci = (z1, . . . , zk), k ∈ N erreichen kann, dann gilt: 

(i) M in z0 gestartet bei Eingabe a1 · · · ai läuft zum ersten Mal rechts aus ai heraus 

im Zustand z1. 

(ii) Für j = 2, 4, . . . , k − 1 gilt: M gestartet in zj auf Eingabezeichen ai bei Eingabewort 

a1 · · · ai läuft zum ersten Mal rechts aus ai heraus im Zustand zj+1. 

Da cn = (z) für z ∈ E, wird dann w von M akzeptiert. 

Induktion: 

i = 0: c0 = (z0), M beginnt seine Rechnung in z0. 

i > 0: M ′ erreiche den Zustand ci = (z ′ 1, . . . , z ′ l ) durch Lesen der Eingabe a1 · · · ai. 

Der Vorgängerzustand sei ci−1 = (z1, . . . , zk). 

ai 

Da k, l ungerade und ci−1 ↦→ ci existiert ein ungerades j, sodass gilt: M in 

Zustand zj bei Eingabe ai bewegt sich nach rechts. Sei j1 das kleinste solche j 

(siehe Abbildung 1.1). Nach Definition von ↦→ (Regeln 3, 4) folgt dann: 

Damit ist (i) beweisen. 

δ(zj1, ai) = (z ′ 1, R). 

Außerdem folgt nach Definition von ↦→, ←, dass (zj1+1, . . . , zk) ai 

, R) für j = 2, 4, . . . l − 1 (siehe Abbildung 1.2), so gilt (ii). 

Falls δ(z ′ j , ai) = (z ′ j+1 

← (z ′ 2, . . . , z ′ l ). 

Andernfalls gilt δ(z ′ j , ai) = (z, L) für ein z ∈ Z und ein 2 ≤ j ≤ k − 1 

(siehe Abbildung 1.3). Sei j2 das kleinste solche j. Dann ist z = zj1+1 und 

(zj1+2, . . . , zk) ai 

↦→ (z ′ j2+1 , . . . , z′ l ). Die Argumentation verläuft nun wie oben mit 

ci−1 = (zj1+2, . . . , zk) und ci = (zj2+1, . . . , z ′ l ).


z0 

a1 

z1 

z2 

zj1 

zk 

ai 

z ′ 1 

z ′ l 

z ′ l 

Abbildung 1.1 

an 

z ∈E 

2 Kontextfreie Sprachen 

zj1 

ai 

z ′ z 

3 

′ z 

2 

′ 1 

z ′ 4 

z ′ 5 

z ′ l 

Abbildung 1.2 

zj1 

ai 

z ′ z 

3 

′ z 

2 

′ 1 

z ′ zj1+1 j2 

zj1+2 z ′ j2+1 

zk 

z ′ l 

Abbildung 1.3 

Kontextfreie Sprachen werden durch kontextfreie Grammatiken definiert. Eine kontextfreie 

Grammatik (kurz: kf. Grammatik, CFG) ist ein 4-Tupel 

wobei 

G = (V, Σ, P, S), 

– V eine endliche Menge von Variablen (Nicht-Terminalsymbolen), 

– Σ das Terminalalphabet, V ∩ Σ = ∅, 

– P ⊆ V × (V ∪ Σ) ∗ eine Menge von Produktionen/Regeln und 

– S ∈ V das Startsymbol ist. 

Eine kontexfreie Grammatik heißt in Normalform, falls 

P ⊆ (V × (V \ {S} ∪ Σ) + ) ∪ {S → ε}. 

Zu jeder kontextfreien Grammatik gibt es eine kontextfreie Grammatik G ′ in Normalform 

mit L(G) = L(G ′ ). 

Schreibweisen: 

Für (α, β) ∈ P schreiben wir α → β ∈ P 

Für A → α1 ∈ P, . . . , A → αn ∈ P kurz: A → α1| · · · |αn ∈ P . 

α ⇒G β: β entsteht aus α durch Anwendung einer Regel aus P , d. h. α ⇒G β, falls 

es α1, α2 ∈ (V ∪ Σ) ∗ und A → γ ∈ P gibt, sodass α = α1Aα2 und β = α1γα2. 

⇒ ∗ G 

ist die reflexive und transitive Hülle von ⇒G.


Eine Ableitung ist eine Folge von Satzformen, die aus der Startvariablen einer Grammatik 

ein Wort über deren Terminalalphabet ableitet, d. h. eine Folge 

S ⇒G w1 ⇒G w2 ⇒G . . . ⇒G wn mit wi ∈ (V ∪ Σ) ∗ , 1 ≤ i < n und wn ∈ Σ ∗ . 

Die von der kontextfreien Grammatik erzeugte Sprache ist 

L(G) = {w ∈ Σ ∗ | S ⇒ ∗ G w}. 

CFL ist die Klasse der kontextfreien Sprachen, d. h. die Klasse aller L(G) für kontextfreie 

Grammatiken G. 

Satz (Pumping-Lemma, uvwxy-Theorem): Sei L eine kontextfreie Sprache. Dann gibt 

es eine Zahl n, sodass sich alle Wörter z ∈ L mit |z| ≥ n zerlegen lassen in z = uvwxy, 

sodass folgende Eigenschaften erfüllt sind: 

(i) |vx| ≥ 1 

(ii) |vwx| ≤ n 

(iii) Für alle i ≥ 0 gilt: uv i wx i y ∈ L 

Beispiel: – Dyck-Sprache über dem Alphabet Σ: 

Setze Σ ′ = {ā | a ∈ Σ} ( ” Kopie“ von Σ) und ˆ Σ = Σ ∪ Σ ′ . D ∗ Σ 

von der Grammatik 

erzeugt wird, wobei 

G = ({S, T }, ˆ Σ, P, S) 

P = {S → T S|ε} ∪ {T → aSā | a ∈ Σ}. 

Sei z. B. Σ = {(, [, }. D∗ Σ 

Klammergebirge mit Klammern aus ˆ Σ. Ein Wort aus D∗ Σ ist 

(< []() > [])[< ()() >]. 

– L = {w ∈ Σ ∗ | w = w R , d. h. w ist ein Palindrom} ∈ CFL: 

ist die Sprache, die 

ist die Sprache aller korrekten 

Die kontextfreie Grammatik G = ({S}, Σ, {S → aSa|a|ε a ∈ Σ}, S) erzeugt L. 

– L = {a k b k c k | k ≥ 0} ist nicht kontextfrei: 

Angenommen L wäre kontextfrei. Dann existiert n ∈ N wie im Pumping-Lemma. 

Wähle z = a n b n c n . Es gilt |z| = 3n ≥ n und z ∈ L. Sei z = uvwxy eine beliebige 

Zerlegung von z mit |vx| > 0 und |vwx| ≤ n. 

z = a . . . a b . . . b c . . . c = a n b n c n 

vwx =

2.1 Chomsky-Normalform und CYK-Algorithmus 23 

Daraus ergibt sich: In vwx kommen höchstens zwei der drei Buchstaben a, b und 

c vor. Es folgt 

uv 0 wx 0 y = uwy /∈ L 

und das ist ein Widerspruch zur Annahme, dass L kontextfrei ist. 

Abschlusseigenschaften 

– L, L ′ ∈ CFL ⇒ L ∪ L ′ , L ◦ L ′ , L ∗ ∈ CFL: 


– CFL ist abgeschlossen unter Homomorphismen und inversen Homomorphismen: 


– CFL ist nicht abgeschlossen unter Durchschnitt: 

Sei L1 = {a n b n c m | n, m ≥ 0} und L2 = {a n b m c m | n, m ≥ 0}. Es ist L1, L2 ∈ 

CFL, denn eine kontextfreie Grammatik für L1 ist G = ({S, A, B}, {a, b, c}, P, S) 

mit den Produktionen 

S → AB, A → aAb|ε, B → cB|ε. 

Für den Durchschnitt L1 ∩ L2 gilt jedoch L1 ∩ L2 = {a k b k c k | k ≥ 0} /∈ CFL 

(gemäß obigem Beispiel). 

– CFL ist nicht abgeschlossen unter Komplement: 

Annahme doch, dann wäre CFL abgeschlossen unter Durchschnitt (nach de Morgan) 

und das ist ein Widerspruch. 

2.1 Chomsky-Normalform und CYK-Algorithmus 

Definition: Eine kontextfreie Grammatik G = (V, Σ, P, S) mit ε /∈ L heißt in Chomsky- 

Normalform (CNF), falls alle Regeln von der Form 

für A, B, C ∈ V und a ∈ Σ sind. 

A → BC oder A → a 

Satz: Sei G eine kontextfreie Grammatik mit ε /∈ L(G). Dann gibt es eine kontextfreie 

Grammatik G ′ in CNF mit L(G) = L(G ′ ). 

Beweis: Sei G = (V, Σ, P, S) eine kontextfreie Grammatik mit ε /∈ L(G). Wir geben 

einen Algorithmus an, der die Regelmenge von G so verändert, dass nur noch Regeln 

der oben gegebenen Typen bleiben: 

Schritt I: Elimination von Regeln der Form A → B mit A, B ∈ V .


(i) Gibt es Variablen B1, B2, . . . , Bk ∈ V mit 

B1 → B2, B2 → B3, . . . , Bk−1 → Bk, Bk → B1 

so ersetze in allen Regeln die Variablen B1, B2, . . . , Bk durch die neue Variable 

B und lösche obige Regeln. 

(ii) Nummeriere die Variablen in V so, dass V = {A1, . . . , An} und aus Ai → Aj ∈ P 

folgt, dass i < j. 

(iii) Für k = n − 1, n − 2, . . . , 1, führe folgenden Schritt (iv) durch: 

(iv) Falls es eine Regel Ak → Ak ′ ∈ P gibt mit k′ > k, dann lösche Ak → Ak ′ und 

füge für jede Regel Ak ′ → α ∈ P eine Regel Ak → α zu P hinzu. 

Nun sind alle Regeln von der Form: 

A → a (für A ∈ V und a ∈ Σ) oder A → α (für A ∈ V und |α| ≥ 2) 

Schritt II: Behandeln der Terminalzeichen. 

Für alle a ∈ Σ füge eine neue Variable Ba zu V und eine neue Regel Ba → a zu P 

hinzu. Ersetze nun in allen Regeln A → α (mit |α| ≥ 2) auf der rechten Seite das 

Zeichen a durch Ba. 

Nun sind alle Regeln von der Form: 

A → a (für A ∈ V, a ∈ Σ) oder A → B1B2 . . . Bk (für A, B1, B2, . . . , Bk ∈ V, k ≥ 2) 

Schritt III: Verkürzen der Regeln. 

Für jede Regel A → B1 . . . Bk mit k ≥ 3 füge neue Variablen C2, . . . , Ck−1 zu V hinzu 

und ersetze in P obige Regel durch 

Der CYK-Algorithmus 

A → B1C2 

C2 → B2C3 

. 

Ck−1 → Bk−1Bk 

Sei G = (V, Σ, P, S) eine kontextfreie Grammatik in CNF. Ist x = a, a ∈ Σ und 

A ⇒ ∗ x, so muss eine Regel A → a in P existieren. 

.


Ist x = a1a2 . . . an, n ≥ 2 und A ⇒ ∗ x, so muss eine Regel A → BC und ein k mit 

1 ≤ k < n existieren, sodass B ⇒ ∗ a1 . . . ak und C ⇒ ∗ ak+1 . . . an. 

Notation: Für x ∈ Σ ∗ bezeichne xi,j das Teilwort von x, das an Position i beginnt und 

Länge j hat. Im obigen Absatz gilt also: B ⇒ ∗ x1,k und C ⇒ ∗ xk+1,n−k. 

Obige Beobachtung ist Grundlage des Algorithmus von Cooke, Younger und Kasami: 

Verwende ein Feld T [1 . . . n, 1 . . . n] mit der Bedeutung A ∈ T [i, j] gdw. A ⇒ ∗ xi,j. 

CYK-Algorithmus: 

Eingabe: x = a1 . . . an 

Methode: 

for i = 1 to n do 

T [i, 1] := {A ∈ V | A → ai ∈ P }; 

for j = 2 to n do 

for i = 1 to n + 1 − j do 

begin 

T [i, j] := ∅; 

for k = 1 to j − 1 do 

T [i, j] := T [i, j] ∪ {A ∈ V |A → BC, B ∈ T [i, k] ∧ C ∈ T [i + k, j − k]}; 

end; 

if S ∈ T [1, n] then accept else reject; 

Satz: Das Wortproblem für kontextfreie Sprachen ist entscheidbar in Zeit O(n 3 ). 

Bemerkung: Mit dem so genannten Early-Algorithmus ist es möglich, das Wortproblem 

in O(n 2.6... ) zu lösen. Der Early-Algorithmus ist jedoch aufwendiger zu implementieren. 

Beispiel: Betrachte eine kontextfreie Grammatik in Chomsky-Normalform mit folgenden 

Regeln: 

Eingabe: x = baaba, n = |x| = 5 

S → AB|BC B → CC|b 

A → BA|a C → AB|a


j ↓ 

x = b a a b a 

i → 1 2 3 4 5 

1 

2 

3 

4 

5 

B A, C A, C B A, C 

S, A B S, C S, A 

∅ B B 

∅ 

S,A,C 

S,A,C 

Es ist S ∈ T [1, 5], also gilt x ∈ L(G). Hieraus lässt sich die folgende Ableitung konstruieren: 

S ⇒ BC 

⇒ bC 

⇒ bAB 

⇒ baB 

⇒ baCC 

⇒ baABC 

⇒ baaBC 

⇒ baabC 

⇒ baaba 

Eine weitere mögliche Ableitung aus obiger Matrix ist: 

S ⇒ AB 

⇒ BAB 

⇒ ∗ baB 

⇒ baCC 

⇒ ∗ baaba 

B 

b 

S 

A 

A 

a 

b a 

A 

a 

S 

C 

B A C 

A 

B 

C C 

B 

a b 

B 

b 

B 

a 

C 

a

2.2 Greibach-Normalform und Kellerautomaten 27 

2.2 Greibach-Normalform und Kellerautomaten 

Kellerautomat M: 

Eingabeband 

a1 a2 . . . 

endliche Kontrolle 

(Zustand) 

Lesekopf, bewegt sich 

nach rechts 

Keller 

D 

C 

B 

A 

# 

Lesekopf, steht immer auf 

dem obersten Kellersymbol 

Definition: Ein (nichtdeterministischer) Kellerautomat (kurz: KA, NKA) ist ein 7- 

Tupel 

M = (Z, Σ, Γ, δ, z0, #, E), 

wobei 

– Z die endliche Menge der Zustände, 

– Σ das Eingabealphabet, 

– Γ das Kelleralphabet, 

– z0 ∈ Z der Startzustand, 

– # ∈ Γ das unterste Kellersymbol (bei Initialisierung), 

– E ⊆ Z die Menge der Endzustände und 

– δ : Z × (Σ ∪ {ε}) × Γ → Pe(Z × Γ ∗ ) die Überführungsfunktion mit Pe(M) = 

{M ′ ⊆ M | M ′ endlich} ist. 

Für z, z ′ ∈ Z, a ∈ Σ, A, B1, . . . , Bk ∈ Γ bedeutet δ(z, a, A) ∋ (z ′ , B1, . . . , Bk): 

Ist M im Zustand z, liest das Eingabezeichen a in der Eingabe und ist A das oberste 

Kellersymbol, so kann M in den Zustand z ′ übergehen und das Kellersymbol A durch


die Symbole B1, . . . , Bk ersetzen (B1 wird oberstes Kellersymbol). Der Lesekopf bewegt 

sich dabei ein Feld auf dem Eingabeband nach rechts. 

Ist δ(z, ε, A) ∋ (z ′ , B1, . . . , Bk) so bewegt sich der Lesekopf dabei nicht. 

Die ” üblichen“ Kelleroperationen ergeben sich zu: 

Schreibweise: zaA → z ′ B1 . . . Bk. 

pop : B1 . . . Bk = ε 

push(B) : B1 . . . Bk = BA 

Definition: Eine Konfiguration eines Kellerautomaten ist ein Tripel 

K ∈ Z × Σ ∗ × Γ ∗ . 

Die Konfiguration K = (z, α, β) bedeutet, dass M sich im Zustand z befindet, α der 

noch zu lesende Teil der Eingabe und β der Kellerinhalt ist. 

Definiere die binäre Relation ⊢M (oder auch ⊢) auf der Menge aller Konfigurationen. 

Intuitiv bedeutet K ⊢ K ′ , dass K ′ aus K durch einen Schritt von M hervorgeht. 

Formal: 

(z, a1 . . . an, A1 . . . Am) ⊢M 

⎧ 

⎪⎨ 

⎪⎩ 

(z ′ , a2 . . . an, B1 . . . BkA2 . . . Am), 

falls δ(z, a1, A1) ∋ (z ′ , B1 . . . Bk), 

(z ′ , a1 . . . an, B1 . . . BkA2 . . . Am), 

falls δ(z, ε, A1) ∋ (z ′ , B1 . . . Bk), 

wobei z, z ′ ∈ Z, a1, . . . , an ∈ Σ und A1, . . . , Am, B1, . . . , Bk ∈ Γ. Wir schreiben ⊢ ∗ M für 

die reflexive und transitive Hülle von ⊢M . 

Definition: Die von einem Kellerautomaten M per Endzustand akzeptierte Sprache 

ist 

L(M) = {x ∈ Σ ∗ | (z0, x, #) ⊢ ∗ M (z, ε, γ) für ein z ∈ E, γ ∈ Γ ∗ }. 

Die von einem Kellerautomaten M mit leerem Keller akzeptierte Sprache ist 

N(M) = {x ∈ Σ ∗ | (z0, x, #) ⊢ ∗ M (z, ε, ε) für ein z ∈ Z}. 

Satz: Sei L ⊆ Σ ∗ . Dann sind folgende Aussagen äquivalent: 

(i) Es gibt einen Kellerautomaten M mit L = N(M). 

(ii) Es gibt einen Kellerautomaten M mit L = L(M). 

Beweis: (Übungsaufgabe)


Definition: Eine kontextfreie Grammatik G = (V, Σ, P, S) mit ε /∈ L(G) heißt in 

Greibach-Normalform (GNF), falls alle Regeln von der Form 

sind. 

A → aB1 . . . Bk 

(a ∈ Σ, A, B1, . . . , Bk ∈ V, k ≥ 0) 

Satz: Sei G kontextfrei mit ε /∈ L(G). Dann gibt es eine kontextfreie Grammatik G ′ 

in Greibach-Normalform mit L(G) = L(G ′ ). 

Beweis: Vorüberlegung zur Linksrekursion: 

Eine Regel A → Aα heißt linksrekursiv. In Greibach-Normalform sind solche Regeln 

nicht erlaubt. Bereinige wie folgt: 

Sei A eine Variable mit linksrekursiven Regeln A → Aα1| . . . |Aαk und den weiteren 

nicht-linksrekursiven Regeln A → β1| . . . |βl. Folgende Ableitungen sind aus A möglich: 

mit i1, i2, . . . ∈ {1, . . . , k}, 1 ≤ j ≤ l. 

βj 

A 

Obige Regeln können also durch folgende Regeln ersetzt werden: 

mit einer neuen Variablen B. 

A 

A 

αi2 

A → β1| . . . |βl|β1B| . . . |βlB 

B → α1| . . . |αk|α1B| . . . |αkB, 

Sei nun G = (V, Σ, P, S) gegeben, o. B. d. A. sei G in Chomsky-Normalform und V = 

{A1, . . . , Am}. 

Schritt I: Modifiziere P so, dass aus Ai → Ajα ∈ P folgt, dass i < j. 

A 

αi1


Eingabe: G = (V, Σ, P, S) 

Methode: 

for i := 1, . . . , m do 

begin 

for j := 1, . . . , i − 1 do 

for all Ai → Ajα ∈ R do 

begin 

Seien Aj → β1| . . . |βl alle Regeln mit Aj auf der linken Seite; 

Lösche Ai → Ajα; 

Füge Ai → β1α| . . . |βlα zu P hinzu; 

end; 

Falls es linksrekursive Regeln Ai → Aiα gibt, dann beseitige diese wie oben 

unter Einführung der neuen Variable Bi; 

end; 

Nun gilt für alle Regeln Ai → Ajα ∈ P , dass i < j. Insbesondere gilt für Am → α ∈ P 

gilt, dass α mit einem Terminalzeichen beginnt. 

Schritt II: Bringe Ai-Regeln in die gewünschte Form. 


Methode: 

for i := m − 1, . . . , 1 do 

for all Ai → Ajα ∈ P do 

begin 

Seien Aj → β1| . . . |βl alle Aj−Regeln; 

Streiche Ai → Ajα; 

Füge die Regeln Ai → β1α| . . . |βlα zu P hinzu; 

end; 

Schritt III: Bringe Bi-Regeln in gewünschte Form. 


Methode: 

for i := 1, . . . , m do 

begin 

Ist Bi → Ajα ∈ P und sind Aj → β1| . . . |βl alle Aj−Regeln, so streiche 

Bi → Ajα und f\”uge Bi → β1α| . . . |βlα zu P hinzu; 

end; 

Definition: Eine Ableitung S ⇒ α1 ⇒ α2 ⇒ . . . ⇒ αn heißt Linksableitung, falls in 

jedem Ableitungsschritt αi ⇒ αi+1 (i = 1, . . . , n − 1) immer das erste (am weitesten 

links stehende) Nichtterminal in αi ersetzt wird.


Linksableitungen für Grammatiken in GNF haben die Gestalt 

S ⇒ aB1 . . . Bk ⇒ abC1 . . . ClB2 . . . Bk ⇒ abcD1 . . . DmC2 . . . ClB2 . . . Bk ⇒ . . . , 

wobei a, b, c ∈ Σ, B1, . . . , Bk, C1, . . . , Cl, D1, . . . , Dm ∈ V und S die Startvariable ist. 

Satz: Eine Sprache L ist kontextfrei gdw. es einen Kellerautomaten M gibt mit L = 

N(M). 

Beweis: ” ⇒“: Sei L = L(G) für G = (V, Σ, P, S). O. B. d. A. sei G in Greibach- 

Normalform. Definiere M = ({z}, Σ, V, δ, z, S), wobei δ wie folgt gegeben ist: 

δ(z, a, A) ∋ (z, γ), falls A → aγ ∈ P. 

Behauptung: Für alle x ∈ Σ∗ und α ∈ V ∗ gilt: es existiert eine Linksableitung S ⇒∗ G xα 

gdw. (z, x, S) ⊢∗ M (z, ε, α) 

Beweis der Behauptung: ” ⇐“: Induktion über die Länge i der Rechnung von M: 

i = 0: x = ε und S = α: S ⇒ ∗ S 

i ≥ 1: Sei (z, x, S) ⊢ ∗ (z, ε, α) in i Schritten von M. Setze x = ya, y ∈ Σ ∗ , a ∈ Σ. 

Obige Rechnung lässt sich wie folgt aufspalten (M hat keine ε-Übergänge!): 

=x 

 

(z, ya , S) ⊢ ∗ (z, a, β) ⊢ (z, ε, α) 

 

(i−1)Schritte 

Also gilt auch: (z, y, S) ⊢ ∗ (z, ε, β) in (i − 1) Schritten. Nach Induktionsvoraussetzung 

folgt: S ⇒ ∗ yβ durch eine Linksableitung. 

Aus (z, a, β) ⊢ (z, ε, α) ergibt sich: β = Aγ für ein A ∈ V , γ ∈ V ∗ , A → aη ∈ P 

und α = ηγ. Zusammengenommen ergibt sich also folgende Linksableitung: 

S ⇒ ∗ yβ = yAγ ⇒ yaηγ = xα. 

” ⇒“: Induktion über die Länge i der Linksableitung S ⇒∗ xα: 

i = 0: S ⇒ ∗ S und xα = S: (z, ε, S) ⊢ ∗ (z, ε, S) 

i ≥ 1: S ⇒ ∗ xα kann zerlegt werden in 

S ⇒ ∗ yAγ ⇒ yaηγ, 

 

(i−1) Schritte 

wobei A → aη ∈ P , x = ya und α = ηγ und a ∈ Σ, y ∈ Σ ∗ , A ∈ V , γ, η ∈ V ∗ . 

Nach Induktionsvoraussetzung folgt: (z, y, S) ⊢ ∗ (z, ε, Aγ).


Aus A → aη ∈ P ergibt sich δ(z, a, A) ∋ (z, η) nach Definition von δ. 

Zusammengenommen erhalten wir: 

(z, x, S) = (z, ya, S) ⊢ ∗ (z, a, Aγ) ⊢ (z, ε, ηγ) = (z, ε, α). 

Wähle nun in der Behauptung α = ε: 

x ∈ L(G) gdw. S ⇒ ∗ G x gdw. (z, x, S) ⊢ ∗ M (z, ε, ε) gdw. x ∈ N(M) 

für alle x ∈ Σ ∗ . Also gilt L(G) = N(M). 

(Behauptung) 

” ⇐“: Idee: Die Rechnung von M auf der Eingabe x soll durch eine Linksableitung 

simuliert werden. Nichtterminale einer Satzform sollen dabei dem Kellerinhalt von M 

zu diesem Rechenschritt entsprechen. Dazu verwenden wir die Nichtterminale [z, A, z ′ ] 

mit z, z ′ ∈ Z, A ∈ Γ, sodass 

(z, x, A) ⊢ ∗ M (z ′ , ε, ε) gdw. [z, A, z ′ ] ⇒ ∗ G x. 

Sei M = (Z, Σ, Γ, δ, z0, #, E) ein Kellerautomat (beachte: die Endzustände E von M 

werden hier nicht benötigt, da nur N(M) betrachtet wird). Definiere G = (V, Σ, P, S), 

wobei V = {S}∪(Z ×Γ×Z) (Tripelkonstruktion) und P aus folgenden Regeln besteht: 

(i) S → [z0, #, z] für alle z ∈ Z. 

(ii) [z, A, zm+1] → a[z1, B1, z2][z2, B2, z3] . . . [zm, Bm, zm+1] für alle z, z1, . . . , zm+1 ∈ 

Z, a ∈ Σ ∪ {ε} und A, B1, . . . , Bm ∈ Γ, sodass 

δ(z, a, A) ∋ (z1, B1 . . . Bm). 

Ist m = 0, so lautet die Regel [z, A, z1] → a. 

Behauptung: Für alle z, z ′ ∈ Z, A ∈ Γ und x ∈ Σ ∗ gilt: 

[z, A, z ′ ] ⇒ ∗ x gdw. (z, x, A) ⊢ ∗ (z ′ , ε, ε). 

Beweis der Behauptung: ” ⇐“: Induktion über die Länge i der Rechnung von M: 

i = 1: Es gilt: (z, x, A) ⊢ (z ′ , ε, ε), also δ(z, x, A) ∋ (z ′ , ε), also [z, A, z ′ ] → x ∈ P , also 

[z, A, z ′ ] ⇒ x 

i > 1: Sei x = ay, y ∈ Σ ∗ , a ∈ Σ ∪ {ε} und 

(z, ay, A) ⊢ (z1, y, B1 . . . Bn) ⊢ ∗ (z ′ , ε, ε), 

also δ(z, a, A) ∋ (z1, B1 . . . Bn) für B1, . . . , Bn ∈ Γ. 

Zerlege y in y = y1y2 . . . yn (yi ∈ Σ ∗ ), sodass während der Verarbeitung von 

yi das Symbol Bi vom Keller verschwindet, also: y1 ist das kürzeste Präfix von 

y, nach dessen Verarbeitung der Kellerinhalt B2 . . . Bn ist, y1y2 ist das kürzeste 

Präfix von y, nach dessen Verarbeitung der Kellerinhalt B3 . . . Bn ist, usw.


Kellerhöhe 

n 

n − 1 

n − 2 

. 

. 

. 

1 

0 

y1 

y2 

. . . 

yn 

Eingabe 

Es gibt z2, . . . , zn+1 = z ′ in 

 

, sodass (zj, yj, Bj) ⊢ ∗ (zj+1, ε, ε) für 1 ≤ j ≤ n. Nach 

Induktionsvoraussetzung folgt dann [zj, Bj, zj+1] ⇒∗ yj für 1 ≤ j ≤ n. 

Weiterhin ist δ(z, a, A) ∋ (z1, B1 . . . Bn) (1. Schritt der obigen Rechnung), also 

ist [z, A, zn+1] → a[z1, B1, z2][z2, B2, z3] . . . [zn, Bn, zn+1] ∈ P nach Definition 

von G. 

Zusammengenommen ergibt sich folgende Ableitung: 

[z, A, zn+1] 

⇒ a[z1, B1, z2][z2, B2, z3] . . . [zn, Bn, zn+1] 

 

=z ′ 

⇒ ay1[z2, B2, z3] . . . [zn, Bn, zn+1] 

⇒ ∗ ay1y2 . . . yn = x 

” ⇒“: Induktion über die Länge i der Ableitung in G: 

i = 1: [z, A, z ′ ] ⇒ x, also [z, A, z ′ ] → x ∈ P , also δ(z, x, A) ∋ (z ′ , ε), also 

(z, x, A) ⊢ (z ′ , ε, ε). 

i > 1: Sei [z, A, z ′ ] ⇒ a[z1, B1, z2][z2, B2, z3] . . . [zn, Bn, zn+1] ⇒ ∗ x mit z ′ = zn+1. 

Schreibe x als x = ay1 . . . yn mit [zj, Bj, zj+1] ⇒ ∗ yj 

 

in 

für 1 ≤ j ≤ n. 

Nach Induktionvoraussetzung folgt dann (zj, yj, Bj) ⊢ ∗ (zj+1, ε, ε) für 1 ≤ j ≤ n. 

Aus dem ersten Schritt der Ableitung folgt außerdem δ(z, a, A) ∋ (z1, B1 . . . Bn), 

also (z, a, A) ⊢ (z1, ε, B1 . . . Bn).

2.3 Deterministisch-kontextfreie Sprachen 34 

Zusammen ergibt sich folgende Rechnung: 

(z, ay1 . . . yn, 

A) ⊢ (z1, y1 . . . yn, B1 . . . Bn) 

 

=x ⊢∗ (z2, y2 . . . yn, B2 . . . Bn) 

⊢∗ (zn+1 

 

=z ′ 

, ε, ε) 

Wähle in der Behauptung z = z0 und A = #. Dann gilt: 

[z0, #, z] ⇒ ∗ x gdw. (z0, x, #) ⊢ ∗ (z, ε, ε) für alle z ∈ Z. 

Da S → [z0, #, z ′ ] ∈ P für alle z ′ ∈ Z folgt also: 

x ∈ L(G) ⇔ S ⇒ ∗ x 

⇔ S ⇒ [z0, #, z] ⇒ ∗ x für ein z ∈ Z 

⇔ (z0, x, #) ⊢ ∗ (z, ε, ε) für ein z ∈ Z 

⇔ x ∈ N(M) 

(Behauptung) 

Korollar: (i) Jede kontextfreie Sprache kann von einem Kellerautomaten mit nur 

einem Zustand akzeptiert werden. 

(ii) Jede kontextfreie Sprache L mit ε /∈ L kann von einem Kellerautomaten mit nur 

einem Zustand akzeptiert werden, der keine ε-Übergänge besitzt. 

2.3 Deterministisch-kontextfreie Sprachen 

Definition: Ein Kellerautomat M = (Z, Σ, Γ, δ, z0, #, E) heißt deterministischer Kellerautomat 

(DKA), falls für alle z ∈ Z, a ∈ Σ, A ∈ Γ gilt: 

|δ(z, ε, A)| + |δ(z, a, A)| ≤ 1. 

Eine kontextfreie Sprache L heißt deterministisch kontextfrei (L ∈ DCFL), falls es 

einen DKA M mit L = L(M) gibt. 

Es gilt: {ww R | w ∈ {0, 1} ∗ } ∈ CFL \ DCFL. Also: DCFL CFL. 

Ziel: DCFL ist abgeschlossen unter Komplement. 

Idee: Der Maschinentyp ist deterministisch, daher kann man Endzustände und Nicht- 

Endzustände vertauschen. 

Probleme:

2.3 Deterministisch-kontextfreie Sprachen 35 

A Der DKA akzeptiert seine Eingabe nicht, weil er seine Eingabe nicht vollständig 

liest, erbleibt während der Rechnung stecken. Mögliche Ursachen: undefinierter 

Eintrag in der δ-Funktion, leerer Keller, Endlosschleife von ε-Übergängen. 

⇒ Beim Vertauschen von Endzuständen und Nicht-Endzuständen bleibt der Automat 

erneut stecken und akzeptiert nicht. 

B Der DKA akzeptiert x, macht aber nach dem Lesen der vollständigen Eingabe 

noch eine Folge von ε-Übergängen, wobei er sowohl Endzustände als auch Nicht- 

Endzustände annimmt. 

⇒ Nach dem Vertauschen von Endzuständen und Nicht-Endzuständen wird x 

erneut akzeptiert. 

Satz: Das Komplement jeder DCFL ist eine DCFL. 

Beweis: Sei L ∈ DCFL, L = L(M) für DKA M = (Z, Σ, Γ, δ, z0, #, E). O. B. d. A. 

nehmen wir an, dass M seine Eingabe stets ganz liest (Problem A, Übungsaufgabe). 

Zu Problem B: Definiere M ′ = (Z ′ , Σ, Γ, δ ′ , z0 ′ , #, E ′ ) wie folgt: 

– Z ′ = Z × {1, 2, 3} 

Idee: Die zweite Komponente merkt sich, ob seit dem Lesen des letzten Zeichens ein 

Endzustand angenommen wurde (Zustand ∈ Z × {1}) oder nicht (Zustand ∈ Z × {2}). 

Vor dem Lesen des nächsten Zeichens wechseln wir von Z × {2} nach Z × {3}. 

– E ′ = Z × {3} 

– z0 ′ 

(z0, 1), falls z0 ∈ E 

= 

(z0, 2), falls z0 /∈ E 

Und δ ′ definiert wie folgt: 

(i) Falls δ(z, ε, A) = {(z ′ , γ)}, dann 

δ ′ ((z, k), ε, A) = {((z ′ , k ′ ), γ)}, 

wobei k ′ = 1, falls z ′ ∈ E oder k = 1, k ′ = 2 sonst. 

(ii) Falls δ(z, a, A) = {(z ′ , γ)} für a ∈ Σ, dann 

und 

δ ′ ((z, 2), ε, A) = {((z, 3), A)} 

δ ′ ((z, 1), a, A) = δ ′ ((z, 3), a, A) = {((z ′ , k ′ ), γ)}, 

wobei k ′ = 1, falls z ′ ∈ E, k ′ = 2 sonst.

2.4 Entscheidbarkeitsfragen 36 

Behauptung: Es gilt L(M) = L(M ′ ). 

Beweis der Behauptung: Sei a1 . . . an ∈ L(M). Dann nimmt M einen Zustand aus E 

an, nachdem an gelesen wurde (evtl. erst nach einer Folge von ε-Übergängen). M ′ 

wechselt dann in einen Zustand aus Z × {1}. Bei weiteren ε-Übergängen bleibt der 

Zustand von M ′ aus Z × {1}. ⇒ M ′ akzeptiert nicht. 

Sei nun a1 . . . an /∈ L(M). Dann sind alle Zustände, die M nach dem Lesen von an 

annimmt nicht aus E. Dann sind die entsprechenden Zustände von M ′ aus Z × {2}. 

Nach der Simulation der Bewegungen von M geht M ′ nun in einen Zustand aus Z × 

{3} = E ′ über. ⇒ M ′ akzeptiert. 

Bemerkung: – DCFL ist nicht unter Schnitt abgeschlossen 

(Seite 23f: es gilt L1, L2 ∈ DCFL). 

– DCFL ist nicht unter Vereinigung abgeschlossen. 

(Falls doch, dann wäre DCFL nach de Morgan unter Schnitt abgeschlossen, denn 

L1 ∩ L2 = L1 ∪ L2.) 

Definition: Eine Sprache L ⊆ Σ ∗ hat die Präfixeigenschaft (L ist präfixfrei), falls für 

alle w ∈ L gilt: kein echtes Präfix von w ist in L, d. h. 

w ∈ L ⇒ ∀u, v ∈ Σ + (w = uv ⇒ u /∈ L) . 

Es gilt: Die von deterministischen Kellerautomaten mit leerem Keller akzeptiertem 

Sprachen sind genau die deterministisch kontextfreien Sprachen mit Präfixeigenschaft, 

die sog. LR(0)-Sprachen (z. B. PASCAL). 

Es gilt: L ∈ DCFL ⊆ Σ ∗ ⇒ L ′ = L · {$} ∈ DCFL und präfixfrei für $ /∈ Σ. 

2.4 Entscheidbarkeitsfragen 

Das Postsche Korrespondenzproblem 

Sei Σ ein Alphabet, |Σ| ≥ 2. Das Postsche Korrespondenzproblem (PCP) über Σ ist 

definiert wie folgt: 

Gegeben: Eine endliche Folge von Paaren C = ((x1, y1), (x2, y2), . . . , (xk, yk)) 

mit xi, yi ∈ Σ + für 1 ≤ i ≤ k. 

Frage: Gibt es i1, i2, . . . , in mit iµ ∈ {1, . . . , k}, 1 ≤ µ ≤ n, sodass 

xi1xi2 . . . xin = yi1yi2 . . . yin?


Im Fall einer positiven Antwort heißt C lösbar und die Folge (i1, . . . , in) heißt Lösung 

von C. 

Beispiel: Betrachte folgende Instanz C = ((1, 101), (10, 00), (011, 11)) des Postschen 

Korrespondenzproblems. 

Schreibe die Folgeglieder untereinander: 

Es ergibt sich: 

1 10 011 

101 00 11 

i1 = 1 i2 = 3 i3 = 2 i4 = 3 

1 011 10 011 

101 11 00 11 

Eine Lösung ist damit: (1, 3, 2, 3), also C ∈ PCP. 

Beispiel: Ist das Postsche Korrespondenzproblem für folgende Instanz lösbar? 


001 01 01 10 

0 011 101 001 

Beobachtung: PCP ist rekursiv-aufzählbar. Betrachte folgenden Algorithmus: 

Eingabe: C = ((x1, y1), . . . , (xk, yk)) 

Methode: 

for n := 1, 2, 3, . . . 

for alle Folgen i1, . . . , in ∈ {1, . . . , k} 

if xi1xi2 . . . xin = yi1yi2 . . . yin then Ausgabe ” C ist lösbar“ und stopp. 

Der Algorithmus stoppt gdw. C eine Lösung besitzt. Also ist dieser Algorithmus ein 

Semi-Entscheidungsalgorithmus für PCP und ist PCP rekursiv-aufzählbar. 

Ziel: PCP ist nicht entscheidbar. 

Definition: Das Halteproblem ist die Sprache 

H = {〈M, w〉 | M ist eine deterministische 1-Band-TM, die bei Eingabe w hält}. 

H ist nicht entscheidbar. (Notation: 〈x〉 ist eine berechenbare Kodierung von x.)


Definition: Seien A ⊆ Σ ∗ , B ⊆ Γ ∗ Sprachen. A heißt reduzierbar auf B (in Zeichen: 

A ≤ B), falls es eine totale berechenbare Funktion f : Σ ∗ → Γ ∗ gibt, sodass für alle 

x ∈ Σ ∗ gilt: 

x ∈ A ⇔ f(x) ∈ B 

Ist A nicht entscheidbar, so ist B nicht entscheidbar. Ist B entscheidbar, so ist A 

entscheidbar. 

Ziel: H ≤ PCP 

Wir betrachten zunächst das modifiziertes Postsches Korrespondenzproblem (MPCP) 

und zeigen dessen Unentscheidbarkeit. Das Problem MPCP ist definiert wie folgt: 

Gegeben: C = ((x1, y1), . . . , (xk, yk)) wie bei PCP 

Frage: Gibt es eine Folge i2, . . . , in ∈ {1, . . . , k}, sodass x1xi2 . . . xin = 

y1yi2 . . . yin? 

Ziel: H ≤ MPCP ≤ PCP 

Lemma: H ≤ MPCP 

Beweis: Wir definieren eine totale berechenbare Funktion f, die Paare 〈M, w〉 in Instanzen 

von MPCP überführt, sodass 

〈M, w〉 ∈ H ⇔ f(〈M, w〉) ∈ MPCP. 

Sei w ∈ Σ ∗ und M = (Z, Σ, Γ, δ, z0, , E) eine Turingmaschine, wobei 

– Z die Zustandsmenge, 


– Γ, Σ ⊂ Γ das Arbeitsalphabet, 

– δ : Z × Σ → Z × Σ × {L, N, R} die Überführungsfunktion, 


– das Leersymbol und 

– und E ⊆ Z die Endzustandsmenge ist. 

Sei o. B. d. A. δ(z, a) undefiniert für alle z ∈ E, a ∈ Σ und Z ∩ Γ = ∅. 

Eine Konfiguration von M ist ein Wort über Γ ∗ · Z · Γ ∗ , wobei uzv mit u, v ∈ Γ ∗ und 

z ∈ Z bedeutet:


– M ist im Zustand z. 

– der Bandinhalt (Inhalt aller Bandzellen, die bisher besucht worden sind) ist uv. 

– Der Kopf von M steht auf dem ersten Zeichen von v. 

M akzeptiert w gdw. es gibt Konfigurationen K0, K1, . . . , Kt mit K0 = z0w, Kt ∈ 

Γ ∗ · E · Γ ∗ und für 1 ≤ i < t geht Ki+1 durch einen Schritt von M aus Ki hervor. 

Wir konstruieren nun eine Instanz C des MPCP durch Angabe von Paaren (xi, yi): 

Das Alphabet des MPCP ist Z ∪ Γ ∪ {#}, wobei # /∈ Z ∪ Γ. 

(i) ” Startregel“ 

(x1, y1) = (##, ##z0w#) 

(ii) ” Überführungsregeln“ 

Ist δ(z, a) = (z ′ , b, N), so nimm das Paar (za, z ′ b) auf. 

Ist δ(z, a) = (z ′ , b, R), so nimm das Paar (za, bz ′ ) auf. 

Ist δ(z, a) = (z ′ , b, L), so nimm das Paar (cza, z ′ cb) für alle c ∈ Σ und zusätzlich 

das Paar (#za, #z ′ b) auf. 

Ist δ(z, ) = (z ′ , b, N), so nimm zusätzlich (z#, z ′ b#) auf. 

Ist δ(z, ) = (z ′ , b, R), so nimm zusätzlich (z#, bz ′ #) auf. 

Ist δ(z, ) = (z ′ , b, L), so nimm zusätzlich (cz#, z ′ cb#) für alle c ∈ Σ auf. 

(iii) ” Kopierregeln“ 

Für alle a ∈ Σ ∪ {#} nimm das Paar (a, a) auf. 

(iv) ” Löschregeln“ 

Für alle z ∈ E und a ∈ Σ nimm folgende (az, z) und (za, z) auf. 

(v) ” Abschlussregeln“ 

Für alle z ∈ E nimm das Paar (z##, #) auf. 

Behauptung: M stoppt bei Eingabe w ⇔ C hat eine Lösung. 

Beweis der Behauptung: ” ⇒“: M stoppt bei Eingabe w. Dann gibt es eine Folge 

K0, K1, . . . , Kt wie oben erläutert. Eine Lösung von C ergibt sich nun wie folgt: 

– Beginne mit (x1, y1) 

## 

##z0w# 

Der untere String ist immer länger als der obere. Wenn oberer und unterer String 

mit # enden, dann ist der untere String genau eine Konfiguration länger als der 

obere.


– Wende Kopier- und Überführungsregeln an, bis folgende Situation entsteht: 

## K0# K1# · · · Kt−1# 

## K0# K1# K2# · · · Kt# 

– Wende Lösch- und Kopierregeln an, bis folgende Situation entsteht: 

## K0# K1# · · · Kt−1# Kt# · · · # 

## K0# K1# K2# · · · Kt# · · · # z# 

wobei z ∈ E. 

– Wende passende Abschlussregel an: 

· · · # z# # 

· · · # z# # 

Insgesamt folgt damit C ∈ MPCP. 

” ⇐“: Besitzt C eine Lösung i1, . . . , in mit i1 = 1, so lässt sich mit ähnlichen Argumenten 

eine haltende Rechnung von M konstruieren. 

Korollar: MPCP ist unentscheidbar. 

Lemma: MPCP ≤ PCP. 

Beweis: Sei C eine Instanz des MPCP über dem Alphabet Σ. Seien #, $ /∈ Σ. Für 

w = a1 . . . am ∈ Σ + , definiere 

# w # = #a1#a2# . . . #am# 

w # = a1#a2# . . . #am# 

# w = #a1#a2# . . . #am 

Ist nun C = ((x1, y1), . . . , (xk, yk)), so definiere f als 

f ist total und berechenbar. 

f(C) = (( # x # 

1 ,# y1), (x # 

1 ,# y1), . . . , (x # 

k ,# yk), ($, #$)). 

Behauptung: C ∈ MPCP ⇔ f(C) ∈ PCP. 

Beweis der Behauptung: ” ⇒“: Sei (i1, i2, . . . , in) mit i1 = 1 eine Lösung von C, d. h. 

xi1xi2 . . . xin = yi1yi2 . . . yin. 

Dann ist (1, i2 + 1, . . . , in + 1, k + 2) eine Lösung von f(C). 

” ⇐“: Ist (i1, . . . , in) eine Lösung von f(C), so muss gelten: 

i1 = 1, i2, . . . , in−1 ∈ {2, . . . , k + 1} und in = k + 2 

Dann ist (1, i2 − 1, . . . , in−1 − 1) eine Lösung von C.


Korollar: PCP ist unentscheidbar. 

Satz: Das PCP-Problem über Σ ist schon für |Σ| = 2 unentscheidbar. 

Beweis: Sei Σ ein beliebiges Alphabet, Σ = {b1, . . . , bm}. Für 1 ≤ j ≤ m definiere 

bj = 01 j . Für w ∈ Σ + , w = a1 . . . an, setze w = a1 . . . an. Dann gilt: 

((x1, y1), . . . , (xn, yn)) ∈ PCP (über Σ) 

⇔ ((x1, y1), . . . , (xn, yn)) ∈ PCP (über {0, 1}) 

Bemerkung: – Das PCP über Σ mit |Σ| = 1 ist entscheidbar. 

– Sei PCPk das PCP-Problem eingeschränkt auf Eingaben mit genau k Paaren. 

Dann gilt: 

– Die Probleme PCP1 und PCP2 sind entscheidbar. 

– PCPk ist für k ≥ 7 unentscheidbar. 

– Die Entscheidbarkeit des PCPk für k ∈ {3, . . . , 6} ist offen. 

Entscheidbarkeit für kontextfreie Sprachen 

Satz: Das Schnittproblem für DCFL, also das Problem 

Gegeben: Kontextfreie Grammatiken G1, G2 mit L(G1), L(G2) ∈ DCFL. 

Frage: Ist L(G1) ∩ L(G2) = ∅? 

ist unentscheidbar. 

Beweis: Wir geben eine Reduktion des PCP auf das Schnittproblem für DCFL an. Sei 

C = ((x1, y1), . . . , (xn, yn)) ein Instanz von PCP über Σ = {0, 1}. Definiere die Grammatik 

G1 über dem Alphabet Σ = {0, 1, $, a1, . . . , ak} als G1 = ({S, A, B}, Σ, P, S) mit 

folgenden Produktionen: 

(w R ist dabei das Wort w gespiegelt.) 

Die von G1 erzeugte Sprache ist: 

S → A$B 

A → a1Ax1| . . . |akAxk|a1x1| . . . |akxk 

B → y R 1 Ba1| . . . |y R k Bak|y R 1 a1| . . . |y R k ak 

L(G1) = ain . . . ai1xi1 . . . xin$y R jm . . . yR j1 aj1 . . . ajm 

 

n, m ≥ 1, iµ, jν ∈ {1, . . . , k} . 

Definiere die Grammatik G2 = ({S, T }, Σ, P, S) mit folgenden Produktionen:


Die von G2 erzeugte Sprache ist: 

S → a1Sa1| . . . |akSak|T 

T → 0T 0|1T 1|$ 

L(G1) = uv$v R u R u ∈ {a1, . . . , an} ∗ , v ∈ {0, 1} ∗ . 

Offenbar ist L(G1), L(G2) ∈ DCFL. 

Es gilt: 

C besitzt die Lösung i1, . . . , in gdw. 

ain . . . ai1xi1 . . . xin$y R jn . . . yR j1 ai1 . . . ain ∈ L(G1) ∩ L(G2). 

C ↦→ 〈G1, G2〉 ist eine Reduktion von PCP auf das Schnittproblem für DCFL. 

Korollar: – Das Schnittproblem für CFL ist unentscheidbar. 

– Das Schnittproblem für deterministische Kellerautomaten, d. h. das Problem 


Gegeben: Deterministische Kellerautomaten M1, M2. 

Frage: Ist L(M1) ∩ L(M2) = ∅? 

Satz: Das Äquivalenzproblem für kontextfreie Sprachen, also das Problem 


Gegeben: Kontextfreie Grammatiken G1, G2. 

Frage: Ist L(G1) = L(G2)? 

Beweis: Reduktion vom Schnittproblem für determistische Kellerautomaten. Seien 

M1, M2 deterministische Kellerautomaten. Dann gilt: 

L(M1) ∩ L(M2) = ∅ 

⇔ L(M1) ⊆ L(M2) 

⇔ L(M1) ⊆ L(M C 2 ) 

⇔ L(M1) ∪ L(M C 2 ) = L(M C 2 ) 

⇔ L(M3) = L(M C 2 ), 

L(M1) 

L(M2) 

wobei M C 2 DKA mit L(M C 2 ) = L(M2) und M3 ein KA mit L(M1) ∪ L(M C 2 ) ist. Also 

(M1, M2) /∈ Schnittproblem ⇔ (M3, M C 2 ) ∈ Äquivalenzproblem und (M1, M2) ↦→ 

(M3, M C 2 ) ist die gewünschte Reduktion.


Bemerkung: Das Äquivalenzproblem für DCFL bzw. DKAen ist entscheidbar. 

Satz: Das Problem Non-empty Complement (NEC) für kontextfreie Sprachen, also 

das Problem 


Gegeben: Kontextfreie Grammatik über einem Alphabet Σ. 

Frage: Ist L(G) = Σ ∗ ? 

Beweis: Seien G1 und G2 wie im Beweis des Schnittproblems auf Seite 41. Dann gilt: 

C ∈ PCP ⇔ L(G1) ∩ L(G2) = ∅ 

⇔ L(G1) ∩ L(G2) = Σ ∗ 

⇔ L(G1) ∪ L(G2) = Σ ∗ 

⇔ L(G4) = Σ ∗ , 

wobei ist G4 eine kontextfreie Grammatik mit L(G4) = L(G1) ∪ L(G2) ist. Die Abbildung 

C ↦→ G4 reduziert PCP auf NEC. 

Satz: Das Problem 


Gegeben: Kontextfreie Grammatiken G1 und G2. 

Frage: Ist L(G1) ∩ L(G2) kontextfrei? 

Beweis: Sei C eine Instanz des Postschen Korrespondenzproblems. Seien G1 und G2 

die Grammatiken aus dem Beweis der Unentscheidbarkeit des Schnittproblems von 

Seite 41. 

Behauptung: C ist lösbar gdw. L(G1) ∩ L(G2) /∈ CFL. 

Dann ist das Komplement des PCPs reduzierbar auf das Problem in der Aussage des 

Satzes. 

Beweis der Behauptung: Sei C nicht lösbar. Dann ist L(G1) ∩ L(G2) = ∅, also L(G1) ∩ 

L(G2) ∈ CFL. 

Sei C lösbar. Dann besitzt C hat unendlich viele Lösungen, also |L(G1) ∩ L(G2)| = ∞. 

Sei L := L(G1) ∩ L(G2). Wir zeigen L /∈ CFL mit Hilfe des Pumping-Lemmas: Angenommen 

L sei kontextfrei, dann existiert ein n ∈ N gemäß Pumping-Lemma. Wähle 

z ∈ L mit 

z = aim . . . ai1xi1 . . . xim$y R im . . . yR i1 ai1 . . . aim 

mit m > n. z existiert, da |L| = ∞. Damit gilt |z| > n. Sei z = uvwxy eine Zerlegung 

von z mit |vx| > 0 und |vwx| ≤ n. 

Wir zeigen: uwy /∈ L.


Fall 1: vx enthält das Zeichen $ ⇒ uwy enthält kein $, also z /∈ L. 

Fall 2: w enthält das Zeichen $ ⇒ vx ∈ {0, 1} ∗ , da |vwx| ≤ n ⇒ uwy /∈ L(G1), also 

uwy /∈ L. 

Fall 3: vwx enthält kein $ ⇒ v und x sind beide links vom $ oder beide rechts vom 

$ ⇒ uwy /∈ L(G2), also uwy /∈ L. 



Gegeben: Kontextfreie Grammatik G. 

Frage: Ist L(G) kontextfrei? 

Beweis: Sei C eine Instanz des PCPs, G1 und G2 wie oben definiert. Konstruiere 

eine kontextfreie Grammatik G4 mit L(G4) = L(G1) ∩ L(G2) (wie im Beweis für das 

NEC-Problem, Seite 43). Dann gilt: 

C ist nicht lösbar ⇔ L(G1) ∩ L(G2) ∈ CFL ⇔ L(G4) ∈ CFL 

(Reduktion vom Komplement des PCPs) 




Frage: Ist L(G) regulär? 

Beweis: Seien C, G1, G2 und G4 definiert wie oben. Dann gilt: 

C ist nicht lösbar ⇔ L(G1) ∩ L(G2) = ∅ 

⇔ L(G1) ∩ L(G2) ∈ REG 

⇔ L(G4) ∈ REG 

⇔ L(G4) ∈ REG, 

wobei REG die Klasse aller regulären Sprachen bezeichne. 



Frage: Ist L(G) ∈ DCFL?



Beweis: Seien C, G1, G2 und G4 definiert wie oben. Dann gilt: 

C ist nicht lösbar ⇔ L(G1) ∩ L(G2) = ∅ 

⇔ L(G1) ∩ L(G2) ∈ DCFL 

⇔ L(G4) ∈ DCFL 

⇔ L(G4) ∈ DCFL 

Entscheidbare Probleme für kontextfreie Sprachen 

Lemma: Sei G = (V, Σ, P, S) eine kontextfreie Grammatik in Chomsky-Normalform. 

Dann gilt: 

(i) L(G) = ∅ ⇔ es gibt x ∈ L(G) mit |x| < 2 |V | . 

(ii) |L(G)| = ∞ ⇔ es gibt x ∈ L(G) mit 2 |V | ≤ |x| < 2 |V |+1 . 

Beweis: zu (i): Anwendung des Pumping-Lemmas für kontextfreie Sprachen. Konstante 

n aus dem Pumping-Lemma ist gerade 2 |V | . 

” ⇐“: klar 

” ⇒“: Sei z ein kürzestes Wort in L(G). Wir zeigen: |z| < 2|V | . 

Annahme: |z| ≥ 2 |V | . Dann ist z nach dem Pumping-Lemma zerlegbar in z = uvwxy 

mit |vx| > 0 und |vwx| ≤ 2 |V | und uv i wx i y ∈ L für i ∈ N, insbesondere also uwy ∈ 

L(G). 

Aber |uwy| = |z| − |vx| < |z| und das ist ein Widerspruch zur Wahl von z. 

zu (ii): siehe Übung. 

Satz: Das Leerheitsproblem für kontextfreie Sprachen, also das Problem 

ist entscheidbar. 


Frage: Ist L(G) = ∅? 

Beweis: Sei G eine kontextfreie Grammatik. Folgender Algorithmus leistet das Gewünschte: 

(i) Bestimme G ′ in Chomsky-Normalform mit L(G) = L(G ′ ).

3 Kontextsensitive Sprachen und Typ-0-Sprachen 46 

(ii) Setze n := Anzahl der Nichtterminale in G ′ . 

(iii) Für alle z mit |z| < 2 n überprüfe, ob z ∈ L(G ′ ) (z.B. mit CYK-Algorithmus). 

(iv) Antwort ” ja“, falls kein z ∈ L(G) gefunden, sonst ” nein“. 

Satz: Das Endlichkeitsproblem für kontextfreie Sprachen, also das Problem 

ist entscheidbar. 


Frage: Ist |L(G)| = ∞? 

Beweis: Analog zum obigen Algorithmus mit Teil (ii) des vorhergehenden Lemmas. 

Übersicht der Entscheidbarkeitsprobleme 

( √ ˆ= entscheidbar) 

Wortproblem 

Leerheitsproblem 

Endlichkeitsproblem 

Äquivalenzproblem 

Schnittproblem 

Nichtleeres Komplement 

REG CFL 

√ √ 

√ √ 

√ √ 

√ 

√ 

√ 

3 Kontextsensitive Sprachen und Typ-0-Sprachen 

Sei G = (V, Σ, P, S) eine Grammatik. Ist P ⊆ (V ∪ Σ) + × (V ∪ Σ) ∗ , so ist G eine 

Typ-0-Grammatik. 

Gilt zusätzlich, dass aus (α, β) ∈ P stets |α| ≤ |β| folgt, so heißt G Typ-1-Grammatik 

oder kontextsensitive Grammatik (kurz: CSG). (Ausnahme: Die Regel S → ε ist erlaubt, 

falls S in keiner rechten Regelseite vorkommt.) CSL ist die Klasse aller kontextsensitiven 

Sprachen, d. h. der Sprachen, für die es eine Typ-1-Grammatik gibt. 

Ein linear-beschränkter Automat (LBA) ist eine nichtdeterministische Turingmaschine, 

die bei Eingabelänge n Platz ≤ n benötigt, d. h. deren Kopf den Bereich des Bandes, 

in dem die Eingabe steht, niemals verlässt. Dazu sei angenommen, dass das rechte 

Eingabeende speziell markiert ist (siehe unten).

3.1 Maschinenmodelle für Typ-0- und Typ-1-Sprachen 47 

3.1 Maschinenmodelle für Typ-0- und Typ-1-Sprachen 

Satz: Eine Sprache hat eine Typ-1-Grammatik gdw. sie von einem LBA akzeptiert 

wird. 

Beweis: ” ⇒“: Sei L = L(G) mit G = (V, Σ, P, S). Folgender Algorithmus bei Eingabe 

w ∈ Σ ∗ prüft, ob S ⇒ ∗ G w: 

Eingabe: w ∈ Σ ∗ 

Methode: 

Wähle nichtdeterministisch Regel α → β; 

Wähle nichtdeterministisch Vorkommen von β auf dem Arbeitsband; 

Falls solch ein Vorkommen existiert: Ersetze β durch α; 

Falls nur noch S übrigbleibt: Akzeptiere; 

Ansonsten wiederhole obige Schritte. 

” ⇐“: Sei L = L(M) für einen linear beschänkten Automat M = (Z, Σ, Γ, δ, z0, , E), 

wobei 

– Z die Menge der Zustände, 


– Γ das Arbeitsalphabet mit Γ ⊇ Σ ∪ Σ ∪ {}, wobei Σ = {â | a ∈ Σ}, 

– δ die Übergangsfunktion, 


– ∈ Γ \ Σ das Leersymbol und 

– E ⊆ Z die Menge der Endzustände ist. 

Eine Konfiguration von M ist ein Wort aus Γ ∗ · (Z × Γ) · Γ ∗ . Dabei bedeutet u(z, a)v 

für a ∈ Σ u, v ∈ Σ ∗ und z ∈ Z: M ist im Zustand z, der Bandinhalt ist uav und der 

Kopf befindet sich auf dem Zeichen a. 

Beispiel: 

. . . a b c d . . . 

Diese Situation entspricht der Konfiguration a(z, b)cd. Es gilt |a(z, b)cd| = 4. 

z

3.1 Maschinenmodelle für Typ-0- und Typ-1-Sprachen 48 

Die Startkonfiguration von M bei Eingabe w = a1 . . . an ist (z0, a1)a2a3 . . . an−1ân (ân 

symbolisiert die Markierung des rechten Randes). 

Definiere G = (V, Σ, P, S) wie folgt: Definiere zunächst eine Regelmenge P ′ , die auf 

Konfigurationen genau die Arbeitsweise von M nachvollzieht. Der Übergang 

δ(z, a) ∋ (z ′ , b, L) führt auf die Regel c(z, a) → (z ′ , c)b für alle c ∈ Γ \ {}, 

δ(z, a) ∋ (z ′ , b, R) führt auf die Regel (z, a)c → b(z ′ , c) für alle c ∈ Γ \ {}, 

δ(z, a) ∋ (z ′ , b, N) führt auf die Regel (z, a) → (z ′ , b). 

Es gilt also für Konfigurationen K, K ′ von M, dass K ⊢ K ′ gdw. K ⇒ ∗ K ′ mit Regeln 

aus P ′ . 

Sei ∆ = Γ ∪ (Z × Γ) ein Alphabet für Konfigurationen von M. Setze V = {S, A} ∪ 

(∆ × Σ). Dann besteht die Regelmenge P aus folgenden Regeln: 

(i) S → ((z0, â), a) für a ∈ Σ 

S → A(â, a) für a ∈ Σ 

A → A(a, a) für a ∈ Σ 

A → ((z0, a), a) für a ∈ Σ 

Mit diesen Regeln können aus S alle Wörter der Form 

((z0, a1), a1)(a2, a2)(a3, a3) . . . (an−1, an−1)(ân, an) 

für a1, . . . , an ∈ Σ erzeugt werden. 

Die Folge der ersten Komponenten entspricht der Startkonfiguration von M auf 

a1 . . . an. Die Folge der zweiten Komponenten entspricht der Eingabe a1 . . . an. 

(ii) (A1, a)(A2, b) → (B1, a)(B2, b) für A1A2 → B1B2 ∈ P ′ 

(A, a) → (B, a) für A → B ∈ P ′ 

(A, B ∈ ∆ und a, b ∈ Σ, A, B, A1, A2, B1, B2 ∈ ∆) 

Mit diesen Regeln wird auf den ersten Komponenten eine Rechnung von M simuliert. 

Das Eingabewort in den zweiten Komponenten bleibt dabei unverändert. 

(iii) ((z, a), b) → b für z ∈ E und a ∈ Γ, b ∈ Σ 

(a, b) → b für a ∈ Γ, b ∈ Σ 

Mit diesen Regeln können nach Erreichen einer Endkonfiguration alle ersten 

Komponenten gelöscht werden. Es bleibt a1 . . . an übrig. 

Falls also w ∈ L(M), dann gilt S ⇒∗ G w. Die Umkehrung kann analog gezeigt werden. 

Insgesamt folgt somit L(M) = L(G). 

Korollar: Das Wortproblem für Typ-1-Grammatiken ist entscheidbar. 

Korollar: Eine Sprache hat eine Typ-0-Grammatik gdw. sie von einer Turingmaschine 

akzeptiert wird gdw. sie rekursiv-aufzählbar ist.

3.2 Entscheidbarkeit und Abschlußeigenschaften 49 

Beweis: ” ⇒“: Der Algorithmus im obigen Beweis ist ein Semi-Entscheidungsalgorithmus 

für die gegebene Typ-0-Sprache. 

” ⇐“: Grammatik wie oben aus der Turingmaschine konstruieren, wobei die Regeln unter 

Punkt (i) für alle c ∈ Γ erstellt und zusätzlich zu Punkt (iii) die Regeln ((z, a), ) → 

ε, (a, ) → ε für alle a ∈ Γ hinzugefügt werden müssen. 

3.2 Entscheidbarkeit und Abschlußeigenschaften 

Das Äquivalenz- und Schnittproblem für CSL sind nicht entscheidbar, da sie bereits für 

CFL nicht entscheidbar sind. Betrachte das für CFL entscheidbare Leerheitsproblem: 

Satz: Das Leerheitsproblem für Typ-1-Sprachen ist unentscheidbar. 

Beweis: Reduktion vom Komplement des Schnittproblems. 

Gegeben seien zwei Typ-1-Grammatiken G1, G2. Konstruiere eine Typ-1-Grammatik 

G mit L(G) = L(G1) ∩ L(G2) (dies ist möglich, da CSL unter Schnitt abgeschlossen 

ist, s. u.). Es gilt also: (G1, G2) ∈ Schnittproblem ⇔ G /∈ Leerheitsproblem. 

Satz: Die Klasse CSL ist unter Vereinigung abgeschlossen. 

Beweis: Sei L1 = L(G1), L2 = L(G2) für Typ-1-Grammatiken Gi = (Vi, Σ, Pi, Si), 

i = 1, 2 und o. B. d. A. S /∈ V1 ∪ V2, V1 ∩ V2 = ∅. Dann gilt L1 ∪ L2 = L(G) für die 

kontextsensitive Grammatik G = (V1∪V2∪{S}, Σ, P1∪P2∪{S → S1, S → S2}, S). 

Satz: Die Klasse CSL ist unter Durchschnitt abgeschlossen. 

Beweis: Gegeben sei Li = L(Mi) für LBAen Mi, i = 1, 2. Definiere LBA M für L1 ∩L2 

wie folgt: 

Eingabe: w ∈ Σ ∗ 

Methode: 

Simuliere M1 auf w; (mit Paaren wie oben, damit w erhalten bleibt) 

Simuliere M2 auf w; 

Akzeptiere, falls beide Simulationen akzeptieren; 

Wir wollen nun den Komplementabschluß von CSL untersuchen: 

Sei s: N → N. NSPACE(s) ist die Klasse der Sprachen, die von nichtdeterministischen 

Turingmaschinen in Platz O(s) akzeptiert werden. Also: CSL = NSPACE(n). 

coNSPACE(s) ist Klasse der Komplemente von Sprachen aus NSPACE(s). Die Frage, 

ob CSL unter Komplement abgeschlossen ist, ist also 

NSPACE(n) = coNSPACE(n)?


Wir werden diese Frage allgemeiner untersuchen: 

s: N → N heißt raumkonstruierbar, falls es eine deterministische Turingmaschine gibt, 

die bei Eingabe eines Wortes der Länge n genau s(n) Zellen benutzt. 

Für s(n) < n verwenden wir dazu Turingmaschinen mit Arbeitsband und getrenntem 

Eingabeband. Der Platzbedarf ist in diesem Fall die Anzahl der benutzten Zellen 

auf dem Arbeitsand. Für s(n) ≥ n fällt dieses Modell mit dem Modell der Einband- 

Turingmaschine zusammen (siehe Vorlesung ” Komplexität von Algorithmen“). 

Eine Konfiguration einer Turingmaschine mit getrenntem Eingabeband ist ein Tupel 

(Zustand, Inhalt des Arbeitsbandes, Kopfposition auf dem Arbeitsband, Kopfposition 

auf dem Eingabeband). 

Für s(n) ≥ log n gilt damit: 

|Konfiguration von M bei Eingabelänge n| = O(s(n)). 

⇒ Anzahl aller solcher Konfigurationen = 2 O(s(n)) . 

⇒ Jeder akzeptierende Pfad ist zeitbeschränkt durch 2 c·s(n) für c ∈ N . 

Satz (Immermann, Szelepczényi): Sei s(n) ≥ log n raumkonstruierbar. Dann gilt: 

NSPACE(s) = coNSPACE(s). 

Beweis: Sei A ∈ NSPACE(s). Sei M eine nichtdeterministische Turingmaschine wie 

oben, die A in Platz s akzeptiert. O. B. d. A. sei angenommen, alle Pfade von M haben 

die gleiche Länge 2 c·s(|x|) bei Eingabe x. 

K x start 

0 1 0 1 0 

accept reject 

= t 

Notation: K1 M, x K2, falls M bei Eingabe x in genau t Schritten die Konfiguration 

K2 aus der konfiguration K1 erreichen kann. 

Wir nehmen an, wir kennen die Zahl 

n x M := |{K | K ist s(|x|) raumbeschränkt und K x start 

= N 

M, x K}|,


wobei N = s c·s(|x|) und K x start die Startkonfiguration von M bei Eingabe x ist. Dann 

akzeptiert folgende nichtdeterministische Turingmaschine die Sprache A: 

Eingabe: x 

Methode: 

K ′ := K x start; m := 0; 

for i := 0 to n x M do 

begin 

rate Konfiguration K mit K > K ′ (in einer lex. Reihenfolge, bei der K x start 

minimal ist) und K nicht akzeptierend; 

rate Pfad Π der Länge 2 c·s(|x|) ; 

if K x start 

K ′ := K; 

end; 

if m = n x M 

= 2 c·s(|x|) 

M, x 

Problem: Wie berechnet man n x M ? 

K mit Π then m := m + 1; 

then halte akzeptierend else halte verwerfend; 

Sei M so normalisiert, dass es eine eindeutige akzeptierende Konfiguration Kakz = 

= 1 

(q+, ε, 1, 1) gibt. Weiterhin sei Kakz M, x Kakz der einzige Konfigurationsübergang aus 

Kakz, d. h. weitere Schritte führen nicht mehr aus Kakz heraus. Sei N = 2c·s(|x|) eine 

obere Schranke für die Anzahl der Konfigurationen bei Eingabe x, dann gilt: 

M akzeptiert x gdw. K x start 

= N 

M, x Kakz. 

= t 

M, x 

Definiere nx M (t) := |{K | K ist s(|x|)-raumbeschänkt und Kx start K}| für 0 ≤ t ≤ 

N. Es gilt: nx M = nxM (N). Wir konstruieren eine s-platzbeschränkte nichtdeterministische 

Turingmaschine, die nx M (t + 1) berechnet, falls sie nxM (t) gegeben hat (Induktives 

Zählen). 

Berechnung von nx M (0): nxM (0) = 1. 

Berechnung von nx M (t + 1): Sei nxM Konfiguration K, ob Kx = t + 1 

start M, x 

Wie kann Kx = t + 1 

start M, x 

(t) gegeben. Prüfe für jede s(|x|)-raumbeschränkte 

K. Die Anzahl dieser K ist nxM (t + 1). 

K geprüft werden? 

Seien Ki1 , . . . , Kir alle Vorgängerkonfigurationen von K (r ist konstant und wird 

durch M bestimmt). Prüfe, ob Kx = t 

start M, x Kiµ für ein 1 ≤ µ ≤ r. 

Wie kann K x start 

= t 

M, x Kiµ geprüft werden? Beachte: nx M (t) ist bekannt! 

Methode: 

m:=0; 

for all Konfigurationen K do 

begin 

rate nichtdeterministisch (A) oder (B):


(A): Simuliere t Schritte von M; 

= t 

M, x 

if Kx start K then m := m + 1; 

(B): tue garnichts; 

end; 

if m = nx M (t) then halte ablehnend; 

else Ausgabe ja“, falls Kiµ eine Konfiguration war, für die (A) geraten 

” 

wurde, andernfalls Ausgabe nein“; 

” 

Der Gesamtalgorithmus ergibt sich zu: 

Eingabe: x 

Methode: 

(∗Falls n = n x M 

(t), so gilt: reach(x,n,t,K)=true gdw. Kstart = t 

M, x K∗) 

function reach(x, n, t, K): boolean; 

begin 

m := 0; b := false; 

for all Konfigurationen K ′ do 

begin 

rate nichtdeterministisch (A) oder (B): 

(A): if K x start 

= t 

M, x K′ then (∗Simulation von t Schritten von M∗) 

begin 

m := m + 1; 

if K ′ = K then b := true; 

end; 

(B): nop; 

end; 

if m = n then return b else reject; 

end; 

(∗Hauptprogramm:∗) 

N := 2 c·s(|x|) ; n := 1; 

for t := 1 to N do (∗Schleifeninvariante: n := n x M 

begin 

k := 0; 

for all Konfigurationen K do 

begin 

f := false; 

for all Vorgängerkonfigurationen K ′ von K do 

if reach(x, n, t − 1, K ′ ) then f := true; 

if f then k := k + 1; 

end; (∗k := n x M (t)∗) 

n := k; 

end; (∗n := n x M (N) = nx M ∗) 

if reach(x, n, N, Kakz) then reject else accept; 

(t − 1)∗)


Die Variablen N, K, K ′ , b, f, n, k, t haben einen Speicherbedarf von O(s), also benötigt 

der Gesamtalgorithmus ebenfalls O(s) Speicher. 

Korollar: – Sei A ⊆ Σ ∗ . Dann gilt: A ∈ CSL ⇔ A ∈ CSL. 

– NSPACE(n) = coNSPACE(n). 

– NL = coNL. 

Bemerkung: Es ist offen, ob deterministische LBAen nicht schon ausreichen, um alle 

kontextsensitiven Sprachen zu akzeptieren (das so genannte erste LBA-Problem). In 

komplexitätstheoretischer Notation ist dies also die Frage, ob NSPACE(n) = SPACE(n).

Skript zur Vorlesung - Institut für Theoretische Informatik an der ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?