02.02.2015 Aufrufe

Eine Einführung in die Spieltheorie - Math.uni-wuppertal.de ...

Eine Einführung in die Spieltheorie - Math.uni-wuppertal.de ...

Eine Einführung in die Spieltheorie - Math.uni-wuppertal.de ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

0<br />

Bergische Universität Wuppertal<br />

Fachbereich C - <strong>Math</strong>ematik und Naturwissenschaften -<br />

Arbeitsgruppe Optimierung und Approximation<br />

<strong>E<strong>in</strong>e</strong> E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong><br />

- Theorie und Numerik strategischer Spiele -<br />

Vorlesungsskript SS 2009<br />

von<br />

Prof. Dr. Manfred Men<strong>de</strong>l<br />

Kommentar: Das Skript wird parallel zur Vorlesung erstellt. Geplant s<strong>in</strong>d sechs<br />

Kapitel. Stand 14. 07. 2009: Kapitel 1 bis 5.


1<br />

Vorwort<br />

Die <strong>Spieltheorie</strong> als mathematische Diszipl<strong>in</strong> wur<strong>de</strong> im ersten Drittel <strong>de</strong>s letzten<br />

Jahrhun<strong>de</strong>rts von John von Neumann begrün<strong>de</strong>t. Seit <strong>de</strong>m wegweisen<strong>de</strong>n<br />

Buch von v. Neumann und Morgenstern aus <strong>de</strong>m Jahr 1944 ”<br />

Theorie of Games<br />

and Economic Behaviour“ hat sie <strong>in</strong>sbeson<strong>de</strong>re E<strong>in</strong>gang gefun<strong>de</strong>n <strong>in</strong> <strong>de</strong>n weitverzweigten<br />

Bereich <strong>de</strong>r Ökonomie. Heute f<strong>in</strong><strong>de</strong>n spieltheoretische Mo<strong>de</strong>lle aber nicht<br />

nur Anwendung <strong>in</strong> <strong>de</strong>n Wirtschaftswissenschaften, son<strong>de</strong>rn auch <strong>in</strong> <strong>de</strong>r Biologie,<br />

<strong>de</strong>r Politik und <strong>de</strong>n Gesellschaftswissenschaften. Spezielle Gesellschaftspiele, beispielsweise<br />

das Schachspiel, können <strong>in</strong> spieltheoretischen Mo<strong>de</strong>llen dargestellt und<br />

analysiert wer<strong>de</strong>n. Neben <strong>de</strong>n genannten Wissenschaftlern haben <strong>in</strong> beson<strong>de</strong>rem<br />

Maße <strong>die</strong> <strong>Math</strong>ematiker John F. Nash, Re<strong>in</strong>hard Selten und John Harsanyi zur<br />

Weiterentwicklung <strong>de</strong>r <strong>Spieltheorie</strong> beigetragen. Für ihre herausragen<strong>de</strong>n Arbeiten<br />

auf <strong>die</strong>sem Gebiet haben sie im Jahr 1994 geme<strong>in</strong>sam <strong>de</strong>n Nobelpreis für<br />

Wirtschaftswissenschaften erhalten.<br />

Die <strong>Spieltheorie</strong> stellt das formale Intrumentarium zur Analyse von Konflikten<br />

und Kooperationen bereit. Ausgangspunkt ist dabei <strong>die</strong> Formulierung e<strong>in</strong>es spieltheoretischen<br />

Problems als mathematisches Mo<strong>de</strong>ll. Dabei geht es um <strong>die</strong> mathematische<br />

Formulierung strategischer Entscheidungssituationen, <strong>in</strong> <strong>de</strong>nen<br />

a) das Ergebnis <strong>de</strong>r Entscheidungen von mehreren Entscheidungsträgern (Spieler<br />

o<strong>de</strong>r Akteure genannt) abhängt, so dass e<strong>in</strong> e<strong>in</strong>zelner das Ergebnis nicht<br />

unabhängig von <strong>de</strong>r Wahl <strong>de</strong>r an<strong>de</strong>ren bestimmen kann,<br />

b) je<strong>de</strong>r <strong>de</strong>r Entscheidungsträger sich <strong>die</strong>ser Inter<strong>de</strong>pen<strong>de</strong>nz bewußt ist;<br />

c) je<strong>de</strong>r Entscheidungsträger davon ausgeht, dass alle an<strong>de</strong>ren sich ebenfalls<br />

<strong>die</strong>ser Inter<strong>de</strong>pen<strong>de</strong>nz bewußt s<strong>in</strong>d;<br />

d) je<strong>de</strong>r bei se<strong>in</strong>en Entscheidungen a), b), c) berücksichtigt.<br />

Auf Grund <strong>die</strong>ser Eigenschaften s<strong>in</strong>d Interessenskonflikte o<strong>de</strong>r Koord<strong>in</strong>ationsprobleme<br />

charakteristische Eigenschaften von strategischen Entscheidungssituationen.<br />

Viele ökonomische Fragestellungen weisen <strong>die</strong> hier aufgeführten Eigenschaften<br />

auf. Deshalb wird heute von vielen Ökonomen <strong>die</strong> <strong>Spieltheorie</strong> als <strong>die</strong><br />

formale Sprache <strong>de</strong>r ökonomischen Theorie betrachtet. Inzwischen gibt es kaum<br />

e<strong>in</strong>en Bereich <strong>de</strong>r Mikroökonomie, <strong>in</strong> <strong>de</strong>m <strong>die</strong> <strong>Spieltheorie</strong> nicht angewen<strong>de</strong>t wird.<br />

Die vorangehen<strong>de</strong>n Ausführungen machen <strong>de</strong>utlich, dass <strong>die</strong> <strong>Spieltheorie</strong> e<strong>in</strong> weites<br />

Feld mit e<strong>in</strong>er umfassen<strong>de</strong>n mathematischen Theorie, mit zahlreichen numerischen<br />

Lösungsverfahren wie auch mit vielfältigen Anwendungsbereichen darstellt.<br />

All <strong>de</strong>m kann e<strong>in</strong>e ”<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>“ natürlich nur <strong>in</strong> begrenztem


2<br />

Umfang gerecht wer<strong>de</strong>n. <strong>E<strong>in</strong>e</strong> grobe Zielsetzung bei <strong>de</strong>r Erstellung <strong>de</strong>s Skripts besteht<br />

dar<strong>in</strong>, <strong>in</strong> e<strong>in</strong>ige grundlegen<strong>de</strong> Problemstellungen <strong>de</strong>r <strong>Spieltheorie</strong> (endliche<br />

Spiele, <strong>in</strong>sbeson<strong>de</strong>re Zwei-Personenspiele, kooperative Spiele, extensive Spiele)<br />

e<strong>in</strong>zuführen und e<strong>in</strong>e Verb<strong>in</strong>dung zu an<strong>de</strong>ren mathematischen Theorien (z.B. zur<br />

Optimierung) herzustellen, <strong>die</strong> Metho<strong>de</strong>n für <strong>die</strong> Analyse und <strong>die</strong> Konstuktion<br />

von Lösungsverfahren liefern.<br />

Die <strong>Spieltheorie</strong> stellt für <strong>de</strong>n Verfasser <strong>de</strong>s Skripts <strong>in</strong> weiten Bereichen Neuland<br />

dar. Es gibt aber zahlreiche gute Skripte und Lehrbücher, <strong>die</strong> bei <strong>de</strong>r Ausarbeitung<br />

e<strong>in</strong>er Vorlesung e<strong>in</strong>e nützliche Hilfestellung bieten. Bereits im Vorwort soll<br />

darauf h<strong>in</strong>gewiesen wer<strong>de</strong>n, dass sich <strong>de</strong>r Verfasser auf e<strong>in</strong>ige Arbeiten <strong>in</strong> beson<strong>de</strong>rem<br />

Maße stützt; <strong>die</strong>se s<strong>in</strong>d:<br />

[1] Christian Kanzow: E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>. Vorlesungsskript Universität<br />

Würzburg, WS 2006/07.<br />

[2] Christian Kanzow: Optimierungsverfahren zur Lösung l<strong>in</strong>earer Komplementaritätsprobleme.<br />

Vorlesungsskript Universität Hamburg.<br />

[3] Walter Schlee: E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>. Vieweg 2004.<br />

[4] Bern<strong>in</strong>ghaus, Ehrhart, Güth: Strategische Spiele. Spr<strong>in</strong>ger 2006.<br />

[5] C.Geiger, C.Kanzow: Theorie und Numerik restr<strong>in</strong>gierter Optimierungsaufgaben.<br />

Spr<strong>in</strong>ger 2001.<br />

Weitere Literatur, <strong>die</strong> bei <strong>de</strong>r Erstellung <strong>de</strong>s Skripts e<strong>in</strong>e Rolle gespielt hat, wird<br />

im Anhang aufgeführt. Der Inhalt <strong>de</strong>r Vorlesung ist von persönlichen Vorlieben<br />

geprägt. Beson<strong>de</strong>rer Wert wur<strong>de</strong> darauf gelegt, Querverb<strong>in</strong>dungen zur Optimierung,<br />

zu l<strong>in</strong>earen Komplementaritätsproblemen und Variationsungleichungen<br />

herzustellen, um Lösungsverfahren, <strong>die</strong> für <strong>die</strong>se Probleme bekannt s<strong>in</strong>d, für <strong>die</strong><br />

<strong>Spieltheorie</strong> nutzbar zu machen. Das Skript wird kapitelweise parallel zur Vorlesung<br />

erstellt.<br />

Wuppertal, im April 2009<br />

Manfred Men<strong>de</strong>l


Inhaltsverzeichnis<br />

1 E<strong>in</strong>führung <strong>in</strong> strategische Spiele 5<br />

1.1 Strategische Spiele und Nash-Gleichgewicht . . . . . . . . . . . . . 5<br />

1.2 Erläuterung mit Beispielen . . . . . . . . . . . . . . . . . . . . . . 7<br />

1.3 Strategische Äquivalenz . . . . . . . . . . . . . . . . . . . . . . . 11<br />

1.4 An<strong>de</strong>re Lösungskonzepte . . . . . . . . . . . . . . . . . . . . . . . 15<br />

1.5 Klassifikation strategischer Spiele . . . . . . . . . . . . . . . . . . 18<br />

2 Existenz von Nash-Gleichgewichten 21<br />

2.1 Die Abbildung <strong>de</strong>r Bestantwort . . . . . . . . . . . . . . . . . . . 21<br />

2.2 Gemischte Erweiterung . . . . . . . . . . . . . . . . . . . . . . . . 23<br />

2.3 E<strong>in</strong> Existenzsatz von Nikaido-Isoda . . . . . . . . . . . . . . . . . 25<br />

3 Endliche Spiele 29<br />

3.1 Grundlegen<strong>de</strong> Eigenschaften . . . . . . . . . . . . . . . . . . . . . 29<br />

3.2 Zweipersonen-Nullsummen-Spiele . . . . . . . . . . . . . . . . . . 32<br />

3.3 Matrixspiele <strong>in</strong> gemischten Strategien . . . . . . . . . . . . . . . . 35<br />

3.4 Bi-Matrixspiele und quadratische Programme . . . . . . . . . . . 38<br />

3.5 Bi-Matrixspiele und L<strong>in</strong>eare Komplementaritätsprobleme<br />

(LCP) . . . . . . . . . . . . . . . . . . . . . . . . 42<br />

3.5.1 E<strong>in</strong>führung <strong>in</strong> LCP . . . . . . . . . . . . . . . . . . . . . . 43<br />

3.5.2 Bi-Matrixspiele als LCP . . . . . . . . . . . . . . . . . . . 44<br />

3.5.3 E<strong>in</strong> modifiziertes Lemke-Verfahren . . . . . . . . . . . . . 49<br />

3.6 Weitere Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />

4 Variationsungleichungen (VIP) 59<br />

4.1 VIP und Nash-Gleichgewichte . . . . . . . . . . . . . . . . . . . . 59<br />

4.2 Monotone Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 64<br />

4.3 Projektionen auf konvexe Mengen . . . . . . . . . . . . . . . . . . 68<br />

4.4 Existenz von Nash-Gleichgewichten via VIP . . . . . . . . . . . . 70<br />

4.5 Numerische Verfahren . . . . . . . . . . . . . . . . . . . . . . . . 75<br />

4.5.1 Diagonalisierungsverfahren . . . . . . . . . . . . . . . . . . 75<br />

3


INHALTSVERZEICHNIS 4<br />

4.5.2 Fixpunkt- o<strong>de</strong>r Projektionsverfahren . . . . . . . . . . . . 77<br />

5 Spiele <strong>in</strong> Extensivform 82<br />

5.1 Def<strong>in</strong>ition und Beispiele . . . . . . . . . . . . . . . . . . . . . . . 82<br />

5.2 Spiele mit perfekter Information . . . . . . . . . . . . . . . . . . . 87<br />

5.3 Teilspielperfekte Gleichgewichte . . . . . . . . . . . . . . . . . . . 91<br />

5.4 Spiele ohne perfekte Information . . . . . . . . . . . . . . . . . . . 94<br />

5.5 Weitere Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . 103<br />

Literaturverzeichnis 108


Kapitel 1<br />

E<strong>in</strong>führung <strong>in</strong> strategische Spiele<br />

In <strong>die</strong>sem Kapitel wer<strong>de</strong>n grundlegen<strong>de</strong> Begriffe <strong>de</strong>r <strong>Spieltheorie</strong> behan<strong>de</strong>lt. Es<br />

wird <strong>de</strong>r Begriff <strong>de</strong>s strategischen Spiels <strong>de</strong>f<strong>in</strong>iert und erläutert, es folgt <strong>de</strong>r zentrale<br />

Begriff <strong>de</strong>s Nash-Gleichgewichts, <strong>de</strong>r an e<strong>in</strong>igen Beispielen erläutern wird.<br />

Schließlich wer<strong>de</strong>n grundlegen<strong>de</strong> Eigenschaften strategischer Spiele vorgestellt.<br />

1.1 Strategische Spiele und Nash-Gleichgewicht<br />

Def<strong>in</strong>ition 1.1 Unter e<strong>in</strong>em strategischen Spiel o<strong>de</strong>r Spiel <strong>in</strong> Normalform Γ<br />

(kurz als Spiel bezeichnet) versteht man e<strong>in</strong> Tripel<br />

(<br />

A, (X 1 ,...,X m ), (≽ 1 ,...,≽ m ) ) (1.1)<br />

mit folgen<strong>de</strong>r Be<strong>de</strong>utung:<br />

1. A := {1,...,m} ist e<strong>in</strong>e m-elementige Menge; je<strong>de</strong>s Element i ∈ A wird<br />

als Akteur o<strong>de</strong>r Spieler bezeichnet.<br />

2. Je<strong>de</strong>m Spieler i ist <strong>die</strong> Menge X i zugeordnet; je<strong>de</strong>s Element x i ∈ X i wird<br />

Entscheidung o<strong>de</strong>r Strategie <strong>de</strong>s Spielers i und X i Strategiemenge <strong>de</strong>s Spielers<br />

i genannt. Das m-Tupel (x 1 ,...,x m ) mit x i ∈ X i (für i = 1,...,m)<br />

wird e<strong>in</strong>e Strategiekomb<strong>in</strong>ation <strong>de</strong>r m Spieler genannt. X := (X 1 ×...,X m ) =<br />

∏ mi=1<br />

X i heißt Strategiemenge <strong>de</strong>r m Spieler.<br />

3. ≽ i ist e<strong>in</strong>e Präferenzordnung <strong>de</strong>s Spielers i auf <strong>de</strong>r Menge aller Strategiekomb<strong>in</strong>ationen.<br />

Die m Präferenzordnungen ≽ i , jeweils <strong>de</strong>f<strong>in</strong>iert auf X,<br />

wer<strong>de</strong>n zu ≽:= (≽ 1 ,...,≽ m ) zusammengefaßt.<br />

Die Durchführung e<strong>in</strong>es Spiels besteht dar<strong>in</strong>, dass je<strong>de</strong>r Spieler e<strong>in</strong>e Strategie x i<br />

aus se<strong>in</strong>er Menge X i wählt, ohne <strong>die</strong> Entscheidung se<strong>in</strong>er Mitspieler zu kennen.<br />

5


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 6<br />

Die sich ergeben<strong>de</strong> Strategiekomb<strong>in</strong>ation x := (x 1 ,...,x m ) beurteilt danach je<strong>de</strong>r<br />

Spieler entsprechend se<strong>in</strong>er Präferenzordnung.<br />

Kommentar:<br />

Ist <strong>die</strong> Strategiemenge X <strong>de</strong>r m Spieler endlich, so wird das Spiel Γ = (A, X, ≽)<br />

endlich genannt. Die Strategiemenge X i <strong>de</strong>s i-ten Spielers wird dann mit X i :=<br />

{x i 1,x i 2,...,x i n i<br />

} notiert.<br />

Der Begriff ”<br />

Präferenzordnung“ auf X be<strong>de</strong>utet, dass für je zwei Elemente x,y ∈<br />

X gilt: x ≽ i y o<strong>de</strong>r x ≼ i y und dass <strong>die</strong> Relation ≽ i auf X reflexiv und transitiv<br />

ist für je<strong>de</strong>s i ∈ {1,...,m}.<br />

In vielen Anwendungen entsteht für <strong>de</strong>n Spieler i bei E<strong>in</strong>tritt e<strong>in</strong>er Strategiekomb<strong>in</strong>ation<br />

x e<strong>in</strong> Gew<strong>in</strong>n o<strong>de</strong>r Nutzen. Dies wird für je<strong>de</strong>s i ∈ {1,...,m} durch e<strong>in</strong>e<br />

Funktion<br />

u i : X ↦→ R<br />

zu Ausdruck gebracht. Man erhält so für je<strong>de</strong>n Spieler i e<strong>in</strong>e Präferenzordnung,<br />

<strong>in</strong><strong>de</strong>m man für beliebiges x,y ∈ X festlegt:<br />

x ≽ i y ⇐⇒ u i (x) ≥ u i (y) (1.2)<br />

Die Funktion u i wird dann Auszahlungs- o<strong>de</strong>r Nutzenfunktion <strong>de</strong>s Spielers i genannt.<br />

Def<strong>in</strong>ition 1.2 Unter e<strong>in</strong>em Spiel mit Auszahlung versteht man e<strong>in</strong> Tripel Γ :=<br />

(A, X, U), wobei A und X wie oben <strong>de</strong>f<strong>in</strong>iert s<strong>in</strong>d und U := (u 1 ,...,u m ) <strong>de</strong>r<br />

Vektor <strong>de</strong>r Auszahlungsfunktionen u i <strong>de</strong>r e<strong>in</strong>zelnen Spieler ist.<br />

Welche se<strong>in</strong>er Strategien soll nun e<strong>in</strong> Spieler wählen Es ist naheliegend zu verlangen,<br />

dass <strong>de</strong>r e<strong>in</strong>zelne Spieler e<strong>in</strong>e Strategie wählen soll, <strong>die</strong> im S<strong>in</strong>ne se<strong>in</strong>er<br />

Präferenzen e<strong>in</strong> möglichst gutes Ergebnis für ihn br<strong>in</strong>gt unter Berücksichtigung<br />

<strong>de</strong>r apriori nicht bekannten Entscheidungen se<strong>in</strong>er Mitspieler. Das zentrale Problem<br />

<strong>de</strong>r <strong>Spieltheorie</strong> ist es, Kriterien hierfür zu entwickeln. Dabei sei bereits an<br />

<strong>die</strong>ser Stelle erwähnt, dass es e<strong>in</strong>e Reihe von verschie<strong>de</strong>nen Lösungsbegriffen gibt,<br />

von <strong>de</strong>nen <strong>de</strong>r be<strong>de</strong>utendste sicherlich <strong>de</strong>r <strong>de</strong>s Nash-Gleichgewichts ist. An<strong>de</strong>re<br />

Kriterien wer<strong>de</strong>n an späterer Stelle angesprochen.<br />

Def<strong>in</strong>ition 1.3 Gegeben sei e<strong>in</strong> strategisches Spiel Γ = (A, X, ≽). E<strong>in</strong> Vektor<br />

x ∗ := (x ∗,1 ,...,x ∗,m ) ∈ X heißt e<strong>in</strong> Nash-Gleichgewicht <strong>de</strong>s Spiels Γ, wenn für<br />

je<strong>de</strong>n Spieler i ∈ A gilt:<br />

x ∗ ≽ i<br />

(<br />

x ∗,1 ,..,x ∗,i−1 ,x i ,x ∗,i+1 ,..,x ∗,m) ∀ x i ∈ X i (1.3)<br />

o<strong>de</strong>r (<strong>in</strong> e<strong>in</strong>em Spiel mit Auszahlung):<br />

u i (x ∗ ) ≥ u i (x ∗,1 ,..,x ∗,i−1 ,x i ,x ∗,i+1 ,..,x ∗,m ) ∀ x i ∈ X i (1.4)


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 7<br />

Zur bequemeren Formulierung <strong>de</strong>r Bed<strong>in</strong>gung (1.3) bzw. (1.4) führen wir e<strong>in</strong>e <strong>in</strong><br />

<strong>de</strong>r <strong>Spieltheorie</strong> übliche Schreibweise e<strong>in</strong>: Soll <strong>in</strong> e<strong>in</strong>em Vektor x = (x 1 ,...,x m )<br />

<strong>die</strong> i-te Komponente beson<strong>de</strong>rs hervorgehoben o<strong>de</strong>r gekennzeichnet wer<strong>de</strong>n, so<br />

schreibt man: x = (x i ,x −i ), d.h. es gilt:<br />

(x i ,x −i ) := (x 1 ,..,x i−1 ,x i ,x i+1 ,..,x m )<br />

Auf <strong>die</strong>se Weise kann man <strong>die</strong> genannten Bed<strong>in</strong>gungen wie folgt ausdrücken:<br />

x ∗ ≽ i (x i ,x ∗,−i ) ∀ x i ∈ X i bzw. u i (x ∗ ) ≥ u i (x i ,x ∗,−i ) ∀ x i ∈ X i<br />

Für e<strong>in</strong> Spiel Γ = (A, X, U), also e<strong>in</strong> Spiel mit Auszahlung, kann man e<strong>in</strong> Nash-<br />

Gleichgewicht äquivalent auch auf folgen<strong>de</strong> Weise formulieren, wobei sich <strong>de</strong>r<br />

Beweis <strong>de</strong>r Aussage unmittelbar aus <strong>de</strong>r Def<strong>in</strong>ition 1.3 ergibt.<br />

Satz 1.1 E<strong>in</strong> Vektor x ∗ ∈ X ist genau dann e<strong>in</strong> Nash-Gleichgewicht <strong>de</strong>s Spiels<br />

Γ = (A, X, U), wenn für je<strong>de</strong>s i ∈ A <strong>die</strong> Strategie x ∗,i <strong>de</strong>s i-ten Spielers e<strong>in</strong><br />

Maximierer <strong>de</strong>r folgen<strong>de</strong>n Optimierungsaufgabe ist:<br />

max u i (x i ,x ∗,−i )<br />

s.d. x i ∈ X i<br />

E<strong>in</strong> Nash-Gleichgewicht x ∗ kann also durch folgen<strong>de</strong> Eigenschaft beschrieben wer<strong>de</strong>n:<br />

Än<strong>de</strong>rt e<strong>in</strong> Spieler i ∈ {1,...,m} im Nash-Gleichgewichtspunkt se<strong>in</strong>e Strategie<br />

x i,∗ auf x i ab, wobei <strong>die</strong> übrigen Spieler <strong>die</strong> Strategiekomb<strong>in</strong>ation x ∗,−i beibehalten,<br />

so kann er durch <strong>die</strong>se Än<strong>de</strong>rung ke<strong>in</strong>e Verbesserung herbeiführen, und<br />

<strong>die</strong>s gilt für je<strong>de</strong>n Spieler i.<br />

Man beachte, dass Satz 1.1 ke<strong>in</strong>e Metho<strong>de</strong> liefert, durch Lösung von Optimierungsaufgaben<br />

das Nash-Gleichgeweicht e<strong>in</strong>es Spiels zu ermitteln, weil für <strong>die</strong><br />

Durchführung <strong>de</strong>r Optimierung x ∗ apriori bekannt se<strong>in</strong> müßte.<br />

1.2 Erläuterung mit Beispielen<br />

Wir illustrieren <strong>de</strong>n Begriff <strong>de</strong>s strategischen Spiels und <strong>de</strong>n <strong>de</strong>s Nash-Gleichgewichts<br />

an e<strong>in</strong>igen Beispielen.<br />

Beispiel 1.1 Fre<strong>de</strong>ric und Nicole haben beim letzten Treffen nichts Genaues ausgemacht,<br />

wo sie sich das nächste Mal treffen wollen. Fre<strong>de</strong>ric geht gerne zum<br />

Fußball (F), Nicole gerne <strong>in</strong>s K<strong>in</strong>o (K). Fre<strong>de</strong>ric <strong>de</strong>nkt bei sich: sie wird mir zuliebe<br />

zum Fußball gehen, und ähnlich <strong>de</strong>nkt Nicole, dass er ihr zuliebe <strong>in</strong>s K<strong>in</strong>o<br />

gehen wird. Bei<strong>de</strong>n liegt aber sehr viel daran sich zu treffen.<br />

Die Situation läßt sich als Spiel mit <strong>de</strong>n Spielern ”<br />

Fre<strong>de</strong>ric“ (1) und ”<br />

Nicole“<br />

(2) und <strong>de</strong>n Strategiemengen X 1 = X 2 = {F,K} <strong>in</strong>terpretieren. Auf <strong>de</strong>n vier


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 8<br />

Strategiekomb<strong>in</strong>ationen (F,F), (K,K), (F,K), (K,F) <strong>de</strong>f<strong>in</strong>ieren wir für je<strong>de</strong>n <strong>de</strong>r<br />

bei<strong>de</strong>n Spieler e<strong>in</strong>e Präferenzordnung. Dabei bezeichnet <strong>die</strong> erste Komponente <strong>die</strong><br />

Strategie von Fre<strong>de</strong>ric, <strong>die</strong> zweite <strong>die</strong> Strategie von Nicole. Fre<strong>de</strong>ric ( ”<br />

Er“) könnte<br />

folgen<strong>de</strong> Präferenzordnung haben:<br />

(K,F) ≼ Er (F,K) ≼ Er (K,K) ≼ Er (F,F)<br />

Für Nicole ersche<strong>in</strong>t <strong>die</strong> folgen<strong>de</strong> Präferenzordnung plausibel:<br />

(K,F) ≼ Sie (F,K) ≼ Sie (F,F) ≼ Sie (K,K)<br />

Es gibt hier zwei Nash-Gleichgewichte, nämlich: (F,F) und (K,K).<br />

Man kann <strong>die</strong> bei<strong>de</strong>n Präferenzordnungen auch durch Nutzenfunktionen u 1 (für<br />

” ihn“) und u 2 (für ”<br />

sie“) zum Ausdruck br<strong>in</strong>gen:<br />

u 1 (K,F) = 0 , u 1 (F,K) = 1 , u 1 (K,K) = 2 , u 1 (F,F) = 3<br />

u 2 (K,F) = 0 , u 2 (F,K) = 1 , u 2 (F,F) = 2 , u 2 (K,K) = 3<br />

Bei e<strong>in</strong>em Spiel mit 2 Akteuren ist es üblich, <strong>die</strong> bei<strong>de</strong>n Nutzenfunktionen durch<br />

so genannte Auszahlungsmatrizen darzustellen. Dabei ist X 1 = {x 1 1,x 1 2} = {F,K}<br />

bzw. X 2 = {x 2 1,x 2 2} = {F,K} zu beachten:<br />

A Er = ( u 1 (x 1 i,x 2 j) ) i,j=1.2<br />

bzw. A Sie = ( u 2 (x 1 i,x 2 j) ) i,j=1,2<br />

A Er =<br />

F K<br />

F 3 1<br />

K 0 2<br />

A Sie =<br />

F K<br />

F 2 1<br />

K 0 3<br />

Übungshalber verifizieren wir <strong>die</strong> Aussage von Satz 1.1 für das Nash-Gleichgewicht<br />

(x ∗,1 ,x ∗,2 ) = (K,K); es gilt offenbar:<br />

u 1 (K,K) = max u 1 (x 1 ,K) s.d. x 1 ∈ {K,F }<br />

u 2 (K,K) = max u 2 (K,x 2 ) s.d. x 2 ∈ {K,F }<br />

Entsprechen<strong>de</strong>s läßt sich für das Nash-Gleichgewicht (F,F) zeigen.<br />

Das folgen<strong>de</strong> Beispiel wird <strong>in</strong> <strong>de</strong>r Literatur <strong>in</strong> verschie<strong>de</strong>nen Varianten behan<strong>de</strong>lt,<br />

es ist unter <strong>de</strong>r Bezeichnung ”<br />

Gefangenendilemma“ bekannt.<br />

Beispiel 1.2 Nach e<strong>in</strong>em Raubüberfall wer<strong>de</strong>n zwei Personen 1 und 2 festgenommen,<br />

da sie unter dr<strong>in</strong>gen<strong>de</strong>m Tatverdacht stehen. Die Polizei trennt <strong>die</strong> bei<strong>de</strong>n<br />

Personen, damit zwischen ihnen ke<strong>in</strong>e Absprachen möglich s<strong>in</strong>d, und macht bei<strong>de</strong>n<br />

unabhängig vone<strong>in</strong>an<strong>de</strong>r <strong>de</strong>n folgen<strong>de</strong>n Vorschlag:


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 9<br />

• Wenn e<strong>in</strong>er sich schuldig bekennt und <strong>de</strong>r an<strong>de</strong>re nicht, so erhält <strong>de</strong>r Geständige<br />

1 Jahr Gefängnis aufgrund e<strong>in</strong>er Kronzeugenregelung, während <strong>de</strong>r an<strong>de</strong>re<br />

(Nichtgeständige) 10 Jahre Gefängnis bekommt.<br />

• Wenn bei<strong>de</strong> gestehen, bekommt je<strong>de</strong>r 5 Jahre Gefängnis.<br />

• Wenn ke<strong>in</strong>er gesteht, bekommt je<strong>de</strong>r 2 Jahre Gefängnis wegen illegalen Waffenbesitzes.<br />

Hierbei han<strong>de</strong>lt es sich um e<strong>in</strong> Spiel mit zwei Spielern {1, 2} und <strong>de</strong>n Strategiemengen<br />

X 1 = X 2 := {S,G}<br />

mit S := schweigen , G := gestehen<br />

Die Jahre im Gefängnis s<strong>in</strong>d als Strafe anzusehen, so dass sie <strong>in</strong> <strong>de</strong>n Auszahlungsfunktionen<br />

mit e<strong>in</strong>em negativen Vorzeichen versehen wer<strong>de</strong>n:<br />

u 1 (S,G) = −10 , u 1 (G,G) = −5 , u 1 (S,S) = −2 , u 1 (G,S) = −1<br />

u 2 (G,S) = −10 , u 2 (G,G) = −5 , u 2 (S,S) = −2 , u 2 (S,G) = −1<br />

Man überzeugt sich leich davon, dass <strong>die</strong> Strategiekomb<strong>in</strong>ation (G,G) mit 5 Jahren<br />

Gefängnis das e<strong>in</strong>zige Nash-Gleichgewicht ist, <strong>de</strong>nn es gilt:<br />

u 1 (G,G) = max{u 1 (x 1 i,G) |i = 1, 2 } u 2 (G,G) = max{u 2 (G,x 2 i)|i = 1, 2 }<br />

Hätten bei<strong>de</strong> Personen geschwiegen, wären sie mit 2 Jahren davongekommen.<br />

Weshalb kann man <strong>die</strong> Strategiekomb<strong>in</strong>ation (G,G) <strong>de</strong>nnoch als e<strong>in</strong>e ”<br />

gute Wahl“<br />

bezeichnen Da Spieler 1 nicht weiß, welche Entscheidung Spieler 2 trifft, muss<br />

er abwägen und auch <strong>de</strong>n für ihn schlimmeren Fall e<strong>in</strong>beziehen, dass Spieler 2<br />

gesteht. Wür<strong>de</strong> er <strong>in</strong> <strong>die</strong>sem Fall schweigen, wür<strong>de</strong> er e<strong>in</strong>e Strafe von 10 Jahren<br />

erhalten. Also ist es besser, wenn er gesteht, im schlimmsten Fall bekommt er<br />

dann 5 Jahre, im günstigeren Fall sogar nur e<strong>in</strong> Jahr. Analog stellt sich <strong>die</strong> Situation<br />

für <strong>de</strong>n Spieler 2 dar.<br />

Übungshalber geben wir <strong>die</strong> Auszahlungsmatrizen für <strong>die</strong> bei<strong>de</strong>n Spieler an, wobei<br />

X 1 = {x 1 1,x 1 2} = {S,G} bzw. X 2 = {x 2 1,x 2 2} = {S,G} gilt:<br />

(<br />

u1 (x 1 i,x 2 j) ) i,j=1.2 = S G<br />

S -2 -10<br />

G -1 -5<br />

(<br />

u2 (x 1 i,x 2 j) ) i,j=1,2 = S G<br />

S -2 -1<br />

G -10 -5<br />

Häufig wer<strong>de</strong>n <strong>die</strong> bei<strong>de</strong>n Auszahlungsmatrizen <strong>in</strong> e<strong>in</strong>em Schema zusammengefaßt,<br />

<strong>in</strong><strong>de</strong>m man <strong>die</strong> Stelle (i,j) <strong>de</strong>r Matrix mit <strong>de</strong>m Zahlenpaar


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 10<br />

(u 1 (x 1 i,x 2 j), (u 2 (x 1 i,x 2 j)) besetzt:<br />

Spieler 1<br />

Spieler 2<br />

S G<br />

S -2,-2 -10,-1<br />

G -1,-10 -5,-5<br />

Im folgen<strong>de</strong>n Spiel ”<br />

Ste<strong>in</strong>, Schere, Papier“ ist <strong>de</strong>r Gew<strong>in</strong>n <strong>de</strong>s e<strong>in</strong>en Spielers gleich<br />

<strong>de</strong>m Verlust <strong>de</strong>s an<strong>de</strong>ren. Wir wer<strong>de</strong>n solche Spiele später Nullsummenspiele nennen.<br />

Beispiel 1.3 Gegeben seien zwei Spieler, <strong>die</strong> unabhängig vone<strong>in</strong>an<strong>de</strong>r Ste<strong>in</strong> (St),<br />

Schere (S) o<strong>de</strong>r Papier (P) wählen. Die Strategiemengen bei<strong>de</strong>r Spieler s<strong>in</strong>d also<br />

gegeben durch<br />

X 1 := X 2 := {St, S, P}<br />

Es gelten <strong>die</strong> bekannten Regeln: Papier hüllt <strong>de</strong>n Ste<strong>in</strong>, <strong>de</strong>r Ste<strong>in</strong> macht <strong>die</strong> Schere<br />

stumpf, <strong>die</strong> Schere schnei<strong>de</strong>t Papier. Man kann es auch so ausdrücken:<br />

Papier schlägt Ste<strong>in</strong>, Ste<strong>in</strong> schlägt Schere, Schere schlägt Papier.<br />

Gew<strong>in</strong>nt Spieler 1, so erhält er 1 Euro von Spieler 2, verliert er, so zahlt er 1 Euro<br />

an ihn. In Patt-Situation erfolgt ke<strong>in</strong>e Zahlung. Wie im vorangehen<strong>de</strong>n Beispiel<br />

wer<strong>de</strong>n <strong>die</strong> Auszahlungsmatrizen (für bei<strong>de</strong> Spieler) <strong>in</strong> e<strong>in</strong>em Schema angegeben,<br />

das <strong>die</strong> Präferenzordnung für je<strong>de</strong>n Spieler festlegt:<br />

Spieler 1<br />

Spieler 2<br />

Ste<strong>in</strong> Schere Papier<br />

Ste<strong>in</strong> 0 , 0 1 ,-1 -1 , 1<br />

Schere -1 , 1 0 , 0 1 ,-1<br />

Papier 1 ,-1 -1 , 1 0 , 0<br />

Wir begrün<strong>de</strong>n, dass ke<strong>in</strong> Nash-Gleichgewicht für <strong>die</strong>ses Spiel existiert. So kann<br />

(St,St) ke<strong>in</strong> Nash-Gleichgewicht se<strong>in</strong>, weil gilt:<br />

u 1 (St,St) = 0 < max{u 1 (x 1 ,St) |x 1 ∈ {St,S,P }} = 1<br />

Ebenso kann (St,S) ke<strong>in</strong> Nash-Gleichgewicht se<strong>in</strong>, <strong>de</strong>nn es gilt:<br />

u 2 (St,S) = −1 < max{u 2 (St,x 2 ) |x 2 ∈ {St,S,P }} = 1<br />

Ganz analog sieht <strong>die</strong> Begründung für je<strong>de</strong> <strong>de</strong>r übrigen Strategiekomb<strong>in</strong>ationen<br />

aus, dass sie als Nash-Gleichgewicht nicht <strong>in</strong> Frage kommt.


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 11<br />

1.3 Strategische Äquivalenz<br />

Der Begriff <strong>de</strong>r ”<br />

strategischen Äquivalenz“ gestattet es, Spiele auf typische Formen<br />

zurückzuführen, und <strong>die</strong>se zu untersuchen.<br />

Def<strong>in</strong>ition 1.4 Gegeben seien zwei Spiele<br />

Γ 1 = ( A, (X 1 ,...,X m ), (≽ 1,1 ,...,≽ 1,m ) )<br />

und Γ 2 = ( A, (X 1 ,...,X m ), (≽ 2,1 ,...,≽ 2,m ) )<br />

<strong>die</strong> sich nur durch ihre Präferenzordnungen unterschei<strong>de</strong>n. Sie heißen strategisch<br />

äquivalent, wenn <strong>die</strong> Menge <strong>de</strong>r Nash-Gleichgewichte i<strong>de</strong>ntisch ist.<br />

Aus <strong>de</strong>r Def<strong>in</strong>ition folgt unmittelbar, dass <strong>de</strong>r Begriff ”<br />

strategische Äquivalenz“<br />

e<strong>in</strong>e Äquivalenzrelation auf <strong>de</strong>r Menge <strong>de</strong>r strategischen Spiele erzeugt.<br />

Dass bei <strong>de</strong>n Beispielen, <strong>die</strong> im vorangehen<strong>de</strong>n Abschnitt betrachtet wor<strong>de</strong>n s<strong>in</strong>d,<br />

untere<strong>in</strong>an<strong>de</strong>r ke<strong>in</strong>e strategische Äquivalenz vorliegen kann, ergibt sich alle<strong>in</strong><br />

schon aus <strong>de</strong>r verschie<strong>de</strong>nen Anzahl <strong>de</strong>r Nash-Gleichgewichte.<br />

Wir führen nun e<strong>in</strong>en Begriff e<strong>in</strong>, <strong>de</strong>r an sich von Interesse ist, mit <strong>de</strong>ssen Hilfe<br />

aber auch e<strong>in</strong>e e<strong>in</strong>fache h<strong>in</strong>reichen<strong>de</strong> Bed<strong>in</strong>gung für strategische Äquivalenz angegeben<br />

wer<strong>de</strong>n kann.<br />

Wir betrachten e<strong>in</strong>en Spieler i und e<strong>in</strong>e gegebene Strategiekomb<strong>in</strong>ation ˜x −i <strong>de</strong>r<br />

übrigen Mitspieler. Unter <strong>de</strong>r Bed<strong>in</strong>gung, dass <strong>die</strong> Mitspieler <strong>die</strong>se Strategiekomb<strong>in</strong>ation<br />

beibehalten, wird i <strong>die</strong> Strategie ˜x i e<strong>in</strong>er an<strong>de</strong>ren Strategie x i vorziehen,<br />

wenn gilt: (˜x i , ˜x −i ) ≽ i (x i , ˜x −i ).<br />

Def<strong>in</strong>ition 1.5 Gegeben sei e<strong>in</strong>e Präferenzordnung ≽ i <strong>de</strong>s Spielers i auf <strong>de</strong>r<br />

Menge <strong>de</strong>r Strategiekomp<strong>in</strong>ationen X aller Spieler. Dann wird für i e<strong>in</strong>e Präferenzordnung<br />

≽ i |˜x −i unter <strong>de</strong>r Bed<strong>in</strong>gung ˜x −i auf <strong>de</strong>r Menge <strong>de</strong>r Strategien X i <strong>de</strong>s<br />

Spielers i <strong>de</strong>f<strong>in</strong>iert durch<br />

˜x i ≽ i |˜x −i x i :⇐⇒ (˜x i , ˜x −i ) ≽ i (x i , ˜x −i )<br />

Lemma 1.1 Gegeben seien zwei Spiele Γ 1 und Γ 2 <strong>in</strong> <strong>de</strong>r Notation von Def<strong>in</strong>ition<br />

1.4. S<strong>in</strong>d alle bed<strong>in</strong>gten Präferenzordnungen von Γ 1 und Γ 2 i<strong>de</strong>ntisch, dann s<strong>in</strong>d<br />

<strong>die</strong> bei<strong>de</strong>n Spiele strategisch äquivalent.<br />

Beweis: Sei x ∗ e<strong>in</strong> Nash-Gleichgewicht von Γ 1 . Dann gilt nach Def<strong>in</strong>ition <strong>de</strong>s<br />

Nash-Gleichgewichts:<br />

x ∗ ≽ i,1 (x i ,x ∗,−i )<br />

∀ x i ∈ X i , ∀ i ∈ A


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 12<br />

Nach Def<strong>in</strong>ition <strong>de</strong>r bed<strong>in</strong>gten Präferenzordnung ist <strong>die</strong>s für je<strong>de</strong>s i äquivalent zu<br />

x ∗, i ≽ i,1 | x ∗,−i x i ∀ x i ∈ X i<br />

Da <strong>die</strong> bed<strong>in</strong>gten Präferenzordnungen i<strong>de</strong>ntisch s<strong>in</strong>d, folgt weiter für je<strong>de</strong>s i:<br />

x ∗, i ≽ i,2 | x ∗,−i x i ∀ x i ∈ X i<br />

Daraus folgt nun:<br />

x ∗ ≽ i,2 (x i ,x ∗,−i )<br />

∀ x i ∈ X i , ∀ i ∈ A<br />

Somit ist x ∗ e<strong>in</strong> Nash-Gleichgewicht bezüglich Γ 2 . Da man <strong>in</strong> obiger Begründung<br />

<strong>die</strong> Rollen von Γ 1 und Γ 2 vertauschen kann, folgt <strong>die</strong> Behauptung. ✷<br />

Satz 1.2 Gegeben seien zwei Spiele mit Auszahlungen Γ 1 := (A,X,U) und Γ 2 :=<br />

(<br />

A,X, Ũ) mit <strong>de</strong>r gleichen Anzahl von Spielern und <strong>de</strong>n gleichen Strategiemengen.<br />

Es gebe Zahlen k i > 0 und Funktionen c i : X −i ↦→ R, so dass für je<strong>de</strong>s i ∈ A<br />

gilt:<br />

ũ i (x) = k i u i (x) + c i (x −i ) ∀ x ∈ X (1.5)<br />

Dann s<strong>in</strong>d <strong>die</strong> Spiele Γ 1 und Γ 2 strategisch äquivalent.<br />

Beweis: Im vorliegen<strong>de</strong>n Fall ist <strong>die</strong> Präferenzordnung durch <strong>die</strong> Auszahlungsfunktionen<br />

U bzw. Ũ <strong>de</strong>f<strong>in</strong>iert. Für i ∈ A gilt ˜x i ≽ i |˜x −i x i genau dann, wenn<br />

u i (˜x) ≥ u i (x i , ˜x −i ) ist. Diese Ungleichung ist aber äquivalent zu:<br />

k i u i (˜x) + c i (˜x −i ) ≥ k i u i (x i , ˜x −i ) + c i (˜x −i )<br />

Dies ist aber gleichbe<strong>de</strong>utend mit ũ i (˜x) ≥ ũ i (x i , ˜x −i ), woraus unmittelbar <strong>die</strong><br />

Behauptung folgt. ✷<br />

<strong>E<strong>in</strong>e</strong> Erläuterung <strong>de</strong>s Satzes erfolgt für <strong>de</strong>n e<strong>in</strong>fachen Fall e<strong>in</strong>es Spiels mit<br />

zwei Spielern, <strong>de</strong>ren Strategiemenge jeweils zwei Elemente enthält. Die Formel<br />

(1.5) wird für Spieler 1 durch folgen<strong>de</strong> Beziehungen wie<strong>de</strong>rgegeben:<br />

ũ 1 (x 1 1,x 2 1) = k 1 u 1 (x 1 1,x 2 1) + c 1 (x 2 1)<br />

ũ 1 (x 1 1,x 2 2) = k 1 u 1 (x 1 1,x 2 2) + c 1 (x 2 2)<br />

ũ 1 (x 1 2,x 2 1) = k 1 u 1 (x 1 2,x 2 1) + c 1 (x 2 1)<br />

ũ 1 (x 1 2,x 2 2) = k 1 u 1 (x 1 2,x 2 2) + c 1 (x 2 2)


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 13<br />

Diese Gleichungen kann man <strong>in</strong> folgen<strong>de</strong>m Rechenschema durchführen; <strong>die</strong> nachfolgen<strong>de</strong><br />

Auszahlungsmatrix für Spieler 1 multipliziert man mit k 1 und ad<strong>die</strong>rt<br />

zu <strong>de</strong>n bei<strong>de</strong>n Zeilen <strong>de</strong>n Vektor (c 1 (x 2 1), c 1 (x 2 2)):<br />

k 1 · →<br />

x 2 1 x 2 2<br />

x 1 1 u 1 (x 1 1,x 2 1) u 1 (x 1 1,x 2 2)<br />

x 1 2 u 1 (x 1 2,x 2 1) u 1 (x 1 2,x 2 2)<br />

↑ + c 1 (x 2 1) c 1 (x 2 2))<br />

Die entsprechen<strong>de</strong>n Gleichungen für <strong>de</strong>n Spieler 2 ergeben folgen<strong>de</strong>s Schema:<br />

k 2 · →<br />

x 2 1 x 2 2<br />

x 1 1 u 1 (x 1 1,x 2 1) u 1 (x 1 1,x 2 2)<br />

x 1 2 u 1 (x 1 2,x 2 1) u 1 (x 1 2,x 2 2)<br />

+ c 2 (x 1 1)<br />

c 2 (x 1 2)<br />

Beispiel 1.4 Betrachtet wird das Beispiel 1.2 (Gefangenendilemma). Die Auszahlungen<br />

<strong>de</strong>r bei<strong>de</strong>n Spieler s<strong>in</strong>d <strong>in</strong> folgen<strong>de</strong>r ”<br />

Matrix“ zusammengefaßt:<br />

Spieler 1<br />

Spieler 2<br />

S G<br />

S -2,-2 -10,-1<br />

G -1,-10 -5,-5<br />

Die Matrix wird <strong>in</strong> folgen<strong>de</strong>r Weise abgeän<strong>de</strong>rt: Es wird k 1 = k 2 = 1 gewählt, für<br />

Spieler 1 wird <strong>de</strong>r Zeilenvektor (1, 10) h<strong>in</strong>zuad<strong>die</strong>rt, für Spieler 2 <strong>de</strong>r Spaltenvektor<br />

(1, 10) T . Die ” äquivalenten“ Auszahlungen ( ũ(x 1 i,u 2 j) ) wer<strong>de</strong>n dann durch<br />

folgen<strong>de</strong> Matrix wie<strong>de</strong>rgegeben:<br />

Spieler 1<br />

Spieler 2<br />

S G<br />

S -1,-1 0,0<br />

G 0,0 5,5<br />

Daraus läßt sich ”<br />

leicht“ ablesen, dass (G,G) e<strong>in</strong> Nash-Gleichgewicht ist.<br />

Im Folgen<strong>de</strong>n wird <strong>de</strong>r Begriff <strong>de</strong>r ”<br />

strategischen Äquivalenz“ auf e<strong>in</strong>ige spezielle<br />

Spiele angewandt.<br />

Def<strong>in</strong>ition 1.6 E<strong>in</strong> Konstantensummen-Spiel ist e<strong>in</strong> Spiel Γ := (A,X,U), so<br />

dass für je<strong>de</strong> Spielstrategie x ∈ X <strong>die</strong> Auszahlungssumme ∑ i∈A u i (x) = C ist für<br />

e<strong>in</strong>e Konstante C ∈ R. Ist C = 0, so heißt das Spiel Nullsummen-Spiel.


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 14<br />

Das Spiel ”<br />

Ste<strong>in</strong>-Schere-Papier“(Beispiel 1.3), <strong>de</strong>ssen Auszahlungsmatrix wir nochmals<br />

angeben, ist e<strong>in</strong> Nullsummen-Spiel:<br />

Spieler 1<br />

Spieler 2<br />

Ste<strong>in</strong> Schere Papier<br />

Ste<strong>in</strong> 0 , 0 1 ,-1 -1 , 1<br />

Schere -1 , 1 0 , 0 1 ,-1<br />

Papier 1 ,-1 -1 , 1 0 , 0<br />

Satz 1.3 Je<strong>de</strong>s Konstantensummen-Spiel ist e<strong>in</strong>em Nullsummen-Spiel strategisch<br />

äquivalent.<br />

Beweis: Wir wen<strong>de</strong>n Satz 1.2 an, <strong>in</strong> <strong>de</strong>m wir speziell für je<strong>de</strong>s x setzen:<br />

ũ 1 (x) = u 1 (x) + c 1 ,<br />

ũ i (x) = u i (x) ∀ i = 2,...,m<br />

Mit c 1 = −C folgt dann: ∑ i∈A ũi(x) = ∑ i∈A u i (x) + c 1 = 0.<br />

✷<br />

Def<strong>in</strong>ition 1.7 E<strong>in</strong> Spiel mit 2 Spielern ( ”<br />

Zweipersonen-Spiel“) heißt stark kämpferisch,<br />

wenn für je zwei Strategiekomb<strong>in</strong>ationen x,x ′ ∈ X gilt:<br />

x ≽ 1 x ′ ⇐⇒ x ′ ≽ 2 x (1.6)<br />

Beispiel 1.5 E<strong>in</strong> e<strong>in</strong>faches Beispiel e<strong>in</strong>es stark kämpferischen Spiels ist durch<br />

Spieler 2<br />

Spieler 1<br />

x 2 1 x 2 2<br />

x 1 1 -10, 5 2,-2<br />

x 1 2 1,-1 -1,1<br />

gegeben; <strong>de</strong>nn <strong>die</strong> Auszahlungsmatrizen implizieren folgen<strong>de</strong> Präferenzordnungen:<br />

(x 1 1,x 2 1) ≼ 1 (x 1 2,x 2 2) ≼ 1 (x 1 2,x 2 1) ≼ 1 (x 1 1,x 2 2)<br />

(x 1 1,x 2 2) ≼ 2 (x 1 2,x 2 1) ≼ 2 (x 1 2,x 2 2) ≼ 2 (x 1 1,x 2 1)<br />

Daraus folgt <strong>die</strong> Gültigkeit von (1.6).<br />

✷<br />

Man macht sich leicht klar, dass e<strong>in</strong> Zweipersonen-Nullsummen-Spiel stark kämpferisch<br />

ist. Der nachfolgen<strong>de</strong> Satz zeigt, dass auch <strong>die</strong> Umkehrung gilt.<br />

Satz 1.4 E<strong>in</strong> stark kämpferisches Zweipersonen-Spiel mit Auszahlung ist e<strong>in</strong>em<br />

Nullsummen-Spiel strategisch äquivalent.


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 15<br />

Beweis: Das Zweipersonen-Spiel sei gegeben durch Γ := ({1, 2}, (X 1 ,X 2 ), (u 1 ,u 2 )).<br />

Wir <strong>de</strong>f<strong>in</strong>ieren e<strong>in</strong> zweites Spiel ˜Γ := ({1, 2}, (X 1 ,X 2 ), (ũ 1 , ũ 2 )), <strong>in</strong><strong>de</strong>m wir <strong>die</strong><br />

Auszahlungsfunktionen auf X := X 1 × X 2 wie folgt festlegen:<br />

ũ 1 (x) := u 1 (x), ũ 2 (x) := −u 1 (x) ∀ x ∈ X<br />

Wegen ũ 1 (x) + ũ 2 (x) = 0 ∀ x ∈ X ist ˜Γ e<strong>in</strong> Nullsummenspiel. Aus <strong>de</strong>r Def<strong>in</strong>ition<br />

von Γ als kämpferischem Spiel und aus <strong>de</strong>r Def<strong>in</strong>ition von ũ 2 folgt:<br />

u 2 (x) ≥ u 2 (x ′ ) ⇐⇒ u 1 (x) ≤ u 1 (x ′ )<br />

⇐⇒ −u 1 (x) ≥ −u 1 (x ′ )<br />

⇐⇒ ũ 2 (x) ≥ ũ 2 (x ′ )<br />

Für e<strong>in</strong> Element x ∗ ∈ X gilt somit u i (x ∗ ) ≥ u i (x i ,x ∗,−i ), (∀x i ∈ X i ,i = 1, 2)<br />

genau dann, wenn <strong>die</strong>s auch für <strong>die</strong> Funktionen ũ i gilt. Damit ist <strong>de</strong>r Punkt x ∗<br />

genau dann e<strong>in</strong> Nash-Gleichgewicht bezüglich Γ, wenn er e<strong>in</strong> solches bezüglich ˜Γ<br />

ist, d.h. Γ ist strategisch äquivalent zu ˜Γ. ✷<br />

1.4 An<strong>de</strong>re Lösungskonzepte<br />

Mit <strong>de</strong>m Nash-Gleichgewicht haben wir das zentrale Lösungskonzept <strong>de</strong>r <strong>Spieltheorie</strong><br />

kennengelernt. In <strong>die</strong>sem Abschnitt sollen aber noch zwei an<strong>de</strong>re Lösungsansätze<br />

angesprochen wer<strong>de</strong>n, <strong>die</strong> wir <strong>de</strong>r E<strong>in</strong>fachheit halber nur für Spiele mit<br />

Auszahlungen, also Spiele <strong>de</strong>r Form Γ := (A, X, U), formulieren.<br />

Def<strong>in</strong>ition 1.8 Gegeben seien zwei Strategien ¯x i ,x i ∈ X i . Man sagt, <strong>die</strong> Strategie<br />

¯x i <strong>de</strong>s Spieler i dom<strong>in</strong>iert <strong>die</strong> Strategie x i <strong>die</strong>ses Spielers, wenn für alle<br />

Strategiekomb<strong>in</strong>ationen x −i <strong>de</strong>r übrigen Mitspieler gilt:<br />

u i (¯x i ,x −i ) ≥ u i (x i ,x −i )<br />

Dies be<strong>de</strong>utet mit an<strong>de</strong>ren Worten: Für <strong>de</strong>n Spieler i ist <strong>de</strong>r Nutzen <strong>de</strong>r Strategie<br />

¯x i m<strong>in</strong><strong>de</strong>stens so groß wie <strong>de</strong>r Nutzen <strong>de</strong>r Strategie x i , und zwar unabhängig<br />

davon, welche Strategie x −i <strong>die</strong> übrigen Mitspieler wählen. <strong>E<strong>in</strong>e</strong> Strategie ¯x i heißt<br />

dom<strong>in</strong>ant für <strong>de</strong>n Spieler i, wenn ¯x i alle se<strong>in</strong>e übrigen Strategien x i dom<strong>in</strong>iert.<br />

<strong>E<strong>in</strong>e</strong> Strategie für Spieler i ist also dom<strong>in</strong>ant, wenn sie ihm unter allen für ihn<br />

verfügbaren Strategien <strong>de</strong>n größten Nutzen verschafft, und zwar unabhängig davon,<br />

welche Strategiekomb<strong>in</strong>ation <strong>die</strong> übrigen Mitspieler wählen. Wenn e<strong>in</strong> Spieler<br />

i über e<strong>in</strong>e dom<strong>in</strong>ante Strategie verfügt, gibt es für ihn ke<strong>in</strong>e strategische Unsicherheit:<br />

er wird <strong>die</strong>se Strategie wählen, unabhängig davon, wie sich <strong>die</strong> Mitspieler<br />

entschei<strong>de</strong>n.


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 16<br />

Def<strong>in</strong>ition 1.9 E<strong>in</strong> Vektor x ∗ ∈ X = X 1 × ... × X m heißt Gleichgewicht <strong>in</strong><br />

dom<strong>in</strong>anten Strategien, wenn für je<strong>de</strong>n Spieler i ∈ A <strong>die</strong> Strategie x ∗, i dom<strong>in</strong>ant<br />

ist.<br />

Es ist leicht e<strong>in</strong>zusehen, dass <strong>de</strong>r Begriff <strong>de</strong>s ”<br />

Gleichgewichts <strong>in</strong> dom<strong>in</strong>anten Strategien“<br />

e<strong>in</strong> schärferer Begriff ist als <strong>de</strong>r <strong>de</strong>s Nash-Gleichgewichts. Es gilt folgen<strong>de</strong><br />

Aussage:<br />

Satz 1.5 Je<strong>de</strong>s Gleichgewicht <strong>in</strong> dom<strong>in</strong>anten Strategien ist e<strong>in</strong> Nash-Gleichgewicht.<br />

Beweis: Ist x ∗ e<strong>in</strong> Gleichgewicht <strong>in</strong> dom<strong>in</strong>anten Strategien, so gilt für je<strong>de</strong>n<br />

Spieler i und je<strong>de</strong> Strategiekomb<strong>in</strong>ation x −i <strong>de</strong>r übrigen Spieler:<br />

u i (x ∗, i ,x −i ) ≥ u i (x i ,x −i ) ∀ x i ∈ X i<br />

Dies gilt dann <strong>in</strong>sbeson<strong>de</strong>re auch für x −i := x ∗, −i .<br />

Beispiel 1.6 Das Gefangenendilemma (Beispiel 1.2) ist e<strong>in</strong> Spiel mit e<strong>in</strong>em<br />

Gleichgewicht <strong>in</strong> dom<strong>in</strong>anten Strategien, das durch (G,G) gegeben ist. Dies wird<br />

beson<strong>de</strong>rs <strong>de</strong>utlich, wenn man das dazu strategisch äquivalente Spiel <strong>de</strong>s Beispiels<br />

1.4 betrachtet. ✷<br />

Obwohl das Konzept <strong>de</strong>s ”<br />

Gleichgewichts <strong>in</strong> dom<strong>in</strong>anten Strategien“ <strong>in</strong> <strong>de</strong>r <strong>Spieltheorie</strong><br />

ke<strong>in</strong>e große Rolle spielt, ist <strong>de</strong>r Begriff e<strong>in</strong>er ”<br />

dom<strong>in</strong>ierten“ Strategie <strong>in</strong><br />

e<strong>in</strong>igen Fällen s<strong>in</strong>nvoll. Wird x i von e<strong>in</strong>er Strategie ¯x i strikt dom<strong>in</strong>iert, so kann x i<br />

als i-te Komponente <strong>in</strong> e<strong>in</strong>em Nash-Gleichgewicht x ∗ nicht vorkommen. Bei <strong>de</strong>r<br />

Suche nach e<strong>in</strong>em Nash-Gleichgewicht kann man (strikt) dom<strong>in</strong>ierte Strategien<br />

ausschließen, somit das Problem reduzieren.<br />

Beispiel 1.7 Betrachtet wird e<strong>in</strong> Spiel mit zwei Spielern 1 und 2. Spieler 1 und<br />

2 habe <strong>die</strong> Strategiemengen X 1 := {U,D} bzw. X 2 := {L,M,R}. Die Auszahlungsmatrix<br />

lautet wie folgt:<br />

Spieler 1<br />

✷<br />

Spieler 2<br />

L M R<br />

U 1, 0 1, 2 0, 1<br />

D 0, 3 0, 1 2, 0<br />

Man kann ablesen, dass für Spieler 2 <strong>die</strong> Strategie R durch M dom<strong>in</strong>iert wird<br />

(wegen 2 > 1 und 1 > 0). Spieler 2 wird (bei rationaler Vorgehensweise) niemals<br />

<strong>die</strong> Strategie R spielen, sie kann also von Spieler 2 gestrichen wer<strong>de</strong>n:<br />

Spieler 1<br />

Spieler 2<br />

L M<br />

U 1, 0 1, 2<br />

D 0, 3 0, 1


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 17<br />

Dies bemerkt natürlich Spieler 1 und er erkennt, dass er nun se<strong>in</strong>erseits Strategie<br />

D streichen kann, <strong>de</strong>nn <strong>die</strong>se wird von U dom<strong>in</strong>iert (wegen 1 > 0 und 1 > 0).<br />

Wird <strong>die</strong> zweite Zeile aus <strong>de</strong>m Schema entfernt, erkennt man, dass (U,M) e<strong>in</strong><br />

Gleichgewicht (sogar <strong>in</strong> dom<strong>in</strong>anten) Strategien ist. ✷<br />

Beispiel 1.8 Auch <strong>in</strong> folgen<strong>de</strong>m Beispiel kann e<strong>in</strong> Nash-Gleichgewicht gefun<strong>de</strong>n<br />

wer<strong>de</strong>n, <strong>in</strong><strong>de</strong>m Strategien, <strong>die</strong> dom<strong>in</strong>iert wer<strong>de</strong>n, bei <strong>de</strong>r Suche nach e<strong>in</strong>er Lösung<br />

vernachlässigt wer<strong>de</strong>n.<br />

Zwei Tankstellen liegen an <strong>de</strong>rselben Straße e<strong>in</strong>an<strong>de</strong>r gegenüber. Zusammen können<br />

sie pro Tag 10000 Liter Benz<strong>in</strong> verkaufen. Die Tankstellenbesitzer kaufen Benz<strong>in</strong><br />

für 0,75 Euro pro Liter e<strong>in</strong> und können es grundsätzlich (jeweils <strong>in</strong> Cent-<br />

Schritten) zu höheren Preisen verkaufen. Verlangt e<strong>in</strong>e Tankstelle mehr als 0,80<br />

Euro, so kann sie ke<strong>in</strong> Benz<strong>in</strong> mehr verkaufen. Verlangen bei<strong>de</strong> Tankstellen <strong>de</strong>nselben<br />

Preis, so teilen sie sich <strong>de</strong>n Markt. Ist e<strong>in</strong>e Tankstelle billiger, so kaufen<br />

alle Autofahrer bei <strong>die</strong>ser Tankstelle (10000 Liter), während <strong>die</strong> an<strong>de</strong>re Tankstelle<br />

nichts verkauft. <strong>E<strong>in</strong>e</strong> Peisabsprache f<strong>in</strong><strong>de</strong>t nicht statt. Die Auszahlungen für bei<strong>de</strong><br />

Tankstellen s<strong>in</strong>d <strong>in</strong> folgen<strong>de</strong>r Tabelle dargestellt:<br />

Preis 0,80 0,79 0,78 0,77 0,76 0,75<br />

0,80 250 , 250 0 , 400 0 , 300 0 , 200 0 , 100 0 , 0<br />

0,79 400 , 0 200 , 200 0 , 300 0 , 200 0 , 100 0 , 0<br />

0,78 300 , 0 300 , 0 150 , 150 0 , 200 0 , 100 0 , 0<br />

0,77 200 , 0 200 , 0 200 , 0 100 , 100 0 , 100 0 , 0<br />

0,76 100 , 0 100 , 0 100 , 0 100 , 0 50 , 50 0 , 0<br />

0,75 0 , 0 0 , 0 0 , 0 0 , 0 0 , 0 0 , 0<br />

Die bei<strong>de</strong>n Tankstellenbesitzer s<strong>in</strong>d <strong>die</strong> Spieler, ihre Strategien bestehen <strong>in</strong> <strong>de</strong>r<br />

Festsetzung <strong>de</strong>r Preise, also stehen je<strong>de</strong>m Spieler sechs Strategien zur Verfügung.<br />

Die Auszahlungsfunktionen für bei<strong>de</strong> bestehen <strong>in</strong> <strong>de</strong>r Differenz zwischen Tagese<strong>in</strong>nahmen<br />

und Beschaffungskosten.<br />

Bei rationalem Verhalten wird Spieler 1 (Spaltenspieler) niemals <strong>die</strong> Strategien 1<br />

o<strong>de</strong>r 6 wählen (0,80 bzw. 0,75), weil <strong>die</strong>se von Strategie 2 (0,79) dom<strong>in</strong>iert wer<strong>de</strong>n.<br />

Er kann also se<strong>in</strong>e Strategiemenge um <strong>die</strong>se bei<strong>de</strong>n Strategien reduzieren.<br />

Dasselbe gilt für Spieler 2 (Zeilenspieler), so dass das gegebene Spiel wie folgt<br />

reduziert wer<strong>de</strong>n kann:<br />

Preis 0,79 0,78 0,77 0,76<br />

0,79 200 , 200 0 , 300 0 , 200 0 , 100<br />

0,78 300 , 0 150 , 150 0 , 200 0 , 100<br />

0,77 200 , 0 200 , 0 100 , 100 0 , 100<br />

0,76 100 , 0 100 , 0 100 , 0 50 , 50


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 18<br />

Diese Vorgehensweise läßt sich bei <strong>die</strong>sem Beispiel fortsetzen. Für Spieler 1 wird<br />

nun <strong>die</strong> Strategie 2 (0,79) von Strategie 3 (0,78) dom<strong>in</strong>iert, und entsprechend für<br />

Spieler 2. Man erreicht am En<strong>de</strong>, dass für je<strong>de</strong>n Spieler <strong>die</strong> Strategie 5 (0,76)<br />

übrig bleibt und <strong>die</strong>ses Strategiepaar bil<strong>de</strong>t e<strong>in</strong> Nash-Gleichgewicht.<br />

Man beachte aber, dass <strong>die</strong> Reduzierungen nicht zu strategisch äquivalenten Spielen<br />

geführt haben. Die Wahl von 0,75 für bei<strong>de</strong> Spieler stellt ebenfalls e<strong>in</strong> Nash-<br />

Gleichgewicht dar, das aber durch <strong>die</strong> Reduktionen verloren gegangen ist.<br />

Wir erwähnen als Nächstes noch e<strong>in</strong> weiteres Lösungskonzept, das <strong>in</strong> <strong>de</strong>r spieltheoretischen<br />

Literatur manchmal auftritt und aus <strong>de</strong>r multikriteriellen Optimierung<br />

(Optimierung mit mehreren Zielfunktionen) stammt.<br />

Def<strong>in</strong>ition 1.10 Für e<strong>in</strong> Spiel Γ mit Auszahlung wird e<strong>in</strong> Vektor x ∗ ∈ X :=<br />

X 1 × ... × X m e<strong>in</strong> Pareto-Gleichgewicht genannt, wenn es ke<strong>in</strong> x ∈ X gibt, so<br />

dass gilt:<br />

u i (x) ≥<br />

u i (x ∗ ) ∀ i = 1,...,m<br />

u k (x) > u k (x ∗ ) für m<strong>in</strong><strong>de</strong>stens e<strong>in</strong> k ∈ {1,...,m}<br />

E<strong>in</strong> Pareto-Gleichgewicht x ∗ liegt also dann vor, wenn es ke<strong>in</strong>e Strategiekomb<strong>in</strong>ation<br />

x gibt, <strong>de</strong>ren Nutzen für alle Spieler m<strong>in</strong><strong>de</strong>stens so gut wie x ∗ und für<br />

m<strong>in</strong><strong>de</strong>stens e<strong>in</strong>en Spieler k echt besser ist.<br />

Im Beispiel 1.2 s<strong>in</strong>d <strong>die</strong> Strategiekomb<strong>in</strong>ationen (G,S), (S,G) und (S,S) allesamt<br />

Pareto-Gleichgewichte, nicht aber das e<strong>in</strong>zige Nash-Gleichgeicht (G,G). Dies<br />

zeigt, dass das Pareto-Gleichgewicht mit <strong>de</strong>m Nash-Gleichgewicht nicht vergleichbar<br />

ist. Das Pareto-Gleichgewicht spielt <strong>in</strong> <strong>de</strong>r <strong>Spieltheorie</strong> nur e<strong>in</strong>e untergeordnete<br />

Rolle.<br />

1.5 Klassifikation strategischer Spiele<br />

Strategische Spiele <strong>de</strong>r Form Γ := (A, X, ≽) mit X = ∏ m<br />

i=1 X i können zunächst<br />

nach <strong>de</strong>r Kard<strong>in</strong>alität <strong>de</strong>r Mengen X i unterschie<strong>de</strong>n wer<strong>de</strong>n. Danach heißt Γ<br />

• endlich, wenn alle Strategiemengen X i (i ∈ {1,...,m}) endlich s<strong>in</strong>d;<br />

• abzählbar, wenn m<strong>in</strong><strong>de</strong>stens e<strong>in</strong>e Strategiemenge X i abzählbar ist, und <strong>die</strong><br />

übrigen höchstens abzählbar s<strong>in</strong>d;<br />

• kont<strong>in</strong>uierlich, wenn wenigstens e<strong>in</strong>e <strong>de</strong>r Mengen X i überabzählbar ist.


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 19<br />

Endliche Spiele mit nur zwei Akteuren (Spielern) s<strong>in</strong>d von beson<strong>de</strong>rer Be<strong>de</strong>utung<br />

und erhalten daher e<strong>in</strong>en eigenen Namen:<br />

• E<strong>in</strong> endliches 2-Personen-Nullsummenspiel heißt Matrixspiel.<br />

• E<strong>in</strong> endliches 2-Personen-Spiel heißt Bi-Matrixspiel.<br />

Es soll kurz begrün<strong>de</strong>t wer<strong>de</strong>n, weshalb man <strong>in</strong> <strong>de</strong>n angesprochenen Fällen von<br />

Matrix- bzw. Bi-Matrix-Spielen sprechen kann. Direkt e<strong>in</strong>sehbar ist, dass je<strong>de</strong>s<br />

endliche Spiel strategisch äquivalent e<strong>in</strong>em endlichen Spiel mit Auszahlung ist<br />

bei geeigneter Festlegung <strong>de</strong>r Auszahlungsfunktionen u i . Da nach Voraussetzung<br />

<strong>die</strong> Strategiemengen endlich s<strong>in</strong>d, können sie bei e<strong>in</strong>em 2-Personen-Spiel wie folgt<br />

dargestellt wer<strong>de</strong>n: X 1 = {x 1 ,x 2 ,...,x p } und X 2 = {y 1 ,y 2 ,...,y n }. Def<strong>in</strong>ieren<br />

wir nun<br />

a ij := u 1 (x i ,y j ) , b ij := u 2 (x i ,y j ) für i = 1,...,p; j = 1,...,n<br />

so erhalten wir zwei Matrizen A = (a ij ), B = (b ij ) jeweils <strong>in</strong> R p×n , <strong>die</strong> Auszahlungsmatrizen<br />

von Spieler 1 bzw. 2 genannt wer<strong>de</strong>n. Da man im allgeme<strong>in</strong>en<br />

zwei Matrizen benötigt, spricht man von e<strong>in</strong>em Bi-Matrixspiel. Im Falle e<strong>in</strong>es<br />

2-Personen-Nullsummenspiels gilt B = −A, so dass man zur Beschreibung <strong>de</strong>r<br />

Auszahlung tatsächlich nur e<strong>in</strong>e Matrix benötigt, und daher von e<strong>in</strong>em Matrixspiel<br />

spricht. Die Beispiele 1.1 und 1.2 s<strong>in</strong>d Bi-Matrixspiele, wogegen Beispiel 1.3<br />

als Matixspiel anzusehen ist.<br />

Es gibt weitere Klassifikationsmerkmale für strategische Spiele, <strong>die</strong> sich <strong>in</strong>sbeson<strong>de</strong>re<br />

auf spezielle spieltheoretische Themenstellungen o<strong>de</strong>r beson<strong>de</strong>re Eigenschaften<br />

von Spielen beziehen. Wir geben dazu <strong>die</strong> folgen<strong>de</strong> Liste an, <strong>die</strong> wir im<br />

Wesentlichen <strong>de</strong>r Arbeit [1] von C. Kanzow entnommen haben und <strong>die</strong> bei <strong>de</strong>r<br />

E<strong>in</strong>ordnung spezieller spieltheoretischer Probleme hilfreich se<strong>in</strong> kann:<br />

• kooperative vs. nicht-kooperative Spiele<br />

Bei nicht-kooperativen Spielen wird davon ausgegangen, dass <strong>die</strong> e<strong>in</strong>zelnen<br />

Spieler strikt gegene<strong>in</strong>an<strong>de</strong>r agieren und es ke<strong>in</strong>e Kooperation (Absprachen)<br />

zwischen <strong>de</strong>n Akteuren gibt, wie sie bei kooperativen Spielen erlaubt s<strong>in</strong>d.<br />

Zur Sicherung <strong>de</strong>s Wettbewerbs ist das Bun<strong>de</strong>skartellamt beispielsweise<br />

dafür verantwortlich, dass es <strong>in</strong> gewissen Bereichen (etwa bei M<strong>in</strong>eralölkonzernen)<br />

ke<strong>in</strong>e Kooperation (Preisabsprachen) gibt. Dagegen ist das Ölkartell<br />

OPEC e<strong>in</strong> Beispiel für Kooperation, <strong>in</strong><strong>de</strong>m sich alle Teilnehmer auf För<strong>de</strong>rquoten<br />

e<strong>in</strong>lassen und <strong>die</strong>se e<strong>in</strong>halten müssen.<br />

• statische vs. dynamische Spiele<br />

Bei statischen Spielen wählen alle Spieler ihre Strategie simultan aus. Kei-


KAPITEL 1. EINFÜHRUNG IN STRATEGISCHE SPIELE 20<br />

nem Spieler s<strong>in</strong>d <strong>die</strong> Entscheidungen <strong>de</strong>r Gegenspieler bekannt. Bei <strong>de</strong>n dynamischen<br />

Spielen h<strong>in</strong>gegen tritte e<strong>in</strong>e zeitliche Reihenfolge <strong>de</strong>r Spielzüge<br />

auf.<br />

• One-shot games vs. wie<strong>de</strong>rholte Spiele<br />

One-shot games wer<strong>de</strong>n genau e<strong>in</strong>mal gespielt, bei <strong>de</strong>n wie<strong>de</strong>rholten Spielen<br />

h<strong>in</strong>gegen kann e<strong>in</strong> und dasselbe Spiel mehrfach h<strong>in</strong>ere<strong>in</strong>an<strong>de</strong>r gespielt<br />

wer<strong>de</strong>n. Die Lösung <strong>de</strong>s wie<strong>de</strong>rholten Spiels wird dabei nicht immer e<strong>in</strong>er<br />

gleichen Abfolge <strong>de</strong>r Lösung <strong>de</strong>s one-shot game entsprechen, weil jetzt Lerneffekte<br />

unterstellt wer<strong>de</strong>n, <strong>die</strong> e<strong>in</strong>en E<strong>in</strong>fluß auf <strong>die</strong> Wahl <strong>de</strong>r möglichen<br />

Strategien haben können o<strong>de</strong>r gewisse Strategien ganz ausschließen.<br />

• Spiele mit vollständiger vs. unvollständiger Information<br />

Das hier angesprochene Unterscheidungsmerkmal bezieht sich auf <strong>die</strong> Informationslage<br />

<strong>de</strong>r Spieler. Bei Spielen mit vollständiger Information stehen<br />

sämtliche relevanten Informationen allen Spielern zur Verfügung. Je<strong>de</strong>r<br />

Spieler kennt <strong>die</strong> möglichen Strategien sowie <strong>die</strong> Auszahlungsfunktionen<br />

von allen Mitspielern. Man spricht dann auch von Spielen mit vollständiger<br />

Information. An<strong>de</strong>rnfalls han<strong>de</strong>lt es sich um e<strong>in</strong> Spiel mit unvollständiger<br />

Information.<br />

Schach ist beispielsweise e<strong>in</strong> Spiel mit vollständiger Information. Bei<strong>de</strong> Spieler<br />

kennen <strong>de</strong>n bisherigen Spielverlauf und s<strong>in</strong>d über alle Möglichkeiten, wie<br />

<strong>de</strong>r Mitspieler im nächsten Schritt agieren kann, <strong>in</strong>formiert. Dagegen ist<br />

Skat e<strong>in</strong> Spiel mit mit unvollständiger Information.<br />

Schwerpunkt <strong>die</strong>ser Vorlesung s<strong>in</strong>d Spiele, <strong>die</strong> <strong>die</strong> folgen<strong>de</strong>n Eigenschaften besitzen:<br />

Die behan<strong>de</strong>lten Spiele s<strong>in</strong>d nicht-kooperativ, sie s<strong>in</strong>d statisch, one-shot<br />

games und mit vollständiger Information ausgestattet. Spiele mit an<strong>de</strong>ren Eigenschaften<br />

wer<strong>de</strong>n - wenn überhaupt - nur am Ran<strong>de</strong> und dann eher beispielhaft<br />

behan<strong>de</strong>lt.


Kapitel 2<br />

Existenz von<br />

Nash-Gleichgewichten<br />

In <strong>de</strong>n e<strong>in</strong>fachen Beispielen <strong>de</strong>s ersten Kapitels haben wir gesehen, dass e<strong>in</strong> spieltheoretisches<br />

Problem e<strong>in</strong> o<strong>de</strong>r mehrere Nash-Gleichgewichte haben kann, dass es<br />

aber auch Probleme ohne Nash-Gleichgewichte gibt. In <strong>die</strong>sem Kapitel wird e<strong>in</strong><br />

Existenzsatz von Nikaido-Isoda vorgestellt, <strong>de</strong>r allerd<strong>in</strong>gs auf e<strong>in</strong>em Fixpunktsatz<br />

von Kakutani beruht, <strong>de</strong>r hier nur zitiert wird. Die Grundlage für <strong>de</strong>n Beweis <strong>de</strong>s<br />

genannten Existenzsatzes stellt <strong>die</strong> so genannte Beste-Antwort-Funktion dar, <strong>die</strong><br />

wir als erstes vorstellen.<br />

2.1 Die Abbildung <strong>de</strong>r Bestantwort<br />

Wenn e<strong>in</strong> Spieler i e<strong>in</strong>e Strategiekomb<strong>in</strong>ation x −i ∈ X −i := X 1 × ...X i−1 ×<br />

X i+1 ...X m se<strong>in</strong>er Mitspieler kennen wür<strong>de</strong>, so wür<strong>de</strong> er dazu aus se<strong>in</strong>er Strategiemenge<br />

X i e<strong>in</strong>e bestmögliche unter <strong>de</strong>r Bed<strong>in</strong>gung, dass x −i bereits vorliegt,<br />

wählen. <strong>E<strong>in</strong>e</strong> solche Strategie s i (falls sie existiert) ist durch folgen<strong>de</strong> Bed<strong>in</strong>gung<br />

gekennzeichnet:<br />

s i ≽ i | x −i x i für alle x i ∈ X i (2.1)<br />

Mit Hilfe e<strong>in</strong>er Nutzenfunktion u i für Spieler i läßt sich <strong>die</strong>se Bed<strong>in</strong>gung äquivalent<br />

auch so formulieren, dass s i e<strong>in</strong> Maximierer <strong>de</strong>s folgen<strong>de</strong>n Problems ist:<br />

maxu i (x i ,x −i ) s.d. x i ∈ X i (2.2)<br />

Dabei ist x −i als fest vorgegeben anzusehen. Mit S i (x −i ) bezeichnen wir <strong>die</strong> Menge<br />

aller Optimallösungen <strong>de</strong>r Aufgabe (2.2).<br />

Def<strong>in</strong>ition 2.1 Die Abbildung x −i ↦→ S i (x −i ) heißt beste Antwort <strong>de</strong>s Spielers i<br />

(auf <strong>die</strong> Strategiekomb<strong>in</strong>ation x −i <strong>de</strong>r Mitspieler). Die zusammengesetzte Abbil-<br />

21


KAPITEL 2. EXISTENZ VON NASH-GLEICHGEWICHTEN 22<br />

dung x ↦→ S(x) mit<br />

S(x) := S 1 (x −1 ) × ... × S m (x −m )<br />

von X <strong>in</strong> <strong>die</strong> Potenzmenge ℘(X) wird Beste-Antwort-Funktion <strong>de</strong>s gegebenen<br />

Spiels Γ genannt.<br />

Satz 2.1 Für e<strong>in</strong> Spiel Γ := (A, X, U) ist x ∗<br />

Gleichgewicht, wenn x ∗ ∈ S(x ∗ ) ist.<br />

∈ X genau dann e<strong>in</strong> Nash-<br />

Beweis: 1) Sei x ∗ e<strong>in</strong> Nash-Gleichgewicht von Γ. Dann gilt nach Satz 1.1 für<br />

je<strong>de</strong>s i ∈ {1,...,m}, dass x ∗ i e<strong>in</strong> Maximierer <strong>de</strong>r Aufgabe<br />

maxu i (x i ,x ∗, −i )<br />

s.d. x i ∈ X i<br />

ist. Dies heißt, dass x ∗ i ∈ S i (x ∗ −i ) und somit x ∗ ∈ S(x ∗ ) ist.<br />

2) Geht man umgekehrt von x ∗ ∈ S(x ∗ ) aus, so sieht man unmittelbar e<strong>in</strong>, dass<br />

<strong>die</strong> Inklusionen unter 1) auch rückwärts durchlaufen wer<strong>de</strong>n können, womit <strong>de</strong>r<br />

Satz bewiesen ist. ✷<br />

Beispiel 2.1 Mit Hilfe <strong>de</strong>s Beispiels 1.2 (Gefangenendilemma) aus <strong>de</strong>m vorangehen<strong>de</strong>n<br />

Kapitel wird Satz 2.1 erläutert. Die Auszahlungsfunktionen aus <strong>die</strong>sem<br />

Beispiel lauten:<br />

u 1 (S,G) = −10 , u 1 (G,G) = −5 , u 1 (S,S) = −2 , u 1 (G,S) = −1<br />

u 2 (G,S) = −10 , u 2 (G,G) = −5 , u 2 (S,S) = −2 , u 2 (S,G) = −1<br />

Bestimme <strong>die</strong> Menge S(G,S) := S 1 (S) × S 2 (G):<br />

Lösungsmenge von max u 1 (x,S) mit x ∈ {G,S} :<br />

Lösungsmenge von max u 2 (G,y) mit y ∈ {G,S} :<br />

S 1 (S) = {G}<br />

S 2 (G) = {G}<br />

Bestimme <strong>die</strong> Menge S(S,G) := S 1 (G) × S 2 (S):<br />

Lösungsmenge von max u 1 (x,G) mit x ∈ {G,S} :<br />

Lösungsmenge von max u 2 (S,y) mit y ∈ {G,S} :<br />

S 1 (G) = {G}<br />

S 2 (S) = {G}<br />

Bestimme <strong>die</strong> Menge S(G,G) := S 1 (G) × S 2 (G):<br />

Lösungsmenge von max u 1 (x,G) mit x ∈ {G,S} :<br />

Lösungsmenge von max u 2 (G,y) mit y ∈ {G,S} :<br />

S 1 (G) = {G}<br />

S 2 (G) = {G}


KAPITEL 2. EXISTENZ VON NASH-GLEICHGEWICHTEN 23<br />

Bestimme <strong>die</strong> Menge S(S,S) := S 1 (S) × S 2 (S):<br />

Lösungsmenge von max u 1 (x,S) mit x ∈ {G,S} :<br />

Lösungsmenge von max u 2 (S,y) mit y ∈ {G,S} :<br />

S 1 (S) = {G}<br />

S 2 (S) = {G}<br />

Es gilt also: S(G,S) = {(G,G)}, S(S,G) = {(G,G)}, S(G,G) = {(G,G)},<br />

S(S,S) = {(G,G)}. Damit ist bestätigt, dass gera<strong>de</strong> für das Nash-Gleichgewicht<br />

x ∗ = (G,G) <strong>die</strong> Bed<strong>in</strong>gung x ∗ ∈ S(x ∗ ) erfüllt ist. ✷<br />

2.2 Gemischte Erweiterung<br />

Zur E<strong>in</strong>führung betrachten wir zunächst e<strong>in</strong> Spiel mit zwei Spielern 1 und 2,<br />

<strong>de</strong>n 2-elementigen Strategiemengen X 1 = {x 1 1,x 1 2} und X 2 = {x 2 1,x 2 2} und <strong>de</strong>r<br />

Auszahlung U = (u 1 ,u 2 ). Bei <strong>de</strong>r Untersuchung e<strong>in</strong>es solchen Spiels haben wir<br />

bisher ausschließlich Strategiekomb<strong>in</strong>ationen (x 1 i,x 2 j) (i,j ∈ {1, 2}) zugelassen.<br />

Wie das Beispiel ”<br />

Ste<strong>in</strong>-Schere-Papier“ zeigte, muss sich unter solchen Strategien<br />

ke<strong>in</strong> Nash-Gleichgewicht bef<strong>in</strong><strong>de</strong>n. Außer<strong>de</strong>m ist es nicht immer s<strong>in</strong>nvoll, sich<br />

für genau e<strong>in</strong>e Strategie zu entschei<strong>de</strong>n. Wird das genannte Spiel oft wie<strong>de</strong>rholt,<br />

so macht es vielmehr S<strong>in</strong>n, dass je<strong>de</strong>r Spieler e<strong>in</strong>e Strategie mit e<strong>in</strong>er gewissen<br />

Wahrsche<strong>in</strong>lichkeit spielt. Der Strategiemenge X i <strong>de</strong>s Spielers i ordnen wir <strong>die</strong><br />

” erweiterte Strategiemenge“ ̂X i ∈ R 2 zu, <strong>die</strong> wie folgt <strong>de</strong>f<strong>in</strong>iert ist:<br />

̂X i := {(ξ i 1,ξ i 2) ∈ R 2 |ξ i 1 + ξ i 2 = 1, ξ i 1 ≥ 0, ξ i 2 ≥ 0}<br />

Als Strategie wählt Spieler 1 e<strong>in</strong>en Vektor (ξ 1 1,ξ 1 2) ∈ ̂X 1 mit <strong>de</strong>r Be<strong>de</strong>utung, dass<br />

se<strong>in</strong>e urprünglichen Strategien x 1 1 und x 1 2 mit jeweils <strong>de</strong>r Wahrsche<strong>in</strong>lichkeit ξ 1 1<br />

bzw. ξ 1 2 gespielt wer<strong>de</strong>n (z.B. unter Verwendung e<strong>in</strong>es Wahrsche<strong>in</strong>lichkeitsmechanismus).<br />

Der Vektor (ξ 1 1,ξ 1 2) wird dann e<strong>in</strong>e ”<br />

gemischte Strategie“ <strong>de</strong>s Spielers 1<br />

genannt. Die spezielle gemischte Strategie e 1 = (1, 0) (bzw. e 2 = (0, 2)) be<strong>de</strong>utet,<br />

dass Spieler 1 jeweils nur <strong>die</strong> ursprüngliche Strategie x 1 1 (bzw. x 1 2) spielt, <strong>die</strong> <strong>in</strong><br />

<strong>die</strong>sem Kontext nun ”<br />

re<strong>in</strong>e Strategie“ genannt wird. Entsprechend s<strong>in</strong>d Vektoren<br />

(ξ 2 1,ξ 2 2) ∈ ̂X 2 für Spieler 2 zu <strong>in</strong>terpretieren.<br />

Für gegebene gemischte Strategien ξ 1 := (ξ 1 1,ξ 1 2) ∈ ̂X 1 bzw. ξ 2 := (ξ 2 1,ξ 2 2) ∈ ̂X 2<br />

<strong>de</strong>r bei<strong>de</strong>n Spieler wird <strong>die</strong> erweiterte Auszahlungsfunktion û i für Spieler i ∈<br />

{1, 2} wie folgt festgelegt:<br />

2∑ 2∑<br />

û i (ξ 1 ,ξ 2 ) := ξkξ 1 j 2 u i (x 1 k,x 2 j)<br />

k=1 j=1<br />

Sie entspricht <strong>de</strong>m Erwartungswert <strong>de</strong>s Spielers i für <strong>die</strong> Verteilungvektoren ξ 1<br />

und ξ 2 .


KAPITEL 2. EXISTENZ VON NASH-GLEICHGEWICHTEN 24<br />

Beispiel 2.2 Zur Erläuterung <strong>de</strong>r Begriffe greifen wir auf Beispiel 1.1 zurück.<br />

Wir nehmen an, dass sich Fre<strong>de</strong>ric auf Grund e<strong>in</strong>es Zufallsmechanismus mit jeweils<br />

<strong>de</strong>r Wahrsche<strong>in</strong>lichkeit von 1 für F bzw. K entschei<strong>de</strong>t; für Nicole seien<br />

2<br />

<strong>die</strong>se Wahrsche<strong>in</strong>lichkeiten mit 1 bzw. 2 gegeben. <strong>E<strong>in</strong>e</strong> gemischte Strategie ist<br />

3 3<br />

dann ξ 1 = ( 1, 1) für Spieler 1 und 2 2 ξ2 = ( 1, 2 ) für Spieler 2. Die Auszahlungsfunktionen<br />

û i (ξ 1 ,ξ 2 ) (i = 1, 2) geben dann <strong>de</strong>n Erwartungswert <strong>de</strong>s Nutzens“ für ”<br />

3 3<br />

Spieler i an, <strong>de</strong>r bei <strong>de</strong>r Wahl <strong>de</strong>r gemischten Strategiekomb<strong>in</strong>ation ξ := (ξ 1 ,ξ 2 )<br />

entsteht.<br />

Es soll nun allgeme<strong>in</strong> <strong>die</strong> gemischte Erweiterung e<strong>in</strong>es endlichen Spiels mit Auszahlung<br />

<strong>de</strong>f<strong>in</strong>iert wer<strong>de</strong>n.<br />

Def<strong>in</strong>ition 2.2 Gegeben sei e<strong>in</strong> Spiel Γ := (A, X, U) mit <strong>de</strong>n endlichen Strategiemengen<br />

X i := {x i 1,x i 2,...,x i n i<br />

} für i ∈ {1,...m}. Für je<strong>de</strong>s i ∈ {1,...,m}<br />

wird <strong>die</strong> erweiterte Strategiemenge durch<br />

n i<br />

̂X i := {(ξ1,...,ξ i n i i<br />

) ∈ R n ∑<br />

i<br />

| ξj i = 1, ξj i ≥ 0 ∀ j = 1,...,n i }<br />

j=1<br />

<strong>de</strong>f<strong>in</strong>iert. Für (ξ 1 ,...,ξ m ) ∈ ̂X := ̂X 1 ×...×̂X m wird <strong>die</strong> i-te Auszahlungsfunktion<br />

û i durch<br />

û i (ξ 1 ,...,ξ m ) =<br />

n 1 ∑<br />

j 1 =1<br />

...<br />

n m ∑<br />

j m=1<br />

(ξ 1 j 1 · ... · ξ m j m<br />

) u i (x 1 j 1<br />

,...,x m j m<br />

)<br />

e<strong>in</strong>geführt. Mit Û = (û 1,...,û m ) heißt dann das Spiel ̂Γ := ( A, ̂X, Û) <strong>die</strong> gemischte<br />

Erweiterung <strong>de</strong>s Spiels Γ.<br />

• Je<strong>de</strong>s Element aus <strong>de</strong>r Menge ̂X i ⊂ R n i<br />

wird e<strong>in</strong>e gemischte Strategie von<br />

i genannt. Je<strong>de</strong>m Vektor e k ∈ ̂X i entspricht e<strong>in</strong>e ursprüngliche“ Strategie<br />

”<br />

x i k, <strong>die</strong> nun re<strong>in</strong>e Strategie genannt wird (für <strong>die</strong> gemischte Strategie e k<br />

<strong>de</strong>s Spielers i schreiben wir: x i k). ̂X i ist <strong>die</strong> konvexe Hülle <strong>in</strong> R n i<br />

<strong>de</strong>r n i<br />

E<strong>in</strong>heitsvektoren e k .<br />

• Je<strong>de</strong> Menge ̂X i ist e<strong>in</strong> kompaktes, konvexes Polye<strong>de</strong>r. Als Produktmenge<br />

<strong>die</strong>ser Mengen ist somit auch ̂X e<strong>in</strong>e kompakte, konvexe Menge. Deshalb<br />

wird ̂Γ auch Konvexivizierung <strong>de</strong>s endlichen Spiels Γ genannt.<br />

Für <strong>die</strong> Funktionen û i erhält man aus Def<strong>in</strong>ition 2.2 <strong>die</strong> folgen<strong>de</strong> nützliche Darstellungsformel<br />

für je<strong>de</strong>s i ∈ {1,...,m}:<br />

n i<br />

∑<br />

û i (ξ) = ξj i ûi(x i j,ξ −i ) (2.3)<br />

j=1


KAPITEL 2. EXISTENZ VON NASH-GLEICHGEWICHTEN 25<br />

Beweis: Wir begrün<strong>de</strong>n <strong>die</strong> Formel o.B.d.A. für i = 1:<br />

û 1 (ξ) =<br />

=<br />

=<br />

n 1 ∑<br />

j 1 =1<br />

∑n 1<br />

j 1 =1<br />

∑n 1<br />

j=1<br />

[<br />

ξj 1 ∑n 2<br />

1<br />

j 2 =1<br />

[<br />

ξj 1 ∑n 1<br />

1<br />

...<br />

n 2 ∑<br />

j=1 j 2 =1<br />

n m ∑<br />

j m=1<br />

∑n m<br />

...<br />

ξ 1 j û1(x 1 j,ξ −1 )<br />

(ξ 2 j 2 · ... · ξ m j m<br />

) u 1 (x 1 j 1<br />

,...,x m j m<br />

) ]<br />

j m=1<br />

(δ j j1 ξ 2 j 2 · ... · ξ m j m<br />

) u 1 (x 1 j 1<br />

,...,x m j m<br />

) ]<br />

Dabei s<strong>in</strong>d <strong>die</strong> Zahlen δ j j1 <strong>die</strong> Koord<strong>in</strong>aten <strong>de</strong>s Vektors e j1 ∈ R n 1<br />

.<br />

2.3 E<strong>in</strong> Existenzsatz von Nikaido-Isoda<br />

Das grundlegen<strong>de</strong> Lösungskonzept <strong>de</strong>r <strong>Spieltheorie</strong> beruht auf <strong>de</strong>m Begriff <strong>de</strong>s<br />

Nash-Gleichgewichts. Wie wir gesehen haben, tritt schon für relativ e<strong>in</strong>fache Beispiele<br />

<strong>de</strong>r Fall e<strong>in</strong>, dass e<strong>in</strong> Nash-Gleichgewichtspunkt nicht existiert. E<strong>in</strong> zentrales<br />

Problem <strong>de</strong>r <strong>Spieltheorie</strong> besteht somit dar<strong>in</strong>, unter speziellen Bed<strong>in</strong>gungen<br />

<strong>die</strong> Existenz e<strong>in</strong>es Nash-Gleichgewichts nachzuweisen. In <strong>die</strong>sem Abschnitt wird<br />

e<strong>in</strong> erster Existenzsatz vorgestellt, <strong>de</strong>r auf <strong>de</strong>m Fixpunktsatz von Kakutani beruht.<br />

Um <strong>die</strong>sen Satz formulieren zu können, s<strong>in</strong>d e<strong>in</strong>ige Begriffe bereit zu stellen.<br />

✷<br />

Def<strong>in</strong>ition 2.3 Sei X ⊆ R n . Dann heißt e<strong>in</strong>e Abbildung f : X ↦→ ℘(R m ) (wobei<br />

℘(R m ) <strong>die</strong> Potenzmenge von R m ist) e<strong>in</strong>e Punkt-Menge-Abbildung.<br />

Im Folgen<strong>de</strong>n legen wir e<strong>in</strong> Spiel Γ := (A, X, U) zugrun<strong>de</strong> mit X i ⊆ R n i<br />

für i =<br />

1,...,m. Bei <strong>de</strong>r Def<strong>in</strong>ition <strong>de</strong>r Beste-Antwort-Funktion wur<strong>de</strong> für vorgegebenes<br />

x ∈ X und je<strong>de</strong>s i ∈ {1,...,m} <strong>die</strong> Menge <strong>de</strong>r Maximierer je<strong>de</strong>r Aufgabe<br />

max u i (x i ,x −i ) s.d. x i ∈ X i (2.4)<br />

mit S i (x −i ) bezeichnet und dann S(x) := S 1 (x −1 ) × ... × S m (x −m ) gesetzt. Die<br />

durch Φ(x) := S(x) <strong>de</strong>f<strong>in</strong>ierte Funktion Φ ordnet somit je<strong>de</strong>m Punkt x ∈ X <strong>die</strong><br />

Teilmenge S(x) ∈ ℘(X) zu mit X ⊆ R n 1<br />

×... ×R nm , ist also e<strong>in</strong> Beispiel für e<strong>in</strong>e<br />

Punkt-Menge-Abbildung.<br />

E<strong>in</strong> wichtiger Begriff für Punkt-Menge-Abbildungen ist <strong>de</strong>r <strong>de</strong>r Abgeschlossenheit.<br />

Def<strong>in</strong>ition 2.4 Sei X ⊆ R n . Die Punkt-Menge-Abbildung f : X ↦→ ℘(R m ) wird<br />

abgeschlossen genannt, falls für je zwei konvergente Folgen {x k } ↦→ x <strong>in</strong> X und<br />

{y k } ↦→ y <strong>in</strong> R m mit y k ∈ f(x k ) für alle k ∈ N folgt: y ∈ f(x).


KAPITEL 2. EXISTENZ VON NASH-GLEICHGEWICHTEN 26<br />

Damit s<strong>in</strong>d wir <strong>in</strong> <strong>de</strong>r Lage, <strong>de</strong>n wichtigen Fixpunktsatz von Kakutani zu formulieren.<br />

Auf e<strong>in</strong>en Beweis <strong>die</strong>ses Satzes soll aber im Rahmen <strong>die</strong>ser Ausarbeitung<br />

verzichtet wer<strong>de</strong>n.<br />

Satz 2.2 (Fixpunktsatz von Kakutani)<br />

Sei X e<strong>in</strong>e nichtleere, konvexe und kompakte Teilmenge von R n , <strong>die</strong> Abbildung<br />

f : X ↦→ ℘(X) sei ferner abgeschlossen und besitze <strong>die</strong> Eigenschaft, dass <strong>die</strong><br />

Mengen f(x) für alle x ∈ X nichtleer und konvex s<strong>in</strong>d. Dann besitzt <strong>die</strong> Abbildung<br />

f e<strong>in</strong>en Fixpunkt, d.h. es existiert e<strong>in</strong> x ∗ ∈ X mit x ∗ ∈ f(x ∗ ).<br />

Nach Satz 2.1 ist x ∗ ∈ X genau dann e<strong>in</strong> Nash-Gleichgewicht, wenn x ∗ ∈ S(x ∗ )<br />

ist, d.h. wenn x ∗ e<strong>in</strong> Fixpunkt <strong>de</strong>r Beste-Antwort-Funktion Φ ist. Damit ist nachzuweisen,<br />

dass Φ <strong>die</strong> Voraussetzungen <strong>de</strong>s Satzes von Kakutani erfüllt. Das ist<br />

aber nur möglich, wenn das Spiel Γ gewissen Voraussetzungen genügt. Zu <strong>de</strong>ren<br />

Formulierung ist e<strong>in</strong>e weitere Def<strong>in</strong>ition erfor<strong>de</strong>rlich.<br />

Def<strong>in</strong>ition 2.5 D sei e<strong>in</strong>e konvexe Teilmenge <strong>de</strong>s R p . <strong>E<strong>in</strong>e</strong> Funktion g : D ↦→ R<br />

heißt quasikonkav auf D, wenn für alle x,y ∈ D gilt:<br />

g(x) ≤ g(y) =⇒ g(x) ≤ g(λx + (1 − λ)y) ∀ λ ∈ (0, 1)<br />

Man bestätigt leicht, dass e<strong>in</strong>e auf e<strong>in</strong>er konvexen Menge D konkave Funktion<br />

auch quasikonkav ist. Quasikonkave Funktionen besitzen e<strong>in</strong>e wichtige Anwendung<br />

<strong>in</strong> Bezug auf Maximierungsaufgaben <strong>de</strong>r Form<br />

max g(x) s.d. x ∈ D (2.5)<br />

Satz 2.3 Sei D ⊆ R p konvex und g : D ↦→ R quasikonkav. Dann ist <strong>die</strong> Menge<br />

<strong>de</strong>r Optimallösungen <strong>de</strong>r Aufgabe (2.4) e<strong>in</strong>e konvexe Teilmenge von D.<br />

Beweis: D ∗ sei <strong>die</strong> Menge <strong>de</strong>r Maximierer <strong>de</strong>r Aufgabe (2.5). Falls D ∗ <strong>die</strong> leere<br />

Menge ist, dann ist nichts zu zeigen. Seien nun x ∗ ,y ∗ ∈ D ∗ . Dann gilt g(x ∗ ) =<br />

g(y ∗ ), so dass aus <strong>de</strong>r Def<strong>in</strong>ition <strong>de</strong>r Quasikonkavität von g für alle λ ∈ (0, 1)<br />

folgt: g(x ∗ ) ≤ g(λx ∗ + (1 − λ)y ∗ ). Hier<strong>in</strong> kann aber nur das Gleichheitszeichen<br />

gelten, weil x ∗ e<strong>in</strong> Maximierer ist. Also folgt: λx ∗ +(1 −λ)y ∗ ∈ D ∗ , somit ist D ∗<br />

konvex. ✷<br />

Auf <strong>de</strong>r Grundlage <strong>de</strong>s Fixpunktsatzes von Kakutani beweisen wir nun e<strong>in</strong>en<br />

Existenzsatz für das Nash-Gleichgewicht.


KAPITEL 2. EXISTENZ VON NASH-GLEICHGEWICHTEN 27<br />

Satz 2.4 (Existenzsatz von Nikaido-Isoda)<br />

Sei Γ := (A, X, U) e<strong>in</strong> Spiel, so dass für alle i = 1,...,m <strong>die</strong> folgen<strong>de</strong>n Eigenschaften<br />

erfüllt s<strong>in</strong>d:<br />

a) Die Strategiemengen X i s<strong>in</strong>d nichtleer, konvex und kompakt.<br />

b) Die Auszahlungsfunktionen u i : X ↦→ R s<strong>in</strong>d stetig.<br />

c) Die Auszahlungsfunktionen u i (x i ,x −i ) s<strong>in</strong>d quasikonkav als Abbildung <strong>in</strong> x i<br />

(für alle x −i ).<br />

Dann besitzt das Spiel Γ e<strong>in</strong> Nash-Gleichgewicht.<br />

Beweis: Betrachtet wird <strong>die</strong> Punkt-Menge-Abbildung Φ ↦→ ℘(X), <strong>de</strong>f<strong>in</strong>iert durch<br />

Φ(x) := S(x) := S 1 (x −1 ) × ... × S m (x −m )<br />

Die Lösungsmengen S(x −i ) <strong>de</strong>r Maximierungsaufgaben (2.4) s<strong>in</strong>d nichtleer, weil<br />

jeweils <strong>de</strong>r zulässige Bereich X i nichtleer und kompakt und <strong>die</strong> Funktion u i stetig<br />

ist. Ferner s<strong>in</strong>d sie konvex, weil <strong>die</strong> Funktionen u i (x i ,x −i ) quasikonkav <strong>in</strong> x i s<strong>in</strong>d.<br />

Die Menge S(x) ist als kartesisches Produkt <strong>de</strong>r Mengen S(x −i ) damit ebenfalls<br />

nichtleer und konvex.<br />

Als Nächstes zeigen wir, dass <strong>die</strong> Abbildung Φ abgeschlossen ist. Seien dazu zwei<br />

Folgen x k ↦→ x <strong>in</strong> X und s k ↦→ s mit s k ∈ Φ(x k ) gegeben. Dann gilt<br />

u i (s k, i ,x k, −i ) ≥ u i (x i ,x k, −i ) ∀ x i ∈ X i ∀ k ∈ N<br />

für alle i = 1,...,m. Für k ↦→ ∞ folgt aus <strong>de</strong>r Stetigkeit von u i<br />

u i (s i ,x −i ) ≥ u i (x i ,x −i )<br />

∀ x i ∈ X i<br />

für alle i = 1,...,m. Also ist s i für je<strong>de</strong>s i ∈ {1,...,m} e<strong>in</strong>e Lösung <strong>de</strong>s Optimierungsproblems<br />

(2.4). Also ist s ∈ S(x) und somit ist Φ abgeschlossen.<br />

Die Abbildung Φ erfüllt somit <strong>die</strong> Voraussetzungen <strong>de</strong>s Fixpunktsatzes 2.2 von<br />

Kakutani. Somit gibt es e<strong>in</strong>en Punkt x ∗ ∈ S(x ∗ ) =: Φ(x ∗ ), <strong>de</strong>r nach <strong>de</strong>n Vorüberlegungen<br />

e<strong>in</strong> Nash-Gleichgewichtspunkt ist. ✷<br />

Beispiel 2.3 (Cournot’sches Oligopol)<br />

In e<strong>in</strong>em oligopolistischen Angebotsmo<strong>de</strong>ll wird davon ausgegangen, dass e<strong>in</strong> spezielles<br />

homogenes Gut von m konkurrieren<strong>de</strong>n Unternehmen auf <strong>de</strong>n Markt gebracht<br />

wird. Die Angebotsmenge <strong>de</strong>s Unternehmens i ∈ {1,...,m} sei mit x i , <strong>die</strong><br />

gesamte Angebotsmenge <strong>de</strong>r m Unternehmen mit ξ := ∑ m<br />

i=1 x i bezeichnet. Der<br />

Preis pro Mengene<strong>in</strong>heit für das Gut hängt von <strong>de</strong>r Menge ξ ab, <strong>die</strong> angeboten


KAPITEL 2. EXISTENZ VON NASH-GLEICHGEWICHTEN 28<br />

wird, sie wird mit p(ξ) notiert (man spricht hier von <strong>de</strong>r <strong>in</strong>versen Nachfragefunktion).<br />

Die Produktionskosten <strong>de</strong>s Unternehmens i s<strong>in</strong>d e<strong>in</strong>e Funktion <strong>de</strong>r Ausbr<strong>in</strong>gungsmenge<br />

x i , sie wer<strong>de</strong>n mit c i (x i ) bezeichnet.<br />

Der Profit <strong>de</strong>r Firma i berechnet sich dann zu<br />

u i (x i ) := x i · p(ξ) − c i (x i ) mit x i ≥ 0<br />

Wenn b i <strong>die</strong> Produktionskapazität <strong>de</strong>s Unternehmens i bezeichnet, so s<strong>in</strong>d <strong>die</strong><br />

Mengen x i wählbar aus [0, b i ].<br />

Es liegt also e<strong>in</strong> spieltheoretisches Problem vor mit <strong>de</strong>n Spielern i = 1,...,m,<br />

<strong>de</strong>n unendlichen Strategiemengen X i := [0, b i ] und <strong>de</strong>n Auszahlungsfunktionen<br />

u i . Die Mo<strong>de</strong>llannahmen s<strong>in</strong>d dann üblicherweise so, dass <strong>die</strong> Funktion p als stetig<br />

und konkav <strong>in</strong> <strong>de</strong>r Variablen ξ und <strong>die</strong> Funktionen c i als stetig und konvex<br />

angenommen wer<strong>de</strong>n.<br />

Man kann dann ohne Mühe begrün<strong>de</strong>n, dass alle Voraussetzungen <strong>de</strong>s Satzes 2.4<br />

erfüllt s<strong>in</strong>d, somit e<strong>in</strong> Nash-Gleichgewichtspunkt x ∗ existiert. Er wird auch Cournot’sches<br />

Gleichgewicht <strong>de</strong>s Oligopols genannt.<br />

Abän<strong>de</strong>rung <strong>de</strong>r Strategie (d.h. Ausbr<strong>in</strong>gungsmenge) <strong>de</strong>s i-ten Spielers von x ∗ i<br />

auf x i kann, wenn <strong>die</strong> übrigen Spieler <strong>die</strong> Strategiekomb<strong>in</strong>ation x ∗, −i beibehalten,<br />

ke<strong>in</strong>e Verbesserung <strong>de</strong>r Gew<strong>in</strong>nfunktion für i ergeben.<br />

Wie wir bereits gesehen haben, gibt es endliche Spiele, <strong>die</strong> ke<strong>in</strong> Nash-Gleichgewicht<br />

besitzen. <strong>E<strong>in</strong>e</strong> Folgerung aus <strong>de</strong>m Existenzsatz von Nikaido-Isoda besteht dar<strong>in</strong>,<br />

dass je<strong>de</strong> gemischte Erweiterung e<strong>in</strong>es endlichen Spiels e<strong>in</strong> Nash-Gleichgewicht<br />

hat.<br />

Korollar 2.1 Sei Γ := (A, X, U) e<strong>in</strong> endliches Spiel und ̂Γ := ( A, ̂X, Û) <strong>die</strong><br />

gemischte Erweiterung von Γ. Dann besitzt ̂Γ e<strong>in</strong> Nash-Gleichgewicht ξ ∗ .<br />

Beweis: Aus <strong>de</strong>r Def<strong>in</strong>ition 2.2 folgt direkt, dass <strong>die</strong> Strategiemengen ̂X i nichtleere,<br />

konvexe, kompakte Teilmengen von R n i<br />

s<strong>in</strong>d und dass <strong>die</strong> Funktionen û i<br />

<strong>in</strong> ξ stetig und <strong>in</strong> je<strong>de</strong>r Variablen ξ i l<strong>in</strong>ear und damit pseudokonkav s<strong>in</strong>d. Damit<br />

s<strong>in</strong>d alle Voraussetzungen <strong>de</strong>s Existenzsatzes für ̂Γ erfüllt, also besitzt ̂Γ e<strong>in</strong><br />

Nash-Gleichgewicht. ✷


Kapitel 3<br />

Endliche Spiele<br />

Die gemischte Erweiterung endlicher Spiele ist <strong>in</strong> Abschnitt 2.2 e<strong>in</strong>geführt wor<strong>de</strong>n.<br />

Diese Art Spiele ist <strong>in</strong> <strong>de</strong>r Literatur sehr <strong>in</strong>tensiv behan<strong>de</strong>lt wor<strong>de</strong>n. Wie<br />

wir zeigen konnten, besitzen sie e<strong>in</strong> Nash-Gleichgewicht, was auf endliche Spiele<br />

im Allgeme<strong>in</strong>en nicht zutrifft. In <strong>die</strong>sem Kapitel untersuchen wir Zweipersonen-<br />

Nullsummen-Spiele, <strong>die</strong> nach Satz 1.3 zu Zweipersonen-Konstantensummen-Spielen<br />

strategisch äquivalent s<strong>in</strong>d. Sie können als so genannte Matrixspiele <strong>in</strong> sehr<br />

übersichtlicher Form dargestellt und behan<strong>de</strong>lt wer<strong>de</strong>n. Allgeme<strong>in</strong>e (endliche)<br />

Zweipersonen-Spiele wer<strong>de</strong>n anschließend betrachtet; sie s<strong>in</strong>d zu so genannten<br />

Bi-Matrixspielen äquivalent. Schließlich wird e<strong>in</strong>e Verb<strong>in</strong>dung zur Optimierung<br />

und zu L<strong>in</strong>earen Komplementaritätsproblemen hergestellt. Auf <strong>die</strong>ser Grundlage<br />

können dann spezielle Verfahren zur Bestimmung von Nash-Gleichgewichten<br />

hergeleitet wer<strong>de</strong>n.<br />

3.1 Grundlegen<strong>de</strong> Eigenschaften<br />

Als erstes wird e<strong>in</strong>e spezielle Charakterisierung <strong>de</strong>s Nash-Gleichgewichts bei gemischten<br />

Strategien vorgestellt. Er<strong>in</strong>nert sei daran, dass e<strong>in</strong> Nash-Gleichgewicht<br />

ξ ∗ dadurch <strong>de</strong>f<strong>in</strong>iert ist, dass für je<strong>de</strong>s i ∈ {1,...,m} <strong>die</strong> folgen<strong>de</strong> Bed<strong>in</strong>gung<br />

erfüllt ist:<br />

û i (ξ ∗ ) ≥ û i (ξ i ,ξ ∗,−i ) ∀ ξ i ∈ ̂X i (3.1)<br />

Der folgen<strong>de</strong> Satz zeigt, dass es genügt, auf <strong>de</strong>r rechten Seite <strong>die</strong>ser Ungleichung<br />

an Stelle von ξ i ∈ ̂X i lediglich x i j ∈ X i zu verlangen.<br />

Satz 3.1 Gegeben sei e<strong>in</strong> Spiel Γ := (A, X, U) mit <strong>de</strong>n endlichen Strategiemengen<br />

X i := {x i 1,x i 2,...,x i n i<br />

} für i ∈ {1,...m} sowie se<strong>in</strong>e gemischte Erweiterung<br />

̂Γ. Genau dann ist ξ ∗ e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> ̂Γ, wenn für je<strong>de</strong>s i ∈ {1,...,m}<br />

29


KAPITEL 3. ENDLICHE SPIELE 30<br />

gilt:<br />

û i (ξ ∗ ) ≥ û i (x i j,ξ ∗,−i ) ∀ j ∈ {1,...,n i } (3.2)<br />

Beweis: Ist (3.1) erfüllt, dann ist erst recht (3.2) erfüllt, weil <strong>die</strong> Menge <strong>de</strong>r<br />

re<strong>in</strong>en Strategien <strong>de</strong>s Spielers i e<strong>in</strong>e Teilmenge von ̂X i ist. Ist nun umgekehrt<br />

(3.2) erfüllt, so folgt:<br />

û i (ξ ∗ ) =<br />

n i<br />

∑<br />

û i (ξ ∗ )ξj i ≥<br />

j=1<br />

n i<br />

∑<br />

û i (x i j,ξ ∗,−i )ξj i = û i (ξ i ,ξ ∗,−i )<br />

j=1<br />

für beliebiges ξ i ∈ ̂X i . Verwen<strong>de</strong>t wur<strong>de</strong>n dabei (3.2) und (2.3). Damit ist <strong>die</strong><br />

Aussage bewiesen. ✷<br />

Korollar 3.1 Sei x ∗ e<strong>in</strong> Nash-Gleichgewicht <strong>de</strong>s endlichen Spiels Γ := (A, X, U).<br />

Dann ist x ∗ auch e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> <strong>de</strong>r gemischten Erweiterung ̂Γ.<br />

Beweis: Nach Def<strong>in</strong>ition <strong>de</strong>s Nash-Gleichgewichts <strong>in</strong> Γ gilt für alle i:<br />

u i (x ∗ ) ≥ u i (x i j,x ∗ −i ) ∀ j ∈ {1,...,n i }<br />

⇐⇒ û i (x ∗ ) ≥ û i (x i j,x ∗ −i ) ∀ j ∈ {1,...,n i }<br />

Nach (3.2) folgt daraus <strong>die</strong> Behauptung.<br />

✷<br />

Offensichtlich ist e<strong>in</strong> Nash-Gleichgewicht ξ ∗ <strong>in</strong> <strong>de</strong>r gemischten Erweiterung ̂Γ<br />

schon e<strong>in</strong> Nasch-Gleichgewicht <strong>de</strong>s Spiels Γ, wenn ξ ∗ nur aus re<strong>in</strong>en Strategien<br />

besteht. Das ist genau dann <strong>de</strong>r Fall, wenn je<strong>de</strong>s ξ ∗ i mit e<strong>in</strong>em E<strong>in</strong>heitsvektor<br />

<strong>de</strong>r Form e k ∈ R n i<br />

i<strong>de</strong>ntisch ist.<br />

Die Lösungsmetho<strong>de</strong>n von Zweipersonen-Nullsummen-Spielen s<strong>in</strong>d eng mit <strong>de</strong>m<br />

Begriff <strong>de</strong>s ”<br />

Sattelpunktes“ e<strong>in</strong>er Funktion f von zwei Variablen verknüpft. Aus<br />

<strong>die</strong>sem Grun<strong>de</strong> wird auf <strong>die</strong>sen Begriff mit se<strong>in</strong>en grundlegen<strong>de</strong>n Eigenschften<br />

kurz e<strong>in</strong>gegangen.<br />

Def<strong>in</strong>ition 3.1 Sei f : X × Y ↦→ R e<strong>in</strong>e Funktion von zwei Variablen x und y.<br />

Dann heißt e<strong>in</strong> Punkt (x ∗ ,y ∗ ) ∈ X × Y Sattelpunkt <strong>de</strong>r Funktion f, falls gilt:<br />

f(x,y ∗ ) ≤ f(x ∗ ,y ∗ ) ≤ f(x ∗ ,y) ∀ (x,y) ∈ X × Y<br />

Der folgen<strong>de</strong> Satz zeigt, dass <strong>die</strong> Funktionswerte verschie<strong>de</strong>ner Sattelpunkte von<br />

f stets gleich s<strong>in</strong>d und dass Sattelpunkte auch ”<br />

gemischt“ wer<strong>de</strong>n können.


KAPITEL 3. ENDLICHE SPIELE 31<br />

Satz 3.2 Sei f : X ×Y ↦→ R e<strong>in</strong>e Funktion <strong>in</strong> x und y und seien (x ∗ ,y ∗ ), (˜x, ỹ) ∈<br />

X × Y Sattelpunkte von f. Dann s<strong>in</strong>d auch (x ∗ ,ỹ) und (˜x,y ∗ ) Sattelpunkte von<br />

f und es gilt:<br />

f(˜x, ỹ) = f(x ∗ ,y ∗ ) = f(x ∗ , ỹ) = f(˜x,y ∗ )<br />

Beweis: Da bei<strong>de</strong> Punkte Sattelpunkte s<strong>in</strong>d, erhält man folgen<strong>de</strong> Ungleichungen:<br />

f(x ∗ , ỹ) ≤ f(˜x, ỹ) ≤ f(˜x,y ∗ ) ≤ f(x ∗ ,y ∗ ) ≤ f(x ∗ , ỹ)<br />

Da <strong>die</strong> bei<strong>de</strong>n äußeren Werte <strong>de</strong>r Ungleichungskette gleich s<strong>in</strong>d, folgt Gleichheit:<br />

f(x ∗ ,ỹ) = f(˜x, ỹ) = f(˜x,y ∗ ) = f(x ∗ ,y ∗ )<br />

(˜x,y ∗ ) ist e<strong>in</strong> Sattelpunkt von f, <strong>de</strong>nn für beliebiges (x,y) ∈ X × Y ) gilt:<br />

f(x,y ∗ ) ≤ f(x ∗ ,y ∗ ) = f(˜x,y ∗ ) = f(˜x, ỹ) ≤ f(˜x,y)<br />

Entsprechend weist man nach, dass (x ∗ , ỹ) e<strong>in</strong> Sattelpunkt ist.<br />

✷<br />

Sattelpunkte stetiger Funktionen auf kompakten Mengen lassen sich, wie im Folgen<strong>de</strong>n<br />

beschrieben, durch e<strong>in</strong>e m<strong>in</strong> − max-Eigenschaft charakterisieren.<br />

Satz 3.3 Seien X und Y kompakte Teilmengen von R n 1<br />

bzw. R n 2<br />

und sei f :<br />

X × Y ↦→ R e<strong>in</strong>e stetige Funktion. Dann ist (x ∗ ,y ∗ ) ∈ X × Y genau dann e<strong>in</strong><br />

Sattelpunkt von f, wenn gilt:<br />

max<br />

x<br />

m<strong>in</strong> y<br />

f(x,y) = f(x ∗ ,y ∗ ) = m<strong>in</strong> y<br />

max<br />

x<br />

f(x,y) (3.3)<br />

Beweis:<br />

1) Sei (x ∗ ,y ∗ ) ∈ X × Y e<strong>in</strong> Sattelpunkt von f; dann gilt:<br />

=⇒ max<br />

x<br />

=⇒ m<strong>in</strong> y<br />

Allgeme<strong>in</strong> aber gilt:<br />

f(x,y ∗ ) ≤ f(x ∗ ,y ∗ ) ≤ f(x ∗ ,y) ∀ (x,y) ∈ X × Y<br />

f(x,y ∗ ) ≤ f(x ∗ ,y ∗ ) ≤ m<strong>in</strong> f(x ∗ ,y) y<br />

max<br />

x<br />

f(x,y) ≤ f(x ∗ ,y ∗ ) ≤ max<br />

x<br />

=⇒ m<strong>in</strong> y<br />

max<br />

x<br />

max<br />

x<br />

m<strong>in</strong> f(x,y) y<br />

f(x,y) ≥ m<strong>in</strong> f(x,y) y<br />

f(x,y) ≥ max<br />

x<br />

m<strong>in</strong> y<br />

f(x,y)


KAPITEL 3. ENDLICHE SPIELE 32<br />

Bei<strong>de</strong> Abschätzungen für ”<br />

m<strong>in</strong> − max“ zusammen liefern aber (3.3).<br />

2) Es wer<strong>de</strong> nun <strong>die</strong> Gültigkeit von (3.3) vorausgesetzt:<br />

max<br />

x<br />

m<strong>in</strong> y<br />

f(x,y) = m<strong>in</strong> y<br />

max<br />

x<br />

f(x,y)<br />

Setze F(x) := m<strong>in</strong> y f(x,y) und G(y) := max x f(x,y) und seien x ∗ und y ∗<br />

Punkte, an welchen das Maximum von F bzw. das M<strong>in</strong>imum von G angenommen<br />

wer<strong>de</strong>n. Dann gilt:<br />

max<br />

x<br />

m<strong>in</strong> y<br />

m<strong>in</strong> y<br />

max<br />

x<br />

f(x,y) = F(x ∗ ) = m<strong>in</strong> f(x ∗ ,y) ≤ f(x ∗ ,y ∗ )<br />

y<br />

f(x,y) = G(y ∗ ) = max f(x,y ∗ ) ≥ f(x ∗ ,y ∗ )<br />

x<br />

Daraus erhält man <strong>die</strong> folgen<strong>de</strong> I<strong>de</strong>ntität:<br />

max<br />

x<br />

f(x,y ∗ ) = f(x ∗ ,y ∗ ) = m<strong>in</strong> y<br />

f(x ∗ ,y)<br />

Daraus folgt <strong>die</strong> doppelte Ungleichung:<br />

f(x,y ∗ ) ≤ f(x ∗ ,y ∗ ) ≤ f(x ∗ ,y) ∀ (x,y) ∈ X × Y<br />

✷<br />

Beachte: Im Beweis wur<strong>de</strong> gezeigt, dass e<strong>in</strong>e Funktion f : X × Y ↦→ R, <strong>die</strong> <strong>die</strong><br />

Voraussetzung <strong>de</strong>s Satzes 3.3 erfüllt, <strong>die</strong> folgen<strong>de</strong> Eigenschaft besitzt:<br />

max<br />

x<br />

m<strong>in</strong> y<br />

f(x,y) ≤ m<strong>in</strong> y<br />

max<br />

x<br />

f(x,y) (3.4)<br />

S<strong>in</strong>d <strong>die</strong> Mengen X und Y endlich, so s<strong>in</strong>d für je<strong>de</strong> Funktion f : X × Y ↦→ R <strong>die</strong><br />

Voraussetzungen von Satzes 3.3 erfüllt.<br />

3.2 Zweipersonen-Nullsummen-Spiele<br />

Gegeben sei e<strong>in</strong> Zweipersonen-Nullsummen-Spiel durch<br />

Γ 0 = ( {1, 2},X 1 × X 2 , (u 1 ,u 2 ) )<br />

wobei u 2 := −u 1 gilt; wir setzen u := u 1 = −u 2 .<br />

An Stelle von X 1 := {x 1 i |i = 1,...,p} und X 2 := {x 2 j |i = 1,...,n} notieren wir<br />

<strong>die</strong> Strategiemengen <strong>de</strong>r bei<strong>de</strong>n Spieler auch kurz mit<br />

X 1 := {1,...,p} bzw. X 2 := {1,...,n}


KAPITEL 3. ENDLICHE SPIELE 33<br />

Die Auszahlungsfunktion u wird üblicherweise mit Hilfe <strong>de</strong>r (p × n)-Matrix<br />

A = (u ij ) i=1,...,p; j=1,...,n<br />

mit u ij := u(i,j)<br />

angegeben, <strong>die</strong> Auszahlungsmatrix <strong>de</strong>s Spiels genannt wird. A enthält <strong>die</strong> Auszahlungen<br />

für <strong>de</strong>n 1.Spieler, B = −A s<strong>in</strong>d <strong>die</strong> Auszahlungen für <strong>de</strong>n 2.Spieler.<br />

Zweipersonen-Nullsummen-Spiele s<strong>in</strong>d durch Angabe <strong>de</strong>r Auszahlungsmatrix A<br />

e<strong>in</strong><strong>de</strong>utig festgelegt; <strong>die</strong> Menge <strong>de</strong>r Zeilen<strong>in</strong>dizes {1,...,p} gibt <strong>die</strong> Strategiemenge<br />

<strong>de</strong>s 1.Spielers, <strong>die</strong> Menge <strong>de</strong>r Spalten<strong>in</strong>dizes {1,...,n} jene <strong>de</strong>s 2.Spielers an.<br />

Zweipersonen-Nullsummen-Speile wer<strong>de</strong>n <strong>de</strong>shalb auch Matrixspiele genannt.<br />

Für sie gibt es - wie <strong>de</strong>r folgen<strong>de</strong> Satz zeigt - e<strong>in</strong>e recht e<strong>in</strong>fache Charakterisierung<br />

von Nash-Gleichgewichtspunkten.<br />

Satz 3.4 Γ 0 sei e<strong>in</strong> Zweipersonen-Nullsummen-Spiel. Dann s<strong>in</strong>d folgen<strong>de</strong> Aussagen<br />

äquivalent:<br />

a) (i ∗ ,j ∗ ) ist e<strong>in</strong> Nash-Gleichgewicht von Γ 0 .<br />

b) (i ∗ ,j ∗ ) ist e<strong>in</strong> Sattelpunkt <strong>de</strong>r Funktion u.<br />

c) Es gilt: max i m<strong>in</strong> j u ij = u i ∗ j ∗ = m<strong>in</strong> j max i u ij .<br />

Beweis: Zuerst beweisen wir <strong>die</strong> Äquivalenz a)⇐⇒ b):<br />

(i ∗ ,j ∗ ) sei e<strong>in</strong> Nash-Gleichgewicht<br />

⇐⇒ u 1 (i ∗ ,j ∗ ) ≥ u 1 (i,j ∗ ) ∀ i ∧ u 2 (i ∗ ,j ∗ ) ≥ u 2 (i ∗ ,j) ∀ j (nach Def 1.3)<br />

⇐⇒ u 1 (i ∗ ,j ∗ ) ≥ u 1 (i,j ∗ ) ∀ i ∧ u 1 (i ∗ ,j ∗ ) ≤ u 1 (i ∗ ,j) ∀ j (wegen u 2 = −u 1 )<br />

⇐⇒ u(i,j ∗ ) ≤ u(i ∗ ,j ∗ ) ≤ u(i ∗ ,j) ∀ i , ∀ j (wegen u = u 1 )<br />

(i ∗ ,j ∗ ) ist e<strong>in</strong> Sattelpunkt<br />

Nach Satz 3.3 ist (i ∗ ,j ∗ ) genau dann e<strong>in</strong> Sattelpunkt, wenn <strong>die</strong> Bed<strong>in</strong>gung <strong>in</strong> c)<br />

erfüllt ist. ✷<br />

Genau dann besitzt also das Spiel Γ 0 e<strong>in</strong> Nash-Gleichgewicht, wenn<br />

max<br />

i<br />

m<strong>in</strong><br />

j<br />

u ij = m<strong>in</strong><br />

j<br />

max<br />

i<br />

u ij (3.5)<br />

ist, und e<strong>in</strong> In<strong>de</strong>xpaar (i ∗ ,j ∗ ), an <strong>de</strong>m <strong>de</strong>r max − m<strong>in</strong> − Wert (bzw. m<strong>in</strong> − max −<br />

Wert) angenommen wird, ist e<strong>in</strong> Nash-Gleichgewicht. Die Auszahlung<br />

v(Γ 0 ) := u i ∗ j ∗


KAPITEL 3. ENDLICHE SPIELE 34<br />

an <strong>de</strong>n ersten Spieler heißt dann Spielwert von Γ 0 .<br />

Man beachte, dass nach (3.4) allgeme<strong>in</strong> max i m<strong>in</strong> j u ij ≤ m<strong>in</strong> j max i u ij gilt, und<br />

wir setzen:<br />

v(Γ 0 ) := max<br />

i<br />

m<strong>in</strong><br />

j<br />

u ij und v(Γ 0 ) := m<strong>in</strong><br />

j<br />

max<br />

i<br />

Die folgen<strong>de</strong>n Überlegungen zeigen, dass <strong>die</strong> M<strong>in</strong>imax-Darstellung (3.5) für <strong>die</strong><br />

Gew<strong>in</strong>nung e<strong>in</strong>es Nash-Gleichgewichts von Γ 0 <strong>in</strong>tuitiv e<strong>in</strong>leuchtend ist:<br />

• Überlegung <strong>de</strong>s 1.Spielers: Wenn ich me<strong>in</strong>e Strategie Nr. i spiele, dann gew<strong>in</strong>ne<br />

ich m<strong>in</strong><strong>de</strong>stens m<strong>in</strong> j u ij , egal welche Strategie <strong>de</strong>r 2.Spieler spielt. Ich<br />

wähle dann <strong>die</strong>jenige Strategie i, <strong>die</strong> mir <strong>die</strong> Auszahlung max i m<strong>in</strong> j u ij<br />

garantiert.<br />

• Überlegung <strong>de</strong>s 2.Spielers: Wenn ich me<strong>in</strong>e Strategie Nr. j spiele, dann<br />

verliere ich höchstens max i u ij , egal welche Strategie <strong>de</strong>r 1.Spieler spielt. Ich<br />

wähle dann <strong>die</strong>jenige Strategie j, <strong>die</strong> mir <strong>de</strong>n ger<strong>in</strong>gsten Verlust, nämlich<br />

m<strong>in</strong> j max i u ij br<strong>in</strong>gt.<br />

Die obigen Ausführungen machen <strong>de</strong>utlich, dass <strong>die</strong>se M<strong>in</strong>imax-Strategie nur<br />

dann zu e<strong>in</strong>em Nash-Gleichgewicht führt, wenn es e<strong>in</strong> solches gibt.<br />

Beispiel 3.1 Wir erläutern <strong>die</strong> M<strong>in</strong>imax-Strategie an zwei Zahlenbeispielen. Im<br />

ersten Fall betrachten wir <strong>die</strong> Auszahlungsmatrix<br />

( )<br />

3 1 8<br />

A = (u ij ) =<br />

4 10 4<br />

Wir führen <strong>die</strong> M<strong>in</strong>imax-Strategie für <strong>de</strong>n 1.Spieler ( ”<br />

Zeilenspieler“) aus:<br />

v(Γ 0 ) = max{1, 4} = 4 angenommen für Strategie i = 2<br />

Entsprechen<strong>de</strong> Überlegungen für <strong>de</strong>n 2.Spieler ( ”<br />

Spaltenspieler“) ergeben:<br />

v(Γ 0 ) := m<strong>in</strong>{4, 10, 8} = 4 angenommen für Strategie j = 1<br />

Wegen v(Γ 0 ) = v(Γ 0 ) gibt es e<strong>in</strong> Nash-Gleichgeweicht, <strong>die</strong>ses wird für das Strategiepaar<br />

(i ∗ ,j ∗ ) = (2, 1) angenommen.<br />

Wir än<strong>de</strong>rn nun obige Auszahlungsmatrix <strong>in</strong> e<strong>in</strong>em Element ab, so dass nun<br />

( )<br />

3 1 8<br />

A = (u ij ) =<br />

4 10 0<br />

neue Auszahlungsmatrix ist. Man prüft leicht nach, dass gilt:<br />

u ij<br />

v(Γ 0 ) = max{1, 0} = 1, v(Γ 0 ) = m<strong>in</strong>{4, 10, 8} = 4<br />

E<strong>in</strong> Nash-Gleichgewicht ist <strong>in</strong> <strong>die</strong>sem Fall nicht vorhan<strong>de</strong>n.<br />


KAPITEL 3. ENDLICHE SPIELE 35<br />

3.3 Matrixspiele <strong>in</strong> gemischten Strategien<br />

Zu <strong>de</strong>m Zweipersonen-Nullsummen-Spiel Γ 0 = ({1, 2},X × Y, (u 1 ,u 2 )) mit u 1 =<br />

−u 2 =: u und X := {1,...,p}, Y := {1,...,n} betrachten wir <strong>die</strong> zugehörige<br />

gemischte Erweiterung, <strong>die</strong> gegeben ist durch ̂Γ 0 = ( {1, 2}, ̂X × Ŷ , (û 1, û 2 ) ) mit<br />

p∑<br />

̂X := {x ∈ R p | x i = 1, x i ≥ 0 ∀ i}<br />

n∑<br />

Ŷ := {y ∈ Rn | y j = 1, y j ≥ 0 ∀ j}<br />

i=1<br />

i=1<br />

p∑ n∑<br />

û 1 (x,y) := u 1 (i,j)x i y j<br />

p∑ n∑<br />

û 2 (x,y) := u 2 (i,j)x i y j<br />

i=1 j=1<br />

i=1 j=1<br />

Auf Grund <strong>de</strong>r Voraussetzungen erhalten wir û 1 = −û 2 und wir setzen u := û 1 .<br />

Mit Hilfe <strong>de</strong>r Auszahlungsmatrix A := (u ij ) = (u 1 (i,j)) ∈ R p×n können wir<br />

offensichtlich <strong>die</strong> Funktion u : ̂X × Ŷ ↦→ R wie folgt darstellen:<br />

u(x,y) = x T Ay<br />

Für <strong>die</strong> gemischte Erweiterung ̂Γ 0 gilt nun e<strong>in</strong>e <strong>de</strong>m Satz 3.4 entsprechen<strong>de</strong> Aussage.<br />

Satz 3.5 ̂Γ 0 sei <strong>die</strong> gemischte Erweiterung e<strong>in</strong>es Zweipersonen-Nullsummen-Spiels.<br />

Dann s<strong>in</strong>d folgen<strong>de</strong> Aussagen äquivalent:<br />

a) (x ∗ ,y ∗ ) ist e<strong>in</strong> Nash-Gleichgewicht von ̂Γ 0 .<br />

b) (x ∗ ,y ∗ ) ist e<strong>in</strong> Sattelpunkt <strong>de</strong>r Funktion u.<br />

c) Es gilt: max x m<strong>in</strong> y u(x,y) = u(x ∗ ,y ∗ ) = m<strong>in</strong> y max x u(x,y).<br />

Beweis: Man kann <strong>de</strong>n Beweis von Satz 3.4 wörtlich übernehmen, wenn man i<br />

durch x, j durch y, i ∗ durch x ∗ und j ∗ durch y ∗ ersetzt. ✷<br />

Die gemischte Erweiterung ̂Γ 0 e<strong>in</strong>es Zweipersonen-Nullsummen-Spiels besitzt nach<br />

Korollar 2.1 e<strong>in</strong>en Nash-Gleichgewichtspunkt (x ∗ ,y ∗ ). Der folgen<strong>de</strong> Satz zeigt<br />

nun, dass man durch Lösen e<strong>in</strong>es primal-dualen Paares l<strong>in</strong>earer Optimierungsaufgaben<br />

e<strong>in</strong>en solchen Gleichgewichtspunkt berechnen kann. Dazu sei angemerkt,<br />

dass wir <strong>de</strong>n Vektor (1, 1,...,1) T ∈ R k mit 1 k notieren.<br />

Satz 3.6 ̂Γ 0 sei <strong>die</strong> gemischte Erweiterung e<strong>in</strong>es Zweipersonen-Nullsummen-<br />

Spiels <strong>in</strong> <strong>de</strong>r oben gegebenen Notation. Dann ist (x ∗ ,y ∗ ) genau dann e<strong>in</strong> Nash-<br />

Gleichgewicht von ̂Γ 0 , wenn <strong>die</strong> bei<strong>de</strong>n folgen<strong>de</strong>n Aussagen gelten:


KAPITEL 3. ENDLICHE SPIELE 36<br />

1. (x ∗ ,v ∗ ) ∈ R p × R ist Maximierer <strong>de</strong>r l<strong>in</strong>earen Optimierungsaufgabe:<br />

(LP) max v s.d. A T x ≥ v 1 n ,<br />

p∑<br />

x i = 1 , x ≥ 0 (3.6)<br />

i=1<br />

2. (y ∗ ,w ∗ ) ∈ R n × R ist M<strong>in</strong>imierer <strong>de</strong>r l<strong>in</strong>earen Optimierungsaufgabe:<br />

(LD) m<strong>in</strong> w s.d. Ay ≤ w 1 p ,<br />

n∑<br />

y i = 1 , y ≥ 0 (3.7)<br />

i=1<br />

Beweis: Wir gehen zunächst davon aus, dass (x ∗ ,y ∗ ) e<strong>in</strong> Nash-Gleichgewicht von<br />

̂Γ 0 ist, d.h. (x ∗ ,y ∗ ) ist e<strong>in</strong> Sattelpunkt <strong>de</strong>r Funktion u(x,y) := x T Ay. Es gilt also<br />

x T Ay ∗ ≤ (x ∗ ) T Ay ∗ ≤ (x ∗ ) T Ay ∀ x ∈ ̂X ∀ y ∈ Ŷ (3.8)<br />

Wir setzen nun v ∗ := (x ∗ ) T Ay ∗ =: w ∗ und zeigen: 1) (x ∗ ,v ∗ ) ist e<strong>in</strong> Maximierer<br />

<strong>de</strong>r Aufgabe (3.6) und 2) (y ∗ ,w ∗ ) ist e<strong>in</strong> M<strong>in</strong>imierer <strong>de</strong>r Aufgabe (3.7).<br />

1) Als erstes wird gezeigt, dass (x ∗ ,v ∗ ) zulässig <strong>in</strong> Bezug auf (3.6) ist. Mit A·j als<br />

j-tem Spaltenvektor von A gilt:<br />

v ∗ ≤ (x ∗ ) T Ay<br />

∀ y ∈ Ŷ<br />

=⇒ v ∗ ≤ (x ∗ ) T Ae j ∀ j = 1,...,n<br />

=⇒ v ∗ ≤ (x ∗ ) T A·j ∀ j = 1,...,n<br />

=⇒ v ∗ 1 T p ≤ (x ∗ ) T A<br />

Da außer<strong>de</strong>m x ∗ ∈ ̂X ist, erfüllt (x ∗ ,v ∗ ) alle Zulässigkeitsbed<strong>in</strong>gungen von (3.6).<br />

Bleibt zu zeigen, dass <strong>die</strong>ser Punkt auch optimal ist. Wir nehmen an, er sei es<br />

nicht. Dann gibt es e<strong>in</strong>en zulässigen Punkt (¯x, ¯v) mit ¯v > v ∗ . Da <strong>die</strong>ser zulässig<br />

ist, gilt: ¯x T A ≥ ¯v 1 T n. Diese Ungleichung multiplizieren wir von rechts mit y ∗ ∈ Ŷ :<br />

n∑<br />

¯x T Ay ∗ ≥ ¯v1 T ny ∗ = ¯v yj ∗ = ¯v > v ∗ = (x ∗ ) T Ay ∗<br />

j=1<br />

Dies ist e<strong>in</strong> Wi<strong>de</strong>rspruch zu (3.8).<br />

2) Zuerst wird <strong>die</strong> Zulässigkeit von (y ∗ ,w ∗ ) <strong>in</strong> Bezug auf (3.7) nachgewiesen. Mit<br />

A i· wird <strong>de</strong>r i-te Zeilenvektor von A bezeichnet. Es gilt:<br />

x T Ay ∗ ≤ w ∗<br />

∀ x ∈ ̂X<br />

=⇒ e T i Ay ∗ ≤ w ∗ ∀ i = 1,...,p<br />

=⇒ A i·y ∗ ≤ w ∗ ∀ i = 1,...,p<br />

=⇒ Ay ∗ ≤ w ∗ 1 p


KAPITEL 3. ENDLICHE SPIELE 37<br />

Da außer<strong>de</strong>m y ∗ ∈ Ŷ ist, erfüllt (y∗ ,w ∗ ) alle Zulässigkeitsbed<strong>in</strong>gungen von (3.7).<br />

Wir nehmen an, es gebe e<strong>in</strong>en zulässigen Punkt (ȳ, ¯w) mit ¯w < w ∗ . Wegen <strong>de</strong>ssen<br />

Zulässigkeit gilt: Aȳ ≤ ¯w1 p . Multiplikation <strong>die</strong>ser Ungleichung von l<strong>in</strong>ks mit (x ∗ ) T<br />

ergibt:<br />

p∑<br />

(x ∗ ) T Aȳ ≤ ¯w (x ∗ ) T 1 p = ¯w x ∗ i = ¯w < w ∗ = (x ∗ ) T Ay ∗<br />

Dies ist e<strong>in</strong> Wi<strong>de</strong>rspruch zu (3.8).<br />

i=1<br />

Seien nun umgekehrt (x ∗ ,v ∗ ) bzw. (y ∗ ,w ∗ ) Optimallösungen von (3.6) bzw. (3.7).<br />

Da <strong>die</strong>se Punkte <strong>die</strong> Zulässigkeitsbed<strong>in</strong>gungen erfüllen, gelten <strong>die</strong> Ungleichungen<br />

Ay ∗ ≤ w ∗ 1 p und A T x ∗ ≥ v ∗ 1 n mit v ∗ = w ∗ (weil <strong>die</strong> Aufgaben zue<strong>in</strong>an<strong>de</strong>r dual<br />

s<strong>in</strong>d). Daraus folgt für beliebiges x ∈ ̂X und y ∈ Ŷ :<br />

x T Ay ∗ ≤ w ∗ x T 1 p = w ∗ = v ∗ = v ∗ y T 1 n ≤ y T A T x ∗ = (x ∗ ) T Ay<br />

Ebenso ergibt sich aus<br />

w ∗ = (x ∗ ) T w ∗ 1 p ≥ (x ∗ ) T Ay ∗ = (y ∗ ) T A T x ∗ ≥ (y ∗ ) T v ∗ 1 n = v ∗ = w ∗<br />

auch v ∗ = (x ∗ ) T Ay ∗ = w ∗ . Damit ist gezeigt, dass gilt:<br />

x T Ay ∗ ≤ (x ∗ ) T Ay ∗ ≤ (x ∗ ) T Ay ∀ x ∈ ̂X ∀ y ∈ Ŷ<br />

Diese Ungleichungen besagen aber, dass für u(x,y) <strong>die</strong> Sattelpunktsbed<strong>in</strong>gung<br />

erfüllt ist; also ist (x ∗ ,y ∗ ) e<strong>in</strong> Nash-Gleichgewicht. ✷<br />

Bemerkung: Da <strong>die</strong> gemischte Erweiterung ̂Γ 0 e<strong>in</strong>es Zweipersonen-Nullsummen-<br />

Spiels e<strong>in</strong> Nash-Gleichgewicht besitzt, ist das primal-duale Aufgabenpaar aus Satz<br />

3.6 stets lösbar.<br />

Wir betrachten e<strong>in</strong> kle<strong>in</strong>es Beispiel zu obigem Satz.<br />

Beispiel 3.2 Gegeben sei e<strong>in</strong> Zweipersonen-Nullsummen-Spiel Γ 0 mit <strong>de</strong>r Auszahlungsmatrix<br />

( )<br />

1 0<br />

A :=<br />

−1 2<br />

Die M<strong>in</strong>imax-Metho<strong>de</strong> liefert folgen<strong>de</strong> Ergebnisse:<br />

v(Γ 0 ) = max{0, −1} = 0 , v(Γ 0 ) := m<strong>in</strong>{1, 2} = 1


KAPITEL 3. ENDLICHE SPIELE 38<br />

Dies zeigt, dass Γ 0 ke<strong>in</strong> Nash-Gleichgewicht besitzt.<br />

Die gemischte Erweiterung ̂Γ 0 besitzt e<strong>in</strong> Nash-Gleichgewicht, welches wir mit<br />

<strong>de</strong>n Aufgaben (3.6) und (3.7) berechnen. Zu lösen s<strong>in</strong>d <strong>die</strong> folgen<strong>de</strong>n Aufgaben:<br />

⎧<br />

max v( ) ( ) ( )<br />

⎪⎨ 1 −1 x1 v<br />

s.d.<br />

≥<br />

0 2 x 2 v<br />

x 1 + x 2 = 1<br />

⎪⎩<br />

x ≥ 0<br />

⎧<br />

m<strong>in</strong> w( ) ( ) ( )<br />

⎪⎨ 1 0 y1 w<br />

s.d.<br />

≤<br />

−1 2 y 2 w<br />

y 1 + y 2 = 1<br />

⎪⎩<br />

y ≥ 0<br />

Die bei<strong>de</strong>n Aufgaben s<strong>in</strong>d e<strong>in</strong>fach zu lösen (z.B. auch graphisch: man ersetzt <strong>in</strong><br />

<strong>de</strong>r ersten Aufgabe <strong>die</strong> Variable x 2 durch x 2 = 1 − x 1 und beachtet, dass dann<br />

0 ≤ x 1 ≤ 1 gilt). Als Optimallösungen erhält man:<br />

x ∗ = (0.75, 0.25) T und y ∗ = (0.5, 0.5) T mit v ∗ = 0.5<br />

Auf lange Sicht kann Spieler 1 also e<strong>in</strong>en Gew<strong>in</strong>n von 0.5 erwarten, wenn er mit<br />

75 % <strong>die</strong> erste Strategie und mit 25 % <strong>die</strong> zweite Strategie spielt. Spieler 2 wird<br />

auf lange Sicht bei<strong>de</strong> Strategien jeweils mit 50 % spielen, wobei er se<strong>in</strong>en Verlust<br />

auf 0.5 beschränkt. ✷<br />

3.4 Bi-Matrixspiele und quadratische Programme<br />

Gegeben sei e<strong>in</strong> endliches Zweipersonen-Spiel <strong>in</strong> <strong>de</strong>r Notation<br />

Γ = ({1, 2},X × Y, (u 1 ,u 2 ))<br />

mit <strong>de</strong>n Strategiemengen <strong>de</strong>r bei<strong>de</strong>n Spieler<br />

X := {1,...,p} bzw. Y := {1,...,n}<br />

Die Auszahlungsfunktionen <strong>de</strong>r bei<strong>de</strong>n Spieler lassen sich dann mit Hilfe <strong>de</strong>r<br />

Matrizen A := (a ij ) und B := (b ij ) mit <strong>de</strong>n Elementen<br />

a ij := u 1 (i,j) und b ij := u 2 (i,j)<br />

mit i = 1,...,p; j = 1,...,n<br />

beschreiben. Die Existenz e<strong>in</strong>es Nash-Gleichgewichts ist für das Spiel Γ nicht<br />

garantiert, weil schon für Zweipersonen-Nullsummen-Spiele ke<strong>in</strong> solcher Punkt<br />

existieren muss. Deshalb gehen wir direkt zur gemischten Erweiterung ̂Γ über,


KAPITEL 3. ENDLICHE SPIELE 39<br />

<strong>de</strong>ssen Strategiemengen und Auszahlungsfunktionen gegeben s<strong>in</strong>d durch<br />

p∑<br />

̂X := {x ∈ R p | x i = 1, x i ≥ 0 ∀ i}<br />

n∑<br />

Ŷ := {y ∈ Rm | y j = 1, y j ≥ 0 ∀ j}<br />

i=1<br />

i=1<br />

p∑ n∑<br />

û 1 (x,y) := u 1 (i,j)x i y j<br />

p∑ n∑<br />

û 2 (x,y) := u 2 (i,j)x i y j<br />

i=1 j=1<br />

i=1 j=1<br />

Offensichtlich können mit <strong>de</strong>n bei<strong>de</strong>n Matrizen A,B ∈ R p×n <strong>die</strong> Auszahlungsfunktionen<br />

<strong>in</strong> <strong>de</strong>r Form<br />

û 1 (x,y) = x T Ay und û 2 (x,y) = x T B y ∀ x ∈ ̂X ∀ y ∈ Ŷ (3.9)<br />

geschrieben wer<strong>de</strong>n. Endliche Zweipersonen-Spiele wer<strong>de</strong>n als Bi-Matrixspiele,<br />

ihre gemischten Erweiterungen als Bi-Matrixspiele <strong>in</strong> gemischten Strategien<br />

bezeichnet.<br />

Unter Verwendung <strong>de</strong>r Beziehungen aus (3.9) ist (x ∗ ,y ∗ ) ∈ ̂X × Ŷ genau dann<br />

e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> ̂Γ, wenn <strong>die</strong> folgen<strong>de</strong>n Bed<strong>in</strong>gungen erfüllt s<strong>in</strong>d:<br />

(x ∗ ) T Ay ∗ ≥ x T Ay ∗ ∀ x ∈ ̂X<br />

(x ∗ ) T B y ∗ ≥ (x ∗ ) T B y ∀ y ∈ Ŷ<br />

Ist x ∗ = e i ∗ ∈ R p und y ∗ = e j ∗ ∈ R n , so liegt e<strong>in</strong> Nash-Gleichgewicht (i ∗ ,j ∗ ) <strong>in</strong><br />

re<strong>in</strong>en Strategien vor, das wie folgt gekennzeichnet ist:<br />

a i ∗ j ∗ ≥ a ij ∗ ∀i = 1,...,p ∧ b i ∗ j ∗ ≥ b i ∗ j ∀j = 1,...,n<br />

Aus <strong>de</strong>n Betrachtungen <strong>in</strong> Abschnitt 2.3 wissen wir, dass e<strong>in</strong> Bi-Matrixspiel <strong>in</strong><br />

gemischten Strategien e<strong>in</strong> Nash-Gleichgewicht besitzt. In <strong>die</strong>sem Abschnitt wollen<br />

wir zeigen, dass man e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> gemischten Strategien f<strong>in</strong><strong>de</strong>n<br />

kann, <strong>in</strong><strong>de</strong>m man e<strong>in</strong> zugehöriges Optimierungsproblem löst. Zugrun<strong>de</strong>gelegt wird<br />

folgen<strong>de</strong> quadratische Aufgabe mit l<strong>in</strong>earen Nebenbed<strong>in</strong>gungen:<br />

⎧<br />

⎪⎨<br />

⎪⎩<br />

max x T Ay + x T B y − v − w<br />

s.d. Ay ≤ v1 p<br />

B T x ≤ w1 n<br />

x T 1 p = 1<br />

y T 1 n = 1<br />

x, y ≥ 0<br />

(3.10)<br />

Dabei s<strong>in</strong>d v,w ∈ R und es ist 1 k := (1, 1,...,1) T ∈ R k . Folgen<strong>de</strong>r Satz stellt<br />

e<strong>in</strong>ige wichtige Eigenschaften <strong>de</strong>s Programms (3.10) zusammen.


KAPITEL 3. ENDLICHE SPIELE 40<br />

Satz 3.7 Sei z(x,y,v,w) := x T Ay +x T B y −v −w <strong>die</strong> Zielfunktion <strong>de</strong>r Aufgabe<br />

(3.10). Dann gelten <strong>die</strong> folgen<strong>de</strong>n Aussagen:<br />

a) Für alle Vektoren (x,y,v,w), <strong>die</strong> bezüglich <strong>de</strong>r Aufgabe (3.10) zulässig s<strong>in</strong>d,<br />

gilt: z(x,y,v,w) ≤ 0.<br />

b) Ist (x ∗ ,y ∗ ) e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> gemischten Strategien, so ist <strong>de</strong>r zugehörige<br />

Vektor (x ∗ ,y ∗ ,v ∗ ,w ∗ ) mit v ∗ := (x ∗ ) T Ay ∗ und w ∗ := (x ∗ ) T B y ∗<br />

e<strong>in</strong> globaler Maximierer <strong>de</strong>r Aufgabe (3.10).<br />

c) Das quadratische Problem (3.10) besitzt stets e<strong>in</strong>en globalen Maximierer und<br />

für je<strong>de</strong>n solchen Punkt (¯x, ȳ, ¯v, ¯w) gilt: z(¯x, ȳ, ¯v, ¯w) = 0.<br />

Beweis:<br />

a) Aus <strong>de</strong>r Zulässigkeit von (x,y,v,w) folgt: x,y ≥ 0 und Ay ≤ v1 p , B T x ≤ w1 n .<br />

Daraus folgt:<br />

x T Ay ≤ v x T 1 p = v und y T B T x ≤ w y T 1 n = w<br />

Damit ergibt sich z(x,y,v,w) ≤ 0.<br />

b) Sei (x ∗ ,y ∗ ) e<strong>in</strong> Nash-Gleichgewicht <strong>de</strong>s Spiels ̂Γ. Setze v ∗ := (x ∗ ) T Ay ∗ und<br />

w ∗ := (x ∗ ) T B y ∗ und zeige zunächst, dass (x ∗ ,y ∗ ,v ∗ ,w ∗ ) e<strong>in</strong> zulässiger Punkt für<br />

(3.10) ist. Da (x ∗ ,y ∗ ) ∈ ̂X × Ŷ ist, gilt: x∗ ,y ∗ ≥ 0, (x ∗ ) T 1 p = 1, (y ∗ ) T 1 n = 1. Da<br />

(x ∗ ,y ∗ ) e<strong>in</strong> Nash-Gleichgewicht ist, folgt:<br />

v ∗ = (x ∗ ) T Ay ∗ ≥ x T Ay ∗<br />

∀ x ∈ ̂X<br />

=⇒ v ∗ ≥ e T i Ay ∗ = A i·y ∗ ∀ i = 1,...,p<br />

=⇒ v ∗ 1 p ≥ Ay ∗<br />

Ganz ähnlich zeigt man, dass B T x ∗ ≤ w ∗ 1 n gilt. Also ist <strong>de</strong>r Punkt (x ∗ ,y ∗ ,v ∗ ,w ∗ )<br />

zulässig, bleibt zu begrün<strong>de</strong>n, dass er sogar optimal ist.<br />

Aus <strong>de</strong>r Def<strong>in</strong>ition von v ∗ , w ∗ folgt direkt, dass z(x ∗ ,y ∗ ,v ∗ ,w ∗ ) = 0 gilt. Da<br />

nach Teil a) für alle zulässigen Punkte (x,y,v,w) gilt: z(x,y,v,w) ≤ 0, ist<br />

(x ∗ ,y ∗ ,v ∗ ,w ∗ ) e<strong>in</strong> absolutes Maximum von (3.10).<br />

c) Bekannt ist, dass <strong>die</strong> gemischte Erweiterung e<strong>in</strong>es endlichen Spiels e<strong>in</strong> Nash-<br />

Gleichgewicht besitzt. Liegt <strong>de</strong>n Betrachtungen e<strong>in</strong> Bi-Matrixspiel zugrun<strong>de</strong>, so<br />

ist e<strong>in</strong> solches Nash-Gleichgewicht nach Teil b) globaler Maximierer <strong>de</strong>r Aufgabe<br />

(3.10) mit <strong>de</strong>m Zielfunktionswert 0. Damit ist <strong>die</strong> Aussage bewiesen. ✷<br />

Das Hauptergebnis von Satz 3.7 besagt, dass je<strong>de</strong>s Nash-Gleichgewicht (x ∗ ,y ∗ )<br />

e<strong>in</strong>en globalen Maximierer (x ∗ ,y ∗ ,v ∗ ,w ∗ ) <strong>de</strong>r Aufgabe (3.10) liefert, wobei v ∗ =<br />

(x ∗ ) T Ay ∗ und w ∗ = (x ∗ ) T B y ∗ ist. Im Folgen<strong>de</strong>n soll nun <strong>die</strong> Umkehrung <strong>die</strong>ser<br />

Aussage begrün<strong>de</strong>t wer<strong>de</strong>n.


KAPITEL 3. ENDLICHE SPIELE 41<br />

Satz 3.8 Genau dann ist (x ∗ ,y ∗ ) e<strong>in</strong> Nash-Gleichgewicht von ̂Γ, wenn <strong>de</strong>r Vektor<br />

(x ∗ ,y ∗ ,v ∗ ,w ∗ ) e<strong>in</strong> globaler Maximierer <strong>de</strong>r Aufgabe (3.10) ist.<br />

Beweis: Es genügt also, <strong>die</strong> Rückrichtung zu beweisen. Sei also (x ∗ ,y ∗ ,v ∗ ,w ∗ ) e<strong>in</strong><br />

globaler Maximierer <strong>de</strong>r Aufgabe (3.10). Wegen Satz 3.7 ist <strong>de</strong>r Zielfunktionswert<br />

für e<strong>in</strong>en solchen Punkt gleich null, woraus folgt:<br />

(x ∗ ) T Ay ∗ + (x ∗ ) T B y ∗ = v ∗ + w ∗ (3.11)<br />

Da (x ∗ ,y ∗ ,v ∗ ,w ∗ ) <strong>de</strong>n Restriktionen von (3.10) genügt, gilt:<br />

⇒<br />

Ay ∗ ≤ v ∗ 1 p , B T x ∗ ≤ w ∗ 1 n<br />

(x ∗ ) T Ay ∗ ≤ v ∗ (x ∗ ) T 1 p = v ∗ , (y ∗ ) T B T x ∗ ≤ w ∗ (y ∗ ) T 1 n = w ∗<br />

Zusammen mit (3.11) ergibt das v ∗ = (x ∗ ) T Ay ∗ und w ∗ = (x ∗ ) T B y ∗ .<br />

Sei nun (x,y,v,w) e<strong>in</strong> beliebiger zulässiger Vektor bezüglich <strong>de</strong>r Aufgabe (3.10).<br />

Wegen Ay ∗ ≤ v ∗ 1 p , B T x ∗ ≤ w ∗ 1 n und wegen x,y ≥ 0, x T 1 p = 1,y T 1 m = 1<br />

folgt (analog zu oben):<br />

x T Ay ∗ ≤ v ∗ x T 1 p = v ∗ ,<br />

y T B T x ∗ ≤ w ∗ y T 1 n = w ∗<br />

Somit gilt aber für beliebiges (x,y) ∈ ̂X × Ŷ :<br />

(x ∗ ) T Ay ∗ ≥ x T Ay ∗ und (x ∗ ) T B y ∗ ≥ (x ∗ ) T B y<br />

Also ist (x ∗ ,y ∗ ) e<strong>in</strong> Nash-Gleichgewicht von ̂Γ.<br />

✷<br />

Bemerkung: E<strong>in</strong> Nash-Gleichgewicht von Bi-Matrixspielen <strong>in</strong> gemischten Strategien<br />

kann also ermittelt wer<strong>de</strong>n, <strong>in</strong><strong>de</strong>m man das Optimierungsproblem (3.10)<br />

löst. Man beachte aber, dass <strong>die</strong>ses Problem durchaus lokale Maximierer, <strong>die</strong><br />

nicht global s<strong>in</strong>d, haben kann. E<strong>in</strong> globaler Maximierer ist dadurch gekennzeichnet,<br />

dass se<strong>in</strong> Zielfunktionswert z(x ∗ ,y ∗ ,v ∗ ,w ∗ ) null ist.<br />

Wir erläutern <strong>die</strong> Ergebnisse <strong>die</strong>ses Abschnitts mit Hilfe e<strong>in</strong>es Beispiels.<br />

Beispiel 3.3 Wir ziehen Beispiel 1.2 (Gefangenendilemma) heran. Die Auszahlungsmatrizen<br />

<strong>de</strong>r bei<strong>de</strong>n Spieler s<strong>in</strong>d gegeben durch<br />

( )<br />

−2 −10<br />

A :=<br />

−1 −5<br />

sowie B :=<br />

(<br />

−2 −1<br />

−10 −5<br />

)


KAPITEL 3. ENDLICHE SPIELE 42<br />

Das zugehörige quadratische Programm lautet - wenn wir <strong>de</strong>n nichtl<strong>in</strong>earen Term<br />

<strong>in</strong> <strong>de</strong>r Zielfunktion mit x T (A + B)y zusammenfassen - wie folgt:<br />

⎧<br />

( ) ( )<br />

−4 −11 y1<br />

max (x 1 ,x 2 )<br />

− v − w<br />

−11 −10 y<br />

( ) ( ) 2 ( )<br />

−2 −10 y1 v<br />

⎪⎨ s.d.<br />

≤<br />

−1 −5 y 2 v<br />

( ) ( ) ( )<br />

−2 −10 x1 w<br />

≤<br />

−1 −5 x 2 w<br />

x 1 + x 2 = 1, y 1 + y 2 = 1<br />

⎪⎩<br />

x, y ≥ 0<br />

E<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> re<strong>in</strong>en Strategien ist aus Beispiel 1.2 bekannt, nämlich<br />

x ∗ = (0, 1) T und y ∗ = (0, 1) T , welches <strong>de</strong>n Indizes i ∗ = 2 und j ∗ = 2 entspricht.<br />

Man bestätigt leicht, dass (x ∗ ,y ∗ ) zulässig ist mit <strong>de</strong>m optimalen Zielwert z ∗ = 0.<br />

✷<br />

Zur Lösung <strong>de</strong>r Optimierungsaufgabe (3.10) gibt es verschie<strong>de</strong>ne Algorithmen.<br />

E<strong>in</strong>ige s<strong>in</strong>d <strong>in</strong> implementierter Form, also als Programme, verfügbar, z.B. unter<br />

MATLAB. Zu beachten ist dabei allerd<strong>in</strong>gs, dass <strong>die</strong> E<strong>in</strong>gabe <strong>in</strong> e<strong>in</strong>em bestimmten<br />

Format erfolgen muss, auf das <strong>die</strong> Aufgabe (3.10) umgeschrieben wer<strong>de</strong>n muss<br />

(Näheres dazu <strong>in</strong> <strong>de</strong>r Vorlesung).<br />

3.5 Bi-Matrixspiele und L<strong>in</strong>eare Komplementaritätsprobleme<br />

(LCP)<br />

In <strong>die</strong>sem Abschnitt stellen wir e<strong>in</strong>en Zusammenhang her zwischen Bi-Matrixspielen<br />

und so genannten l<strong>in</strong>earen Komplementaritätsproblemen, <strong>die</strong> <strong>in</strong> <strong>de</strong>r Literatur<br />

allgeme<strong>in</strong> mit LCP abgekürzt wer<strong>de</strong>n. Bei <strong>die</strong>sen Problemen han<strong>de</strong>lt es sich - grob<br />

gesprochen - um spezielle l<strong>in</strong>eare Gleichungs-/Ungleichungssysteme, <strong>die</strong> vielfältige<br />

Anwendungen <strong>in</strong> <strong>de</strong>r <strong>Math</strong>ematik und an<strong>de</strong>ren Gebieten (wie Wirtschaftswissenschaft<br />

und Technik) aufweisen. Als Beispiele seien hier freie Randwertprobleme,<br />

Gleichgewichtsprobleme aus <strong>de</strong>r Ökonomie und spezielle Probleme <strong>de</strong>r Optimierung<br />

genannt. Wir wer<strong>de</strong>n zunächst auf <strong>die</strong> Def<strong>in</strong>ition von LCP e<strong>in</strong>gehen und<br />

bekannte Probleme <strong>de</strong>r Optimierung als LCP darstellen. Anschließend wer<strong>de</strong>n<br />

wir zeigen, dass sich das Problem, für Bi-Matrixspiele e<strong>in</strong> Nash-Gleichgewicht zu<br />

f<strong>in</strong><strong>de</strong>n, als LCP formulieren läßt. Von <strong>de</strong>n zahlreichen Verfahren zur Lösung von<br />

LCP wer<strong>de</strong>n wir schließlich e<strong>in</strong> Verfahren entwickeln, das e<strong>in</strong>e Modifikation <strong>de</strong>s<br />

klassischen Pivotisierungsverfahrens von Lemke darstellt.


KAPITEL 3. ENDLICHE SPIELE 43<br />

3.5.1 E<strong>in</strong>führung <strong>in</strong> LCP<br />

Gegeben seien e<strong>in</strong>e Matrix M ∈ R p×p und e<strong>in</strong> Vektor q ∈ R p . Das l<strong>in</strong>eare Komplementaritätsproblem<br />

LCP(M,q) besteht dar<strong>in</strong>, Vektoren z,w ∈ R p zu f<strong>in</strong><strong>de</strong>n,<br />

so dass <strong>die</strong> folgen<strong>de</strong>n Bed<strong>in</strong>gungen erfüllt s<strong>in</strong>d:<br />

w = M z + q<br />

z ≥ 0, w ≥ 0 (3.12)<br />

w T z = 0<br />

Die Bed<strong>in</strong>gungen z ≥ 0, w ≥ 0 und w T z = 0 zusammen implizieren<br />

z i w i = 0<br />

∀ i ∈ {1,...,p}<br />

Ist q ≥ 0, so läst sich das Problem (3.12) trivial durch z := 0 und w := q lösen.<br />

Die folgen<strong>de</strong> Menge F, <strong>die</strong> <strong>de</strong>f<strong>in</strong>iert ist durch<br />

F := {(z,w) ∈ R p × R p |w = Mz + q , (z,w) ≥ 0}<br />

wird zulässiger Bereich <strong>de</strong>s Problems LCP(M,q) genannt. E<strong>in</strong> Vektor (z,w) ∈ F<br />

nennen wir e<strong>in</strong>en zulässigen Punkt. Erfüllt er zusätzlich <strong>die</strong> Bed<strong>in</strong>gung z i w i = 0<br />

(für alle i), so wird er Lösung von LCP(M,q) genannt.<br />

Für e<strong>in</strong>e Lösung (z,w) <strong>de</strong>s Problems (3.12) gilt also stets z i = 0 o<strong>de</strong>r w i = 0 für<br />

alle i ∈ {1,...,p}. Diese Bed<strong>in</strong>gung wird auch Komplementariätsbed<strong>in</strong>gung <strong>de</strong>s<br />

Problems genannt. Wir wollen erwähnen, dass das Problem (3.12) auch ohne <strong>de</strong>n<br />

Variablenvektor w dargestellt wer<strong>de</strong>n kann; e<strong>in</strong>e äquivalente Formulierung lautet:<br />

z ≥ 0, Mz + q ≥ 0, z T (Mz + q) ≥ 0 (3.13)<br />

Ob das Problem LCP(M,q) überhaupt lösbar ist, hängt von <strong>de</strong>n E<strong>in</strong>gangsdaten<br />

(M,q) ab. Die Gestalt <strong>de</strong>r Lösungsmenge (diskret, konvex, o.ä.) wird von Eigenschaften<br />

<strong>de</strong>r Matrix M bee<strong>in</strong>flußt (vergl. hierzu C.Kanzow [2]). Das folgen<strong>de</strong><br />

Beispiel macht <strong>de</strong>utlich, dass bekannte Probleme aus <strong>de</strong>r Optimierung äquivalent<br />

als l<strong>in</strong>eare Komplementaritätsprobleme dargestellt wer<strong>de</strong>n können.<br />

Beispiel 3.4 Mit <strong>de</strong>n Matrizen Q ∈ R n×n , A ∈ R m×n und <strong>de</strong>n Vektoren c ∈ R n ,<br />

b ∈ R m formulieren wir <strong>die</strong> folgen<strong>de</strong> quadratische Optimierungsaufgabe:<br />

{<br />

m<strong>in</strong><br />

1<br />

2 xT Qx + c T x<br />

s.d. Ax ≤ b, x ≥ 0


KAPITEL 3. ENDLICHE SPIELE 44<br />

Mit <strong>de</strong>n Lagrange-Multiplikatoren u ∈ R m , v ∈ R n mit u ≥ 0,v ≥ 0 und <strong>de</strong>m<br />

Schlupfvektor y ∈ R m mit y ≥ 0 s<strong>in</strong>d <strong>die</strong> KKT-Bed<strong>in</strong>gungen <strong>die</strong>ses Optimierungsproblems<br />

gegeben durch:<br />

−(Qx + c) = A T u − v<br />

y + Ax = b<br />

u T y = 0 , v T x = 0<br />

x,y,u,v ≥ 0<br />

Aus <strong>de</strong>r folgen<strong>de</strong>n Umformulierung <strong>de</strong>r KKT-Bed<strong>in</strong>gungen wird ersichtlich, dass<br />

e<strong>in</strong> l<strong>in</strong>eares Komplementaritätsproblem vorliegt:<br />

( ) ( ) ( ) ( )<br />

v Q A<br />

T x c<br />

=<br />

+<br />

y −A 0 u b<br />

( )<br />

v<br />

(x T ,u T ) = 0<br />

y<br />

(x,u) ≥ 0, (v,y) ≥ 0<br />

Dabei entsprechen sich <strong>die</strong> folgen<strong>de</strong>n Größen:<br />

( ) ( ) (<br />

v x Q A<br />

T<br />

w = , z = , M =<br />

y u<br />

−A 0<br />

) (<br />

c<br />

, q =<br />

b<br />

)<br />

Mit c ∈ R n , b ∈ R m und A ∈ R m×n wird <strong>die</strong> folgen<strong>de</strong> l<strong>in</strong>eare Optimierungsaufgabe<br />

betrachtet: {<br />

m<strong>in</strong> c T x<br />

s.d. Ax ≤ b, x ≥ 0<br />

Ihre KKT-Bed<strong>in</strong>gungen s<strong>in</strong>d gegeben durch<br />

( ) (<br />

v 0 A<br />

=<br />

T ) ( ) (<br />

x c<br />

+<br />

y −A 0 u b<br />

( )<br />

v<br />

(x T ,u T ) = 0<br />

y<br />

)<br />

(x,u) ≥ 0, (v,y) ≥ 0<br />

Sie besitzen offensichtlich ebenfalls <strong>die</strong> Form e<strong>in</strong>es l<strong>in</strong>earen Komplementaritätsproblems.<br />

✷<br />

3.5.2 Bi-Matrixspiele als LCP<br />

Wir kehren nun zu e<strong>in</strong>em endlichen Zwei-Personenspiel mit <strong>de</strong>n Auszahlungsmatrizen<br />

A und B zurück und betrachten dazu <strong>die</strong> gemischte Erweiterung <strong>die</strong>ses


KAPITEL 3. ENDLICHE SPIELE 45<br />

Spiels, d.h. e<strong>in</strong> Bi-Matrixspiel <strong>in</strong> gemischten Strategien. In <strong>die</strong>sem Unterabschnitt<br />

wird nun e<strong>in</strong> Zusammenhang e<strong>in</strong>es solchen Spiels zu e<strong>in</strong>em LCP hergestellt. Insbeson<strong>de</strong>re<br />

wird sich zeigen, dass sich e<strong>in</strong> Nash-Gleichgewicht für e<strong>in</strong> Bi-Matrixspiel<br />

<strong>in</strong> gemischten Strategien durch Lösen e<strong>in</strong>es l<strong>in</strong>earen Komplementaritätsproblems<br />

bestimmen läßt. Zunächst leiten wir zwei e<strong>in</strong>fache Resultate her, <strong>die</strong> wir als Lemmata<br />

formulieren.<br />

Das erste Ergebnis zeigt, dass je<strong>de</strong>s Bi-Matrixspiel <strong>in</strong> gemischten Strategien strategisch<br />

äquivalent ist zu e<strong>in</strong>em Spiel <strong>die</strong>ses Typs, bei <strong>de</strong>m <strong>die</strong> bei<strong>de</strong>n Auszahlungsmatrizen<br />

nur positive E<strong>in</strong>träge aufweisen.<br />

Lemma 3.1 Sei γ ∈ R beliebig gegeben und sei E ∈ R p×n <strong>die</strong>jenige Matrix, <strong>de</strong>ren<br />

sämtliche E<strong>in</strong>träge 1 s<strong>in</strong>d. Dann ist (x ∗ ,y ∗ ) genau dann e<strong>in</strong> Nash-Gleichgewicht<br />

<strong>in</strong> gemischten Strategien zum Bi-Matrixspiel (A,B), wenn <strong>die</strong>ser Punkt auch e<strong>in</strong><br />

Nash-Gleichgewicht <strong>in</strong> gemischten Strategien zum Bi-Matrixspiel (A+γE,B+γE)<br />

ist.<br />

Beweis: Sei zunächst (x ∗ ,y ∗ ) e<strong>in</strong> Nash-Gleichgewicht für e<strong>in</strong> Bi-Matrixspiel <strong>in</strong><br />

gemischten Strategien mit <strong>de</strong>n Auszahlungsmatrizen A, B. Für alle (x,y) ∈ ̂X×Ŷ<br />

gilt dann:<br />

(x ∗ ) T Ay ∗ ≥ x T Ay ∗ und (x ∗ ) T B y ∗ ≥ (x ∗ ) T B y<br />

Für alle x ∈ ̂X folgt dann:<br />

(x ∗ ) T (A + γE)y ∗ = (x ∗ ) T Ay ∗ + γ(x ∗ ) T E y ∗<br />

= (x ∗ ) T Ay ∗ + γ(x ∗ ) T 1 p (wegen E y ∗ = 1 p )<br />

= (x ∗ ) T Ay ∗ + γ (wegen (x ∗ ) T 1 p = 1)<br />

≥<br />

x T Ay ∗ + γ<br />

= x T Ay ∗ + γx T 1 p (wegen x T 1 p = 1)<br />

= x T Ay ∗ + γx T E y ∗ (wegen E y ∗ = 1 p )<br />

= x T (A + γE)y ∗<br />

Ebenso zeigt man, dass für alle y ∈ Ŷ gilt:<br />

(x ∗ ) T (A + γE)y ∗ ≥ (x ∗ ) T (A + γE)y<br />

Damit ist (x ∗ ,y ∗ ) auch e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> gemischten Strategien zum Bi-<br />

Matrixspiel (A + γE,B + γE).<br />

Ist umgekehrt (x ∗ ,y ∗ ) e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> gemischten Strategien zum Bi-<br />

Matrixspiel (A + γE,B + γE), so folgt aus obigen Überlegungen, dass <strong>die</strong>ser<br />

Punkt auch e<strong>in</strong> Nash-Gleichgewicht ist, wenn man zu <strong>de</strong>n Auszahlungsmatrizen


KAPITEL 3. ENDLICHE SPIELE 46<br />

A + γE, B + γE <strong>die</strong> Matrix −γE h<strong>in</strong>zuad<strong>die</strong>rt. Die Behauptung <strong>de</strong>s Lemmas ist<br />

damit bewiesen. ✷<br />

Wenn man also e<strong>in</strong> h<strong>in</strong>reichend großes γ wählt, kann man erreichen, dass <strong>die</strong><br />

Matrizen A + γE, B + γE nur nicht-negative o<strong>de</strong>r sogar nur positive E<strong>in</strong>träge<br />

besitzen. Ohne E<strong>in</strong>schränkung ist es <strong>de</strong>shalb zulässig, nur solche Bi-Matrixspiele<br />

<strong>in</strong> gemischten Strategien zu untersuchen, <strong>de</strong>ren Auszahlungsmatrizen A, B nur<br />

positive E<strong>in</strong>träge haben.<br />

Die folgen<strong>de</strong> Aussage bil<strong>de</strong>t <strong>die</strong> Grundlage dafür, dass wir e<strong>in</strong> Bi-Matrixspiel <strong>in</strong><br />

gemischten Strategien als LCP formulieren können.<br />

Lemma 3.2 Seien x ∗ ≥ 0 und y ∗ ≥ 0 mit (x ∗ ) T 1 p = 1 und (y ∗ ) T 1 n = 1. Dann<br />

ist (x ∗ ,y ∗ ) genau dann e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> gemischten Strategien, wenn<br />

gelten.<br />

(x ∗ ) T Ay ∗ 1 p ≥ Ay ∗ und (x ∗ ) T B y ∗ 1 n ≥ B T x ∗ (3.14)<br />

Beweis: 1) Als erstes gehen wir davon aus, dass (x ∗ ,y ∗ ) mit <strong>de</strong>n angegebenen Eigenschaften<br />

e<strong>in</strong> Nasch-Gleichgewicht ist. Dann gelten für <strong>die</strong> Auszahlungsmatrix<br />

<strong>de</strong>s ersten Spielers folgen<strong>de</strong> Implikationen:<br />

(x ∗ ) T Ay ∗ ≥ x T Ay ∗ ∀ x ∈ ̂X<br />

=⇒ (x ∗ ) T Ay ∗ ≥ e T i Ay ∗ = A i . y ∗ ∀ i = 1,...,p<br />

=⇒ (x ∗ ) T Ay ∗ 1 p ≥ Ay ∗<br />

Entsprechend ergeben sich für <strong>die</strong> Matrix B nachstehen<strong>de</strong> Implikationen:<br />

(x ∗ ) T B y ∗ ≥ (x ∗ ) T B y ∀ y ∈ Ŷ<br />

=⇒ (x ∗ ) T B y ∗ ≥ (x ∗ ) T B e j = (B T ) j . x ∗ ∀ j = 1,...,n<br />

=⇒ (x ∗ ) T B y ∗ 1 n ≥ B T x ∗<br />

2) Umgekehrt sei nun <strong>die</strong> Gültigkeit <strong>de</strong>r Ungleichungen (3.14) vorausgesetzt.<br />

Dann erhält man folgen<strong>de</strong> Implikationen, zunächst für <strong>die</strong> Matrix A:<br />

(x ∗ ) T Ay ∗ 1 p ≥ Ay ∗<br />

Entsprechend folgt für <strong>die</strong> Matrix B:<br />

=⇒ (x ∗ ) T Ay ∗ x T 1 p ≥ x T Ay ∗ ∀ x ∈ ̂X<br />

=⇒ (x ∗ ) T Ay ∗ ≥ x T Ay ∗ ∀ x ∈ ̂X<br />

(x ∗ ) T B y ∗ 1 n ≥ B T x ∗<br />

=⇒ (x ∗ ) T B y ∗ y T 1 n ≥ y T B T x ∗ ∀ y ∈ Ŷ<br />

=⇒ (x ∗ ) T B y ∗ ≥ (x ∗ ) T B y ∀ y ∈ Ŷ


KAPITEL 3. ENDLICHE SPIELE 47<br />

Somit ist (x ∗ ,y ∗ ) e<strong>in</strong> Nash-Gleichgewicht.<br />

✷<br />

Wir kommen nun zum Hauptresultat <strong>die</strong>ses Abschnitts, das besagt, dass je<strong>de</strong>s<br />

Bi-Matrixspiel <strong>in</strong> gemischten Strategien zu e<strong>in</strong>em LCP äquivalent ist. Dabei bezeichnet<br />

O k e<strong>in</strong>e (k × k)-Matrix, <strong>de</strong>ren E<strong>in</strong>träge sämtlich null s<strong>in</strong>d.<br />

Satz 3.9 Gegeben sei e<strong>in</strong> Bi-Matrixspiel mit <strong>de</strong>n Auszahlungsmatrizen A, B,<br />

<strong>de</strong>ren E<strong>in</strong>träge ohne E<strong>in</strong>schränkung alle positiv seien. Def<strong>in</strong>iere außer<strong>de</strong>m:<br />

( ) ( )<br />

Op −A<br />

1p<br />

M :=<br />

−B T und q :=<br />

O m 1 m<br />

Dann gelten <strong>die</strong> folgen<strong>de</strong>n Aussagen:<br />

a) Ist (x ∗ ,y ∗ ) e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> gemischten Strategien, so ist<br />

(<br />

x ∗ y ∗ )<br />

(¯x, ȳ) :=<br />

(x ∗ ) T B y ∗, (x ∗ ) T Ay ∗<br />

e<strong>in</strong>e Lösung von LCP(M,q) mit ¯x ≠ 0, ȳ ≠ 0.<br />

b) Ist (¯x, ȳ) e<strong>in</strong>e Lösung von LCP(M,q) mit ¯x ≠ 0, ȳ ≠ 0, so ist<br />

(x ∗ ,y ∗ ) :=<br />

( ) ¯x ȳ<br />

,<br />

¯x T 1 p ȳ T 1 n<br />

e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> gemischten Strategien.<br />

Beweis: a) Sei (x ∗ ,y ∗ ) e<strong>in</strong> Nash-Gleichgewicht. Wir setzen α := (x ∗ ) T Ay ∗ und<br />

β := (x ∗ ) T B y ∗ . Wegen x ∗ ≥ 0,y ∗ ≥ 0, x ∗ ≠ 0,y ∗ ≠ 0 sowie A > 0,B > 0, gilt:<br />

α > 0,β > 0, und <strong>de</strong>r Vektor<br />

( ) x<br />

∗<br />

(¯x, ȳ) :=<br />

β , y∗<br />

α<br />

ist wohl<strong>de</strong>f<strong>in</strong>iert mit (¯x, ȳ) ≥ 0.<br />

Ausgehend von <strong>de</strong>r Aussage <strong>de</strong>s Lemmas 3.2 erhält man folgen<strong>de</strong> Implikationen:<br />

(x ∗ ) T Ay ∗ 1 p ≥ Ay ∗ =⇒ α1 p ≥ Ay ∗ =⇒ 1 p ≥ A ȳ<br />

(x ∗ ) T B y ∗ 1 n ≥ B T x ∗ =⇒ β1 n ≥ B T x ∗ =⇒ 1 n ≥ B T ¯x<br />

Damit ist <strong>die</strong> Gültigkeit folgen<strong>de</strong>r Ungleichung gezeigt:<br />

( ) ( ) ( )<br />

Op −A ¯x 1p<br />

−B T<br />

+ ≥ 0 (3.15)<br />

O m ȳ 1 m


KAPITEL 3. ENDLICHE SPIELE 48<br />

Wegen (x ∗ ) T Ay ∗ = α und (x ∗ )1 p = 1 gilt folgen<strong>de</strong> I<strong>de</strong>ntität:<br />

−¯x T Aȳ + ¯x T 1 p = − 1<br />

αβ (x∗ ) T Ay ∗ + 1 β (x∗ ) T 1 p = − 1 β + 1 β = 0<br />

Wegen (x ∗ ) T B y ∗ = β und (y ∗ )1 n = 1 erhält man:<br />

−ȳ T B T ¯x + ȳ T 1 n = − 1<br />

αβ (x∗ ) T B y ∗ + 1 α (y∗ ) T 1 n = − 1 α + 1 α = 0<br />

Damit ist <strong>die</strong> Gültigkeit folgen<strong>de</strong>r Gleichung nachgewiesen:<br />

(¯x T ,ȳ ) [( ) ( ) ( )]<br />

T O p −A ¯x 1p<br />

−B T<br />

+ = 0 (3.16)<br />

O m ȳ 1 m<br />

Wegen (¯x, ȳ) ≥ 0 und (3.15),(3.16)ist somit (¯x, ȳ) nach (3.13) e<strong>in</strong>e Lösung von<br />

LCP(M,q).<br />

b) Sei nun umgekehrt (¯x, ȳ) ≥ 0 mit ¯x ≠ 0, ȳ ≠ 0 e<strong>in</strong>e Lösung von LCP(M,q).<br />

Dann genügt (¯x, ȳ) <strong>de</strong>n Bed<strong>in</strong>gungen (3.15),(3.16). Daraus folgt, dass <strong>die</strong>ser Vektor<br />

folgen<strong>de</strong>s Gleichungs-/Ungleichunssystem erfüllt:<br />

¯x ≥ 0 −Aȳ + 1 p ≥ 0 −¯x T Aȳ + ¯x T 1 p = 0 (3.17)<br />

ȳ ≥ 0 −B T ¯x + 1 n ≥ 0 −ȳ T B T ¯x + ȳ T 1 n = 0 (3.18)<br />

Wegen ¯x ≠ 0 und ȳ ≠ 0 gilt: ¯x T 1 p > 0 und ȳ T 1 n > 0 und <strong>de</strong>r Vektor<br />

( ) ¯x<br />

(x ∗ ,y ∗ ȳ<br />

) := ,<br />

¯x T 1 p ȳ T 1 n<br />

ist wohl<strong>de</strong>f<strong>in</strong>iert mit (x ∗ ,y ∗ ) ≥ 0 und (x ∗ ) T 1 p = 1, (y ∗ ) T 1 n = 1.<br />

Aus <strong>de</strong>r Def<strong>in</strong>ition von (x ∗ ,y ∗ ) und aus (3.17), (3.18) folgt:<br />

(x ∗ ) T Ay ∗ 1 p =<br />

(x ∗ ) T B y ∗ 1 n =<br />

1 1<br />

¯x T Aȳ1<br />

¯x T 1 p ȳ T p = 1 1<br />

1 n ȳ T p ≥ 1 Aȳ = Ay ∗<br />

1 n ȳ T 1 n<br />

1 1<br />

¯x T Bȳ1<br />

¯x T 1 p ȳ T n = 1 1<br />

1 n ¯x T n ≥ 1 B T ¯x = B T x ∗<br />

1 p ¯x T 1 p<br />

Nach Lemma 3.2 ist damit nachgewiesen, dass (x ∗ ,y ∗ ) e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong><br />

gemischten Strategien ist. ✷<br />

Satz 3.9 liefert also e<strong>in</strong>en Ansatz zur Bestimmung e<strong>in</strong>es Nash-Gleichgewichts für<br />

Bi-Matrixspiele <strong>in</strong> gemischten Strategien mittels LCP. Zu bestimmen ist e<strong>in</strong>e<br />

Lösung ¯z (bzw. (¯z, ¯w)) <strong>de</strong>s folgen<strong>de</strong>n Probelms:<br />

z ≥ 0, Mz + q ≥ 0, z T (Mz + q) ≥ 0


KAPITEL 3. ENDLICHE SPIELE 49<br />

o<strong>de</strong>r äquivalent<br />

w := Mz + q , w T z = 0, z ≥ 0, w ≥ 0 (3.19)<br />

wobei M, q, z, w wie folgt gegeben s<strong>in</strong>d mit m := p + n:<br />

M :=<br />

( )<br />

( )<br />

(<br />

Op −A<br />

−B T ∈ R m×m 1p<br />

x<br />

, q := ∈ R m , z :=<br />

O n 1 n y<br />

)<br />

∈ R m , w ∈ R m<br />

Wegen q ≥ 0 ist ¯z := 0, ¯w := q e<strong>in</strong>e Lösung <strong>de</strong>s LCP (3.19), <strong>die</strong> wir triviale<br />

Lösung nennen. Man benötigt aber nach Satz 3.9 e<strong>in</strong>e solche Lösung ¯z mit ¯x ≠ 0,<br />

ȳ ≠ 0.<br />

Beispiel 3.5 Wir erläutern Satz 3.9 an folgen<strong>de</strong>m e<strong>in</strong>fachen Zahlenbeispiel. Betrachtet<br />

wird e<strong>in</strong> Bi-Matrixspiel <strong>in</strong> gemischten Strategien mit <strong>de</strong>n Auszahlungmatrizen<br />

A, B <strong>de</strong>r bei<strong>de</strong>n Spieler wie folgt:<br />

A :=<br />

(<br />

2 2<br />

3 1<br />

)<br />

und B :=<br />

(<br />

2 1<br />

2 5<br />

E<strong>in</strong> Nash-Gleichgewicht (x ∗ 1,x ∗ 2,y ∗ 1,y ∗ 2) kann man nach Satz 3.9, Teil b), aus <strong>de</strong>r<br />

Lösung (¯x 1 , ¯x 2 ,ȳ 1 ,ȳ 2 ) <strong>de</strong>s Problems LCP(M,q) gew<strong>in</strong>nen, wobei M und q wie folgt<br />

gegeben s<strong>in</strong>d:<br />

⎛<br />

M := ⎜<br />

⎝<br />

0 0 −2 −2<br />

0 0 −3 −1<br />

−2 −2 0 0<br />

−1 −5 0 0<br />

)<br />

⎞ ⎛<br />

⎟<br />

⎠ und q := ⎜<br />

⎝<br />

Zur Ermittlung e<strong>in</strong>er Lösung <strong>de</strong>s Problems LCP(M,q) stehen verschie<strong>de</strong>nen Verfahren<br />

zur Verfügung (vgl. Kanzow [2]). Für unser Problem ist aber bereits e<strong>in</strong>e<br />

Lösung bekannt, nämlich <strong>die</strong> triviale. Wir müssen aber e<strong>in</strong>e solche mit ¯x ≠ 0,<br />

ȳ ≠ 0 bestimmen. Dieses leistet <strong>die</strong> Orig<strong>in</strong>alversion <strong>de</strong>s Lemke-Verfahrens nicht.<br />

Deshalb wird das Lemke-Verfahren <strong>die</strong>sen Anfor<strong>de</strong>rungen entsprechend modifiziert.<br />

3.5.3 E<strong>in</strong> modifiziertes Lemke-Verfahren<br />

Bei <strong>de</strong>r Entwicklung <strong>de</strong>s Lösungsverfahrens für <strong>die</strong> Aufgabe (3.19) legen wir das<br />

Gleichungssystems w − Mz = q o<strong>de</strong>r äquivalent<br />

(<br />

w<br />

(I , −M)<br />

z<br />

)<br />

1<br />

1<br />

1<br />

1<br />

⎞<br />

⎟<br />

⎠<br />

= q (3.20)


KAPITEL 3. ENDLICHE SPIELE 50<br />

zugrun<strong>de</strong>. Die verbleiben<strong>de</strong>n Bed<strong>in</strong>gungen z ≥ 0, w ≥ 0, z T w = 0 wer<strong>de</strong>n im Verfahren<br />

implizit berücksichtigt. Wir verwen<strong>de</strong>n (mit m = p + n) <strong>die</strong> Abkürzungen<br />

(<br />

w<br />

Q := (I , −M) ∈ R m×2m und u :=<br />

z<br />

)<br />

∈ R 2m<br />

<strong>E<strong>in</strong>e</strong> In<strong>de</strong>xmenge B ⊂ {1,...,2m} mit |B | = m heißt Basis<strong>in</strong><strong>de</strong>xmenge (kurz:<br />

BasisIM) zur Matrix Q, wenn <strong>die</strong> Spaltenvektoren Q . j für j ∈ B l<strong>in</strong>ear unabhängig<br />

s<strong>in</strong>d. Ferner setzen wir N := {1,...,2m}\B und nennen (B,N) e<strong>in</strong>e<br />

Basisstruktur zu Q. <strong>E<strong>in</strong>e</strong> Variable u j mit j ∈ B wird Basisvariable, e<strong>in</strong> u l mit<br />

l ∈ N Nichtbasisvariable genannt.<br />

Def<strong>in</strong>ition 3.2 <strong>E<strong>in</strong>e</strong> Lösung u <strong>de</strong>r Gleichung (3.20) heißt Basislösung zur BasisIM<br />

B, wenn u l = 0 ist für alle l ∈ N. Sie heißt zulässig, wenn sie außer<strong>de</strong>m<br />

<strong>de</strong>r Bed<strong>in</strong>gung u ≥ 0 genügt. Sie wird strikt komplementär genannt, wenn sie <strong>die</strong><br />

Bed<strong>in</strong>gung z T w = 0 erfüllt.<br />

<strong>E<strong>in</strong>e</strong> zulässige, strikt komplementäre Basislösung von Q ist also e<strong>in</strong>e Lösung von<br />

LCP(M,q).<br />

Beispiel 3.6 Für das Problem (3.19) ist beispielsweise B := {1,...,m} e<strong>in</strong>e<br />

BasisIM mit N := {m + 1,...,m}. Setzt man u N := z = 0, u B := w = q, so<br />

liegt wegen q ≥ 0 e<strong>in</strong>e zulässige Basislösung zur BasisIM B vor, <strong>die</strong> offensichtlich<br />

strikt komplementär ist.<br />

Def<strong>in</strong>ition 3.3 <strong>E<strong>in</strong>e</strong> zulässige Basislösung zur BasisIM B heißt fast komplementär,<br />

wenn es genau e<strong>in</strong>en In<strong>de</strong>x s ∈ {1,...,2m} gibt, so dass z s und w s<br />

Nichtbasisvariable s<strong>in</strong>d.<br />

Das Gleichungssystem w − Mz = q schreiben wir nun <strong>in</strong> Form e<strong>in</strong>es verkürzten<br />

Tableaus:<br />

z<br />

r.S.<br />

w −M q<br />

mit − M :=<br />

( )<br />

Op A<br />

B T O n<br />

,q :=<br />

(<br />

1p<br />

1 n<br />

)<br />

(3.21)<br />

Ohne E<strong>in</strong>schränkung können wir A > 0 und B > 0 voraussetzen. Die im Folgen<strong>de</strong>n<br />

verwen<strong>de</strong>te Term<strong>in</strong>ologie entspricht <strong>de</strong>r Vorlesung OR II, L<strong>in</strong>eare Optimierung.<br />

Wählt man im Tableau (3.21) e<strong>in</strong>e beliebige Spalte k als Pivotspalte und<br />

<strong>die</strong> Pivotzeile i nach <strong>de</strong>m Kriterium <strong>de</strong>r Quotientenm<strong>in</strong>imierung <strong>de</strong>s Simplexverfahrens,<br />

dann erhält man mit e<strong>in</strong>em Austauschschritt (analog zum Simplexverfahren)<br />

zum Pivot<strong>in</strong><strong>de</strong>x ik e<strong>in</strong> Nachfolgetableau, <strong>de</strong>ssen Basislösung zulässig und


KAPITEL 3. ENDLICHE SPIELE 51<br />

fast komplementär ist.<br />

Im Nachfolgetableau gibt es somit genau e<strong>in</strong>en In<strong>de</strong>x s, so dass z s und w s Nichtbasisvariable<br />

s<strong>in</strong>d. Liegt nun allgeme<strong>in</strong> e<strong>in</strong> fast komplementäres, zulässiges Tableau<br />

vor, das <strong>die</strong> Nichtbasisvariablen z s und w s enthält, so wählt man für <strong>de</strong>n folgen<strong>de</strong>n<br />

Austauschschritt <strong>die</strong> Pivotspalte wie folgt: Diejenige <strong>de</strong>r bei<strong>de</strong>n Variablen z s<br />

bzw. w s , <strong>die</strong> zuerst Nichtbasisvariable war, legt <strong>die</strong> Pivotspalte fest, d.h. tritt beim<br />

Austauschschritt <strong>in</strong> <strong>die</strong> Basis e<strong>in</strong>. Die Pivotzeile wird nach <strong>de</strong>r bereits erwähnten<br />

Quotientenm<strong>in</strong>imierung bestimmt. Der anschließen<strong>de</strong> Austauschschritt ergibt<br />

wie<strong>de</strong>r e<strong>in</strong> zulässiges Tableau, das zum<strong>in</strong><strong>de</strong>st fast komplementär, im günstigeren<br />

Falle sogar komplementär ist.<br />

Wir fassen nun <strong>die</strong> Vorgehensweise <strong>in</strong> e<strong>in</strong>er algorithmischen Beschreibung zusammen,<br />

wobei wir das aktuell im Verfahren geführte Tableau wie folgt bezeichnen:<br />

u N<br />

Algorithmus [Modifikation von Lemke]<br />

r.S.<br />

u B<br />

¯M ¯q<br />

(3.22)<br />

0) Initialisiere das Tableau (3.22) mit u N := z, u B := w, ¯M := −M, ¯q := q.<br />

Wähle e<strong>in</strong>e beliebige Spalte k mit ν(k) ∈ N als Pivotspalte. Pivotzeile i<br />

wird e<strong>in</strong>e Zeile, <strong>die</strong> <strong>de</strong>r folgen<strong>de</strong>n Bed<strong>in</strong>gung ( Quotientenm<strong>in</strong>imierung“)<br />

”<br />

genügt:<br />

¯q i<br />

= m<strong>in</strong>{ ¯q j<br />

|j ∈ {1,...,m}, ¯m jk > 0} (3.23)<br />

¯m ik ¯m jk<br />

Führe e<strong>in</strong>en Austauschschritt zum Pivot ¯m ik aus.<br />

1) Das aktuelle Tableau (3.22) ist zulässig und fast komplementär mit <strong>de</strong>n<br />

Variablen z s und w s als Nichtbasisvariable. Diejenige <strong>de</strong>r bei<strong>de</strong>n Variablen<br />

z s bzw. w s , <strong>die</strong> zuerst Nichtbasisvariable war, legt <strong>die</strong> Pivotspalte k fest.<br />

Bestimme <strong>die</strong> Pivotzeile i nach <strong>de</strong>r Quotientenm<strong>in</strong>imierung (3.23). Führe<br />

e<strong>in</strong>en Austauschschritt zum Pivot ¯m ik aus.<br />

2) Erfüllt <strong>die</strong> Basislösung <strong>de</strong>s neuen Tableaus <strong>die</strong> Komplementaritätsbed<strong>in</strong>gung,<br />

stop. An<strong>de</strong>rnfalls ist <strong>die</strong>se Lösung fast komplementär. Gehe zu 1).<br />

✷<br />

Satz 3.10 Für <strong>die</strong> Untermatrizen A und B von M gelte: A > 0 und B > 0. Ferner<br />

mögen im Laufe <strong>de</strong>s Verfahrens ke<strong>in</strong>e entarteten Tableaus auftreten. Dann ist<br />

<strong>de</strong>r Algorithmus [Modifikation von Lemke] wohl<strong>de</strong>f<strong>in</strong>iert und bricht nach endlich<br />

vielen Durchläufen mit e<strong>in</strong>er Lösung (¯z, ¯w) <strong>de</strong>s LCP (3.19) mit ¯x ≠ 0, ȳ ≠ 0 ab.


KAPITEL 3. ENDLICHE SPIELE 52<br />

Beweis: Das Verfahren ist wohl<strong>de</strong>f<strong>in</strong>iert, wenn <strong>die</strong> Quotientenm<strong>in</strong>imierung <strong>in</strong><br />

<strong>de</strong>n Schritten 1), 2) ausführbar ist. Diese ist genau dann nicht ausführbar, wenn<br />

<strong>die</strong> In<strong>de</strong>xmenge <strong>in</strong> (3.23) leer ist. Dies ist <strong>de</strong>r Fall, wenn <strong>die</strong> Pivotspalte ¯M . k ≤ 0<br />

ist. Daraus wür<strong>de</strong> folgen, dass das Polye<strong>de</strong>r F e<strong>in</strong>e unbeschränkte Kante besäße.<br />

Nach (3.15) gilt aber für je<strong>de</strong>s (z,w) aus <strong>de</strong>m Polye<strong>de</strong>r F: x ≥ 0, B T x ≤ 1 n ,<br />

y ≥ 0, Ay ≤ 1 p . Damit ist F wegen A,B > 0 beschränkt und kann ke<strong>in</strong>e unbeschränkte<br />

Kante besitzen.<br />

Zunächst bemerken wir, dass <strong>die</strong> Matrix ¯M nach <strong>de</strong>n Regeln <strong>de</strong>s Austauschschrittes<br />

<strong>die</strong> Blockstruktur von −M beibehält, d.h. es gilt im Laufe <strong>de</strong>s Verfahrens:<br />

( )<br />

Op Ā ¯M := ¯B T O n<br />

Wir nehmen nun an, das Verfahren sei nicht endlich. Nach <strong>de</strong>m ersten Iterationsschritt<br />

ist <strong>die</strong> Wahl <strong>de</strong>s Pivotelements <strong>in</strong> je<strong>de</strong>m Schritt e<strong>in</strong><strong>de</strong>utig festgelegt,<br />

d.h. nach <strong>de</strong>m ersten Schritt ist auch <strong>die</strong> Abfolge <strong>de</strong>r berechneten Basislösungen<br />

e<strong>in</strong><strong>de</strong>utig bestimmt. Da es nur endlich viele Tableaus gibt, müssen nach endlich<br />

vielen Durchläufen, etwa ab <strong>de</strong>m ¯k-ten Tableau, <strong>die</strong> Tableaus zyklisch durchlaufen<br />

wer<strong>de</strong>n. Es gibt also e<strong>in</strong>e Zahl α ∈ N, so dass das ¯k-te mit <strong>de</strong>m (¯k + α)-ten<br />

Tableau übere<strong>in</strong>stimmt. Da aber das Vorgängertableau <strong>de</strong>s ¯k-ten Tableaus e<strong>in</strong><strong>de</strong>utig<br />

bestimmt ist, müsste sogar das (¯k −1)-te mit <strong>de</strong>m (¯k −1+α)-ten Tableau<br />

übere<strong>in</strong>stimmen. Dies wi<strong>de</strong>rspricht <strong>de</strong>r M<strong>in</strong>imalität von ¯k. Nun folgt aus <strong>de</strong>n Regeln<br />

<strong>de</strong>s Austauschschrittes, dass ab <strong>de</strong>m 3.Tableau stets zwei w-Variable <strong>in</strong> <strong>de</strong>r<br />

Nichtbasis stehen, e<strong>in</strong>e über <strong>de</strong>n Spalten 1,...,p, <strong>die</strong> an<strong>de</strong>re über <strong>de</strong>n Spalten<br />

p + 1,...,p + n. Somit gilt ¯k ≥ 3. Also bricht das Verfahren ab mit e<strong>in</strong>er komplementären<br />

Basislösung von F.<br />

Es ist zu begrün<strong>de</strong>n, dass <strong>die</strong>se <strong>die</strong> Bed<strong>in</strong>gungen ¯x ≠ 0 und ȳ ≠ 0 erfüllt. Im Austausch<br />

mit <strong>de</strong>n w-Variablen tritt nach zwei Austauschschritten e<strong>in</strong>e x-Variable<br />

und e<strong>in</strong>e y-Variable <strong>in</strong> <strong>die</strong> Basis e<strong>in</strong> (<strong>die</strong> erste <strong>in</strong> <strong>de</strong>n unteren Block“, <strong>die</strong> an<strong>de</strong>re<br />

<strong>in</strong> <strong>de</strong>n oberen Block“). Bis zum Abbruch <strong>de</strong>s Verfahrens s<strong>in</strong>d Variablen<br />

”<br />

”<br />

<strong>de</strong>s jeweiligen Typs <strong>in</strong> <strong>de</strong>n genannten Blöcken vorhan<strong>de</strong>n. Da <strong>die</strong> Tableaus nichtentartet<br />

s<strong>in</strong>d, ist damit im Abbruchtableau m<strong>in</strong><strong>de</strong>stens e<strong>in</strong>e x-Variable und e<strong>in</strong>e<br />

y-Variable <strong>in</strong> <strong>de</strong>r Basislösung ungleich null. ✷<br />

Beispiel 3.7 Wir erläutern das Verfahren am Beispiel 3.5. Danach liegt e<strong>in</strong> Problem<br />

LCP(M,q) vor mit<br />

⎛<br />

M := ⎜<br />

⎝<br />

0 0 −2 −2<br />

0 0 −3 −1<br />

−2 −2 0 0<br />

−1 −5 0 0<br />

⎞ ⎛<br />

⎟<br />

⎠ und q := ⎜<br />

⎝<br />

1<br />

1<br />

1<br />

1<br />

⎞<br />

⎟<br />


KAPITEL 3. ENDLICHE SPIELE 53<br />

Wir bil<strong>de</strong>n das Tableau zu w − Mz = q mit z T := (z 1 ,z 2 ,z 3 ,z 4 ) = (x 1 ,x 2 ,y 1 ,y 2 )<br />

und w T := (w 1 ,w 2 ,w 2 ,w 4 ):<br />

z 1 z 2 z 3 z 4<br />

w 1 0 0 2 2 1<br />

w 2 0 0 3 1 1<br />

w 3 ( 2 ) 2 0 0 1<br />

w 4 1 5 0 0 1<br />

w 3 z 2 w 2 z 4<br />

w 1 0 0 − 2 3<br />

z 3 0 0<br />

1<br />

3<br />

4<br />

3<br />

1<br />

3<br />

1<br />

3<br />

1<br />

3<br />

1<br />

1<br />

z 1 1 0 0<br />

2 2<br />

w 4 − 1 2<br />

( 4 ) 0 0<br />

1<br />

2<br />

w 3 w 4 w 2 w 1<br />

z 4 0 0 − 1 2<br />

3<br />

4<br />

z 3 0 0<br />

1<br />

2<br />

− 1 4<br />

1<br />

4<br />

1<br />

4<br />

5<br />

z 1 − 1 3<br />

0 0<br />

8 4 8<br />

z 2 − 1 8<br />

1<br />

1<br />

0 0<br />

4 8<br />

w 3 z 2 z 3 z 4<br />

w 1 0 0 2 2 1<br />

w 2 0 0 ( 3 ) 1 1<br />

1<br />

1<br />

z 1 1 0 0<br />

2 2<br />

w 4 − 1 2<br />

4 0 0<br />

1<br />

2<br />

w 3 w 4 w 2 z 4<br />

w 1 0 0 − 2 3<br />

( ) 4<br />

3<br />

z 3 0 0<br />

1<br />

3<br />

1<br />

3<br />

1<br />

3<br />

1<br />

3<br />

5<br />

z 1 − 1 3<br />

0 0<br />

8 4 8<br />

z 2 − 1 8<br />

1<br />

1<br />

0 0<br />

4 8<br />

Die Basislösung ist zulässig und komplementär.<br />

Also liegt e<strong>in</strong>e Lösung <strong>de</strong>s LCP<br />

vor mit:<br />

¯x 1 = 3 8 , ¯x 2 = 1 8<br />

ȳ 1 = 1 4 , ȳ 2 = 1 4<br />

Nach Satz 3.9, Teil b), ist somit x ∗ = ( 3<br />

, ) 1<br />

4 4 und y ∗ = ( 1<br />

<strong>de</strong>s Bi-Matrixspiels <strong>in</strong> gemischen Strategien.<br />

2 , 1 2<br />

)<br />

e<strong>in</strong> Nash-Gleichgewicht<br />

Beispiel 3.8 Wir greifen Beispiel 1.2 (Gefangenendilemma) auf, das wir als gemischte<br />

Erweiterung betrachten. Wir gehen zu e<strong>in</strong>em strategisch äquivalenten<br />

Problem über, <strong>in</strong><strong>de</strong>m wir zu <strong>de</strong>n gegebenen Auszahlungsmatrizen <strong>die</strong> Matrix 11E<br />

h<strong>in</strong>zuad<strong>die</strong>ren. Die neuen Auszahlungsmatrizen lauten dann:<br />

A :=<br />

(<br />

9 1<br />

10 6<br />

)<br />

und B :=<br />

(<br />

9 10<br />

1 6<br />

)


KAPITEL 3. ENDLICHE SPIELE 54<br />

Mit <strong>de</strong>m Starttableau w − Mz = q erhalten wir damit folgen<strong>de</strong> Tableaufolge:<br />

z 1 z 2 z 3 z 4<br />

w 1 0 0 9 1 1<br />

w 2 0 0 10 6 1<br />

w 3 9 1 0 0 1<br />

w 4 ( 10 ) 6 0 0 1<br />

w 4 z 2 z 3 w 2<br />

w 1 0 0<br />

22<br />

3<br />

− 1 6<br />

z 4 0 0<br />

5<br />

3<br />

w 3 − 9<br />

z 1<br />

1<br />

10<br />

− 44<br />

10<br />

( 6<br />

10<br />

1<br />

6<br />

5<br />

6<br />

1<br />

6<br />

1<br />

0 0<br />

10 10<br />

)<br />

1<br />

0 0<br />

10<br />

w 4 z 2 z 3 z 4<br />

w 1 0 0 9 1 1<br />

w 2 0 0 10 ( 6 ) 1<br />

w 3 − 9 10<br />

− 44<br />

10<br />

0 0<br />

1<br />

10<br />

z 1<br />

1<br />

10<br />

6<br />

1<br />

0 0<br />

10 10<br />

w 4 z 1 z 3 w 2<br />

w 1 0 0<br />

22<br />

3<br />

− 1 6<br />

z 4 0 0<br />

5<br />

3<br />

w 3 − 1 6<br />

z 2<br />

1<br />

6<br />

1<br />

6<br />

5<br />

6<br />

1<br />

6<br />

22<br />

5<br />

0 0<br />

3 6<br />

5<br />

1<br />

0 0<br />

6 6<br />

Die letzte Basislösung ist zulässig und komplementär.<br />

Mit (z 1 ,z 2 ,z 3 ,z 4 ) := (x 1 ,x 2 ,y 1 ,y 2 ) erhalten wir als Lösung <strong>de</strong>s LCP:<br />

¯x 1 = 0, ¯x 2 = 1 6 , ȳ 1 = 0, ȳ 2 = 1 6 .<br />

Nach Satz 3.9, Teil b), ist somit x ∗ = (0, 1) und y ∗ = (0, 1) e<strong>in</strong> Nash-Gleichgewicht<br />

<strong>de</strong>s Bi-Matrixspiels <strong>in</strong> gemischen Strategien. Dies entspricht <strong>de</strong>m bereits ermittelten<br />

re<strong>in</strong>en Nash-Gleichgewicht (G,G).


KAPITEL 3. ENDLICHE SPIELE 55<br />

3.6 Weitere Beispiele<br />

In <strong>die</strong>sem Abschnitt beschäftigen wir uns mit e<strong>in</strong>igen anwendungsorientierten<br />

Matrix- und Bimatrixspielen.<br />

Beispiel 3.9 <strong>E<strong>in</strong>e</strong> Firma F produziert e<strong>in</strong> Gerät, <strong>de</strong>ssen wichtigstes Bauteil e<strong>in</strong><br />

spezieller Transistor ist. Der Transistor wird von e<strong>in</strong>er Lieferfirma L bezogen<br />

und dann <strong>in</strong> das Gerät e<strong>in</strong>gebaut. Die Lebensdauer <strong>de</strong>s Geräts hängt von <strong>die</strong>sem<br />

Transistor ab. Wird das Gerät <strong>in</strong>nerhalb <strong>de</strong>r Garantiefrist <strong>de</strong>fekt, so muss es auf<br />

Kosten <strong>de</strong>r Firma F reparaiert wer<strong>de</strong>n; <strong>die</strong> Reparaturkosten betragen 36 [GE]. Die<br />

Lieferfirma L bietet <strong>de</strong>n Transistor <strong>in</strong> 3 Varianten (Typen) zu unterschiedlichen<br />

Preisen und verschie<strong>de</strong>nen Garantieleistungen an:<br />

• Typ I kostet 4 [GE] pro Stück und L übernimmt ke<strong>in</strong>e Garantie.<br />

• Typ II kostet 24 [GE] pro Stück und L übernimmt <strong>die</strong> Reparaturkosten bei<br />

e<strong>in</strong>em Defekt <strong>in</strong>nerhalt <strong>de</strong>r Garantiefrist.<br />

• Typ III kostet 40 [GE] pro Stück. Wird <strong>die</strong>ser Typ <strong>in</strong>nerhalb <strong>de</strong>r Garantiefrist<br />

<strong>de</strong>fekt, so übernimmt L <strong>die</strong> Reparaturkosten und zahlt zusätzlich 40<br />

[GE] an F aus e<strong>in</strong>er Versicherung, <strong>die</strong> für <strong>die</strong>sen Typ speziell abgeschlossen<br />

wur<strong>de</strong>.<br />

Gefragt ist nach e<strong>in</strong>er Strategie für F, um <strong>die</strong> Kosten möglichst ger<strong>in</strong>g zu halten.<br />

Die Firma F besitzt drei Optionen (Strategien), e<strong>in</strong>e Entscheidung zu treffen: sie<br />

kann Typ I, II o<strong>de</strong>r III wählen, wobei für F im Garantiefall <strong>die</strong> folgen<strong>de</strong>n Kosten<br />

anfallen:<br />

I : - 4 - 36 = -40 , II : -24 , III : - 40 + 40 = 0<br />

Tritt ke<strong>in</strong> Defekt <strong>in</strong> <strong>de</strong>r Garantiefrist auf, so entstehen für F <strong>die</strong> folgen<strong>de</strong>n Kosten:<br />

I : - 4 ; II : -24 , III : - 40<br />

Wir formulieren das Problem als Nullsummenspiel, <strong>in</strong> <strong>de</strong>m <strong>de</strong>r Zeilenspieler (<strong>die</strong><br />

Firma F) <strong>die</strong> Strategien I, II, III zur Verfügung hat, und für <strong>de</strong>n Spaltenspieler<br />

(<strong>die</strong> Natur) <strong>die</strong> folgen<strong>de</strong>n Möglichkeiten {D,nonD} (<strong>de</strong>fekt, nicht <strong>de</strong>fekt) bestehen.<br />

Auf <strong>die</strong>se Weise erhalten wir folgen<strong>de</strong> Auszahlungsmatrix A := (u ij ) ∈ R 3×2 :<br />

A =<br />

⎛<br />

⎜<br />

⎝<br />

−40 −4<br />

−24 −24<br />

0 −40<br />

⎞<br />

⎟<br />


KAPITEL 3. ENDLICHE SPIELE 56<br />

Um e<strong>in</strong> Nash-Gleichgewicht für F (Zeilenspieler) zu f<strong>in</strong><strong>de</strong>n, lösen wir <strong>die</strong> folgen<strong>de</strong><br />

l<strong>in</strong>eare Optimierungsaufgabe gemäß (3.6)<br />

⎧<br />

⎪⎨<br />

⎪⎩<br />

max v<br />

(<br />

−40 −24 0<br />

s.d.<br />

−4 −24 −40<br />

x 1 + x 2 + x 3 = 1<br />

x ≥ 0<br />

) ⎛ ⎞<br />

x 1<br />

⎜ ⎟ ⎝ x 2<br />

x 3<br />

(<br />

v<br />

⎠ ≥<br />

v<br />

)<br />

(3.24)<br />

Mit Schlupfvariablen y 1 ≥ 0, y 2 ≥ 0 und w 1 = 0 ist <strong>die</strong> Aufgabe (3.24) wie folgt<br />

gegeben:<br />

max v<br />

s.d. y 1 + 40x 1 + 24x 2 + v = 0<br />

y 2 + 4x 1 + 24x 2 + 40x 3 + v = 0<br />

w 1 + x 1 + x 2 + x 3 = 1<br />

w 1 = 0,y ≥ 0,x ≥ 0<br />

Die Aufgabe wur<strong>de</strong> mit e<strong>in</strong>em L<strong>in</strong>opt-Solver ( ”<br />

Handysim“) gelöst; es wur<strong>de</strong> <strong>die</strong><br />

folgen<strong>de</strong> Lösung ermittelt: x ∗ 1 ≈ 0.53, x ∗ 2 = 0, x ∗ 3 ≈ 0.47. Die Lösung empfiehlt<br />

also, Typ I <strong>in</strong> 53 %,Typ III <strong>in</strong> 47 % <strong>de</strong>r Fälle und Typ II gar nicht e<strong>in</strong>zusetzen.<br />

Man beachte, dass sich das Mo<strong>de</strong>ll (3.24) auch direkt als l<strong>in</strong>eare Optimierungsaufgabe<br />

aufstellen läßt.<br />

Beispiel 3.10 BOING und AIRBUS überlegen, e<strong>in</strong>en neuen Flugzeugtyp zu entwickeln<br />

und damit <strong>in</strong> <strong>de</strong>n Markt e<strong>in</strong>zutreten o<strong>de</strong>r nicht. Die Entwicklungskosten<br />

e<strong>in</strong>es neuen Flugzeugtyps s<strong>in</strong>d sehr hoch, beispielsweise entsprechen <strong>die</strong> Entwicklungskosten<br />

<strong>de</strong>s A 380 fast <strong>de</strong>m gesamten Unternehmenswert. Bei so hohen Entwicklungskosten<br />

ist das Projekt nicht profitabel, wenn <strong>de</strong>r Konkurrent gleichzeitig<br />

e<strong>in</strong>en ähnlichen Flugzeugtyp entwickelt und damit <strong>in</strong> <strong>de</strong>nselben Markt für Flugzeuge<br />

mit entsprechen<strong>de</strong>n Fluggastkapizitäten e<strong>in</strong>tritt. Die Situation ist <strong>in</strong> folgen<strong>de</strong>m<br />

Schema dargestellt, das <strong>die</strong> Elemente bei<strong>de</strong>r Auszahlungsmatrizen A,B enthält<br />

(ME = Markte<strong>in</strong>tritt, kME = ke<strong>in</strong> Markte<strong>in</strong>tritt):<br />

. AIRBUS<br />

ME kME<br />

BOING ME -5, -5 100, 0<br />

kME 0 , 100 0 , 0<br />

Man kann durch Überprüfen herausf<strong>in</strong><strong>de</strong>n, dass <strong>die</strong> re<strong>in</strong>en Strategiepaare (ME,kME)<br />

bzw. (kME,ME) Nash-Gleichgewichte s<strong>in</strong>d.<br />

Die gemischten Strategien für Bo<strong>in</strong>g seien mit (x 1 ,x 2 ) (mit x 1 + x 2 = 1,x i ≥ 0)<br />

und jene für Airbus mit (y 1 ,y 2 ) (mit y 1 + y 2 = 1,y i ≥ 0) bezeichnet. Wir gehen


KAPITEL 3. ENDLICHE SPIELE 57<br />

zu e<strong>in</strong>em äquivalenten Spiel über, <strong>in</strong><strong>de</strong>m wir 10 zu je<strong>de</strong>m Matrixelement von A<br />

und B dazuad<strong>die</strong>ren. Mit z := (z i ) := (x 1 ,x 2 ,y 1 ,y 2 ) lautet dann das Starttableau<br />

für <strong>de</strong>n modifizierten Lemke-Algorithmus wie folgt:<br />

z 1 z 2 z 3 z 4<br />

w 1 0 0 5 110 1<br />

w 2 0 0 10 10 1<br />

w 3 5 110 0 0 1<br />

w 4 10 10 0 0 1<br />

Je nach Wahl <strong>de</strong>r Pivotspalte beim Start <strong>de</strong>s Verfahrens erhält man (unter Beachtung<br />

von Satz 3.9,b)) als Lösung <strong>die</strong> re<strong>in</strong>en Strategien x ∗ = (0, 1), y ∗ = (1, 0) o<strong>de</strong>r<br />

¯x = (1, 0), ȳ = (0, 1), <strong>die</strong> oben genannten Nash-Gleichgewichten entsprechen.<br />

Bei e<strong>in</strong>em Neustart ist es aber auch möglich, e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> gemischten<br />

Strategien zu erhalten, nämlich:<br />

˜x ≈ (0.952, 0.048), ỹ = (0.048, 0.952)<br />

Dies br<strong>in</strong>gt <strong>die</strong> Erwartung zum Ausdruck, dass je<strong>de</strong>r <strong>de</strong>r bei<strong>de</strong>n Kontrahenten mit<br />

e<strong>in</strong>er Wahrsche<strong>in</strong>lichkeit von ca. 95 % <strong>in</strong> <strong>de</strong>n Markt e<strong>in</strong>tritt. Diese Wahrsche<strong>in</strong>lichkeit<br />

hängt von <strong>de</strong>n Gew<strong>in</strong>nen bzw. Verlusten ab, <strong>die</strong> <strong>in</strong> <strong>de</strong>r Auszahlungsmatrix<br />

enthalten s<strong>in</strong>d. (Man beachte, dass im vorliegen<strong>de</strong>n Fall bei e<strong>in</strong>em vergleichsweise<br />

kle<strong>in</strong>en Verlust Aussichten auf e<strong>in</strong>en großen Gew<strong>in</strong>n bestehen.)<br />

Beispiel 3.11 Auch bei <strong>die</strong>sem Beispiel han<strong>de</strong>lt es sich um e<strong>in</strong> Markte<strong>in</strong>trittsspiel<br />

(es ist <strong>in</strong> abgeän<strong>de</strong>rter Form [4] entnommen). Es ist e<strong>in</strong> Spiel zwischen<br />

e<strong>in</strong>em Monopolisten (Spieler 2) und e<strong>in</strong>em potentiellen Konkurrenten (Spieler<br />

1), <strong>de</strong>r <strong>die</strong> Absicht hat, <strong>in</strong> <strong>de</strong>n Markt e<strong>in</strong>zutreten. Der Monopolist hat <strong>die</strong> Wahl,<br />

e<strong>in</strong>en Vernichtungskampf zu führen (Option s 21 ) o<strong>de</strong>r <strong>de</strong>n Konkurrenten auf <strong>de</strong>m<br />

Markt zu dul<strong>de</strong>n (Option s 22 ). Im ersten Fall wür<strong>de</strong>n bei<strong>de</strong> Spieler gleich große<br />

Verluste erlei<strong>de</strong>n, im zweiten Fall wür<strong>de</strong>n sie <strong>de</strong>n Markt teilen. Spieler 1 s<strong>in</strong>d<br />

<strong>die</strong> Optionen <strong>de</strong>s Spielers 2 bekannt. Er hat <strong>die</strong> Wahl, auf Grund <strong>de</strong>r Androhung<br />

e<strong>in</strong>es Vernichtungskampfes auf e<strong>in</strong>en Marke<strong>in</strong>tritt zu verzichten (s 11 ) o<strong>de</strong>r <strong>in</strong> <strong>de</strong>n<br />

Markt e<strong>in</strong>zutreten (s 12 ). Wir legen das folgen<strong>de</strong> Auszahlungsschema zugrun<strong>de</strong>:<br />

. Spieler 2<br />

Spieler 1<br />

s 21 s 22<br />

s 11 0 , 100 0 , 100<br />

s 12 -10 , -10 40 , 40


KAPITEL 3. ENDLICHE SPIELE 58<br />

Das Tableau ist so zu verstehen, dass es im Falle <strong>de</strong>r Strategie s 11 ( ”<br />

ke<strong>in</strong> Markte<strong>in</strong>tritt“)<br />

bei <strong>de</strong>r Androhung e<strong>in</strong>es Vernichtungskampfes bleibt und auch ke<strong>in</strong>e Teilung<br />

<strong>de</strong>s Marktes e<strong>in</strong>tritt.<br />

Man prüft leicht nach, dass es zwei Nash-Gleichgewichte <strong>in</strong> re<strong>in</strong>en Strategien gibt,<br />

nämlich (s 11 ,s 21 ) und (s 12 ,s 22 ). <strong>E<strong>in</strong>e</strong> ökonomische Interpretation <strong>die</strong>ser Gleichgewichte<br />

bleicht <strong>de</strong>m Leser überlassen.<br />

Bemerkung: Wie <strong>die</strong> Beispiele gezeigt haben, kann e<strong>in</strong> endliches Zwei-Personenen-<br />

Spiel mehrere Nash-Gleichgewichte besitzen. Das angegebene Verfahren f<strong>in</strong><strong>de</strong>t bei<br />

je<strong>de</strong>m Durchlauf natürlich nur e<strong>in</strong>en Gleichgewichtspunkt. Zu L<strong>in</strong>earen Komplementaritätsproblemen<br />

gibt es e<strong>in</strong>e umfassen<strong>de</strong> Theorie (z.B. über <strong>die</strong> Struktur <strong>de</strong>r<br />

Lösungsmenge) und e<strong>in</strong>e Vielzahl unterschiedlicher Lösungsverfahren. Der Leser<br />

sei <strong>die</strong>sbezüglich auf C. Kanzow [2] verwiesen.


Kapitel 4<br />

Variationsungleichungen (VIP)<br />

Im letzten Kapitel haben wir gezeigt, dass je<strong>de</strong>s Zweipersonen-Spiel sowohl äquivalent<br />

ist zu e<strong>in</strong>er quadratischen Optimierungsaufgabe wie auch zu e<strong>in</strong>em L<strong>in</strong>earen<br />

Komplementaritätsproblem. In <strong>die</strong>sem Kapitel legen wir nun allgeme<strong>in</strong>er e<strong>in</strong><br />

strategisches Spiel mit m Spielern <strong>in</strong> <strong>de</strong>r Notation<br />

Γ = ( {1,...,m}, (X 1 ,...,X m ), (u 1 ,...,u m ) ) (4.1)<br />

zugrun<strong>de</strong>. Unser Ziel besteht dar<strong>in</strong>, e<strong>in</strong>e Verb<strong>in</strong>dung von Γ zu e<strong>in</strong>em Variationsungleichungs-Problem<br />

(Variational Inequality Problem, kurz: VIP) herzustellen.<br />

Auf <strong>de</strong>r Grundlage von Variationsungleichungen wer<strong>de</strong>n wir dann e<strong>in</strong>en weiteren<br />

Existenzsatz für Nash-Gleichgewichte begrün<strong>de</strong>n, <strong>de</strong>r auf an<strong>de</strong>ren Voraussetzungen<br />

als jener von Nikaido-Isoda beruht. Von <strong>de</strong>n zahlreichen Verfahren zur Lösung<br />

von Variationsungleichungen wird e<strong>in</strong>es vorgestellt und erläutert, wie es sich im<br />

spieltheoretischen S<strong>in</strong>ne nutzen läßt.<br />

4.1 VIP und Nash-Gleichgewichte<br />

Zunächst wird <strong>de</strong>r Begriff ”<br />

Variationsungleichung“ e<strong>in</strong>geführt. Anschließend wird<br />

e<strong>in</strong>e Verb<strong>in</strong>dung zu wichtigen mathematischen Problemen hergestellt.<br />

Def<strong>in</strong>ition 4.1 Seien X ⊆ R n nichtleer und abgeschlossen sowie F : X ↦→ R n gegeben.<br />

Als Variationsungleichung (variational <strong>in</strong>equality problem; kurz: V IP(X,F))<br />

versteht man das Problem, e<strong>in</strong>en Vektor x ∗ ∈ X zu f<strong>in</strong><strong>de</strong>n, <strong>de</strong>r <strong>de</strong>r Bed<strong>in</strong>gung<br />

F(x ∗ ) T (x − x ∗ ) ≥ 0<br />

∀ x ∈ X<br />

genügt. Der Vektor x ∗ heißt dann Lösung <strong>de</strong>r Variationsungleichung V IP(X,F),<br />

während X als zulässige Menge von V IP(X,F) bezeichnet wird.<br />

59


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 60<br />

Die folgen<strong>de</strong>n Resultate zeigen, dass sich bei e<strong>in</strong>er geeigneten Wahl <strong>de</strong>r zulässigen<br />

Menge X und/o<strong>de</strong>r <strong>de</strong>r Funktion F zahlreiche Probleme als Spezialfall e<strong>in</strong>er Variationsungleichung<br />

erweisen. Wir beg<strong>in</strong>nen zunächst mit e<strong>in</strong>em Zusammenhang<br />

zwischen nichtl<strong>in</strong>earen Gleichungssystemen und Variationsungleichungen.<br />

Lemma 4.1 Betrachte <strong>die</strong> Variationsungleichung V IP(X,F) mit X = R n . Dann<br />

ist <strong>de</strong>r Vektor x ∗ ∈ X genau dann e<strong>in</strong>e Lösung von V IP(X,F), wenn er das Gleichungssystem<br />

F(x) = 0 löst.<br />

Beweis: Sei x ∗ zunächst als Lösung von V IP(X,F) mit X = R n vorausgesetzt.<br />

Dann gilt F(x ∗ ) T (x −x ∗ ) ≥ 0 ∀ x ∈ R n . Speziell für <strong>de</strong>n Vektor x := x ∗ −F(x ∗ )<br />

folgt dann:<br />

0 ≤ F(x ∗ ) T (x − x ∗ ) = −F(x ∗ ) T F(x ∗ ) = −‖F(x ∗ )‖ 2<br />

Daraus folgt: F(x ∗ ) = 0.<br />

Gilt umgekehrt F(x ∗ ) = 0, so folgt F(x ∗ ) T (x − x ∗ ) ≥ 0 ∀ x ∈ R n . ✷<br />

Bevor wir auf e<strong>in</strong>en weiteren wichtigen Spezialfall von Variationsungleichungen<br />

e<strong>in</strong>gehen, verallgeme<strong>in</strong>ern wir <strong>de</strong>n Begriff <strong>de</strong>s ”<br />

L<strong>in</strong>earen Komplementaritätsproblems“.<br />

Def<strong>in</strong>ition 4.2 Sei F : R n + ↦→ R n gegeben. Das (nichtl<strong>in</strong>eare) Komplementaritätsproblem<br />

besteht dar<strong>in</strong>, e<strong>in</strong>en Vektor x ∗ ∈ R n zu f<strong>in</strong><strong>de</strong>n, so dass x = x ∗ <strong>de</strong>m<br />

folgen<strong>de</strong>n System genügt:<br />

x ≥ 0, F(x) ≥ 0, x T F(x) = 0<br />

Dieses System wird mit NCP(F) bezeichnet (nonl<strong>in</strong>ear complementary problem).<br />

Besitzt F(x) <strong>die</strong> Form F(x) := M x + q mit M ∈ R n×n und q ∈ R n , so liegt e<strong>in</strong><br />

l<strong>in</strong>eares Komplementaritätsproblem vor.<br />

Wir wer<strong>de</strong>n zeigen, dass auch Komplementaritätsprobleme als Spezialfall von<br />

Variationsungleichungen aufgefasst wer<strong>de</strong>n können. Alle Verfahren zur Lösung<br />

von Variationsungleichungen können somit auch auf Komplementaritätsprobleme<br />

angewen<strong>de</strong>t wer<strong>de</strong>n.<br />

Lemma 4.2 Seien X = R n + und F : X ↦→ R n . Dann löst e<strong>in</strong> Vektor x ∗ ∈ R n<br />

genau dann <strong>die</strong> Variationsungleichung V IP(X,F), wenn x ∗ das Komplementaritätsproblem<br />

NCP(F) löst.


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 61<br />

Beweis: Sei zunächst x ∗ ∈ X = R n + e<strong>in</strong>e Lösung von V IP(X,F), d.h. für alle<br />

x ∈ X gilt: F(x ∗ ) T (x − x ∗ ) ≥ 0. Setze speziell <strong>de</strong>n Vektor x = x ∗ + e i für<br />

i ∈ {1,...,n}. Dann folgt:<br />

F(x ∗ ) T e i ≥ 0 ∀ i ⇐⇒ F i (x ∗ ) ≥ 0 ∀ i ⇐⇒ F(x ∗ ) ≥ 0<br />

Damit ist x ∗ ≥ 0 und F(x ∗ ) ≥ 0 gezeigt. Daraus folgt (x ∗ ) T F(x ∗ ) ≥ 0.<br />

Annahme: Es gäbe e<strong>in</strong> i ∈ {1,...,n} mit x ∗ iF i (x ∗ ) > 0. Wähle dann x :=<br />

(x i ,x ∗,−i ) mit x i = 0. Damit erhält man wegen<br />

0 > −F i (x ∗ )x ∗ i = F(x ∗ ) T (x − x ∗ ) ≥ 0<br />

e<strong>in</strong>en Wi<strong>de</strong>rspruch. Somit gilt auch F(x ∗ ) T x ∗ = 0 und x ∗ löst NCP(F).<br />

Sei nun umgekehrt x ∗ e<strong>in</strong>e Lösung von NCP(F), also x ∗ ≥ 0, F(x ∗ ) ≥ 0,<br />

F(x ∗ ) T x ∗ = 0. Für beliebiges x ≥ 0 gilt dann:<br />

F(x ∗ ) T (x − x ∗ ) = F(x ∗ ) T x − F(x ∗ ) T x ∗ = F(x ∗ ) T x ≥ 0<br />

d.h. x ∗ ist e<strong>in</strong>e Lösung von V IP(X,F) mit X = R n +.<br />

✷<br />

Als nächstes stellen wir e<strong>in</strong>en Bezug von Variationsungleichungen zu Optimierungsproblemen<br />

her. Zu <strong>die</strong>sem Zweck betrachten wird das folgen<strong>de</strong> Problem:<br />

maxf(x) s.d. x ∈ X (4.2)<br />

Lemma 4.3 Seien f : R n ↦→ R stetig differenzierbar und X ⊆ R n nichtleer,<br />

abgeschlossen und konvex. Dann gelten:<br />

a) Ist x ∗ e<strong>in</strong> lokaler Maximierer von (4.2), so löst x ∗ <strong>die</strong> Variationsungleichung<br />

V IP(X,F) mit F = −∇f.<br />

b) Ist f konkav und x ∗ e<strong>in</strong>e Lösung von V IP(X,F) mit F = −∇f, so ist x ∗<br />

e<strong>in</strong> globaler Maximierer von (4.2).<br />

Beweis: a) Sei x ∗ ∈ X e<strong>in</strong> lokaler Maximimierer <strong>de</strong>r Aufgabe (4.2). Da X konvex<br />

ist, ist d := x − x ∗ für beliebiges x ∈ X e<strong>in</strong>e zulässige Richtung <strong>in</strong> x ∗ . Da x ∗ e<strong>in</strong><br />

lokaler Maximierer ist, gilt für <strong>die</strong> Richtungsableitung ∇f(x ∗ ) T d ≤ 0. (An<strong>de</strong>rnfalls<br />

wür<strong>de</strong> f(x ∗ +t d) > f(x ∗ ) für h<strong>in</strong>reichend kle<strong>in</strong>e t > 0 gelten und d wäre e<strong>in</strong>e<br />

Aufstiegsrichtung <strong>in</strong> x ∗ .) Somit gilt −∇f(x ∗ ) T (x − x ∗ ) ≥ 0 für beliebiges x ∈ X<br />

und x ∗ ist e<strong>in</strong>e Lösung von V IP(X,F) mit F = −∇f.<br />

b) Sei nun x ∗ ∈ X e<strong>in</strong>e Lösung von V IP(X,F). Dann gilt für alle x ∈ X:<br />

∇f(x ∗ ) T (x − x ∗ ) ≤ 0. Für e<strong>in</strong>e differenzierbare konkave Funktion gilt für je<strong>de</strong>s<br />

Paar x ∗ ,x ∈ X: f(x) ≤ f(x ∗ )+∇f(x ∗ ) T (x−x ∗ ). Daraus folgt direkt f(x) ≤ f(x ∗ )


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 62<br />

für beliebiges x ∈ X. Somit ist x ∗ globaler Maximierer von (4.2).<br />

✷<br />

Wir kommen nun zum Hauptresultat <strong>die</strong>ses Abschnitts, wonach unter geeigneten<br />

Voraussetzungen e<strong>in</strong> Nash-Gleichgewicht mit Hilfe von Variationsungleichungen<br />

bestimmt wer<strong>de</strong>n kann. Dieses Ergebnis ist sowohl von theoretischem Interesse<br />

(Existenz- und E<strong>in</strong><strong>de</strong>utigkeitsaussagen für e<strong>in</strong> Nash-Gleichgewicht) wie auch<br />

von praktischem Nutzen (Verwendung von Verfahren zu Berechnung e<strong>in</strong>es Nash-<br />

Gleichgewichts via Variationsungleichungen).<br />

Satz 4.1 Gegeben sei e<strong>in</strong> Spiel Γ gemäß (4.1) mit nichtleeren, abgeschlossenen<br />

und konvexen Strategiemengen X i ⊆ R n i<br />

sowie stetig differenzierbaren Auszahlungsfunktionen<br />

u i : X ↦→ R (mit X = X 1 ×...×X m ) <strong>de</strong>rart, dass u i (x i ,x −i ) als<br />

Funktion von x i konkav ist. Dann ist x ∗ = (x ∗,1 ,...,x ∗,m ) genau dann e<strong>in</strong> Nash-<br />

Gleichgewicht von Γ, wenn x ∗ Lösung <strong>de</strong>r Variationsungleichung V IP(X,F) ist<br />

mit<br />

⎛ ⎞<br />

F(x) := − ⎜<br />

⎝<br />

∇ x 1 u 1 (x)<br />

.<br />

∇ x m u m (x)<br />

Beweis: Sei x ∗ = (x ∗,1 ,...,x ∗,m ) zunächst e<strong>in</strong> Nash-Gleichgewicht von Γ. Dann<br />

ist x ∗,i für je<strong>de</strong>s i ∈ {1,...,m} e<strong>in</strong> Maximierer <strong>de</strong>r Aufgabe<br />

⎟<br />

⎠<br />

max u i (x i ,x ∗,−i ) s.d. x i ∈ X i (4.3)<br />

x i<br />

Wegen Lemma 4.3 gilt dann ∇ x i u i (x ∗ ) T (x i −x ∗,i ) ≤ 0 für i ∈ {1,...,m}. Somit:<br />

m∑<br />

F(x ∗ ) T (x − x ∗ ) = − ∇ x i u i (x ∗ ) T (x i − x ∗,i ) ≥ 0<br />

i=1<br />

Also ist x ∗ e<strong>in</strong>e Lösung von V IP(X,F).<br />

Sei nun umgekehrt x ∗ als Lösung von V IP(X,F) vorausgesetzt. Dann gilt<br />

F(x ∗ ) T (x − x ∗ ) ≥ 0<br />

∀ x ∈ X<br />

Speziell für e<strong>in</strong>en Vektor <strong>de</strong>r Gestalt<br />

x := (x i ,x ∗,−i ) ∈ X<br />

mit e<strong>in</strong>em beliebigen x i ∈ X i folgt hieraus<br />

∇ x i u i (x ∗ ) T (x i − x ∗,i ) ≤ 0


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 63<br />

Wegen <strong>de</strong>r vorausgesetzten Konkavität von u i (x i ,x ∗,−i ) folgt hieraus:<br />

u i (x i ,x ∗,−i ) ≤ u i (x ∗ ) + ∇ x i u i (x ∗ ) T (x i − x ∗,i ) ∀x i ∈ X i<br />

Damit folgt u i (x i ,x ∗,−i ) ≤ u i (x ∗ ) (∀x i ∈ X i ) und x ∗,i ist Maximierer von (4.3).<br />

Also ist x ∗ Nash-Gleichgewicht von Γ. ✷<br />

Beispiel 4.1 Wir erläutern Satz 4.1 an e<strong>in</strong>em Bi-Matrixspiel Γ <strong>in</strong> gemischten<br />

Strategien. Die Auszahlungsmatrizen <strong>in</strong> re<strong>in</strong>en Strategien seien gegeben durch<br />

A,B ∈ R p×n , also besitzen <strong>die</strong> Auszahlungsfunktionen für Γ <strong>die</strong> Form<br />

û 1 (x,y) := x T Ay und û 2 (x,y) := x T B y mit (x,y) ∈ ̂X × Ŷ<br />

Man prüft nach, dass <strong>die</strong> Funktionen û i : ̂X × Ŷ ↦→ R (i = 1, 2) <strong>die</strong> Voraussetzungen<br />

<strong>de</strong>s Satzes erfüllen. Nun gilt:<br />

∇ x û 1 (x,y) = Ay<br />

und ∇ y û 2 (x,y) = B T x<br />

Nach Satz 4.1 ist <strong>de</strong>r Punkt (x ∗ ,y ∗ ) ∈ ̂X × Ŷ genau dann e<strong>in</strong> Nash-Gleichgwicht<br />

von Γ, wenn er <strong>die</strong> angegebene Variationsungleigung erfüllt.<br />

Wegen F(x ∗ ,y ∗ ) T = −(y ∗T A T ,x ∗T B) gelten für beliebiges (x,y) ∈ ̂X × Ŷ <strong>die</strong><br />

folgen<strong>de</strong>n Umformungen:<br />

⇐⇒<br />

( )<br />

x − x<br />

−(y ∗T A T ,x ∗T ∗<br />

B)<br />

y − y ∗ ≥ 0<br />

(<br />

x<br />

−<br />

T Ay ∗ − x ∗T Ay ∗ )<br />

x ∗T By − x ∗T By ∗ ≥ 0<br />

Daraus folgt direkt: x ∗T Ay ∗ ≥ x T Ay ∗ und x ∗T By ∗ ≥ x ∗T By für alle (x,y) ∈<br />

̂X × Ŷ . Dies s<strong>in</strong>d <strong>die</strong> bekannten Bed<strong>in</strong>gungen für e<strong>in</strong> Nash-Gleichgewicht bei<br />

e<strong>in</strong>em Bi-Matrixspiel <strong>in</strong> gemischten Strategien. ✷<br />

Beispiel 4.2 Wir greifen Beispiel 2.3 (Cournot’sches Oligopol) auf. Danach br<strong>in</strong>gen<br />

m konkurrieren<strong>de</strong> Unternehmen e<strong>in</strong> homogenes Gut auf <strong>de</strong>n Markt. Die Daten<br />

für <strong>die</strong>ses Problem wer<strong>de</strong>n nochmals kurz genannt:<br />

i : Unternehmen i mit i ∈ {1,...,m}<br />

x i : <strong>die</strong> von i hergestellten ME <strong>de</strong>s Produkts<br />

ξ : mit ξ := ∑ m<br />

i=1 x i , <strong>in</strong>sgesamt auf <strong>de</strong>n Markt gebrachte ME<br />

p(ξ): Marktpreis pro ME bei e<strong>in</strong>em Angebot von ξ ME<br />

c i (x i ): Produktionskosten von i, wenn x i ME hergestellt wer<strong>de</strong>n.


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 64<br />

Wie <strong>in</strong> Beispiel 2.3 erhalten wir für je<strong>de</strong>s Unternehmen i folgen<strong>de</strong> Nutzenfunktion:<br />

u i (x i ) := x i · p(ξ) − c i (x i ) mit x i ≥ 0<br />

Wie bereits erwähnt, wer<strong>de</strong>n <strong>die</strong>se Funktionen als konkav vorausgesetzt. Ferner<br />

nehmen wir an, dass sie stetig differenzierbar seien. Nach Satz 4.1 ist das Problem,<br />

für <strong>die</strong>se Aufgabe e<strong>in</strong> Nash-Gleichgewicht zu f<strong>in</strong><strong>de</strong>n, äquivalent damit, <strong>die</strong><br />

Variationsungleichung V IP(X,F) mit X = R m + und <strong>de</strong>r folgen<strong>de</strong>n Funktion F<br />

zu lösen:<br />

⎛ ⎞<br />

F(x) := − ⎜<br />

⎝<br />

⎛<br />

:= − ⎜<br />

⎝<br />

∇ x1 u 1 (x)<br />

.<br />

∇ xm u m (x)<br />

⎟<br />

⎠<br />

p(ξ) + x 1 p ′ (ξ) − c ′ 1(x 1 )<br />

.<br />

p(ξ) + x m p ′ (ξ) − c ′ m(x m )<br />

Dabei ist x = (x 1 ,...,x m ) T . Da <strong>in</strong> <strong>die</strong>sem Fall <strong>de</strong>r zulässige Bereich X i = R +<br />

für alle i ist, ist nach Lemma 4.2 V IP(X,F) äquivalent zu <strong>de</strong>m Komplementaritätsproblem<br />

NCP(F). ✷<br />

4.2 Monotone Funktionen<br />

In <strong>die</strong>sem Abschnitt führen wir <strong>die</strong> Klasse <strong>de</strong>r monotonen Funktionen e<strong>in</strong>; grundlegen<strong>de</strong><br />

Eigenschaften <strong>die</strong>ser Funktionen wer<strong>de</strong>n vorgestellt.<br />

Def<strong>in</strong>ition 4.3 Sei X ⊆ R n e<strong>in</strong>e beliebige Menge. <strong>E<strong>in</strong>e</strong> Funktion F : X ↦→ R n<br />

heißt auf X<br />

a) monoton, wenn gilt:<br />

b) strikt mononton, wenn gilt:<br />

⎞<br />

⎟<br />

⎠<br />

(x − y) T (F(x) − F(y)) ≥ 0 ∀ x,y ∈ X<br />

(x − y) T (F(x) − F(y)) > 0 ∀ x,y ∈ X , x ≠ y<br />

c) gleichmäßig monoton, wenn es e<strong>in</strong> µ > 0 gibt mit<br />

(x − y) T (F(x) − F(y)) ≥ µ‖x − y‖ 2 ∀ x,y ∈ X


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 65<br />

Anschaulich versteht man im Fall n = 1 unter e<strong>in</strong>er (strikt) monotonen Funktion<br />

e<strong>in</strong>e (strikt) monoton wachsen<strong>de</strong> Funktion,während e<strong>in</strong>e (strikt) monoton fallen<strong>de</strong><br />

Funktion ke<strong>in</strong>e (strikt) monotone Funktion im S<strong>in</strong>ne <strong>de</strong>r Def<strong>in</strong>ition 4.3 ist.<br />

Offenbar ist je<strong>de</strong> gleichmäßig monotone Funktion auch strikt monoton und je<strong>de</strong><br />

strikt monotone Funktion ist monoton, wobei <strong>die</strong> Umkehrungen <strong>die</strong>ser Aussagen<br />

nicht gelten.<br />

Wir geben als Nächstes e<strong>in</strong>ige Beipiele von monotonen Funktionen an.<br />

Beispiel 4.3 Sei F : R ↦→ R. Dann gelten:<br />

a) Die Funktion F(x) := c (c e<strong>in</strong>e beliebige Konstante) ist monoton, aber nicht<br />

strikt monoton.<br />

b) Die Funktion F(x) := x 3 ist strikt monoton, aber nicht gleichmäßig monoton.<br />

c) Die Funktion F(x) := x ist gleichmäßig monoton.<br />

Die nächste Bemerkung charakterisiert <strong>die</strong> Klasse <strong>de</strong>r (strikt, gleichmäßigen) monotonen<br />

Funktionen im Falle aff<strong>in</strong>-l<strong>in</strong>earer Abbildungen. Der Beweis <strong>de</strong>r folgen<strong>de</strong>n<br />

Aussagen wird <strong>in</strong> <strong>de</strong>r Vorlesung ausgeführt.<br />

Bemerkung: Sei F : R n ↦→ R n e<strong>in</strong>e aff<strong>in</strong>-l<strong>in</strong>eare Abbildung, d.h. es gilt<br />

F(x) := M x + q mit M ∈ R n×n , q ∈ R n<br />

Man kann dann <strong>die</strong> folgen<strong>de</strong>n Aussagen leicht begrün<strong>de</strong>n:<br />

a) F ist monoton ⇐⇒ M ist positiv semi-<strong>de</strong>f<strong>in</strong>it.<br />

b) F ist strikt monoton ⇐⇒ F ist gleichmäßig monoton ⇐⇒ M ist positiv<br />

<strong>de</strong>f<strong>in</strong>it.<br />

Als Nächstes charakterisieren wir <strong>die</strong> (strikt, gleichmäßig) monotonen Funktionen<br />

mit Hilfe ihrer Jacobe-Matrizen.<br />

Satz 4.2 Seien X ⊆ R n e<strong>in</strong>e offene und konvexe Menge und F : X ↦→ R n stetig<br />

differenzierbar. Dann gelten:<br />

a) F ist genau dann monoton auf X, wenn F ′ (x) für alle x ∈ X positiv semi<strong>de</strong>f<strong>in</strong>it<br />

ist.<br />

b) Ist F ′ (x) für alle x ∈ X positiv <strong>de</strong>f<strong>in</strong>it, so ist F strikt monoton auf X.


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 66<br />

c) F ist genau dann gleichmäßig monoton auf X, wenn F ′ (x) gleichmäßig<br />

positiv <strong>de</strong>f<strong>in</strong>it auf X ist, d.h. wenn es e<strong>in</strong> µ > 0 gibt mit<br />

für alle x ∈ X und für alle d ∈ R n .<br />

d T F ′ (x)d ≥ µ‖d‖ 2 (4.4)<br />

Beweis: Wir beg<strong>in</strong>nen mit Teil c) <strong>de</strong>s Satzes, und setzen zunächst voraus, dass<br />

F gleichmäßig monoton auf X ist. Da F stetig differenzierbar ist, folgt aus <strong>de</strong>r<br />

Richtungsdifferenzierbarkeit für beliebiges d ∈ R n und x ∈ X:<br />

d T F ′ (x)d = d T F(x + td) − F(x)<br />

lim<br />

t→0 t<br />

td T (F(x + td) − F(x))<br />

= lim<br />

t→0 t 2<br />

≥ lim d‖2<br />

t2µ‖t = µ‖d‖ 2<br />

t→0<br />

1<br />

Verwen<strong>de</strong>t wur<strong>de</strong> dabei, dass auf Grund <strong>de</strong>r gleichmäßigen Monotonie für h<strong>in</strong>reichend<br />

kle<strong>in</strong>e t gilt: td T (F(x + td) − F(x)) ≥ µ‖td‖ 2 .<br />

Sei nun umgekehrt <strong>die</strong> Ungleichung (4.4) vorausgesetzt. Benutzt wird nun <strong>de</strong>r<br />

Mittelwertsatz <strong>in</strong> <strong>de</strong>r folgen<strong>de</strong>n <strong>in</strong>tegralen Form:<br />

Damit erhält man dann<br />

(x − y) T (F(x) − F(y)) =<br />

Θ(y + h) − Θ(y) =<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

Θ ′ (y + th)hdt<br />

(x − y) T F ′ (y + t(x − y))(x − y)dt ≥ µ‖x − y‖ 2<br />

woraus <strong>die</strong> gleichmäßige Monotonie von F auf X direkt folgt.<br />

Der Beweis von Teil a) erfolgt analog, <strong>in</strong><strong>de</strong>m man <strong>in</strong> obiger Beweisführung e<strong>in</strong>fach<br />

µ = 0 setzt.<br />

Zum Beweis von b): Es sei F ′ (z) positiv <strong>de</strong>f<strong>in</strong>it für alle z ∈ X. Dann ist Θ(t) :=<br />

(x − y) T F ′ (y + t(x − y))(x − y) > 0 für alle x,y ∈ X mit x ≠ y und für alle<br />

t ∈ [0, 1]. Folglich ist<br />

(x − y) T (F(x) − F(y)) =<br />

∫ 1<br />

0<br />

Θ(t)dt > 0<br />

für alle x,y ∈ X mit x ≠ y. Also ist F strikt monoton.<br />


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 67<br />

Man beachte, dass <strong>die</strong> Umkehrung <strong>de</strong>r Aussage <strong>de</strong>s Satzes 4.2 b) im Allgeme<strong>in</strong>en<br />

nicht gilt; z.B. ist F(x) = x 3 strikt monoton, aber F ′ (0) = 0 ist nicht positiv<br />

<strong>de</strong>f<strong>in</strong>it.<br />

Im folgen<strong>de</strong>n soll nun e<strong>in</strong> Zusammenhang zwischen (strikt, gleichmäßig) konvexen<br />

Funktionen f : R n ↦→ R und (strikt, gleichmäßig) monotonen Funktionen<br />

F : R n ↦→ R n hergestellt wer<strong>de</strong>n. Die grundlegen<strong>de</strong>n Eigenschaften (strikter,<br />

gleichmäßiger) konvexer Funktionen setzen wir dabei aus <strong>de</strong>r Vorlesung über<br />

Nichtl<strong>in</strong>eare Optimierung als bekannt voraus (s. auch Geiger/Kanzow: Theorie<br />

und Numerik restr<strong>in</strong>gierter Optimierungsaufgaben, Spr<strong>in</strong>ger 2002, Abschnitt 2.1).<br />

Satz 4.3 Seien X ⊆ R n e<strong>in</strong>e offene und konvexe Menge und f : X ↦→ R zweimal<br />

stetig differenzierbar. Dann gelten:<br />

a) f ist genau dann konvex auf X, wenn ∇ 2 f(x) positiv-semi<strong>de</strong>f<strong>in</strong>it ist für alle<br />

x ∈ X.<br />

b) Ist ∇ 2 f(x) positiv <strong>de</strong>f<strong>in</strong>it für alle x ∈ X, so ist f strikt konvex auf X.<br />

c) f ist genau dann gleichmäßig konvex auf X, wenn ∇ 2 f(x) gleichmäßig positiv<br />

<strong>de</strong>f<strong>in</strong>it auf X ist.<br />

Auch hier ist <strong>die</strong> Umkehrung <strong>de</strong>r Aussage b) im Allgeme<strong>in</strong>en nicht richtig. Die<br />

Funktion f(x) = x 4 ist strikt konvex auf R, aber f ′′ (0) = 0 ist nicht positiv<br />

<strong>de</strong>f<strong>in</strong>it.<br />

Da f genau dann (strikt, gleichmäßig) konkav auf X ist, wenn g := −f auf<br />

X (strikt, gleichmäßig) konvex ist, gilt e<strong>in</strong>e entsprechen<strong>de</strong> Aussage über konkave<br />

Funktionen: Wenn man <strong>in</strong> Satz 4.3 ”<br />

konvex“ durch ”<br />

konkav“ ersetzt, so ist<br />

∇ 2 f(x) durch -∇ 2 f(x) zu ersetzen.<br />

Als Folgerung aus <strong>de</strong>n Sätzen 4.2 und 4.3 erhält man <strong>de</strong>n folgen<strong>de</strong>n Zusammenhang<br />

zwischen monotonen und konvexen Funktionen.<br />

Korollar 4.1 Seien X ⊆ R n e<strong>in</strong>e offene und konvexe Menge und f : X ↦→ R<br />

zweimal stetig differenzierbar. Dann gelten:<br />

a) f ist genau dann konvex auf X, wenn ∇f auf X monoton ist.<br />

b) f ist genau dann gleichmäßig konvex auf X, wenn ∇f gleichmäßig monoton<br />

auf X ist.


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 68<br />

Es gilt auch <strong>die</strong> Aussage: f ist genau dann streng konvex auf X, wenn ∇f auf X<br />

streng monoton ist. Diese Aussage läßt sich aber nicht als Folgerung <strong>de</strong>r bei<strong>de</strong>n<br />

zitierten Sätze gew<strong>in</strong>nen (vgl. das bereits genannte Buch von Geiger/Kanzow).<br />

Da f genau dann (strikt, gleichmäßig) konkav auf X ist, wenn g := −f auf X<br />

(strikt, gleichmäßig) konvex ist, gilt e<strong>in</strong>e entsprechen<strong>de</strong> Aussage über konkave<br />

Funktionen: Wenn man <strong>in</strong> Korollar 4.1 ”<br />

konvex“ durch ”<br />

konkav“ ersetzt, so ist<br />

∇f durch −∇f zu ersetzen.<br />

4.3 Projektionen auf konvexe Mengen<br />

In <strong>die</strong>sem Abschnitt beschäftigen wir uns mit Projektionen auf konvexe Mengen<br />

und leiten elementare Eigenschaften von Projektionen her.<br />

Lemma 4.4 Gegeben seien e<strong>in</strong> Vektor y ∈ R n und e<strong>in</strong>e nichtleere, abgeschlossene<br />

und konvexe Menge X ⊆ R n . Dann gibt es genau e<strong>in</strong>en Vektor z ∈ X, so dass<br />

gilt:<br />

‖y − z‖ = <strong>in</strong>f ‖y − x‖<br />

x∈X<br />

Der Vektor z heißt Projektion von y auf <strong>die</strong> Menge X. Man verwen<strong>de</strong>t dafür <strong>die</strong><br />

Notation: z = Proj X (y).<br />

Beweis: Wir betrachten für f : X ↦→ R,f(x) := ‖y − x‖ 2 <strong>die</strong> folgen<strong>de</strong> Optimierungsaufgabe:<br />

m<strong>in</strong> f(x) s.d. x ∈ X (4.5)<br />

Für <strong>die</strong> erste und zweite Ableitung von f nach x gilt:<br />

( n<br />

)<br />

∑<br />

∇f(x) = ∇ (x i − y i ) 2 = 2(x − y) , ∇ 2 f(x) = 2I<br />

i=1<br />

Da ∇ 2 f(x) positiv <strong>de</strong>f<strong>in</strong>it für alle x ∈ X ist, ist f streng konvex auf X. f kann<br />

also höchstens e<strong>in</strong>en M<strong>in</strong>imierer <strong>in</strong> X besitzen. Sei nun x 0 e<strong>in</strong> Punkt aus X ≠ ∅.<br />

Die Aufgabe<br />

m<strong>in</strong> f(x) s.d. x ∈ X , ‖y − x‖ ≤ ‖y − x 0 ‖ (4.6)<br />

besitzt <strong>die</strong>selben M<strong>in</strong>imierer wie Aufgabe (4.5). Da <strong>de</strong>r zulässige Bereich <strong>de</strong>r Aufgabe<br />

(4.6) nichtleer und kompakt und f auf X stetig ist, existiert e<strong>in</strong> M<strong>in</strong>imierer<br />

z, <strong>de</strong>r e<strong>in</strong><strong>de</strong>utig bestimmt ist. ✷<br />

Die <strong>in</strong> Lemma 4.4 <strong>de</strong>f<strong>in</strong>ierte Abbildung Proj X : R n ↦→ X besitzt offensichtlich<br />

<strong>die</strong> folgen<strong>de</strong>n Eigenschaften:<br />

Proj X (y) = y ∀ y ∈ X , Proj X ◦ Proj X = Proj X


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 69<br />

Im folgen<strong>de</strong>n Satz, Projektionsatz genannt, gibt e<strong>in</strong>e Charakterisierung <strong>de</strong>r Projektion<br />

von y auf X dar.<br />

Satz 4.4 Gegeben seien e<strong>in</strong> Vektor y ∈ R n und e<strong>in</strong>e nichtleere, abgeschlossene<br />

und konvexe Menge X ⊆ R n . Dann ist z genau dann <strong>die</strong> Projektion von y auf X,<br />

wenn <strong>die</strong> folgen<strong>de</strong> Bed<strong>in</strong>gung gilt:<br />

(z − y) T (x − z) ≥ 0 ∀ x ∈ X (4.7)<br />

Beweis: Sei zunächst z als Projektion von y auf X vorausgesetzt. Wir <strong>de</strong>f<strong>in</strong>ieren<br />

wie<strong>de</strong>r <strong>die</strong> Funktion f(x) := ‖y−x‖ 2 . Für beliebiges x ∈ X gilt nun z+λ(x−z) ∈<br />

X für alle λ ∈ (0, 1). Es folgt:<br />

f(z) ≤<br />

f(z + λ(x − z))<br />

= ‖(z − y) + λ(x − z)‖ 2<br />

= ((z − y) + λ(x − z)) T ((z − y) + λ(x − z))<br />

= 2λ(z − y) T (x − z) + ‖z − y‖ 2 + λ 2 ‖x − z‖ 2<br />

Wegen f(z) = ‖z − y‖ 2 folgt daraus: 0 ≤ 2λ(z − y) T (x − z) + λ 2 ‖x − z‖ 2 .<br />

Divi<strong>die</strong>rt man <strong>die</strong>se Ungleichung durch 2λ und läßt dann λ gegen 0+ gehen, so<br />

folgt: (z − y) T (x − z) ≥ 0 für x ∈ X.<br />

Wir setzen nun <strong>die</strong> Eigenschaft (4.7) voraus, dann gilt für beliebiges x ∈ X:<br />

0 ≥ (y − z) T (x − z)<br />

= (y − z) T (x − y + y − z)<br />

= ‖y − z‖ 2 + (y − z) T (x − y)<br />

≥<br />

‖y − z‖ 2 − ‖y − z‖‖x − y‖<br />

Daraus folgt: ‖x−y‖ ≥ ‖y−z‖ für beliebiges x ∈ X, und somit: z = Proj X (y). ✷<br />

Der Projektionssatz besagt, dass für z = Proj X (y) und beliebiges x ∈ X stets<br />

<strong>die</strong> Ungleichung (z − y) T (x − z) ≥ 0 erfüllt ist. Wegen (z − y) T (x − z) =<br />

‖z − y‖‖x − z‖ cos ϕ (ϕ <strong>de</strong>r von <strong>de</strong>n Vektoren z − y und x − z e<strong>in</strong>geschlossene<br />

W<strong>in</strong>kel) heißt <strong>die</strong>s, dass <strong>de</strong>r W<strong>in</strong>kel zwischen z − y und x − z für alle x ∈ X<br />

zwischen 0 ◦ und 90 ◦ liegt.<br />

Als Nächstes zeigen wir, dass <strong>de</strong>r Abstand zweier projizierter Punkte niemals<br />

größer se<strong>in</strong> kann als <strong>de</strong>r Abstand <strong>die</strong>ser bei<strong>de</strong>n Punkte selbst.<br />

Lemma 4.5 Sei X ⊆ R n e<strong>in</strong>e nichtleere, abgeschlossene und konvexe Menge.<br />

Dann gilt für alle x,y ∈ R n :<br />

‖Proj X (x) − Proj X (y)‖ ≤ ‖x − y‖<br />

Die Abbildung x ↦→ Proj X (x) ist also auf R n Lipschitz-stetig.


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 70<br />

Beweis: Seien x,y ∈ R n beliebig gegeben. Dann ist<br />

x − y = Proj X (x) − Proj X (y) + (x − Proj X (x)) + (Proj X (y) − y)<br />

= Proj X (x) − Proj X (y) + u<br />

mit u := (x − Proj X (x)) + (Proj X (y) − y). Damit folgt:<br />

‖x − y‖ 2<br />

= ‖Proj X (x) − Proj X (y)‖ 2 + ‖u‖ 2 + 2u T (Proj X (x) − Proj X (y))<br />

= ‖Proj X (x) − Proj X (y)‖ 2 + ‖u‖ 2<br />

+2 (x − Proj X (x)) T (Proj X (x) − Proj X (y))<br />

+2 (Proj X (y) − y) T (Proj X (x) − Proj X (y))<br />

Anwendung <strong>de</strong>s Projektionssatzes 4.4 ergibt:<br />

(x − Proj X (x)) T (Proj X (x) − Proj X (y)) ≥ 0<br />

(Proj X (y) − y) T (Proj X (x) − Proj X (y)) ≥ 0<br />

Damit ist <strong>in</strong>sgesamt gezeigt ‖x − y‖ 2 ≥ ‖Proj X (x) − Proj X (y)‖ 2 und <strong>die</strong> Behauptung<br />

<strong>de</strong>s Lemmas bewiesen. ✷<br />

Die Abbildung x ↦→ Proj X (x) von R n nach X ist also nicht expansiv.<br />

4.4 Existenz von Nash-Gleichgewichten via VIP<br />

In <strong>die</strong>sem Abschnitt beschäftigen wir uns mit Existenz- und E<strong>in</strong><strong>de</strong>utigkeitsaussagen<br />

von Lösungen von Variationsungleichungen. Diese Aussagen geben auch<br />

Auskunft über <strong>die</strong> Existenz und über <strong>die</strong> Struktur von Nash-Gleichgewichten <strong>de</strong>s<br />

Spiels Γ, weil nach Satz 4.1 e<strong>in</strong> strategisches Spiel Γ als Problem V IP(X,F)<br />

(mit geeignetem F) äquivalent dargestellt wer<strong>de</strong>n kann. Um zu e<strong>in</strong>er ersten Existenzaussage<br />

zu gelangen, wollen wir zunächst e<strong>in</strong>e äquivalente Formulierung <strong>de</strong>s<br />

Problems V IP(X,F) als Fixpunktproblem angeben.<br />

Satz 4.5 Seien X ⊆ R n nichtleer, abgeschlossen und konvex, F : X ↦→ R n sowie<br />

γ > 0. Dann ist x ∗ ∈ R n genau dann e<strong>in</strong>e Lösung <strong>de</strong>r Variationsungleichung<br />

V IP(X,F), wenn x ∗ e<strong>in</strong> Fixpunkt <strong>de</strong>r Abbildung<br />

ist, d.h. wenn x ∗ = P(x ∗ ) gilt.<br />

P : X ↦→ X , P(x) := Proj X (x − γF(x))


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 71<br />

Beweis: Man beachte, dass für je<strong>de</strong>s x ∈ X <strong>die</strong> Projektion Proj X (x − γF(x))<br />

wie<strong>de</strong>r <strong>in</strong> X liegt, also e<strong>in</strong>e Selbstabbildung <strong>de</strong>r Menge X vorliegt. Es gelten nun<br />

folgen<strong>de</strong> Äquivalenzen:<br />

x ∗ löst V IP(X,F) ⇐⇒<br />

⇐⇒<br />

⇐⇒<br />

F(x ∗ ) T (x − x ∗ ) ≥ 0 ∀ x ∈ X<br />

γF(x ∗ ) T (x − x ∗ ) ≥ 0 ∀ x ∈ X<br />

(x ∗ − (x ∗ − γF(x ∗ ))) T (x − x ∗ ) ≥ 0 ∀ x ∈ X<br />

⇐⇒ x ∗ = Proj X (x ∗ − γF(x ∗ )) = P(x ∗ )<br />

Die letzte Äquivalenz begrün<strong>de</strong>t sich mit <strong>de</strong>m Projektionssatz 4.4, wobei x ∗ <strong>die</strong><br />

Rolle von z und x ∗ − γF(x ∗ ) jene von y spielt. ✷<br />

Mit Hilfe <strong>de</strong>s folgen<strong>de</strong>n Fixpunktsatzes von Brouwer kann - unter bestimmten<br />

Voraussetzungen - <strong>die</strong> Existenz von Lösungen für V IP(X,F) begrün<strong>de</strong>t wer<strong>de</strong>n.<br />

Der Fixpunktsatz von Brouwer kann als e<strong>in</strong>fache Folgerung aus <strong>de</strong>m Fixpunktsatz<br />

von Kakutani gewonnen wer<strong>de</strong>n.<br />

Satz 4.6 Seien X ⊆ R n e<strong>in</strong>e nichtleere, konvexe und kompakte Menge sowie<br />

f : X ↦→ X stetig. Dann besitzt f e<strong>in</strong>en Fixpunkt, d.h. es existiert e<strong>in</strong> x ∗ ∈ X<br />

mit f(x ∗ ) = x ∗ .<br />

Beweis: Wir fassen f als Punkt-Menge-Abbildung auf, <strong>in</strong><strong>de</strong>m wir <strong>die</strong> Abbildung<br />

F : X ↦→ ℘(X),F(x) := {f(x)} betrachten. Auf Grund <strong>de</strong>r Stetigkeit von f ist<br />

<strong>die</strong> Abbildung F abgeschlossen. Ferner s<strong>in</strong>d <strong>die</strong> Mengen F(x) nichtleer und konvex.<br />

Alle Voraussetzungen <strong>de</strong>s Satzes 2.2 von Kakutani s<strong>in</strong>d somit erfüllt. Also<br />

gibt es e<strong>in</strong> x ∗ ∈ X mit x ∗ ∈ F(x ∗ ), d.h. x ∗ = f(x ∗ ). ✷<br />

Als Folgerung aus <strong>de</strong>n Sätzen 4.5 und 4.6 erhalten wir nun e<strong>in</strong>en ersten Existenzsatz<br />

für Lösungen <strong>de</strong>s Problems V IP(X,F), bei <strong>de</strong>m <strong>die</strong> Menge X nichtleer,<br />

konvex und kompakt vorausgesetzt wird.<br />

Satz 4.7 Seien X ⊆ R n e<strong>in</strong>e nichtleere, konvexe und kompakte Menge sowie F :<br />

X ↦→ R n stetig. Dann besitzt <strong>die</strong> Variationsungleichung V IP(X,F) (m<strong>in</strong><strong>de</strong>stens)<br />

e<strong>in</strong>e Lösung.<br />

Beweis: Betrachte wie<strong>de</strong>r <strong>die</strong> Abbildung P(x) := Proj X (x − γF(x)), <strong>die</strong> als<br />

Komposition von zwei stetigen Abbildungen stetig ist. Da P e<strong>in</strong>e Selbstabbildung<br />

auf X ist und <strong>die</strong> übrigen Voraussetzungen <strong>de</strong>s Brouwerschen Satzes 4.6<br />

erfüllt, besitzt <strong>die</strong> Abbildung e<strong>in</strong>en Fixpunkt x ∗ = P(x ∗ ). Nach Satz 4.5 ist x ∗<br />

dann e<strong>in</strong>e Lösung von V IP(X,F). ✷


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 72<br />

Im Folgen<strong>de</strong>n soll nun gezeigt wer<strong>de</strong>n, dass das Problem V IP(X,F) unter gewissen<br />

Voraussetzungen an <strong>die</strong> Funktion F genau e<strong>in</strong> Lösung besitzt. Dazu beg<strong>in</strong>nen<br />

wir mit e<strong>in</strong>em e<strong>in</strong>fach zu begrün<strong>de</strong>n<strong>de</strong>m Resultat, das besagt, das V IP(X,F) für<br />

strikt monotones F höchstens e<strong>in</strong>e Lösung besitzt.<br />

Lemma 4.6 Seien X ⊆ R n nichtleer, abgeschlossen und konvex und <strong>die</strong> Funktion<br />

F : X ↦→ R n strikt monoton. Dann besitzt V IP(X,F) höchstens e<strong>in</strong>e Lösung.<br />

Beweis: Wir gehen von <strong>de</strong>r Annahme aus, dass V IP(X,F) zwei Lösungen x 1 ,x 2<br />

besitzt mit x 1 ≠ x 2 . Dann gilt:<br />

F(x 1 ) T (x − x 1 ) ≥ 0 , F(x 2 ) T (x − x 2 ) ≥ 0<br />

∀ x ∈ X<br />

Setzt man für x ∈ X speziell x 2 bzw. x 1 e<strong>in</strong>, dann folgt:<br />

F(x 1 ) T (x 2 − x 1 ) ≥ 0 , F(x 2 ) T (x 1 − x 2 ) ≥ 0<br />

Multipliziert man bei<strong>de</strong> Ungleichungen mit (−1) und ad<strong>die</strong>rt, so erhält man:<br />

(<br />

F(x 1 ) − F(x 2 ) ) T<br />

(x 1 − x 2 ) ≤ 0<br />

Da F streng monoton auf X ist, gilt aber an<strong>de</strong>rerseits:<br />

(x 1 − x 2 ) T ( F(x 1 ) − F(x 2 ) ) > 0<br />

Wir haben also e<strong>in</strong>en Wi<strong>de</strong>rspruch erhalten, und V IP(X,F) kann höchstens e<strong>in</strong>e<br />

Lösung besitzen.<br />

✷<br />

Der Nachweis <strong>de</strong>r Existenz e<strong>in</strong>er Lösung ist etwas schwieriger und bedarf e<strong>in</strong>er<br />

weiteren For<strong>de</strong>rung an das Wachstumsverhalten <strong>de</strong>r Funktion F. Für r > 0 <strong>de</strong>f<strong>in</strong>ieren<br />

wir <strong>die</strong> Schnittmenge X r mit<br />

X r := X ∩ K r (0)<br />

wobei K r (0) := {x ∈ R n | ‖x‖ ≤ r} ist. Ist X nichtleer, abgeschlossen und konvex,<br />

so ist für h<strong>in</strong>reichend großes r auch X r nichtleer, konvex und kompakt.<br />

Lemma 4.7 Seien X ⊆ R n nichtleer, abgeschlossen, konvex sowie F : X ↦→ R n<br />

stetig. Dann besitzt V IP(X,F) genau dann e<strong>in</strong>e Lösung x ∗ , wenn es e<strong>in</strong> r > ‖x ∗ ‖<br />

gibt, so dass x ∗ e<strong>in</strong>e Lösung von V IP(X r ,F) ist.


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 73<br />

Beweis: Wir setzen zunächst voraus, dass V IP(X,F) e<strong>in</strong>e Lösung x ∗ besitzt.<br />

Wähle dann e<strong>in</strong> r > ‖x ∗ ‖ beliebig. Wegen X r ⊆ X und x ∗ ∈ X r ist dann x ∗ auch<br />

e<strong>in</strong>e Lösung von V IP(X r ,F).<br />

Sei umgekehrt e<strong>in</strong> r > 0 gegeben, so dass V IP(X r ,F) e<strong>in</strong>e Lösung x ∗ besitzt mit<br />

‖x ∗ ‖ < r. Sei x ∈ X beliebig. Für h<strong>in</strong>reichend kle<strong>in</strong>es λ > 0 ist dann<br />

y := x ∗ + λ(x − x ∗ ) ∈ X r<br />

Da x ∗ das Problem V IP(X r ,F) löst, folgt:<br />

F(x ∗ ) T (y − x ∗ ) ≥ 0<br />

=⇒ λF(x ∗ ) T (x − x ∗ ) ≥ 0<br />

=⇒ F(x ∗ ) T (x − x ∗ ) ≥ 0<br />

Da x ∈ X beliebig gewählt ist, ist x ∗ auch Lösung von V IP(X,F).<br />

✷<br />

Das folgen<strong>de</strong> Resultat zeigt nun, dass unter e<strong>in</strong>er geeigneten Wachstumsbed<strong>in</strong>gung<br />

an <strong>die</strong> Funktion F <strong>die</strong> Existenz e<strong>in</strong>er Lösung <strong>de</strong>s Problems V IP(X,F)<br />

garantiert wer<strong>de</strong>n kann, auch wenn <strong>die</strong> Menge X nicht beschränkt ist.<br />

Satz 4.8 Seien X ⊆ R n nichtleer, abgeschlossen, konvex sowie F : X ↦→ R n<br />

stetig. Existiert e<strong>in</strong> ¯x ∈ X mit<br />

(x − ¯x) T (F(x) − F(¯x))<br />

lim<br />

x∈X, ‖x‖→∞ ‖x − ¯x‖<br />

so besitzt V IP(X,F) (m<strong>in</strong><strong>de</strong>stens) e<strong>in</strong>e Lösung.<br />

= ∞ (4.8)<br />

Beweis: Sei µ e<strong>in</strong>e Zahl mit µ > ‖F(¯x‖. Wegen (4.8) gibt es e<strong>in</strong>e Zahl r > ‖¯x‖,<br />

so dass gilt:<br />

(x − ¯x) T (F(x) − F(¯x)) > µ‖x − ¯x‖ ∀ x ∈ X mit ‖x‖ ≥ r<br />

Damit erhält man für alle x ∈ X mit ‖x‖ ≥ r:<br />

F(x) T (x − ¯x) > µ ‖x − ¯x‖ + F(¯x) T (x − ¯x)<br />

≥<br />

µ ‖x − ¯x‖ − ‖F(¯x)‖ ‖(x − ¯x‖<br />

= (µ − ‖F(¯x)‖) ‖(x − ¯x‖<br />

= (µ − ‖F(¯x)‖) (‖(x‖ − ‖¯x‖)<br />

> 0 (4.9)


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 74<br />

Betrachte nun <strong>die</strong> Menge X r := X ∩K r (0), <strong>die</strong> wegen ¯x ∈ X r nichtleer ist. Ferner<br />

ist sie konvex und kompakt. Nach Satz 4.7 besitzt das Problem V IP(X r ,F) e<strong>in</strong>e<br />

Lösung x ∗ . Wir zeigen nun, dass ‖x ∗ ‖ < r gelten muss. Es folgt:<br />

F(x ∗ ) T (x − x ∗ ) ≥ 0 ∀ x ∈ X r<br />

=⇒ F(x ∗ ) T (¯x − x ∗ ) ≥ 0 (da ¯x ∈ X r )<br />

=⇒ F(x ∗ ) T (x ∗ − ¯x) ≤ 0<br />

Wegen (4.9) erhält man daher ‖x ∗ ‖ < r. Nach Lemma 4.7 ist damit x ∗<br />

Lösung von V IP(X,F).<br />

e<strong>in</strong>e<br />

✷<br />

Als Folgerung <strong>de</strong>r obigen Resultate erhalten wir <strong>die</strong> folgen<strong>de</strong> Aussage über <strong>die</strong><br />

Existenz und E<strong>in</strong><strong>de</strong>utigkeit e<strong>in</strong>er Lösung von V IP(X,F) bei e<strong>in</strong>er gleichmäßig<br />

monotonen Funktion F.<br />

Satz 4.9 Seien X ⊆ R n nichtleer, abgeschlossen, konvex sowie F : X ↦→ R n<br />

stetig und gleichmäßig monoton. Dann besitzt V IP(X,F) genau e<strong>in</strong>e Lösung.<br />

Beweis: Da F gleichmäßig monoton ist, gibt es e<strong>in</strong> µ > 0, so dass gilt:<br />

(x − y) T (F(x) − F(y)) ≥ µ‖x − y‖ 2 ∀ x,y ∈ X<br />

Daraus kann man ablesen, dass F <strong>de</strong>r Wachstumsbed<strong>in</strong>gung (4.8) genügt für e<strong>in</strong><br />

beliebiges y := ¯x. Wegen Satz 4.8 besitzt V IP(X,F) m<strong>in</strong><strong>de</strong>stens e<strong>in</strong>e Lösung.<br />

An<strong>de</strong>rerseits ist <strong>die</strong> gleichmäßig monotone Funktion F <strong>in</strong>sbeson<strong>de</strong>re strikt monoton,<br />

so dass V IP(X,F) nach Satz 4.6 höchstens e<strong>in</strong>e Lösung besitzt. Also gibt<br />

es genau e<strong>in</strong>e Lösung.<br />

✷<br />

Wir komb<strong>in</strong>ieren nun <strong>die</strong> <strong>in</strong> <strong>die</strong>sem Abschnitt gewonnenen Existenz- und E<strong>in</strong><strong>de</strong>utigkeitsaussagen<br />

über <strong>die</strong> Lösungen von V IP(X,F) mit <strong>de</strong>m Resultat <strong>de</strong>s Satzes<br />

4.1, wonach unter geeigneten Voraussetzungen je<strong>de</strong> Lösung von V IP(X,F)<br />

mit e<strong>in</strong>em Nash-Gleichgewicht <strong>de</strong>s Spiels Γ (gemäß (4.1)) korrespon<strong>die</strong>rt. Auf<br />

<strong>die</strong>se Weise erhält man <strong>de</strong>n folgen<strong>de</strong>n Existenz-/E<strong>in</strong><strong>de</strong>utigkeitssatz für Nash-<br />

Gleichgewichte.<br />

Satz 4.10 Gegeben sei e<strong>in</strong> Spiel Γ gemäß (4.1) mit nichtleeren, abgeschlossenen<br />

und konvexen Strategiemengen X i ⊆ R n i<br />

sowie stetig differenzierbaren Auszahlungsfunktionen<br />

u i : X ↦→ R (i = 1,...,m). Setze<br />

⎛ ⎞<br />

F(x) := − ⎜<br />

⎝<br />

Dann gelten <strong>die</strong> folgen<strong>de</strong>n Aussagen:<br />

∇ x 1 u 1 (x)<br />

.<br />

∇ x m u m (x)<br />

⎟<br />

⎠ (4.10)


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 75<br />

a) Ist F strikt monoton, so existiert höchstens e<strong>in</strong> Nash-Gleichgewicht.<br />

b) Ist F gleichmäßig monoton, so existiert genau e<strong>in</strong> Nash-Gleichgewicht.<br />

c) S<strong>in</strong>d alle Strategiemengen X i kompakt, so gibt es m<strong>in</strong><strong>de</strong>stens e<strong>in</strong> Nash-<br />

Gleichgewicht.<br />

Beweis: Unter Berücksichtigung von Satz 4.1 erhält man a) aus Lemma 4.6, b)<br />

aus Satz 4.9 und c) aus Satz 4.7.<br />

✷<br />

Bemerkung: Die Voraussetzungen <strong>in</strong> <strong>de</strong>n Teilen a) und b) <strong>de</strong>s Satzes kann<br />

man durch For<strong>de</strong>rungen ersetzen, <strong>die</strong> man an <strong>die</strong> Auszahlungsfunktionen u i (i =<br />

1,...,m) stellt. Es gilt nämlich (vgl. Korollar 4.1 mit Bemerkungen):<br />

• Ist u i (x i ,x −i ) e<strong>in</strong>e streng konkave Funktion <strong>in</strong> <strong>de</strong>r Variablen x i , so ist<br />

−∇ xi u i (x i ,x −i ) streng monoton <strong>in</strong> x i .<br />

• Ist u i (x i ,x −i ) e<strong>in</strong>e gleichmäßig konkave Funktion <strong>in</strong> <strong>de</strong>r Variablen x i , so ist<br />

−∇ xi u i (x i ,x −i ) gleichmäßig monoton <strong>in</strong> x i .<br />

Wegen (4.10) ist dann auch F streng bzw. gleichmäßig monoton auf X.<br />

4.5 Numerische Verfahren<br />

Es gibt zahlreiche Verfahren, <strong>die</strong> zur Lösung von Nash-Gleichgewichtsproblemen<br />

e<strong>in</strong>gesetzt wer<strong>de</strong>n können. Dabei können e<strong>in</strong>ige <strong>die</strong>ser Verfahren direkt auf auf <strong>die</strong><br />

spieltheoretische Formulierung <strong>de</strong>r Probleme angewen<strong>de</strong>t wer<strong>de</strong>n, an<strong>de</strong>re dagegen<br />

s<strong>in</strong>d auf Variationsungleichungen zugeschnitten. Wir beschränken uns hier auf <strong>die</strong><br />

Darstellung von zwei relativ e<strong>in</strong>fachen Verfahren, e<strong>in</strong>em Iterationsverfahren nach<br />

Jacobi bzw. Gauß-Sei<strong>de</strong>l (direkte Verfahren) und e<strong>in</strong>em Fixpunkt-Verfahren zur<br />

Lösung von VIP.<br />

4.5.1 Diagonalisierungsverfahren<br />

Zugrun<strong>de</strong> gelegt wird e<strong>in</strong> Spiel <strong>in</strong> Normalform mit m Spielern, <strong>de</strong>n Strategiemengen<br />

X i und <strong>de</strong>n Auszahlungsfunktionen u i für <strong>de</strong>n i-ten Spieler. E<strong>in</strong> Nash-<br />

Gleichgewicht für <strong>die</strong>ses Spiel zu f<strong>in</strong><strong>de</strong>n be<strong>de</strong>utet, e<strong>in</strong>en Punkt x ∗ ∈ X zu ermitteln,<br />

<strong>de</strong>r für je<strong>de</strong>s i ∈ {1,...,m} <strong>die</strong> folgen<strong>de</strong> Bed<strong>in</strong>gung erfüllt:<br />

max u i (x i ,x ∗, −i ) s.d. x i ∈ X i<br />

Zur Lösung <strong>die</strong>ser Aufgabe formulieren wir e<strong>in</strong> Lösungsverfahren (<strong>in</strong> zwei Varianten),<br />

das wegen se<strong>in</strong>er Ähnlichkeit mit entsprechen<strong>de</strong>n Verfahren zur Lösung


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 76<br />

l<strong>in</strong>earer Gleichungssysteme Jacobi- bzw. Gauß-Sei<strong>de</strong>l-Verfahren genannt wird.<br />

Algorithmus 4.1 (Diagonalisierungsverfahren nach Jacobi)<br />

0) Wähle Startpunkte x 0,i ∈ X i für i = 1,...,m, setze x 0 = (x 0,1 ,...,x 0,m )<br />

und k = 0.<br />

1) Falls x k e<strong>in</strong> Nash-Gleichgewicht ist, STOP.<br />

2) Bestimme sukzessive für i = 1,...,m e<strong>in</strong>e Lösung x k+1,i von<br />

max u i (x i ,x k, −i ) s.d. x i ∈ X i (4.11)<br />

3) Setze x k+1 := (x k+1,1 ,...,x k+1,m ), k := k + 1 und gehe zu 1).<br />

Bei je<strong>de</strong>r Iteration k s<strong>in</strong>d <strong>in</strong> Schritt 2) m Optimierungsaufgaben zu lösen. Zu<br />

maximieren s<strong>in</strong>d jeweils <strong>die</strong> Funktionen<br />

u i (x k,1 ,...,x k,i−1 ,x i ,x k,i+1 ,...,x k,m )<br />

wobei x i über <strong>de</strong>r Menge X i optimiert wird. Bei <strong>de</strong>r Bearbeitung <strong>de</strong>r i-ten Aufgabe<br />

s<strong>in</strong>d aber bereits <strong>die</strong> neuen Wert x k+1,1 ,...,x k+1,i−1 bekannt. Wenn man <strong>die</strong>se<br />

an Stelle <strong>de</strong>r Werte x k,1 ,...,x k,i−1 verwen<strong>de</strong>t, so entsteht das Diagonalisierungsverfahren<br />

nach Gauß-Sei<strong>de</strong>l, das bis auf <strong>die</strong>se kle<strong>in</strong>e Modifikation ansonsten mit<br />

obigem Verfahren übere<strong>in</strong>stimmt.<br />

Algorithmus 4.2 (Diagonalisierungsverfahren nach Gauß-Sei<strong>de</strong>l)<br />

0) Wähle Startpunkte x 0,i ∈ X i für i = 1,...,m, setze x 0 = (x 0,1 ,...,x 0,m )<br />

und k = 0.<br />

1) Falls x k e<strong>in</strong> Nash-Gleichgewicht ist, STOP.<br />

2) Bestimme sukzessive für i = 1,...,m e<strong>in</strong>e Lösung x k+1,i von<br />

max u i (x k+1,1 ,...,x k+1,i−1 ,x i ,x k,i+1 ,...,x k,m ) s.d. x i ∈ X i<br />

3) Setze x k+1 := (x k+1,1 ,...,x k+1,m ), k := k + 1 und gehe zu 1).<br />

Für Algorithmus 4.1 geben wir folgen<strong>de</strong>n Konvergenzsatz an, <strong>de</strong>r <strong>in</strong> entsprechen<strong>de</strong>r<br />

Form (mit analogem Beweis) auch für das Verfahren von Jacobi gilt.<br />

Satz 4.11 Die Funktionen u i seien stetig differenzierbar und konkav <strong>in</strong> x i für i =<br />

1,...,m, <strong>die</strong> Mengen X i ⊆ R n i<br />

seien nichtleer, konvex und abgeschlossen, ferner<br />

sei {x k } e<strong>in</strong>e durch Algorithmus 4.2 erzeugte Folge. Konvergiert <strong>die</strong>se gegen e<strong>in</strong><br />

x ∗ , so ist x ∗ e<strong>in</strong> Nash-Gleichgewicht.


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 77<br />

Beweis: Wir zeigen zuerst: Ist D ⊆ R p e<strong>in</strong>e konvexe Menge und f : D ↦→ R<br />

e<strong>in</strong>e stetig differenzierbare, konkave Funktion, so ist x ∗ genau dann e<strong>in</strong> (lokaler<br />

= globaler) Maximierer von f auf D, wenn <strong>die</strong> Bed<strong>in</strong>gung<br />

∇f(x ∗ ) T (x − x ∗ ) ≤ 0 ∀ x ∈ D (4.12)<br />

erfüllt ist.<br />

Sei zunächst x ∗ als Maximierer von f auf D vorausgesetzt. Dann gilt für alle<br />

x ∈ D: f(x) − f(x ∗ ) ≤ 0. Daraus folgt für beliebiges x ∈ D:<br />

∇f(x ∗ ) T (x − x ∗ ) = lim<br />

t↓0<br />

f(x ∗ + t(x − x ∗ )) − f(x ∗ )<br />

t<br />

Sei nun umgekehrt ∇f(x ∗ ) T (x − x ∗ ) ≤ 0 für je<strong>de</strong>s x ∈ D angenommen. Da f<br />

konkav und stetig differenziebar auf D ist, gilt: f(x) ≤ f(x ∗ ) + ∇f(x ∗ ) T (x − x ∗ ).<br />

Damit gilt aber erst recht f(x) ≤ f(x ∗ ) für beliebiges x ∈ D.<br />

Wir betrachten nun das Optimierungsproblem (4.11) <strong>in</strong> Schritt 2) von Algorithmus<br />

4.1. Als Lösung <strong>die</strong>ser Aufgabe ist x k+1,i wegen (4.12) durch <strong>die</strong> Bed<strong>in</strong>gung<br />

≤ 0<br />

∇ xi u i (x k+1,i ,x k, −i ) T (x i − x k+1,i ) ≤ 0<br />

∀ x i ∈ X i<br />

charakterisiert. Da <strong>die</strong> Folge {x k } gegen x ∗ konvergiert, erhält man durch Grenzübergang<br />

(k → ∞) für je<strong>de</strong>s i:<br />

∇ xi u i (x ∗,i ,x ∗,−i ) T (x i − x ∗,i ) ≤ 0<br />

∀ x i ∈ X i<br />

Also ist x ∗,i Maximierer <strong>de</strong>r Aufgabe<br />

max u i (x i ,x ∗, −i ) s.d. x i ∈ X i<br />

für je<strong>de</strong>s i ∈ {1,...,m} und somit ist x ∗ e<strong>in</strong> Nash-Gleichgewicht.<br />

✷<br />

Man beachte, dass x ∗ als Konvergenzpunkt (und nicht nur als Häufungspunkt)<br />

<strong>de</strong>r Iterationsfolge {x k } vorausgesetzt wird.<br />

4.5.2 Fixpunkt- o<strong>de</strong>r Projektionsverfahren<br />

In Satz 4.5 haben wir festgestellt, dass x ∗ genau dann e<strong>in</strong>e Lösung von V IP(X,F)<br />

ist, wenn x ∗ e<strong>in</strong>e Fixpunkt <strong>de</strong>r Abbildung<br />

P : X ↦→ X , P(x) := Proj X (x − γF(x)) (4.13)<br />

ist. Dabei ist X e<strong>in</strong>e nichtleere, abgeschlossene, konvexe Teilmenge <strong>de</strong>s R n , F<br />

ist e<strong>in</strong>e Funktion von X nach R n und γ > 0. Daher ist es naheliegend, e<strong>in</strong>e


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 78<br />

Lösung <strong>de</strong>s Problems V IP(X,F) mit Hilfe e<strong>in</strong>es Fixpunktverfahrens zu ermitteln.<br />

Tatsächlich s<strong>in</strong>d zahlreiche Fixpunktverfahren zur Lösung von Variationsungleichungen<br />

entwickelt wor<strong>de</strong>n. Wir wer<strong>de</strong>n <strong>in</strong> <strong>die</strong>sem Abschnitt e<strong>in</strong> e<strong>in</strong>faches<br />

Fixpunktverfahren mit e<strong>in</strong>er Modifikation, für <strong>die</strong> etwas schwächere Voraussetzungen<br />

erfor<strong>de</strong>rlich s<strong>in</strong>d vorstellen.<br />

Algorithmus 4.3 (Fixpunkt- o<strong>de</strong>r Projektionsverfahren)<br />

0) Wähle x 0 ∈ X, γ > 0, und setze k := 0.<br />

1) Ist x k Lösung von V IP(X,F), STOP.<br />

2) Berechne x k+1 gemäß x k+1 := Proj X (x k − γF(x k )).<br />

3) Setze k := k + 1 und gehe zu Schritt 1).<br />

Der Konvergenzsatz für Algorithmus 4.3 beruht auf <strong>de</strong>m Fixpunktsatz von Banach,<br />

<strong>de</strong>n wir hier <strong>in</strong> etwas vere<strong>in</strong>fachter Form (ohne Beweis) wie<strong>de</strong>rgegeben wird.<br />

Satz 4.12 (Fixpunktsatz von Banach)<br />

Seien X ⊆ R n e<strong>in</strong>e nichtleere und abgeschlossene Menge sowie P : X ↦→ X e<strong>in</strong>e<br />

kontrahieren<strong>de</strong> Selbstabbildung, d.h. es gibt e<strong>in</strong>e Konstante κ ∈ (0, 1), so dass für<br />

alle x,y ∈ X gilt:<br />

‖P(x) − P(y)‖ ≤ κ ‖x − y‖<br />

Dann besitzt P genau e<strong>in</strong>en Fixpunkt x ∗ <strong>in</strong> X. Ferner konvergiert je<strong>de</strong> durch <strong>die</strong><br />

Vorschrift x k+1 := P(x k ), k = 0, 1, 2,..., x 0 ∈ X beliebig erzeugte Folge {x k }<br />

gegen <strong>die</strong>sen Fixpunkt x ∗ .<br />

Dieser Fixpunktsatz wird nun auf <strong>die</strong> Abbildung P(x) := Proj X (x − γF(x))<br />

angewandt, wobei <strong>die</strong> Voraussetzungen an X und F so gestellt wer<strong>de</strong>n müssen,<br />

dass P e<strong>in</strong>e kontrahieren<strong>de</strong> Selbstabbildung wird.<br />

Satz 4.13 Sei X ⊆ R n nichtleer, abgeschlossen, konvex. Sei ferner F : X ↦→ R n<br />

gleichmäßig monoton mit <strong>de</strong>r Monotonie-Konstanten µ > 0 sowie Lipschitz-stetig<br />

auf X mit <strong>de</strong>r Lipschitz-Konstanten L > 0. Sei γ < 2µ/L 2 . Dann konvergiert <strong>die</strong><br />

durch <strong>de</strong>n Algorithmus 4.3 erzeugte Folge {x k } gegen <strong>die</strong> e<strong>in</strong><strong>de</strong>utige Lösung von<br />

V IP(X,F).<br />

Beweis: Wir gehen davon aus, dass Algorithmus 4.3 e<strong>in</strong>e unendliche Folge {x k }<br />

erzeugt, also nicht nach endlich vielen Schritten abbricht. Die Menge X genügt<br />

offenbar <strong>de</strong>n Voraussetzungen <strong>de</strong>s Banachschen Fixpunktsatzes. Ferner ist <strong>die</strong>


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 79<br />

Abbildung P gemäß (4.13) e<strong>in</strong>e Selbstabbildung von X <strong>in</strong> sich. Wir weisen nach,<br />

dass sie unter <strong>de</strong>n angegebenen Bed<strong>in</strong>gungen kontrahierend ist. Es gilt:<br />

‖P(x) − P(y)‖ 2 = ‖Proj X (x − γF(x)) − Proj X (y − γF(y))‖ 2<br />

≤ ‖x − y + γ(F(x) − F(y))‖ 2 (nach Lemma 4.5)<br />

= ‖x − y‖ 2 + γ 2 ‖F(x) − F(y)‖ 2 − 2γ(x − y) T (F(x) − F(y))<br />

≤ ( 1 + γ 2 L 2 − 2γµ ) ‖x − y‖ 2<br />

Bei <strong>de</strong>r letzten Abschätzung wer<strong>de</strong>n <strong>die</strong> Voraussetzungen <strong>de</strong>r Funktion F genutzt.<br />

Wir setzen nun<br />

√<br />

κ := 1 + γ 2 L 2 − 2γµ<br />

Wegen γ < 2µ/L 2 ist κ ∈ (0, 1), d.h. P ist kontrahierend. Wegen Satz 4.9 besitzt<br />

V IP(X,F) genau e<strong>in</strong>e Lösung x ∗ . Nach Satz 4.12 konvergiert gilt: x k ↦→ x ∗ . ✷<br />

Satz 4.13 liegen sehr e<strong>in</strong>schränken<strong>de</strong> Voraussetzungen zugrun<strong>de</strong>. H<strong>in</strong>zu kommt,<br />

dass γ so gewählt wer<strong>de</strong>n muss, dass <strong>die</strong> Bed<strong>in</strong>gung γ < 2µ/L 2 erfüllt ist. Dies<br />

ist <strong>in</strong>sofern problematisch, weil <strong>die</strong> Monotonie-Konstante µ und <strong>die</strong> Lipschitz-<br />

Konstante L im Allgeme<strong>in</strong>en nicht bekannt s<strong>in</strong>d.<br />

Wir geben e<strong>in</strong>e Modifikation von Algorithmus 4.3 an, <strong>die</strong> mit etwas schwächeren<br />

Voraussetzungen auskommt, dafür aber <strong>in</strong> Schritt 2) zwei Projektionen durchführen<br />

muss.<br />

Algorithmus 4.4 (Extragra<strong>die</strong>ntenverfahren)<br />

0) Wähle x 0 ∈ X, γ > 0, und setze k := 0.<br />

1) Ist x k Lösung von V IP(X,F), STOP.<br />

2) Berechne<br />

y k := Proj X (x k − γF(x k ))<br />

x k+1 := Proj X (x k − γF(y k ))<br />

3) Setze k := k + 1 und gehe zu Schritt 1).<br />

Der <strong>in</strong> Schritt 2) berechnete Hilfsvektor y k entspricht gera<strong>de</strong> <strong>de</strong>r nächsten Iterierten<br />

x k+1 aus Algorithmus 4.3. Wir geben für das Verfahren e<strong>in</strong>en Konvergenzsatz<br />

an, verzichten hier aber auf e<strong>in</strong>en Beweis <strong>de</strong>s Satzes. Der Leser sei <strong>die</strong>sbezüglich<br />

auf das Buch von Geiger/Kanzow [5] (Abschnitt 7.2) verwiesen.


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 80<br />

Satz 4.14 Seien X ⊆ R n nichtleer, abgeschlossen, konvex und F : X ↦→ R n<br />

monoton und Lipschitz-stetig auf X mit <strong>de</strong>r Lipschitz-Konstanten L > 0. Sei<br />

ferner γ < 1/L und <strong>die</strong> Lösungsmenge von V IP(X,F) nichtleer. Dann konvergiert<br />

<strong>die</strong> durch <strong>de</strong>n Algorithmus 4.4 erzeugte Folge {x k } gegen e<strong>in</strong>e Lösung von<br />

V IP(X,F).<br />

Im Folgen<strong>de</strong>n soll noch etwas zum Aufwand <strong>de</strong>r bei<strong>de</strong>n zuletzt dargestellten Verfahren<br />

gesagt wer<strong>de</strong>n. Dieser hängt offensichtlich im Wesentlichen davon ab, wie<br />

e<strong>in</strong>fach sich <strong>die</strong> Berechnung <strong>de</strong>r Projektion e<strong>in</strong>es Vektors y ∈ R n auf <strong>die</strong> konvexe<br />

Menge X gestaltet. Wird X durch Box-Restriktionen beschrieben, also <strong>in</strong> <strong>de</strong>r<br />

Form<br />

X := [a 1 ,b 1 ] × ... × [a n ,b n ]<br />

mit unteren Schranken a i ∈ R ∪ {−∞} und oberen Schranken b i ∈ R ∪ {∞} für<br />

i = 1,...,n, so läßt sich <strong>die</strong> Projektion komponentenweise angeben:<br />

⎧<br />

⎪⎨ a i falls y i < a i<br />

[Proj X (y)] i = y i falls y i ∈ [a i ,b i ]<br />

⎪⎩<br />

b i falls y i > b i<br />

In <strong>die</strong>sem Fall ist also <strong>die</strong> Berechnung <strong>de</strong>r Projektion äußerst e<strong>in</strong>fach und wenig<br />

aufwändig. Wird X dagegen durch l<strong>in</strong>eare Restriktionen beschrieben, dann hat<br />

man bereits e<strong>in</strong> quadratisches Problem zu lösen. Entsprechend komplizierter wird<br />

<strong>die</strong> Berechnung im Fall nichtl<strong>in</strong>earer Restriktion, was als zu aufwändig angesehen<br />

wird.<br />

Es gibt e<strong>in</strong>e Vielzahl von Verfahren zur Lösung von Variationsungleichungen. Der<br />

Leser sei <strong>die</strong>sbezüglich auf das Vorlesungsskript von C.Kanzow (s. [1]) und auf das<br />

Buch von C.Geiger/C.Kanzow, Kapitel 7, (s. [5]) verwiesen. Neue Verfahren zur<br />

Lösung von Variationsungleichungen wer<strong>de</strong>n auch <strong>in</strong> <strong>de</strong>n im Literaturverzeichnis<br />

aufgeführten und von mir betreuten Masterthesen vorgestellt.<br />

Beispiel 4.4 Das folgen<strong>de</strong> Beispiel ist <strong>de</strong>m Skript [1] entnommen. Dabei wird<br />

das Oligopolmo<strong>de</strong>ll aus Beispiel 4.2 mit <strong>de</strong>r Nutzenfunktion<br />

u i (x i ) := x i · p(ξ) − c i (x i ) mit x i ≥ 0<br />

für das Unternehmen i (mit i ∈ {1,...,m}) zugrun<strong>de</strong> gelegt.<br />

Die Kostenfunktion sei nun <strong>de</strong>f<strong>in</strong>iert durch<br />

β i<br />

c i (x i ) := c i x i + L −1/β i<br />

i<br />

1 + β i<br />

x<br />

1+β i<br />

β i<br />

i


KAPITEL 4. VARIATIONSUNGLEICHUNGEN (VIP) 81<br />

während <strong>die</strong> <strong>in</strong>verse Nachfragefunktion gegeben ist durch<br />

p(ξ) := (α/ξ) 1 α<br />

Speziell wur<strong>de</strong>n folgen<strong>de</strong> Zahlen gewählt: m = 5, α := 5000, γ := 1.1. Die Parameter<br />

c i , β i und L i s<strong>in</strong>d <strong>in</strong> <strong>de</strong>r nachstehen<strong>de</strong>n Tabelle angegeben.<br />

i 1 2 3 4 5<br />

c i 10 8 6 4 2<br />

β i 1.2 1.1 1.0 0.9 0.8<br />

L i 5 5 5 5 5<br />

Das Zahlenbeispiel wur<strong>de</strong> mit <strong>de</strong>n Algorithmen 4.1 und 4.2 bearbeitet, wobei als<br />

Startvektor x 0 := (10,...,10) und als Abbruchkriterium ‖x k+1 − x k ‖ ≤ 10 −5 benutzt<br />

wor<strong>de</strong>n s<strong>in</strong>d. Benötigt wur<strong>de</strong>n dabei 34 bzw. 20 Iteration. Als Lösungsvektor<br />

wur<strong>de</strong> x ∗ ≈ (36.93, 41.82, 43.71, 42.66, 38.18) T gefun<strong>de</strong>n.<br />

In <strong>de</strong>r Masterthesis [7] wur<strong>de</strong> <strong>die</strong> Aufgabe mit verschie<strong>de</strong>nen an<strong>de</strong>ren Verfahren,<br />

auf <strong>die</strong> hier nicht e<strong>in</strong>gegangen wird, bearbeitet, wobei <strong>die</strong> niedrigste Anzahl <strong>de</strong>r<br />

Iterationen bei 8 lag.


Kapitel 5<br />

Spiele <strong>in</strong> Extensivform<br />

Bisher haben wir strategische Spiele <strong>in</strong> Normalform behan<strong>de</strong>lt. Es wer<strong>de</strong>n nun<br />

Spiele betrachtet, <strong>die</strong> als Folge von Spielzügen gegeben s<strong>in</strong>d, <strong>die</strong> <strong>in</strong> e<strong>in</strong>er gewissen<br />

Reihenfolge von m Spielern gemacht wer<strong>de</strong>n. Spiele <strong>die</strong>ses Typs wer<strong>de</strong>n Spiele <strong>in</strong><br />

Extensivform genannt, wobei sich zeigen wird, dass sie <strong>in</strong> Normalform überführt<br />

wer<strong>de</strong>n können. Beson<strong>de</strong>re Eigenschaften, <strong>die</strong> <strong>die</strong> Extensivform aufweist, gehen<br />

dabei möglicherweise verloren. Die Unterscheidung zwischen bei<strong>de</strong>n Arten besteht<br />

also nicht dar<strong>in</strong>, dass e<strong>in</strong>e völlig neue Klasse vorliegt, son<strong>de</strong>rn <strong>in</strong> <strong>de</strong>r Art,<br />

wie <strong>die</strong> Spiele dargestellt wer<strong>de</strong>n. Die Normalform liefert eher e<strong>in</strong>e statische Beschreibung<br />

e<strong>in</strong>es Spiels, wogegen <strong>die</strong> Extensivform zusätzliche Eigenschaften wie<br />

<strong>die</strong> Zugfolge o<strong>de</strong>r <strong>de</strong>n Informationsstand <strong>de</strong>r Spieler <strong>in</strong> <strong>de</strong>r Darstellung berücksichtigt.<br />

Die Grundstruktur e<strong>in</strong>es Spiels <strong>in</strong> Extensivform besitzt <strong>die</strong> Form e<strong>in</strong>es<br />

(gerichteten) Wurzelbaumes, e<strong>in</strong> Begriff, <strong>de</strong>r aus <strong>de</strong>n Grundvorlesungen bekannt<br />

ist. Wir beschränken uns hier auf e<strong>in</strong>e knappe Beschreibung jener graphentheoretischer<br />

Grundbegriffe, <strong>die</strong> im Folgen<strong>de</strong>n gebraucht wer<strong>de</strong>n.<br />

5.1 Def<strong>in</strong>ition und Beispiele<br />

Gegeben sei e<strong>in</strong> gerichteter Baum ⃗ T(K, P) mit <strong>de</strong>r Knotenmenge K := {k 1 ,...,k s }<br />

und <strong>de</strong>r Pfeilmenge P. Je<strong>de</strong>r Pfeil (gerichtete Kante) p ∈ P kann mit Hilfe von<br />

zwei geeigneten Knoten k l ,k j ∈ K als Paar p = (k l ,k j ) dargestellt wer<strong>de</strong>n. k l<br />

wird Anfangsknoten, k j Endknoten von p genannt. E<strong>in</strong> Knoten k l heißt Vorgänger<br />

(o<strong>de</strong>r Vater) von k j (und entsprechend: k j Nachfolger (o<strong>de</strong>r Sohn) von k l ), wenn<br />

es e<strong>in</strong> p ∈ P gibt mit p = (k l ,k j ). Die Menge aller Nachfolgeknoten (Söhne)<br />

e<strong>in</strong>es Knotens k wird mit N(k), <strong>die</strong> Menge aller Pfeile p = (k,k ′ ) mit k ′ ∈ N(k)<br />

mit Z(k) notiert. Z(k) umfaßt also alle Pfeile p mit Anfangsknoten k. Wir nennen<br />

Z(k) auch Vorwärtsstern von k. <strong>E<strong>in</strong>e</strong> Folge k l0 , (k l0 ,k l1 ),k l1 ,...,k lq−1 , (k lq−1 ,k lq ),k lq<br />

von Knoten und Pfeilen heißt Weg mit Anfangsknoten k l0 und Endknoten k lq<br />

82


KAPITEL 5. SPIELE IN EXTENSIVFORM 83<br />

(kurz: Weg von k l0 nach k lq ). E<strong>in</strong> Weg W wird häufig mit <strong>de</strong>m Symbol [p j0 ,...,p jr ],<br />

<strong>de</strong>r Folge <strong>de</strong>r durchlaufenen Pfeile, angegeben.<br />

E<strong>in</strong> gerichteter Baum ⃗ T(K, P) =: ⃗ T wird Wurzelbaum mit Wurzel k 1 genannt,<br />

wenn k 1 ke<strong>in</strong>en Vorgänger und je<strong>de</strong>r an<strong>de</strong>re Knoten k ∈ K, k ≠ k 1 , genau e<strong>in</strong>en<br />

Vorgänger <strong>in</strong> ⃗ T besitzt. E<strong>in</strong> Knoten k heißt f<strong>in</strong>aler Knoten (o<strong>de</strong>r Blatt) <strong>in</strong> ⃗ T,<br />

wenn er ke<strong>in</strong>en Nachfolger hat. Die Menge <strong>de</strong>r f<strong>in</strong>alen Knoten bezeichnen wir mit<br />

F. In e<strong>in</strong>em Wurzelbaum gibt es für je<strong>de</strong>n Knoten k mit k ≠ k 1 genau e<strong>in</strong>en Weg<br />

W mit Anfangsknoten k 1 und Endknoten k. <strong>E<strong>in</strong>e</strong>n solchen Weg bezeichnen wir<br />

mit W(k 1 ,k). Die Anzahl <strong>de</strong>r Pfeile r := |W(k 1 ,k)| heißt Tiefe o<strong>de</strong>r Stufe <strong>de</strong>s<br />

Knotens k im Baum ⃗ T. k 1 ist e<strong>in</strong> Knoten <strong>de</strong>r Stufe 0, je<strong>de</strong>r Nachfolger k von<br />

k 1 ist e<strong>in</strong> Knoten <strong>de</strong>r Stufe 1, je<strong>de</strong>r Nachfolger e<strong>in</strong>es solchen Nachfolgers ist e<strong>in</strong><br />

Knoten <strong>de</strong>r Stufe 2, usw.<br />

✉ k 1<br />

p 1 p 2 p 3<br />

✉✠ ❄✉ ❘ ✉<br />

k 2 k 3 k 4<br />

p 4 p 5 p 6 p 7<br />

❄<br />

✉ ✉✠ ❄✉ ❘<br />

k 5 k 6 k 7 k 8<br />

✉<br />

p 8 p 9 p 10<br />

❄✉ ❘ ❄<br />

k 9 ✉ k 10 ✉k 11<br />

In <strong>de</strong>n folgen<strong>de</strong>n anschaulichen Darstellungen s<strong>in</strong>d <strong>die</strong> Knoten und Pfeile e<strong>in</strong>es<br />

Wurzelbaumes stets wie <strong>in</strong> obiger Skizze durchnummeriert (<strong>in</strong> <strong>de</strong>r natürlichen<br />

Reihenfolge von oben nach unten, von l<strong>in</strong>ks nach rechts“), ohne dass <strong>die</strong>se Nummerierung<br />

explizit angegeben wird. Der Wurzelknoten (hier k 1 ) wird stets an <strong>die</strong><br />

”<br />

Spitze“ <strong>de</strong>s Baumes gesetzt. Auf e<strong>in</strong>e Kennzeichnung <strong>de</strong>r Pfeilrichtung kann verzichtet<br />

wer<strong>de</strong>n, weil alle Pfeile weg vom Wurzelknoten“ orientiert s<strong>in</strong>d.<br />

”<br />


KAPITEL 5. SPIELE IN EXTENSIVFORM 84<br />

Die Menge <strong>de</strong>r Spieler (o<strong>de</strong>r Akteure) wird wie<strong>de</strong>r mit A := {1,...,m} bezeichnet.<br />

Um Zufallse<strong>in</strong>flüsse mo<strong>de</strong>llieren zu können, wird e<strong>in</strong> zusätzlicher Spieler<br />

( ”<br />

Zufallsspieler“), <strong>de</strong>r <strong>die</strong> Nummer ”<br />

0“ trägt, e<strong>in</strong>geführt. Je<strong>de</strong>r Spieler i ∈ A<br />

wird eigentlicher Spieler genannt. Die Menge <strong>de</strong>r Entscheidungen (Aktionen) <strong>de</strong>r<br />

Spieler wird mit S bezeichnet. S sei endlich.<br />

Def<strong>in</strong>ition 5.1 Gegeben seien e<strong>in</strong> Wurzelbaum ⃗ T(K, P), e<strong>in</strong>e Menge A von m<br />

Spielern und e<strong>in</strong>e Menge S von Aktionen. Falls Abbildungen<br />

ϕ : K\F ↦→ A ∪ {0}<br />

ν : P ↦→ S<br />

mit A ⊆ ϕ(K\F)<br />

<strong>de</strong>f<strong>in</strong>iert s<strong>in</strong>d, wird das Tripel ( ⃗ T(K, P), A, S) e<strong>in</strong> Spielbaum genannt.<br />

In e<strong>in</strong>em Spielbaum ist also je<strong>de</strong>m Knoten k e<strong>in</strong> Spieler i = ϕ(k) und je<strong>de</strong>m Pfeil<br />

e<strong>in</strong>e Entscheidung (Aktion) s := ν(p) zugeordnet. p heißt dann Träger von s, was<br />

wir mit Tr(s) = p notieren. Für i = ϕ(k) mit k ∈ K\F stellt <strong>die</strong> Menge ν(Z(k))<br />

<strong>die</strong> Menge <strong>de</strong>r Aktionen (potenziellen Entscheidungen) von i am Entscheidungsknoten<br />

k dar. Ist W(k 1 ,k) = [p l0 ,...,p lt ] e<strong>in</strong> Weg (von k 1 nach k), so wird <strong>die</strong><br />

Entscheidungsfolge [ν(p l0 ),...,ν(p lt )] e<strong>in</strong> Spielverlauf (o<strong>de</strong>r e<strong>in</strong>e Spielhistorie) genannt.<br />

Die Menge<br />

ϕ −1 (i) := {k ∈ K\F |ϕ(k) = i}<br />

bezeichnet <strong>die</strong> Menge <strong>de</strong>r Knoten, <strong>die</strong> <strong>de</strong>m Spieler i zugeordnet ist.<br />

Def<strong>in</strong>ition 5.2 E<strong>in</strong> 6-Tupel G := ( ⃗ T(K, P), A, S, (ω)k : ϕ(k)=0 , (I i ) i=0,...m ,u e) heißt<br />

Spiel <strong>in</strong> extensiver Form, wenn<br />

a) ( ⃗ T(K, P), A, S) e<strong>in</strong> Spielbaum gemäß Def<strong>in</strong>ition 5.1 ist,<br />

b) (ω) k mit ϕ(k) = 0 e<strong>in</strong>e Wahrsche<strong>in</strong>lichkeitsverteilung auf <strong>de</strong>r Kantenmenge<br />

Z(k) ist,<br />

c) I i := (I i 1,...,I i j i<br />

) e<strong>in</strong>e Zerlegung <strong>de</strong>r <strong>de</strong>m Spieler i zugeordneten Knotenmenge<br />

ϕ −1 (i) (i ∈ {0,...,m}) ist, wobei für k,k ′ ∈ I i l gelten soll:<br />

ν(Z(k)) = ν(Z(k ′ )).<br />

d) u e : F ↦→ R m e<strong>in</strong>e Auszahlungsfunktion ist, bei <strong>de</strong>r je<strong>de</strong> Komponente u e (k) i<br />

<strong>de</strong>s Vektors u e (k) <strong>die</strong> Auszahlung <strong>de</strong>s Spielers i am f<strong>in</strong>alen Knoten k angibt.<br />

Erläuterungen:<br />

b) An e<strong>in</strong>em Knoten k, <strong>de</strong>r <strong>de</strong>m Zufallsspieler ”<br />

0“ zugeordnet ist, gibt es auf<br />

<strong>de</strong>r Menge Z(k) e<strong>in</strong>e Wahrsche<strong>in</strong>lichkeitsverteilung, <strong>die</strong> ausdrückt, mit welcher<br />

Wahrsche<strong>in</strong>lichkeit e<strong>in</strong>e Aktion ( ”<br />

Entscheidung“) ν(p) mit p ∈ Z(k)<br />

e<strong>in</strong>tritt.


KAPITEL 5. SPIELE IN EXTENSIVFORM 85<br />

c) Es wird also e<strong>in</strong>e Zerlegung <strong>de</strong>r Knotenmenge ϕ −1 (i) (= <strong>de</strong>m Spieler i entsprechen<strong>de</strong><br />

Knotenmenge) angegeben: ϕ −1 (i) = I i 1 ∪... ∪I i j i<br />

. Besteht I i l aus<br />

mehreren Knoten, z.B. I i l := {k,k ′ ,k ′′ }, so kann i nicht unterschei<strong>de</strong>n, an<br />

welchem <strong>die</strong>ser drei Knoten er sich <strong>in</strong> <strong>de</strong>r aktuellen Spielsituation bef<strong>in</strong><strong>de</strong>t,<br />

d.h. er kennt <strong>de</strong>n Spielverlauf bis zu <strong>die</strong>sem Knoten nicht vollständig. (Die<br />

Mengen I i l wer<strong>de</strong>n Informationmengen genannt.)<br />

Die Menge <strong>de</strong>r (möglichen) Aktionen ν(Z(k)) ist aber für je<strong>de</strong>n Knoten<br />

k ∈ I l i gleich. (Im S<strong>in</strong>ne e<strong>in</strong>er allgeme<strong>in</strong>eren Mo<strong>de</strong>lbildung ließe sich <strong>die</strong>se<br />

For<strong>de</strong>rung aber durch Angabe <strong>de</strong>r Menge <strong>de</strong>r verfügbaren Aktionen an <strong>de</strong>r<br />

Informationsmenge I l i ersetzen.)<br />

d) Der In<strong>de</strong>x ”<br />

e“ <strong>in</strong> u e besagt, dass es sich um e<strong>in</strong>e (vektorwertige) Auszahlungsfunktion<br />

für e<strong>in</strong> extensives Spiel han<strong>de</strong>lt.<br />

Beispiel 5.1 Wir erläutern <strong>die</strong> Def<strong>in</strong>ition anschaulich an folgen<strong>de</strong>m Wurzelbaum:<br />

1<br />

L<br />

R<br />

2 0<br />

A B a b<br />

1 1<br />

l r l r<br />

0.2 0.8<br />

✉<br />

✉<br />

( ) ( )<br />

5 1.25<br />

5<br />

0<br />

✉ ✉ ✉ ✉<br />

( ) ( ) ( ) ( 0 1 1 0<br />

0 2<br />

2 0)<br />

Die Informationsmengen seien gegeben durch:<br />

I 1 := {{k 1 }, {k 4 ,k 5 }}, I 2 := {{k 2 }}<br />

Die Skizze ist wie folgt zu <strong>in</strong>terpretieren: Das Spiel wird von Spieler 1 eröffnet.<br />

Er kann sich für L o<strong>de</strong>r R entschei<strong>de</strong>n. Nach <strong>de</strong>r Entscheidung L kommt Spieler


KAPITEL 5. SPIELE IN EXTENSIVFORM 86<br />

2 zum Zug, nach R kommt e<strong>in</strong>e zufällige Entscheidung a o<strong>de</strong>r b zustan<strong>de</strong>, <strong>die</strong> mit<br />

e<strong>in</strong>er Wahrsche<strong>in</strong>lichkeit von 20 % bzw. 80 % e<strong>in</strong>tritt. Die strichlierte L<strong>in</strong>ie <strong>in</strong><br />

Stufe 3, <strong>die</strong> <strong>die</strong> Knoten k 4 und k 5 verb<strong>in</strong><strong>de</strong>t, besagt, dass Spieler 2 nicht weiß,<br />

ob <strong>de</strong>r vorausgehen<strong>de</strong> Spielverlauf (L,A) o<strong>de</strong>r (L,B) war. Die f<strong>in</strong>alen Knoten k 6<br />

bis k 11 stellen das Spielen<strong>de</strong> e<strong>in</strong>es möglichen Spielverlaufs dar. Die Vektoren an<br />

<strong>die</strong>sen Knoten geben <strong>die</strong> Auszahlungen für Spieler 1 und 2 wie<strong>de</strong>r.<br />

Bemerkung: Am Knoten k 3 entschei<strong>de</strong>t <strong>de</strong>r Zufall mit e<strong>in</strong>er Wahrsche<strong>in</strong>lichkeit<br />

von 0, 2 bzw. 0, 8, ob a o<strong>de</strong>r b e<strong>in</strong>tritt, d.h. er entschei<strong>de</strong>t lediglich darüber, welche<br />

Auszahlung stattf<strong>in</strong><strong>de</strong>t. Wenn man rationales Han<strong>de</strong>ln <strong>de</strong>r eigentlichen Spieler<br />

voraussetzt, kann man <strong>de</strong>n Spielbaum <strong>in</strong> <strong>die</strong>sm Fall um <strong>die</strong> f<strong>in</strong>alen Knoten k 6 und<br />

k 7 sowie <strong>die</strong> Pfeile p 5 und p 6 verkürzen. k 3 wird dann f<strong>in</strong>aler Knoten mit <strong>de</strong>m<br />

Auszahlungvektor (Erwartungswert) (2, 1) T (= 0.2(5, 5) T + 0.8(1.25, 0) T ). ✷<br />

Im Folgen<strong>de</strong>n können wir also ohne E<strong>in</strong>schränkung voraussetzen, dass es ke<strong>in</strong>en<br />

Knoten k mit ϕ(k) = 0 gibt, <strong>de</strong>ssen sämtliche Nachfolger f<strong>in</strong>ale Knoten s<strong>in</strong>d.<br />

(An<strong>de</strong>rnfalls kann man <strong>de</strong>n Spielbaum verkürzen.)<br />

Def<strong>in</strong>ition 5.3 E<strong>in</strong> Spiel G := ( ⃗ T(K, P), A, S, (ω)k : ϕ(k)=0 , (I i ) i=0,...m ,u e) heißt<br />

extensives Spiel mit perfekter Information, falls für je<strong>de</strong>s i alle Elemente von<br />

I i e<strong>in</strong>elementige Mengen s<strong>in</strong>d. An<strong>de</strong>rnfalls spricht man von e<strong>in</strong>em Spiel ohne<br />

perfekte Information.<br />

Das Spiel <strong>de</strong>s Beispiels 5.1 ist somit e<strong>in</strong> Spiel mit nicht perfekter Information. E<strong>in</strong><br />

weiteres Beispiel <strong>die</strong>ser Art ist folgen<strong>de</strong>s Spiel, bei <strong>de</strong>m alle Spieler gleichzeitig<br />

entschei<strong>de</strong>n können.<br />

Beispiel 5.2 Drei Chemiefirmen verwen<strong>de</strong>n das Wasser e<strong>in</strong>er natürlichen Resource<br />

zur Produktion. Je<strong>de</strong> Firma hat zwei Strategien, nämlich ihr Abwasser zu<br />

re<strong>in</strong>igen (Strategie R, Kosten 1 GE) o<strong>de</strong>r das Abwasser nicht gere<strong>in</strong>igt zurückfließen<br />

zu lassen (Strategie N, ke<strong>in</strong>e Kosten). Die örtlichen Gegebenheiten s<strong>in</strong>d aber<br />

nun so, dass das ungere<strong>in</strong>igte Abwasser e<strong>in</strong>er Firma ke<strong>in</strong>en merkbaren Scha<strong>de</strong>n<br />

anrichtet, wenn jedoch m<strong>in</strong><strong>de</strong>stens zwei Firmen ihr Abwasser ungere<strong>in</strong>igt zurückfließen<br />

lassen, dann scha<strong>de</strong>t <strong>die</strong>s <strong>de</strong>r Produktion aller drei Firmen. In <strong>die</strong>sem<br />

Fall muß <strong>die</strong> natürliche Resource total gere<strong>in</strong>igt wer<strong>de</strong>n und für je<strong>de</strong> Firma entstehen<br />

zusätzlich 3 GE an Kosten. Wir stellen <strong>die</strong> Situation anschaulich <strong>in</strong> e<strong>in</strong>em<br />

Wurzelbaum dar:


KAPITEL 5. SPIELE IN EXTENSIVFORM 87<br />

1<br />

R<br />

N<br />

2 2<br />

R N R N<br />

3 3 3 3<br />

R N R N R N R N<br />

✉<br />

( −1<br />

−1<br />

−1<br />

) ( −1<br />

−1<br />

0<br />

✉ ✉ ✉ ✉ ✉ ✉ ✉<br />

) ( ) ( ) ( ) ( )( )( )<br />

−1 −4 0 −3 −3 −3<br />

0 −3 −1 −4 −3 −3<br />

−1 −3 −1 −3 −4 −3<br />

Die strichlierten L<strong>in</strong>ien zwischen Knoten besagen wie<strong>de</strong>r, dass <strong>de</strong>n Spielern <strong>de</strong>r<br />

entsprechen<strong>de</strong>n Knoten vorangehen<strong>de</strong> Spielabläufe nicht bekannt s<strong>in</strong>d ( <strong>de</strong>r Spieler<br />

i = 3 weiß nicht, ob <strong>die</strong> Spielabläufe (R,R), (R,N), (N,R), (N,N) vorangegan-<br />

”<br />

gen s<strong>in</strong>d“). ✷<br />

5.2 Spiele mit perfekter Information<br />

Extensive Spiele mit perfekter Information können auch abgekürtzt dargestellt<br />

wer<strong>de</strong>n durch<br />

G := ( ⃗ T(K, P), A, S, (ω)k : ϕ(k)=0 ,u e)<br />

da <strong>die</strong> Informationspartitionen nur e<strong>in</strong>elementige Mengen enthalten.<br />

Def<strong>in</strong>ition 5.4 Sei G := ( ⃗ T(K, P), A, S, (ω)k : ϕ(k)=0 ,u e) e<strong>in</strong> extensives Spiel mit<br />

perfekter Information. Als (re<strong>in</strong>e) Strategie <strong>de</strong>s Spielers i mit i ∈ A∪{0} versteht<br />

man je<strong>de</strong>s Element x i aus <strong>de</strong>r Menge<br />

X i :=<br />

∏<br />

k∈ϕ −1 (i)<br />

Dabei ist n i := |ϕ −1 (i)|, ferner sei x i := (x i 1,...,x i n i<br />

).<br />

ν(Z(k)) ∈ R n i<br />

(5.1)<br />

Für (x 0 ,x) := (x 0 ,x 1 ,...,x m ) ∈ X 0 × X 1 × ... × X m wird nun <strong>die</strong> Pfeilmenge<br />

P(x 0 ,x) := {Tr(x i j) |j = 1,...,n i ;i = 0, 1,...,m}


KAPITEL 5. SPIELE IN EXTENSIVFORM 88<br />

betrachtet. Sie besitzt wegen (5.3) <strong>die</strong> folgen<strong>de</strong> Eigenschaft: zu je<strong>de</strong>m k ∈ K<br />

gibt es genau e<strong>in</strong>en Pfeil p = Tr(x i j) ∈ P(x 0 ,x) mit p ∈ Z(k). Für e<strong>in</strong>e Menge<br />

mit <strong>die</strong>ser Eigenschaft läßt sich leicht nachweisen (Induktion über <strong>die</strong> Anzahl<br />

<strong>de</strong>r Knoten), dass sie genau e<strong>in</strong>e Teilmenge {p j1 ,...,p jr } besitzt, <strong>die</strong> e<strong>in</strong>en Weg<br />

W(k 1 ,k f ) vom Wurzelknoten k 1 zu e<strong>in</strong>em f<strong>in</strong>alen Knoten k f beschreiben. Ist ke<strong>in</strong>e<br />

<strong>de</strong>r zugehörigen Entscheidungen ν(p jl ) e<strong>in</strong>e Zufallsentscheidung, so wird für je<strong>de</strong>n<br />

eigentlichen Spieler i e<strong>in</strong>e Auszahlungsfunktion festgelegt durch<br />

u i : X = X 1 × ... × X m ↦→ R , u i (x) := u e (k f ) i (5.2)<br />

S<strong>in</strong>d Zufallsentscheidungen dabei, so ist u e (k f ) i mit <strong>de</strong>n Wahrsche<strong>in</strong>lichkeiten<br />

pr(ν(p jl ) jener Pfeile p jl , <strong>die</strong> auf <strong>de</strong>m Weg von k 1 nach k f liegen und Zufallentscheidungen<br />

markieren, zu multiplizieren.<br />

Def<strong>in</strong>ition 5.5 Gegeben sei e<strong>in</strong> Spiel G <strong>in</strong> extensiver Form mit <strong>de</strong>r Spielermenge<br />

A. Die Strategiemenge X i und <strong>die</strong> Auszahlungsfunktion u i seien für i ∈ A gemäß<br />

(5.3) bzw. (5.2) <strong>de</strong>f<strong>in</strong>iert. Dann heißt Γ| G<br />

:= (A,X, (u i )) das von G <strong>in</strong>duzierte<br />

Spiel <strong>in</strong> Normalform.<br />

Beispiel 5.3 Wir än<strong>de</strong>rn Beispiel 5.1 zu e<strong>in</strong>em Spiel mit perfekter Information<br />

ab, d.h. <strong>die</strong> strichlierte L<strong>in</strong>ie zwischen <strong>de</strong>n Knoten k 4 und k 5 seien entfernt.<br />

Spieler 1 kann an <strong>de</strong>n Knoten k 1 ,k 4 ,k 5 entschei<strong>de</strong>n. Se<strong>in</strong>e Strategiemenge lautet:<br />

X 1 = ν(Z(k 1 )) × ν(Z(k 4 )) × ν(Z(k 5 ))<br />

= {(L,l,l), (L,l,r), (L,r,l), (L,r,r), (R,l,l), (R,l,r), (R,r,l), (R,r,r)}<br />

Spieler 2 ist nur e<strong>in</strong> Knoten, nämlich k 2 , zugeordnet. Se<strong>in</strong>e Strategiemenge ist<br />

gegeben durch<br />

X 2 = ν(Z(k 2 )) = {A,B}<br />

Es ist X = X 1 × X 2 = ν(Z(k 1 )) × ν(Z(k 4 )) × ν(Z(k 5 )) × ν(Z(k 2 )). Mit X 1 =<br />

{x 1 j |j = 1,...,8} und X 2 = {x 2 1,x 2 2} erhält man folgen<strong>de</strong> Auszahlungsmatrizen<br />

für <strong>die</strong> bei<strong>de</strong>n Spieler (beachte, dass sich <strong>die</strong>se auf <strong>die</strong> verkürzte Darstellung beziehen):<br />

x 1 j<br />

x 2 1 x 2 2<br />

A B<br />

(L,l,l) (0,0) (1,2)<br />

(L,l,r) (0,0) (0,0)<br />

(L,r,l) (1,2) (1,2)<br />

(L,r,r) (1,2) (0,0)<br />

(R,l,l) (2,1) (2,1)<br />

(R,l,r) (2,1) (2,1)<br />

(R,r,l) (2,1) (2,1)<br />

(R,r,r) (2,1) (2,1)


KAPITEL 5. SPIELE IN EXTENSIVFORM 89<br />

Nash-Gleichgewichte s<strong>in</strong>d <strong>die</strong> Strategiekomb<strong>in</strong>ationen (x 1 j,x 2 1) und (x 1 j,x 2 2) für j =<br />

5,...,8 ✷<br />

Typisch für <strong>die</strong> Umformulierung e<strong>in</strong>es Spiels <strong>in</strong> Extensivform <strong>in</strong> e<strong>in</strong> solches <strong>in</strong><br />

Normalform ist, dass e<strong>in</strong>e relativ große Zahl von Strategiekomb<strong>in</strong>ationen auftritt,<br />

<strong>die</strong> bei e<strong>in</strong>er direkten Formulierung <strong>de</strong>s Spiels <strong>in</strong> Normalform vermie<strong>de</strong>n wor<strong>de</strong>n<br />

wäre. In obigem Beispiel können von <strong>de</strong>n letzten vier Komb<strong>in</strong>ationen offensichtlich<br />

drei gestrichen wer<strong>de</strong>n. Dies motiviert <strong>die</strong> folgen<strong>de</strong> Def<strong>in</strong>ition.<br />

Def<strong>in</strong>ition 5.6 Zwei Strategien x i und ˜x i <strong>de</strong>s Spielers i heißen äquivalent, wenn<br />

für alle Strategien <strong>de</strong>r Mitspieler alle Auszahlungen i<strong>de</strong>ntisch s<strong>in</strong>d, d.h. wenn gilt:<br />

u l (x i ,x −i ) = u l (˜x i ,x −i )<br />

∀ x −i ∈ X −i , ∀ l = 1,...,m<br />

Beachte: Bei äquivalenten Strategien muss nur e<strong>in</strong> Vertreter <strong>in</strong> <strong>die</strong> Strategiemenge<br />

aufgenommen wer<strong>de</strong>n.<br />

Beispiel 5.4 Im Spiel ”<br />

NIM“ können 2 Spieler nache<strong>in</strong>an<strong>de</strong>r von e<strong>in</strong>em Haufen<br />

mit fünf Ste<strong>in</strong>chen jeweils e<strong>in</strong> o<strong>de</strong>r zwei Ste<strong>in</strong>chen wegnehmen. Wer <strong>de</strong>n letzten<br />

Ste<strong>in</strong> wegnimmt, ist Sieger. Er erhält vom Verlierer 1 GE ausgezahlt.<br />

1 2<br />

1<br />

2 2<br />

1 2 1 2<br />

1 1 1<br />

1 2 1 2 1 2<br />

✉<br />

( ) 1<br />

−1<br />

2<br />

1 2<br />

✉ ✉<br />

( ( )<br />

1<br />

−1<br />

−1)<br />

1<br />

✉<br />

✉<br />

( ) ( −1 −1<br />

1<br />

1<br />

) ( 1<br />

−1<br />

✉ ✉<br />

) ( −1<br />

1<br />

✉<br />

)<br />

) ( 1<br />

−1


KAPITEL 5. SPIELE IN EXTENSIVFORM 90<br />

Das Spiel ist <strong>in</strong> e<strong>in</strong>em ”<br />

verkürzten“ Spielbaum dargestellt, verkürzt <strong>in</strong> folgen<strong>de</strong>m<br />

S<strong>in</strong>n: Hat e<strong>in</strong> Spieler auf e<strong>in</strong>er Stufe ke<strong>in</strong>e Alternative mehr, d.h. bleibt auf e<strong>in</strong>er<br />

Stufe nur noch e<strong>in</strong> Ste<strong>in</strong> übrig, so lassen wir <strong>die</strong>sen Zweig im Spielbaum weg und<br />

<strong>in</strong>tegrieren das Ergebnis <strong>die</strong>ser Aktion bereits <strong>in</strong> <strong>die</strong> Auszahlung <strong>de</strong>r vorherigen<br />

Stufe.<br />

Die Strategiemengen <strong>de</strong>s Spielers 1 <strong>in</strong> Normalform s<strong>in</strong>d gegeben durch<br />

X 1 = ν(Z(k 1 )) × ν(Z(k 4 )) × ν(Z(k 5 )) × ν(Z(k 6 ))<br />

= {(1, 2)} 4<br />

X 2 = ν(Z(k 2 )) × ν(Z(k 3 )) × ν(Z(k 8 ))<br />

= {(1, 2)} 3<br />

X := X 1 × X 2 besteht also aus 16 × 8 Elementen (Strategiekomb<strong>in</strong>ationen). Wir<br />

geben <strong>die</strong> Auszahlungen <strong>de</strong>r Spieler <strong>in</strong> Normalform an. Man beachte, dass es sich<br />

um e<strong>in</strong> Nullsummenspiel han<strong>de</strong>lt, so dass es genügt, <strong>die</strong> Auszahlungsmatrix A für<br />

<strong>de</strong>n Spieler 1 anzugeben (<strong>die</strong> für Spieler 2 ist dann −A):<br />

(1,1,1) (1,1,2) (1,2,1) (2,1,1) (1,2,2) (2,1,2) (2,2,1) (2,2,2)<br />

(1,1,1,1) 1 -1 1 -1 -1 -1 -1 -1<br />

(1,1,1,2) 1 -1 1 -1 -1 -1 -1 -1<br />

(1,1,2,1) 1 -1 1 1 -1 1 1 1<br />

(1,2,1,1) -1 -1 -1 -1 -1 -1 -1 -1<br />

(2,1,1,1) -1 -1 1 -1 1 -1 1 1<br />

(1,1,2,2) 1 -1 1 1 -1 1 1 1<br />

(1,2,1,2) -1 -1 -1 -1 -1 -1 -1 -1<br />

(1,2,2,1) -1 -1 -1 1 -1 1 1 1<br />

(2,1,2,1) -1 -1 1 -1 1 -1 1 1<br />

(2,2,1,1) -1 -1 1 -1 1 -1 1 1<br />

(2,1,1,2)· 1 1 1 1 1 1 1 1<br />

(1,2,2,2) -1 -1 -1 1 -1 1 1 1<br />

(2,1,2,2)· 1 1 1 1 1 1 1 1<br />

(2,2,1,2)· 1 1 1 1 1 1 1 1<br />

(2,2,2,1) -1 -1 1 -1 1 -1 1 1<br />

(2,2,2,2)· 1 1 1 1 1 1 1 1<br />

Das Spiel hat 32 Nash-Gleichgewichte, <strong>die</strong> dadurch charakterisiert s<strong>in</strong>d, dass Spieler<br />

1 e<strong>in</strong>e <strong>de</strong>r Strategien (2, 1, 1, 2), (2, 1, 2, 2), (2, 2, 1, 2) o<strong>de</strong>r (2, 2, 2, 2) und Spieler<br />

2 irgen<strong>de</strong><strong>in</strong>e se<strong>in</strong>er 8 Strategien wählt. Wählt Spieler 1 e<strong>in</strong>e Nash-Strategie,<br />

dann kann Spieler 2 das Ergebnis nicht mehr bee<strong>in</strong>flussen, egal welche se<strong>in</strong>er<br />

Strategien er wählt.<br />


KAPITEL 5. SPIELE IN EXTENSIVFORM 91<br />

5.3 Teilspielperfekte Gleichgewichte<br />

Zur E<strong>in</strong>führung greifen wir Beispiel 3.11 (Markte<strong>in</strong>trittsspielt) nochmals auf. Dabei<br />

han<strong>de</strong>lt es sich um e<strong>in</strong> Spiel zwischen e<strong>in</strong>em Monopolisten (Spieler 2) und<br />

e<strong>in</strong>em potentiellen Konkurrenten (Spieler 1), <strong>de</strong>r <strong>die</strong> Absicht hat, <strong>in</strong> <strong>de</strong>n Markt<br />

e<strong>in</strong>zutreten. Bei e<strong>in</strong>em Marke<strong>in</strong>tritt hat <strong>de</strong>r Monopolist <strong>die</strong> Wahl, agressiv zu<br />

reagieren und e<strong>in</strong>en Vernichtungskampf zu führen ( ”<br />

A“) o<strong>de</strong>r e<strong>in</strong>e Marktteilung<br />

zu dul<strong>de</strong>n (”D“). Auf Grund <strong>de</strong>r Option A <strong>de</strong>s Spielers 2 kann Spieler 1 <strong>die</strong><br />

Entscheidung treffen, nicht e<strong>in</strong>zutreten ( ”<br />

NE“) o<strong>de</strong>r trotz Androhung <strong>de</strong>s Vernichtungskampfes<br />

e<strong>in</strong>zutreten ( ”<br />

E“). Die Situation ist <strong>in</strong> folgen<strong>de</strong>m Spielbaum<br />

dargestellt:<br />

1<br />

NE<br />

E<br />

✉<br />

( ) 0<br />

100<br />

A<br />

2<br />

D<br />

✉<br />

✉<br />

( ) ( )<br />

−10<br />

40<br />

−10<br />

40<br />

Das Spiel <strong>in</strong> Normalform ist <strong>in</strong> folgen<strong>de</strong>m Schema wie<strong>de</strong>rgegeben:<br />

. Spieler 2<br />

A D<br />

Spieler 1 NE 0 , 100 0 , 100<br />

E -10 , -10 40 , 40<br />

Das Spiel hat zwei Nash-Gleichgewichte, nämlich (NE,A) und (E,D). Das zuerst<br />

genannte ist dabei wenig plausibel: Auf Grund <strong>de</strong>r Androhung e<strong>in</strong>es agressiv<br />

geführten Wettbewerbs verzichtet Spieler 1 auf e<strong>in</strong>en Markte<strong>in</strong>tritt. Nur ist <strong>die</strong>se<br />

Androhung wirklich glaubhaft Wenn Spieler 1 tatsächlich e<strong>in</strong>tritt, wird Spieler<br />

2 bei rationalem Verhalten se<strong>in</strong>e Drohung über<strong>de</strong>nken, und von e<strong>in</strong>em ru<strong>in</strong>ösen<br />

Wettbewerb absehen.<br />

<strong>E<strong>in</strong>e</strong> Verfe<strong>in</strong>erung <strong>de</strong>r Nash-Gleichgewichtslösung für dynamische Spiele sche<strong>in</strong>t<br />

daher angebracht. <strong>E<strong>in</strong>e</strong> Strategiekomb<strong>in</strong>ation x ∗ soll nur dann e<strong>in</strong>e Gleichge-


KAPITEL 5. SPIELE IN EXTENSIVFORM 92<br />

wichtslösung se<strong>in</strong>, wenn es für ke<strong>in</strong>en Spieler optimal ist, bei irgen<strong>de</strong><strong>in</strong>em Teilspiel,<br />

das an e<strong>in</strong>em beliebigen Entscheidungsknoten k beg<strong>in</strong>nt, von se<strong>in</strong>er Strategie<br />

abzuweichen. Gleichgewichte, <strong>die</strong> <strong>die</strong>se For<strong>de</strong>rung erfüllen, bezeichnet man<br />

als teilspielperfekte Gleichgewichte. Zur exakten Def<strong>in</strong>ition <strong>die</strong>ses Begriffes s<strong>in</strong>d<br />

e<strong>in</strong>ige Bezeichnungen erfor<strong>de</strong>rlich.<br />

Sei ( ⃗ T(K, P), A, S) e<strong>in</strong> Spielbaum und sei k ∈ K\F beliebig. k ′ ∈ K nennen wir<br />

e<strong>in</strong>en Nachfahren von k <strong>in</strong> ( ⃗ T(K, P) := ⃗ T, wenn es e<strong>in</strong>en Weg von k nach k ′ gibt.<br />

Die Menge <strong>de</strong>r Nachfahren von k <strong>in</strong> ⃗ T wird mit K k bezeichnet. P k sei <strong>die</strong> Menge<br />

aller Pfeile, <strong>die</strong> k o<strong>de</strong>r e<strong>in</strong>en Nachfahren k ′ als Anfangsknoten besitzen. Dann ist<br />

offenbar ⃗ T(K k , P k ) e<strong>in</strong> Wurzelbaum mit Wurzel k (Teilbaum <strong>in</strong> ⃗ T mit Wurzel k).<br />

Dieser wird zu e<strong>in</strong>em Teilspielbaum von ⃗ T, wenn man <strong>die</strong> Zuordnungen von Knoten<br />

zu Spielern und von Pfeilen zu Aktionen durch <strong>die</strong> E<strong>in</strong>schränkungsabbildung<br />

ϕ| Kk \F k<br />

bzw. ν| Pk<br />

vornimmt. Die <strong>de</strong>r Knotenmenge K k \F k entsprechen<strong>de</strong> Menge<br />

von eigentlichen Spielern bezeichnen wir mit A k .<br />

( ⃗ T(K k , P) k , A k , S) wird nun Teilspielbaum (zum Wurzelknoten k) <strong>de</strong>s gegebenen<br />

Spielbaums genannt.<br />

Def<strong>in</strong>ition 5.7 Sei G e<strong>in</strong> Spiel <strong>in</strong> extensiver Form mit perfekter Information und<br />

sei k e<strong>in</strong> Knoten <strong>in</strong> G, <strong>de</strong>r nicht f<strong>in</strong>al ist. Man erhält dann auf <strong>de</strong>m Teilspielbaum<br />

( T(K ⃗ k , P) k , A k , S) e<strong>in</strong> Spiel <strong>in</strong> extensiver Form, wenn man je<strong>de</strong>m Knoten k ′ ∈ K k<br />

mit ϕ(k ′ ) = 0 <strong>die</strong> (ursrüngliche) Wahrsche<strong>in</strong>lichkeitsverteilung (ω) k ′ aus G und<br />

je<strong>de</strong>m eigentlichen Spieler i ∈ A k an je<strong>de</strong>m Endknoten k f ∈ F k <strong>die</strong> Auszahlung<br />

u e i(k f ) zuordnet. E<strong>in</strong> solches Spiel nennt man (e<strong>in</strong> vom Knoten k) ausgehen<strong>de</strong>s<br />

Teilspiel und bezeichnet es mit G k .<br />

Def<strong>in</strong>ition 5.8 Sei G e<strong>in</strong> Spiel <strong>in</strong> extensiver Form mit perfekter Information<br />

und x ∗ e<strong>in</strong> Nash-Gleichgewicht. Dann wird x ∗ e<strong>in</strong> teilspielperfektes Gleichgewicht<br />

genannt, wenn x ∗ auf je<strong>de</strong>m Teilspiel G k von G e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong>duziert,<br />

was heißt, dass <strong>die</strong> Komponenten von x ∗ , <strong>die</strong> zu Pfeilen von G k gehören, e<strong>in</strong><br />

Nash-Gleichgewicht <strong>in</strong> G k bil<strong>de</strong>n.<br />

Das vorangehen<strong>de</strong> Markte<strong>in</strong>trittsspiel G besitzt <strong>die</strong> bei<strong>de</strong>n Nash-Gleichgewichte<br />

x ∗ = (NE,A) und ¯x ∗ = (E,D). Es gibt nur e<strong>in</strong> (echtes) Teilspiel, nämlich G k3<br />

(Teilspiel mit Wurzelknoten k 3 ). x ∗ besitzt <strong>in</strong> G k3 <strong>die</strong> Komponente A, offensichtlich<br />

stellt sie ke<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> G k3 dar. Dagegen ist <strong>die</strong> Komponente D<br />

von ¯x ∗ e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> G k3 . Somit ist ¯x ∗ = (E,D) e<strong>in</strong> teilspielperfektes<br />

Gleichgewicht <strong>in</strong> G.<br />

Satz 5.1 Je<strong>de</strong>s extensive Spiel G mit perfekter Information hat e<strong>in</strong> teilspielperfektes<br />

Gleichgewicht <strong>in</strong> re<strong>in</strong>en Strategien.


KAPITEL 5. SPIELE IN EXTENSIVFORM 93<br />

Beweis: Die Anzahl <strong>de</strong>r Pfeile e<strong>in</strong>es Weges W(k 1 ,k) wird Länge <strong>de</strong>s Weges genannt<br />

und mit L(W(k 1 ,k)) bezeichnet. Ist G k e<strong>in</strong> Teilspiel von G, so wird <strong>die</strong><br />

Länge e<strong>in</strong>es Weges maximaler Länge <strong>in</strong> G k Länge von G k genannt und mit L(G k )<br />

bezeichnet. Das Satz wird durch Induktion über über <strong>die</strong> Länge L(G k ) <strong>de</strong>s Teilspiels<br />

geführt:<br />

Ist L(G k ) = 1, so s<strong>in</strong>d Knoten k ′ ∈ N(k) f<strong>in</strong>ale Knoten. Für <strong>de</strong>n Spieler i = ϕ(k)<br />

führt <strong>die</strong> Entscheidung ν(p) mit p ∈ Z(k) dann zu e<strong>in</strong>em Nash-Gleichgewicht<br />

<strong>in</strong> G k , wenn ν(p) e<strong>in</strong>e maximale Auszahlung für Spieler i im Endknoten k ′ herbeiführt.<br />

Sei nun s ∈ N mit s < L(G) gewählt, und sei <strong>die</strong> Behauptung für je<strong>de</strong>s Teilspiel<br />

mit L(G k ) ≤ s richtig. Wähle nun e<strong>in</strong> Teilspiel G¯k <strong>de</strong>r Länge s+1. Alle Teilspiele<br />

G(k) mit k ∈ N(¯k) besitzen nach Induktionsvoraussetzung e<strong>in</strong> teilspielperfektes<br />

Gleichgewicht.<br />

Ist i = ϕ(¯k) e<strong>in</strong> eigentlicher Spieler, so erhält man e<strong>in</strong> teilspielperfektes Gleichgewicht<br />

<strong>in</strong> G¯k, wenn e<strong>in</strong>e Entscheidung ν(p) mit p ∈ Z(¯k) gefällt wird, <strong>die</strong> zu e<strong>in</strong>em<br />

Teilspiel mit maximaler Auszahlung für <strong>de</strong>n Spieler i führt. Ist ϕ(¯k) = 0, so ist<br />

<strong>die</strong> Vorgehensweise leicht zu modifizieren. Die Auszahlungen für <strong>die</strong> Teilspiele G k<br />

(k ∈ N(¯k)) s<strong>in</strong>d zuerst mit <strong>de</strong>n Wahrsche<strong>in</strong>lichkeiten <strong>de</strong>r Vorgängerpfeile zu multiplizieren<br />

und dann ist <strong>die</strong> Entscheidung“ zu wählen, <strong>die</strong> zu e<strong>in</strong>em maximalen<br />

”<br />

Wert führt.<br />

Auf <strong>die</strong>se Weise verfährt man mit allen Teilspielen <strong>de</strong>r Länge s+1. Damit ist <strong>de</strong>r<br />

Satz bewiesen.<br />

✷<br />

Bemerkung:<br />

• E<strong>in</strong> extensives Spiel G mit perfekter Information besitzt also stets e<strong>in</strong> (teilspielperfektes)<br />

Nash-Gleichgewicht <strong>in</strong> re<strong>in</strong>en Strategien. Dagegen braucht<br />

e<strong>in</strong> Spiel <strong>in</strong> Normalform ke<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> re<strong>in</strong>en Strategien zu<br />

besitzten. Zur Sicherstellung <strong>de</strong>r Existenz muss dann schon zu Spielen <strong>in</strong><br />

gemischten Strategien übergegangen wer<strong>de</strong>n.<br />

• Der Beweis von Satz 5.1 be<strong>in</strong>haltet e<strong>in</strong>e konstruktive Metho<strong>de</strong>, e<strong>in</strong> teilspielperfektes<br />

Gleichgewicht zu berechnen. Die Metho<strong>de</strong> besteht <strong>in</strong> e<strong>in</strong>er<br />

Rückwärts<strong>in</strong>duktion“, wie sie <strong>in</strong> <strong>de</strong>r dynamischen Optimierung angewen<strong>de</strong>t<br />

”<br />

wird.<br />

Beispiel 5.5 Im Beispiel 1.1 haben wir zwei Personen ( ”<br />

er“, ”<br />

sie“) betrachtet,<br />

<strong>die</strong> bei<strong>de</strong> <strong>die</strong> Strategiemengen {K,F } besitzen. Das Beispiel wird nun so modifiziert,<br />

dass Spieler 1 ( ”<br />

er“) e<strong>in</strong>e Vorgabe macht, auf <strong>de</strong>ren Grundlage dann<br />

Spieler 2 ( ”<br />

sie“) e<strong>in</strong>e Entscheidung trifft. Das Spiel wird <strong>in</strong> folgen<strong>de</strong>m Spielbaum<br />

dargestellt.


KAPITEL 5. SPIELE IN EXTENSIVFORM 94<br />

Er<br />

1<br />

K<br />

F<br />

2 2<br />

Sie<br />

K F K F<br />

✉<br />

✉ ✉<br />

✉<br />

( ) ( ) ( ( 2 0 1 3<br />

3<br />

0 1)<br />

2)<br />

Das Spiel wird wie<strong>de</strong>r <strong>in</strong> Normalform dargestellt. Es gilt:<br />

X 1 = ν(Z(k 1 )) = {K,F }<br />

X 2<br />

= ν(Z(k 2 )) × ν(Z(k 2 )) = {(K,K), (K,F), (F,K), (F,F)}<br />

Die Auszahlungsmatrizen bei<strong>de</strong>r Spieler s<strong>in</strong>d <strong>in</strong> folgen<strong>de</strong>r Tabelle wie<strong>de</strong>rgegeben:<br />

Spieler 1<br />

. Spieler 2<br />

(K,K) (K,F) (F,K) (F,F)<br />

K (2,3) (2,3) (0,0) (0,0)<br />

F (1,1) (3,2) (1,1) (3,2)<br />

Nash-Gleichgewichte s<strong>in</strong>d durch Fettdruck gekennzeichnet. Es gibt zwei (eigentliche)<br />

Teilspielbäume, nämlich G k2 und G k3 . Man prüft nach:<br />

• <strong>die</strong> E<strong>in</strong>schränkung von x ∗ := (K, (KK)) ergibt <strong>in</strong> G k3 ke<strong>in</strong> Nash-Gleichgewicht;<br />

• <strong>die</strong> E<strong>in</strong>schränkung von ¯x ∗ := (F, (FF)) ergibt <strong>in</strong> G k2 ke<strong>in</strong> Nash-Gleichgewicht;<br />

• <strong>die</strong> E<strong>in</strong>schränkung von ˜x ∗ := (F, (KF)) liefert <strong>in</strong> G k2 und G k3 e<strong>in</strong> Nash-<br />

Gleichgewicht.<br />

5.4 Spiele ohne perfekte Information<br />

Wir haben bisher <strong>die</strong> von G <strong>in</strong>duzierte Normalform Γ| G nur für extensive Spiele<br />

mit perfekter Information <strong>de</strong>f<strong>in</strong>iert. Die Def<strong>in</strong>ition soll nun verallgeme<strong>in</strong>ert wer<strong>de</strong>n<br />

auf extensive Spiele ohne perfekte Information. Die Informationspartitionen


KAPITEL 5. SPIELE IN EXTENSIVFORM 95<br />

für Spieler i seien gegegen durch I i := {I i 1,...,I i t i<br />

}. Voraussetzungsgemäß gilt für<br />

festes i und j:<br />

k,k ′ ∈ I i j =⇒ νZ(k) = νZ(k ′ )<br />

Für e<strong>in</strong> k ∈ I i j setzen wir: Z(I i j) := Z(k).<br />

Def<strong>in</strong>ition 5.9 Sei G := ( ⃗ T(K, P), A, S, (ω)k : ϕ(k)=0 , (I i ),u e) e<strong>in</strong> extensives Spiel<br />

(ohne perfekte Information). Als (re<strong>in</strong>e) Strategie <strong>de</strong>s Spielers i mit i ∈ A ∪ {0}<br />

versteht man je<strong>de</strong>s Element x i aus <strong>de</strong>r Menge<br />

X i :=<br />

t i ∏<br />

j=1<br />

ν(Z(I i j)) ∈ R t i<br />

(5.3)<br />

Dabei ist t i <strong>die</strong> Anzahl <strong>de</strong>r Partitionsmengen, <strong>in</strong> <strong>die</strong> ϕ −1 (i) zerlegt ist.<br />

Setzt man x i := (x i 1,...,x i t i<br />

), so entspricht je<strong>de</strong>r Informationsmenge I i j genau e<strong>in</strong><br />

Pfeil Tr(x i j), <strong>de</strong>r an <strong>die</strong> Informationsmenge anschließt. Die Strategiekomb<strong>in</strong>ation<br />

<strong>de</strong>r eigentlichen Spieler <strong>in</strong> Normalform ist dann wie<strong>de</strong>r durch X = X 1 ×... ×X m<br />

gegeben.<br />

Beispiel 5.6 Wenn e<strong>in</strong> Versicherungsnehmer (Spieler 1) se<strong>in</strong>er Versicherungsgesellschaft<br />

(Spieler 2) e<strong>in</strong>en Scha<strong>de</strong>n mel<strong>de</strong>t, weiß <strong>die</strong> Versicherung nicht, ob<br />

überhöhte For<strong>de</strong>rungen gestellt wer<strong>de</strong>n.<br />

In <strong>die</strong>sem S<strong>in</strong>ne betrachten wir folgen<strong>de</strong>s extensive Spiel. Der Versicherungsnehmer<br />

hat <strong>die</strong> Option, überhöhte Kosten a + b [GE] (Strategie: B (Betrug)) o<strong>de</strong>r<br />

echte Kosten a [GE] (Strategie: E (Ehrlichkeit)) <strong>in</strong> Rechnung zu stellen. Die Versicherung<br />

kann <strong>die</strong> gefor<strong>de</strong>rten Beträge auszahlen (Strategie A) o<strong>de</strong>r gegen <strong>de</strong>n<br />

Versicherungsnehmer prozessieren (Strategie P), immer <strong>in</strong> <strong>de</strong>r Ungewißheit, wie<br />

sich <strong>de</strong>r Versicherungsnehmer tatsächlich verhalten hat. Wir nehmen an, dass<br />

vor Gericht <strong>die</strong> Wahrheit ans Tageslicht kommt. Der vor Gericht Unterlegene<br />

muss <strong>die</strong> Prozeßkosten <strong>in</strong> Höhe von c [GE] zahlen. Es ist a,b,c > 0. Das Spiel <strong>in</strong><br />

extensiver Form ist anschaulich durch folgen<strong>de</strong>n Spielbaum wie<strong>de</strong>rgegeben:<br />

1<br />

B<br />

E<br />

2 2<br />

A P A P<br />

✉<br />

✉ ✉<br />

✉<br />

( ) ( ) ( )<br />

( )<br />

a+b<br />

a−c a<br />

a<br />

−a−b<br />

−a −a<br />

−a−c


KAPITEL 5. SPIELE IN EXTENSIVFORM 96<br />

Die Informationsmengen s<strong>in</strong>d gegeben durch I 1 1 = {k 1 } und I 2 1 = {k 2 ,k 3 }. Die<br />

re<strong>in</strong>en Strategien s<strong>in</strong>d nun durch X = X 1 × X 2 gegeben mit<br />

X 1 = ν(Z(I 1 1)) = {B,E} ,X 2 = ν(Z(I 2 1)) = {A,P }<br />

Man gelangt zu e<strong>in</strong>em äquivalenten Spiel, wenn man zu allen Auszahlungen <strong>de</strong>n<br />

Vektor (−a,a) T h<strong>in</strong>zuad<strong>die</strong>rt. Man erhält somit <strong>die</strong> folgen<strong>de</strong>n Auszahlungsmatrizen<br />

für <strong>die</strong> bei<strong>de</strong>n Spieler:<br />

. Spieler 2<br />

A P<br />

Spieler 1 B (b,-b) (-c,0)<br />

E (0,0) (0,-c)<br />

Man prüft nach, dass das Spiel ke<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> re<strong>in</strong>en Strategien besitzt.<br />

(Man beachte, dass für e<strong>in</strong> extensives Spiel mit perfekter Information e<strong>in</strong> solches<br />

existieren wür<strong>de</strong>.) Wie uns bekannt ist, gibt es aber e<strong>in</strong> Nash-Gleichgewicht<br />

<strong>in</strong> gemischten Strategien.<br />

Für b := 2 [GE] und c := 1 [GE] berechnen wir e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> gemischten<br />

Strategien. Zu je<strong>de</strong>r Auszahlungsmatrix ad<strong>die</strong>ren wir (b + c)E, damit<br />

<strong>in</strong> <strong>de</strong>n Matrizen nur positive E<strong>in</strong>träge stehen (vgl. Lemma 3.1) Auf <strong>die</strong>se Weise<br />

bekommt man folgen<strong>de</strong>s Starttableau für das Lemke-Verfahren:<br />

z 1 z 2 z 3 z 4<br />

w 1 0 0 5 2 1<br />

w 2 0 0 3 3 1<br />

w 3 1 3 0 0 1<br />

w 4 3 2 0 0 1<br />

Mit <strong>de</strong>m Verfahren erhält man folgen<strong>de</strong> Lösung <strong>de</strong>s LCP: ¯z 1 = ¯x 1 = 0.14, ¯z 2 =<br />

¯x 2 = 0.28, ¯z 3 = ȳ 1 = 0.11, ¯z 4 = ȳ 2 = 0.22. Damit ist nach Satz 3.9 e<strong>in</strong> Nash-<br />

Gleichgewicht <strong>in</strong> gemischten Strategien gegeben durch:<br />

x ∗ = ( 1 3 , 2 3 )T , y ∗ = ( 1 3 , 2 3 )T<br />

Spieler 1 wählt ”<br />

B“ bzw. ”<br />

E“ mit e<strong>in</strong>er Wahrsche<strong>in</strong>lichkeit von 33 % zu 66 %.<br />

Entsprechend verhält sich Spieler 2 mit se<strong>in</strong>en Strategien ”<br />

A“ und ”<br />

P“.<br />

Natürlich hängen <strong>die</strong>se Wahrsche<strong>in</strong>lichkeiten von <strong>de</strong>n Zahlenwerten für b und c<br />

ab.<br />

Rechnet man das Problem mit allgeme<strong>in</strong>en Werten b,c durch, so erhält man:<br />

x ∗ = 1<br />

b + c (c,b)T y ∗ = 1<br />

b + c (c,b)T<br />


KAPITEL 5. SPIELE IN EXTENSIVFORM 97<br />

Das Beispiel zeigt, dass e<strong>in</strong> Spiel <strong>in</strong> Extensivform ohne perfekte Information ke<strong>in</strong><br />

Nash-Gleichgewicht <strong>in</strong> re<strong>in</strong>en Strategien besitzen muss. Bekannt ist aber, dass<br />

Nash-Gleichgewichte <strong>in</strong> gemischten Strategien existieren. An <strong>de</strong>n Begriff <strong>de</strong>r gemischten<br />

Strategie (vgl. Def<strong>in</strong>ition 2.2) sei hier nochmals er<strong>in</strong>nert. In <strong>de</strong>n folgen<strong>de</strong>n<br />

Ausführungen legen wir <strong>die</strong> Spielermenge A := {1,...,m} zugrun<strong>de</strong>. (Sie<br />

lassen sich aber wörtlich auf <strong>de</strong>n Fall A ∪ {0} übertragen.)<br />

Ist für je<strong>de</strong>n Spieler i <strong>die</strong> re<strong>in</strong>e Strategiemenge durch X i := {x i 1,x i 2,...,x i n i<br />

}<br />

gegeben, so ist <strong>die</strong> Menge se<strong>in</strong>er gemischten Strategien durch<br />

n i<br />

̂X i := {(ξ1,...,ξ i n i i<br />

) ∈ R n ∑<br />

i<br />

| ξj i = 1, ξj i ≥ 0 ∀ j = 1,...,n i }<br />

j=1<br />

<strong>de</strong>f<strong>in</strong>iert. Für (ξ 1 ,...,ξ m ) ∈ ̂X := ̂X 1 × ... × ̂X m lautet <strong>die</strong> Auszahlung an i:<br />

û i (ξ 1 ,...,ξ m ) =<br />

n 1 ∑<br />

j 1 =1<br />

...<br />

n m ∑<br />

j m=1<br />

(ξ 1 j 1 · ... · ξ m j m<br />

) u i (x 1 j 1<br />

,...,x m j m<br />

)<br />

<strong>E<strong>in</strong>e</strong> gemischte Strategie ξ i := (ξ i 1,...,ξ i n i<br />

) <strong>de</strong>s Spielers i stellt e<strong>in</strong>e Wahrsche<strong>in</strong>lichkeitsverteilung<br />

über <strong>de</strong>r Menge <strong>de</strong>r re<strong>in</strong>en Strategien dar. Man kann sie als<br />

Zufallsmechanismus auffassen, <strong>de</strong>r globale, d.h. sich auf <strong>de</strong>n gesamten Spielplan<br />

beziehen<strong>de</strong> Aktionspläne umfasst. û i (ξ 1 ,...,ξ m ) ist <strong>de</strong>r Erwartungswert <strong>de</strong>s Spielers<br />

i bei e<strong>in</strong>er Komb<strong>in</strong>ation gemischter Strategien (ξ 1 ,...,ξ m ) aller Spieler.<br />

Beispiel 5.7 Erläuterung <strong>de</strong>r Begriffe an e<strong>in</strong>em 2-Personen 3-Stufen Spiel:<br />

1<br />

L 1 R 1<br />

✉<br />

( 1<br />

1)<br />

l<br />

2<br />

r<br />

1<br />

✉<br />

( 2<br />

2)<br />

L 2 R 2<br />

✉<br />

( 3<br />

2)<br />

✉<br />

( ) −2<br />

−1


KAPITEL 5. SPIELE IN EXTENSIVFORM 98<br />

Die Informationsmengen wer<strong>de</strong>n als e<strong>in</strong>elementig vorausgesetzt: I 1 1 := {k 1 }, I 2 1 :=<br />

{k 4 }, I 1 2 := {k 2 }, I 2 2 := {k 3 }. Spieler 1 stehen 4 re<strong>in</strong>e Strategien zur Verfügung:<br />

x 1 1 = (L 1 ,L 2 ) , x 1 2 = (L 1 ,R 2 ) , x 1 3 = (R 1 ,L 2 ) , x 1 4 = (R 1 ,R 2 )<br />

Spieler 2 besitzt zwei re<strong>in</strong>e Strategien: x 2 1 = l, x 2 1 = r. Die Auszahlungsmatrizen<br />

<strong>in</strong> re<strong>in</strong>en Strategien lauten für bei<strong>de</strong> Spieler:<br />

. Spieler 2<br />

l r<br />

(L 1 ,L 2 ) (1,1) (1,1)<br />

Spieler 1 (L 1 ,R 2 ) (1,1) (1,1)<br />

(R 1 ,L 2 ) (3,2) (2,2)<br />

(R 1 ,R 2 ) (-2,-1) (2,2)<br />

Wir nehmen nun, dass Spieler 1 se<strong>in</strong>e 4 Strategien mit <strong>de</strong>n W-Verteilung ξ 1 :=<br />

( 1 4 , 0, 0, 3 4 ) und Spieler 2 se<strong>in</strong>e bei<strong>de</strong>n Strategien mit <strong>de</strong>r W-Verteilung ξ2 := ( 1 2 , 1 2 )<br />

spielt. Dann berechnen sich <strong>die</strong> Erwartungswerte <strong>de</strong>r Auszahlungen für bei<strong>de</strong> Spieler<br />

wie folgt:<br />

û 1 (ξ 1 ,ξ 2 ) = 1 1<br />

1 + 1 1<br />

1 + 3 1<br />

(−2) + 3 1<br />

2 = 0.25<br />

4 2 4 2 4 2 4 2<br />

û 2 (ξ 1 ,ξ 2 ) = 1 1<br />

1 + 1 1<br />

1 + 3 1<br />

(−1) + 3 1<br />

2 = 0.625<br />

4 2 4 2 4 2 4 2<br />

Neben gemischten Strategien gibt es bei Spielen <strong>in</strong> Extensivform e<strong>in</strong>e weiteres<br />

Strategiekonzept, das je<strong>de</strong>m Spieler i lokal an je<strong>de</strong>r se<strong>in</strong>er Informationsmengen<br />

I i j e<strong>in</strong>e Wahrsche<strong>in</strong>lichkeitsverteilung über <strong>die</strong> ihm zur Verfügung stehen<strong>de</strong>n Aktionen<br />

ν(Z(I i j)) zuordnet. E<strong>in</strong> solcher Plan wird Verhaltensstrategie genannt.<br />

Def<strong>in</strong>ition 5.10 G sei e<strong>in</strong> Spiel <strong>in</strong> Extensivform. Die Informationspartitionen<br />

für Spieler i seien gegegen durch I i := {I i 1,...,I i t i<br />

}. <strong>E<strong>in</strong>e</strong> Verhaltensstrategie von<br />

i ist e<strong>in</strong> Tupel b i := (b i j) j=1,...,ti , wobei b i j e<strong>in</strong>e Wahrsche<strong>in</strong>lichkeitsverteilung auf<br />

<strong>de</strong>r Menge <strong>de</strong>r Aktionen ν(Z(I i j)) darstellt.<br />

Liegt jeweils e<strong>in</strong>e Verhaltensstrategie b i für e<strong>in</strong>en Spieler i vor (i = 1,...,m),<br />

so stellt b := (b 1 ,...,b m ) e<strong>in</strong>e Komb<strong>in</strong>ation von Verhaltensstrategien aller Spieler<br />

dar. Auf je<strong>de</strong>m Vorwärtsstern e<strong>in</strong>es Knotens k ∈ K\F ist damit e<strong>in</strong>e W-<br />

Verteilung <strong>de</strong>f<strong>in</strong>iert, <strong>die</strong> für zwei Knoten k,k ′ aus <strong>de</strong>rselben Informationsmenge<br />

I i j i<strong>de</strong>ntisch ist. Ist nun W(k 1 ,k f ) = [p l1 ,...,p ls ] e<strong>in</strong> Weg von <strong>de</strong>r Wurzel k 1 zu<br />

e<strong>in</strong>em f<strong>in</strong>alen Knoten k f , so ist <strong>die</strong> Wahrsche<strong>in</strong>lichkeit, dass <strong>die</strong>ser Weg durchlaufen<br />

wird, das Produkt <strong>de</strong>r Wahrsche<strong>in</strong>lichkeiten an <strong>de</strong>n Pfeilen p l1 ,...,p ls <strong>die</strong>ses<br />

Weges. Da e<strong>in</strong> Weg von k 1 nach k f e<strong>in</strong><strong>de</strong>utig bestimmt ist, hängt <strong>die</strong>ses Produkt<br />

nur von b und k f ab; es wird mit P b (k f ) bezeichnet.


KAPITEL 5. SPIELE IN EXTENSIVFORM 99<br />

Def<strong>in</strong>ition 5.11 Gegeben seien e<strong>in</strong>e Komb<strong>in</strong>ation b = (b 1 ,...,b m ) von Verhaltensstrategien<br />

aller Spieler sowie <strong>die</strong> Auszahlungsvektoren u e (k) e<strong>in</strong>es extensiven<br />

Spiels für alle f<strong>in</strong>alen Knoten k ∈ F. Die Auszahlung von Spieler i ist <strong>de</strong>r Erwartungswert<br />

über alle möglichen Spielausgänge k ∈ F, d.h.<br />

ũ i (b 1 ,...,b m ) = ∑ k∈F<br />

P b (k)u e (k) i<br />

Bevor wir <strong>de</strong>r Frage nachgehen, welche Beziehung zwischen gemischten Strategien<br />

und Verhaltensstrategien besteht, wollen wir <strong>de</strong>n Begriff <strong>de</strong>r Verhaltensstrategie<br />

und <strong>de</strong>r zugehörigen Auszahlungsfunktion für <strong>die</strong> Spieler an e<strong>in</strong>em Beispiel<br />

erläutern.<br />

Beispiel 5.8 Wir betrachten das folgen<strong>de</strong> extensive Spiel:<br />

1<br />

L<br />

R<br />

2 2<br />

l 1 r 1 l 2 r 2<br />

✉<br />

✉ ✉<br />

✉<br />

( ) ( ) ( )<br />

( 1 3 −2<br />

2<br />

1<br />

2 −1<br />

2)<br />

Es liegt wie<strong>de</strong>r e<strong>in</strong> Spiel mit perfekter Information vor: I 1 1 = {k 1 }, I 2 1 = {k 2 },<br />

I 2 2 = {k 3 }. Wir betrachten nun <strong>die</strong> folgen<strong>de</strong> Komb<strong>in</strong>ation b = (b 1 ,b 2 ) von Verhaltensstrategien:<br />

b 1 := ( 1 2 , 1 2 ), b2 := ((1, 0), ( 1 3 , 2 3 ))<br />

Spieler 1 spielt se<strong>in</strong>e Strategien L bzw. R mit gleicher Wahrsche<strong>in</strong>lichkeit, während<br />

Spieler 2 se<strong>in</strong>e Strategien l 1 mit Wahrsche<strong>in</strong>lichkeit 1 und l 2 zu r 2 mit 1 3 zu 2 3 spielt.<br />

Die Wahrsche<strong>in</strong>lichkeit für das Erreichen e<strong>in</strong>es f<strong>in</strong>alen Knoten lautet:<br />

P b (k 4 ) = 1/2 , P b (k 5 ) = 0 , P b (k 6 ) = 1/6 , P b (k 7 ) = 1/3<br />

Die Auszahlung für <strong>die</strong> bei<strong>de</strong>n Spieler lautet somit:<br />

ũ 1 (b) = 1 2 + 1 6 (−2) + 1 3 2 = 5 6 , ũ 2(b) = 1 2 + 1 6 (−1) + 1 3 2 = 1 ✷


KAPITEL 5. SPIELE IN EXTENSIVFORM 100<br />

Die bei<strong>de</strong>n Konzepte - Verwendung von gemischten Strategien bzw. von Verhaltensstrategien<br />

- <strong>in</strong>duzieren für je<strong>de</strong>n Spieler auf je<strong>de</strong>r Stufe <strong>de</strong>s Spiels Wahrsche<strong>in</strong>lichkeitsverteilungen<br />

auf <strong>de</strong>r Menge <strong>de</strong>r möglichen Aktionen. Bei <strong>de</strong>r Konstruktion<br />

von gemischten Strategien wählt <strong>de</strong>r Spieler e<strong>in</strong>en vollständigen Verhaltensplan<br />

im S<strong>in</strong>ne e<strong>in</strong>er Strategie, während <strong>die</strong> Konstruktion e<strong>in</strong>er Verhaltensstrategie<br />

<strong>die</strong> separate Zufallswahl e<strong>in</strong>er Aktion an je<strong>de</strong>r Informationsmenge erfor<strong>de</strong>rt. Die<br />

Gleichwertigkeit bei<strong>de</strong>r Strategieformen wur<strong>de</strong> von Kuhn 1982 <strong>in</strong> e<strong>in</strong>er grundlegen<strong>de</strong>n<br />

Arbeit festgestellt, wobei aber <strong>die</strong> Voraussetzung <strong>de</strong>s ”<br />

perfect recall“<br />

erfüllt se<strong>in</strong> muss. Was darunter zu verstehen ist, wird im Folgen<strong>de</strong>n erläutert.<br />

Gegeben sei e<strong>in</strong> Wurzelbaum ⃗ T(K). Wir sagen, e<strong>in</strong> Pfeil p liegt vor e<strong>in</strong>em Knoten<br />

k, wenn es e<strong>in</strong>en Weg W(k 1 ,k) gibt, <strong>de</strong>r <strong>de</strong>n Pfeil p enthält. Wir benutzen dafür<br />

das Symbol: p ⊳ k.<br />

Def<strong>in</strong>ition 5.12 G sei e<strong>in</strong> extensives Spiel (ohne perfekte Information). I i sei<br />

<strong>die</strong> Informationspartition für e<strong>in</strong>en beliebigen Spieler i und I i 1, I i 2 seien beliebige<br />

Elemente aus I i . Wenn dann aus<br />

p ∈ Z(I i 1), k,k ′ ∈ I i 2 , p ⊳ k stets folgt: p ⊳ k ′<br />

so wird G e<strong>in</strong> Spiel mit perfect recall genannt.<br />

Die For<strong>de</strong>rung besagt: Liegt p ∈ Z(I i 1) vor e<strong>in</strong>em Knoten k ∈ I i 2, so soll p auch<br />

vor je<strong>de</strong>m an<strong>de</strong>ren Knoten aus I i 2 liegen. Da Spieler i nicht weiß, an welchem Entscheidungsknoten<br />

k,k ′ ∈ I i 2 er sich bef<strong>in</strong><strong>de</strong>t, weiß er dann aber zum<strong>in</strong><strong>de</strong>st, welche<br />

Aktion ν(p) er im Anschluß an I i 2 getätigt hat. Erläuterung an zwei Beispielen:<br />

1<br />

L<br />

R<br />

2 2<br />

A B A B<br />

1 1 1<br />

✉<br />

l r l r l r<br />

✉ ✉<br />

✉ ✉<br />

✉<br />


KAPITEL 5. SPIELE IN EXTENSIVFORM 101<br />

Beispiel a) mit perfect recall: I 1 := {I 1 1,I 1 2,I 1 3} = {{k 1 }, {k 4 ,k 5 }, {k 6 }}, I 2 :=<br />

{I 2 1,I 2 2} = {{k 2 }, {k 3 }}<br />

1<br />

L<br />

R<br />

2 2<br />

A B A B<br />

1 1 1<br />

✉<br />

l r l r l r<br />

✉ ✉<br />

✉ ✉<br />

✉<br />

✉<br />

Beispiel b) ohne perfect recall: I 1 := {I 1 1,I 1 2,I 1 3} = {{k 1 }, {k 4 }, {k 5 ,k 6 }}, I 2 wie<br />

oben.<br />

Kuhn hat 1982 <strong>die</strong> folgen<strong>de</strong> Aussage formuliert, <strong>in</strong> <strong>de</strong>r er <strong>die</strong> Äquivalenz von<br />

gemischten Strategien und Verhaltensstrategien feststellt:<br />

Angenommen, alle Spieler können sich auf je<strong>de</strong>r Stufe <strong>de</strong>s Spiels an<br />

alle ihre vergangenen Spielzüge er<strong>in</strong>nern, dann kann man zeigen, dass<br />

gemischte Strategien und Verhaltensstrategien äquivalent s<strong>in</strong>d <strong>in</strong> folgen<strong>de</strong>m<br />

S<strong>in</strong>ne, dass sie <strong>die</strong> gleichen (erwarteten) Auszahlungen generieren.<br />

Wir wollen <strong>die</strong>se Aussage präzise formulieren. Bevor <strong>die</strong>s geschieht, wollen wir<br />

festhalten, dass je<strong>de</strong> Komb<strong>in</strong>ation ξ := (ξ 1 ,...,ξ m ) gemischter Strategien (ebenso<br />

wie je<strong>de</strong> Verhaltensstrategie b := (b 1 ,...,b m )) auf je<strong>de</strong>m Knoten k ∈ F e<strong>in</strong>e<br />

Wahrsche<strong>in</strong>lichkeit ˜P ξ (k) (bzw. P b (k)) <strong>in</strong>duziert. Diese besagt, dass bei Anwendung<br />

von ξ (bzw. b) <strong>de</strong>r f<strong>in</strong>ale Knoten k mit eben <strong>die</strong>ser Wahrsche<strong>in</strong>lichkeit durch<br />

e<strong>in</strong>en Spielablauf erreicht wird für je<strong>de</strong>s k ∈ F.<br />

Satz 5.2 Gegeben sei e<strong>in</strong> Spiel G <strong>in</strong> extensiver Form mit perfect recall. Zu je<strong>de</strong>r<br />

gemischten Strategie ξ gibt es dann e<strong>in</strong>e Verhaltensstrategie b, so dass<br />

P b (k) = ˜P ξ (k) ∀ k ∈ F<br />

und für <strong>die</strong> erwarteten Auszahlungen û i (ξ) = ũ i (b) für i ∈ A gilt.


KAPITEL 5. SPIELE IN EXTENSIVFORM 102<br />

Wir verzichten auf e<strong>in</strong>en Beweis <strong>de</strong>s Satzes von Kuhn und zeigen durch e<strong>in</strong> Beispiel,<br />

dass <strong>die</strong> Aussage falsch ist, wenn <strong>die</strong> Eigenschaft <strong>de</strong>s ”<br />

perfect recall“ nicht<br />

voraussgesetzt wird.<br />

Beispiel 5.9 E<strong>in</strong> Spiel <strong>in</strong> extensiver Form sei durch folgen<strong>de</strong>n Spielbaum charakterisiert:<br />

1<br />

L<br />

R<br />

2 2<br />

A B A B<br />

k 4 ✉ 1 1<br />

✉ k 7<br />

l r l r<br />

k 8 ✉ ✉ k 9 k 10 ✉ ✉ k 11<br />

Informationspartionen: I 1 := {I 1 1,I 1 2} = {{k 1 }, {k 5 ,k 6 }}, I 2 = {I 2 1} = {{k 2 ,k 3 }}.<br />

Das Spiel weist ke<strong>in</strong>en perfekt recall auf. Die re<strong>in</strong>en Strategien berechnen sich zu<br />

X 1 := ν(Z(k 1 )) × ν(Z(I 1 2)) = {L,R} × {l,r} ,<br />

X 2 := ν(Z(I 2 1)) = {A,B}<br />

Die re<strong>in</strong>en Strategien s<strong>in</strong>d somit gegeben durch<br />

x 1 1 = (L,l), x 1 2 = (L,r), x 1 3 = (R,l), x 1 4 = (R,r) ,<br />

x 2 1 = A, x 2 2 = B<br />

Für <strong>die</strong> Spieler 1 und 2 wählen wir jeweils folgen<strong>de</strong> gemischte Strategie (zu <strong>in</strong>terpretieren<br />

als Wahrsche<strong>in</strong>lichkeiten, mit <strong>de</strong>r <strong>die</strong> re<strong>in</strong>en Strategien e<strong>in</strong>gesetzt<br />

wer<strong>de</strong>n):<br />

ξ 1 := ( 1<br />

, 0, 0, )<br />

1 und ξ 2 := ((1 − p),p)<br />

2 2<br />

mit p ∈ (0, 1).<br />

Wir bestimmen für <strong>die</strong> Komb<strong>in</strong>ation ξ := (ξ 1 ,ξ 2 ) <strong>die</strong> Wahrsche<strong>in</strong>lichkeit, <strong>die</strong> sie<br />

an je<strong>de</strong>m f<strong>in</strong>alen Knoten <strong>in</strong>duziert. Wir erhalten:


KAPITEL 5. SPIELE IN EXTENSIVFORM 103<br />

k ∈ F k 4 k 7 k 8 k 9 k 10 k 11<br />

˜P ξ 1<br />

(k) (1 − p) 1<br />

p 1<br />

p 0 0 1(1 − p)<br />

2 2 2 2<br />

Für e<strong>in</strong>e Verhaltensstrategie b := (b 1 ,b 2 ) machen wir <strong>de</strong>n allgeme<strong>in</strong>en Ansatz<br />

b 1 := ((b L ,b R ), (b l ,b r )) und b 2 = ((1 − q),q) mit q ∈ [0, 1] (zu <strong>in</strong>terpretieren als<br />

W-Verteilungen an <strong>de</strong>n Informationsmengen {k 1 }, {k 5 ,k 6 } bzw. {k 2 ,k 3 }, <strong>die</strong> angeben,<br />

mit welcher Wahrsche<strong>in</strong>lichkeit sich e<strong>in</strong>e Aktion anschließt) und ermitteln<br />

<strong>die</strong> Wahrsche<strong>in</strong>lichkeiten, <strong>die</strong> dadurch an <strong>de</strong>n f<strong>in</strong>alen Knoten <strong>in</strong>duziert wer<strong>de</strong>n:<br />

k ∈ F k 4 k 7 k 8 k 9 k 10 k 11<br />

P b (k) b L (1 − q) b R q b L qb l b L qb r b R (1 − q)b l b R (1 − q)b r<br />

Angenommen, es wür<strong>de</strong> ˜P ξ (k) = P b (k) für alle k ∈ F gelten.<br />

Dann folgt wegen p ∈ (0, 1) direkt q ∈ (0, 1) und b L ≠ 0 ≠ b R (s. Knoten k 4 ,k 7 ).<br />

Damit erhält man weiter:<br />

b r = 0 ∧ b l = 0<br />

Dies ist aber e<strong>in</strong> Wi<strong>de</strong>rspruch, weil b l + b r = 1 gelten muss.<br />

Damit ist gezeigt, dass es im vorliegen<strong>de</strong>n Fall zu <strong>de</strong>m gegebenen ξ ke<strong>in</strong>e Verhaltensstrategie<br />

b gibt mit ˜P ξ (k) = P b (k) für alle k ∈ F. Damit ist klar, dass auch<br />

<strong>die</strong> erwarteten Auszahlungen nicht übere<strong>in</strong>stimmen, <strong>de</strong>nn sie berechnen sich für<br />

Spieler i nach<br />

û i (ξ) = ∑ k∈F<br />

˜P ξ (k)u e i(k) bzw. ũ i (b) = ∑ k∈F<br />

P b (k)u e i(k)<br />

wobei (u e i(k)) i∈A <strong>de</strong>r Auszahlungsvektor für re<strong>in</strong>e Strategien am f<strong>in</strong>alen Knoten k<br />

ist.<br />

✷<br />

Nachzutragen ist, dass bei <strong>de</strong>r Def<strong>in</strong>ition e<strong>in</strong>es Teilspiels <strong>in</strong> e<strong>in</strong>em Spiel ohne<br />

perfekte Information e<strong>in</strong>e zusätzliche For<strong>de</strong>rung auftritt:<br />

Def<strong>in</strong>ition 5.13 G sei e<strong>in</strong> Spiel ohne perfekte Information. Dann ist G k (k ∈ K)<br />

<strong>in</strong> G e<strong>in</strong> Teilspiel, wenn G k <strong>die</strong> <strong>in</strong> Def<strong>in</strong>ition 5.7 genannten Eigenschaften besitzt<br />

und darüber h<strong>in</strong>aus <strong>die</strong> folgen<strong>de</strong> For<strong>de</strong>rung erfüllt: Je<strong>de</strong> Informationsmenge I i j<br />

gehört entwe<strong>de</strong>r zu G k o<strong>de</strong>r nicht, d.h. Informationsmengen dürfen nicht ”<br />

zerschnitten“<br />

wer<strong>de</strong>n.<br />

5.5 Weitere Beispiele<br />

Beispiel 5.10 Drei Firmen möchten e<strong>in</strong> ähnliches Produkt, mit <strong>de</strong>m sie auf <strong>de</strong>m<br />

Markt konkurrieren, als passen<strong>de</strong> Geschenki<strong>de</strong>e für <strong>die</strong> nahen Feiertage anpreisen.


KAPITEL 5. SPIELE IN EXTENSIVFORM 104<br />

Je<strong>de</strong> Firma hat <strong>die</strong> Möglichkeit, ihre Werbung entwe<strong>de</strong>r beim Frühstücksfernsehen<br />

(Strategie ”<br />

morgens“: M) o<strong>de</strong>r am Abend vor <strong>de</strong>r Tagesschau (Strategie ”<br />

abends“:<br />

A) zu plazieren. Wenn e<strong>in</strong>e Firma alle<strong>in</strong> am Morgen o<strong>de</strong>r am Abend wirbt, wird<br />

<strong>die</strong> Wirkung <strong>de</strong>s Fernsehspots mit 1 bzw. 2 bewertet. Werben aber zwei Firmen<br />

zur gleichen Werbezeit, wird <strong>die</strong> Effizienz <strong>de</strong>s Spots jeweils mit null e<strong>in</strong>geschätzt.<br />

Je<strong>de</strong> <strong>de</strong>r Firmen ist also bemüht, morgens o<strong>de</strong>r abends alle<strong>in</strong> zu werben, mit Priorität<br />

für abends. Gibt es Nash-Gleichgewichte <strong>in</strong> re<strong>in</strong>en Strategien Mit welchen<br />

Metho<strong>de</strong>n bestimmt man Nash-Gleichgewichte <strong>in</strong> gemischten Strategien Welche<br />

Be<strong>de</strong>utung haben sie<br />

Wir stellen das Spiel <strong>in</strong> folgen<strong>de</strong>m Spielbaum dar, wobei <strong>die</strong> strichlierten L<strong>in</strong>ien<br />

wie<strong>de</strong>rum <strong>die</strong> Infomationsmengen kennzeichnen:<br />

1<br />

M<br />

A<br />

2 2<br />

M A M A<br />

3 3 3 3<br />

M A M A M A M A<br />

( 0<br />

0<br />

0<br />

✉<br />

✉ ✉ ✉ ✉ ✉ ✉ ✉<br />

) ( ) ( ) ( ) ( ) ( ) ( ) ( )<br />

0 0 1 2 0 0 0<br />

0 2 0 0 1 0 0<br />

2 0 0 0 0 1 0<br />

Die Komb<strong>in</strong>ationen re<strong>in</strong>er Strategien <strong>in</strong> Normalform ergeben sich aus<br />

X 1 × X 2 × X 3 = ν(Z(I 1 1)) × ν(Z(I 2 1)) × ν(Z(I 3 1)) = {M,A} × {M,A} × {M,A}<br />

Damit ergeben sich <strong>die</strong> Auszahlungen für <strong>die</strong> Komb<strong>in</strong>ationen aus re<strong>in</strong>en Strategien<br />

gemäß folgen<strong>de</strong>r Tabelle:


KAPITEL 5. SPIELE IN EXTENSIVFORM 105<br />

. Auszahlungen<br />

X Fa.1 Fa.2 Fa.3<br />

(M,M,M) 0 0 0<br />

(M,M,A) 0 0 2<br />

(M,A,M) 0 2 0<br />

(M,A,A) 1 0 0<br />

(A,M,M) 2 0 0<br />

(A,M,A) 0 1 0<br />

(A,A,M) 0 0 1<br />

(A,A,A) 0 0 0<br />

Man kann aus <strong>de</strong>r Tabelle ablesen, dass <strong>die</strong> Strategiekomb<strong>in</strong>ationen (M,M,A),<br />

(M,A,M), (A,M,M) Nash-Gleichgewichte <strong>in</strong> re<strong>in</strong>en Strategien s<strong>in</strong>d.<br />

Numerisch kann man Nash-Gleichgewichte <strong>in</strong> gemischten Strategien ermitteln,<br />

<strong>in</strong><strong>de</strong>m man <strong>die</strong> Metho<strong>de</strong>n aus Kapitel 4 verwen<strong>de</strong>t (also das Spiel äquivalent als<br />

V IP formuliert und e<strong>in</strong>en Algorithmus zur Lösung von V IP anwen<strong>de</strong>t).<br />

Im vorliegen<strong>de</strong>n Fall ist es auf Grund <strong>de</strong>r speziellen Struktur <strong>de</strong>s Problems möglich,<br />

e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> gemischten Strategien durch ”<br />

e<strong>in</strong>fache Überlegungen“<br />

zu bestimmen. Betrachtet wird <strong>die</strong> erwartete Auszahlung <strong>de</strong>s Spielers 1:<br />

û 1 (ξ 1 ,ξ 2 ,ξ 3 ) =<br />

2∑ 2∑ 2∑<br />

j 1 =1 j 2 =1 j 3 =1<br />

ξ 1 j 1<br />

ξ 2 j 2<br />

ξ 3 j 3<br />

u 1 (x 1 j 1<br />

,x 2 j 2<br />

,x 3 j 3<br />

)<br />

= ξ 1 1 (1 − ξ 2 1) (1 − ξ 3 1) + 2 (1 − ξ 1 1)ξ 2 1ξ 3 1<br />

Dabei wur<strong>de</strong> ξ2 i = 1−ξ1 i verwen<strong>de</strong>t, <strong>in</strong>sbeson<strong>de</strong>re ist û 1 e<strong>in</strong>e Funktion von (ξ1,ξ 1 1,ξ 2 1).<br />

3<br />

Angenommen, es gibt e<strong>in</strong> Nash-Gleichgewicht (ξ ∗,1 ,ξ ∗,2 ,ξ ∗,3 ) <strong>in</strong> gemischten Strategien<br />

mit ξ ∗,i > 0 für i = 1, 2, 3. Dann ist ξ ∗,1<br />

1 Maximierer <strong>de</strong>r Aufgabe<br />

maxû 1 (ξ 1 1,ξ ∗,2<br />

1 ,ξ ∗,3<br />

1 ) s.d. 0 < ξ ∗,1 < 1 (5.4)<br />

û 1 (ξ 1 1,ξ ∗,2<br />

1 ,ξ ∗,3<br />

1 ) ist l<strong>in</strong>ear <strong>in</strong> ξ 1 1 mit <strong>de</strong>n Randwerten<br />

û 1 (1, ξ ∗,2<br />

1 ,ξ ∗,3<br />

1 ) = (1 − ξ ∗,2<br />

1 ) (1 − ξ ∗,3<br />

1 ) und û 1 (0, ξ ∗,2<br />

1 ,ξ ∗,3<br />

1 ) = 2ξ ∗,2<br />

1 ξ ∗,3<br />

1<br />

Genau dann nimmt <strong>die</strong> l<strong>in</strong>eare Funktion û 1 (ξ 1 1,ξ ∗,2<br />

1 ,ξ ∗,3<br />

1 ) e<strong>in</strong> Maximum <strong>in</strong> (0, 1)<br />

an, wenn <strong>die</strong>se Randwerte gleich s<strong>in</strong>d, also gilt:<br />

(1 − ξ ∗,2<br />

1 ) (1 − ξ ∗,3<br />

1 ) = 2ξ ∗,2<br />

1 ξ ∗,3<br />

1 (5.5)<br />

Aus Symmetriegrün<strong>de</strong>n gilt: ξ ∗,1<br />

1 = ξ ∗,2<br />

1 = ξ ∗,3<br />

1 =: s, somit erhält man aus (5.5):<br />

(1 − s) 2 = 2s 2 mit <strong>de</strong>r Lösung: s = 1<br />

1+ √ = √ 2 − 1 ≈ 0.4142.<br />

2<br />

E<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> gemischten Strategien besteht also dar<strong>in</strong>, dass je<strong>de</strong>r<br />

Spieler i se<strong>in</strong>e re<strong>in</strong>en Strategien M, A mit <strong>de</strong>n Wahrsche<strong>in</strong>lichkeiten 0.4142 bzw.<br />

0.5858 spielt. ✷


KAPITEL 5. SPIELE IN EXTENSIVFORM 106<br />

Beispiel 5.11 Drei Manager <strong>in</strong> <strong>de</strong>r Market<strong>in</strong>gabteilung sollen entschei<strong>de</strong>n, ob<br />

<strong>die</strong> neue Werbekampagne im Rundfunk (R), im Fernsehen (F) o<strong>de</strong>r <strong>in</strong> Zeitungen<br />

(Z) geschaltet wird. In <strong>de</strong>r ersten Run<strong>de</strong> wird abgestimmt, ob Rundfunk o<strong>de</strong>r<br />

Fernsehen s<strong>in</strong>nvoller ist, <strong>in</strong> <strong>de</strong>r zweiten Run<strong>de</strong> wird dann über <strong>de</strong>n Sieger <strong>de</strong>r<br />

ersten Run<strong>de</strong> und über <strong>die</strong> Kampagne <strong>in</strong> <strong>de</strong>r Zeitung abgestimmt. Die Me<strong>in</strong>ung<br />

über <strong>die</strong> Erfolgsaussichten <strong>de</strong>r Kampagnen differieren zwischen <strong>de</strong>n Managern;<br />

sie haben folgen<strong>de</strong> Präferenzen:<br />

Manager 1: F ≻ R ≻ Z<br />

Manager 2: R ≻ Z ≻ F<br />

Manager 3: Z ≻ F ≻ R<br />

Ziel <strong>de</strong>r Manager ist es, dass am En<strong>de</strong> möglichst ihre Präferenzen realisiert wer<strong>de</strong>n.<br />

Nach <strong>de</strong>r ersten Run<strong>de</strong> bleibt entwe<strong>de</strong>r F o<strong>de</strong>r R übrig, so dass <strong>in</strong> <strong>de</strong>r zweiten<br />

Run<strong>de</strong> F : Z o<strong>de</strong>r R : Z gespielt wer<strong>de</strong>n muss. Dabei ergeben sich <strong>die</strong> folgen<strong>de</strong>n<br />

bei<strong>de</strong>n Teilspiele:<br />

2.Run<strong>de</strong>: F:Z<br />

1<br />

Z<br />

F<br />

2 2<br />

Z F Z F<br />

3 3 3 3<br />

Z F Z F Z F Z F<br />

✉<br />

✉ ✉ ✉ ✉ ✉ ✉ ✉<br />

Z Z Z F Z F F F<br />

Die stark markierten Pfeile kennzeichnen <strong>die</strong> Entscheidungen, <strong>die</strong> je<strong>de</strong>r Spieler<br />

entsprechend se<strong>in</strong>er Präferenzordnung trifft. Man überzeugt sich davon, dass <strong>die</strong>se<br />

Entscheidungfolge e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> <strong>de</strong>m Teilspiel darstellt. (Wenn jeweils<br />

2 Spieler bei ihrer Entscheidung bleiben und <strong>de</strong>r verbleiben<strong>de</strong> Spieler än<strong>de</strong>rt<br />

se<strong>in</strong>e Entscheidung, so kann er sich gemäß se<strong>in</strong>er Präferenzordnung nicht verbessern.)<br />

Analoge Aussagen gelten, wenn <strong>in</strong> Run<strong>de</strong> 2 R : Z gespielt wird:


KAPITEL 5. SPIELE IN EXTENSIVFORM 107<br />

2.Run<strong>de</strong>: R:Z<br />

1<br />

Z<br />

R<br />

2 2<br />

Z R Z R<br />

3 3 3 3<br />

Z R Z R Z R Z R<br />

✉<br />

✉ ✉ ✉ ✉ ✉ ✉ ✉<br />

Z Z Z R Z R R R<br />

Der Spielbaum <strong>in</strong> Run<strong>de</strong> 1 besitzt folgen<strong>de</strong> Gestalt:<br />

1.Run<strong>de</strong>: F:R<br />

1<br />

R<br />

F<br />

2 2<br />

R F R F<br />

3 3 3 3<br />

R F R F R F R F<br />

✉<br />

✉ ✉ ✉ ✉ ✉ ✉ ✉<br />

R R R F R F F F<br />

Wenn nun <strong>in</strong> Run<strong>de</strong> 1 je<strong>de</strong>r Spieler se<strong>in</strong>e Entscheidung gemäß se<strong>in</strong>er Präferenzordnung<br />

trifft, entsteht <strong>die</strong> Entscheidungsfolge F → R → F mit <strong>de</strong>m Ergebnis F<br />

<strong>in</strong> Run<strong>de</strong> 1, was aber <strong>in</strong> Run<strong>de</strong> 2 mit <strong>de</strong>r Folge F → Z → Z zum En<strong>de</strong>rgebnis Z<br />

führt. Dies kann ke<strong>in</strong> teilspielperfektes Gleichgewicht se<strong>in</strong>. Denn än<strong>de</strong>rt Spieler 1<br />

se<strong>in</strong>e Entscheidung <strong>in</strong> <strong>de</strong>r 1.Run<strong>de</strong> von F zu R, so erzielt er e<strong>in</strong> besseres Ergebnis:


KAPITEL 5. SPIELE IN EXTENSIVFORM 108<br />

Run<strong>de</strong> 1: R → R → F, Run<strong>de</strong> 2: R → R → Z mit <strong>de</strong>m Gesamtergebnis<br />

R. Tatsächlich stellt <strong>die</strong>se Entscheidungsfolge e<strong>in</strong> teilspielperfektes Gleichgewicht<br />

dar.<br />

In Run<strong>de</strong> 1 muss also Spieler 1 gegen se<strong>in</strong>e Präferenzordnung R wählen, um am<br />

En<strong>de</strong> für sich das bestmögliche Ergebnis zu erzielen.<br />


Literaturverzeichnis<br />

[1] Christian Kanzow: E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>. Vorlesungsskript Universität<br />

Würzburg, WS 2006/07.<br />

[2] Christian Kanzow: Optimierungsverfahren zur Lösung l<strong>in</strong>earer Komplementaritätsprobleme.<br />

Vorlesungsskript Universität Hamburg. 2004<br />

[3] Walter Schlee: E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>. Vieweg 2004.<br />

[4] Bern<strong>in</strong>ghaus, Ehrhart, Güth: Strategische Spiele. Spr<strong>in</strong>ger 2006.<br />

[5] C.Geiger, C.Kanzow: Theorie und Numerik restr<strong>in</strong>gierter Optimierungsaufgaben.<br />

Spr<strong>in</strong>ger 2001.<br />

[6] Holler, Ill<strong>in</strong>g: E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>. Spr<strong>in</strong>ger 2008.<br />

[7] B.Pensch<strong>in</strong>ski: Theorie und Numerik von Fixpunktverfahren zur Lösung von<br />

Variationsungleichungen. Masterthesis 2008, Bergische Universität Wuppertal.<br />

[8] Sieg: <strong>Spieltheorie</strong>. Ol<strong>de</strong>nbourg.<br />

109

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!