Vorlesung Einführung in die Spieltheorie
Vorlesung Einführung in die Spieltheorie
Vorlesung Einführung in die Spieltheorie
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>Vorlesung</strong> E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong><br />
Tim Hellmann<br />
17.11.2009<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Existenz von Nash-Gleichgewichten <strong>in</strong> der gemischten<br />
Erweiterung<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Existenz von Nash-Gleichgewichten <strong>in</strong> der gemischten<br />
Erweiterung<br />
Σ i ist <strong>die</strong> Mengen aller Lotterien über <strong>die</strong> Strategien von Sp.i<br />
damit s<strong>in</strong>d auch <strong>die</strong> zusammengesetzten Lotterien def<strong>in</strong>itiert<br />
σ i + σ ′ i und t · σ i sowie σ + σ ′ und t · σ, t ∈ R def<strong>in</strong>iert<br />
Die Σ i s<strong>in</strong>d also konvex, da:<br />
t · σ i + (1 − t) · σ ′ i ∈ Σ i , t ∈ [0, 1]<br />
t · σ + (1 − t) · σ ′ ∈ Σ i , t ∈ [0, 1]<br />
und kompakt, d.h. beschränkt und abgeschlossen<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Erweiterung der Nutzenfunktionen<br />
multil<strong>in</strong>eare Erweiterung der U i auf Σ, U i : Σ → R:<br />
⎛<br />
⎞<br />
u i (σ) := ∑ ⎝u i (s) ∏ σ j (s j ) ⎠<br />
s∈S j∈N<br />
U i ist stetig<br />
U i ist quasikonkav <strong>in</strong> σ i für alle σ −i : für alle σ i , σ ′ i<br />
∈ Σ i ,<br />
σ −i ∈ Σ −i , t ∈ [0, 1] gilt<br />
U i<br />
(<br />
t · σi + (1 − t) · σ ′ i, σ −i<br />
)<br />
≥ m<strong>in</strong><br />
{<br />
Ui (σ i , σ −i ) , U i<br />
(<br />
σ<br />
′<br />
i , σ −i<br />
)}<br />
für alle σ i ∈ Σ i und σ −i ∈ Σ −i gibt es s i , s<br />
i ′ ∈ S i ,<br />
σ i (s i ) , σ i (s<br />
i ′ ) > 0, daß<br />
( )<br />
U i (s i , σ −i ) ≥ U i (σ i , σ −i ) ≥ U i s<br />
′<br />
i , σ −i<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Existenz von Nash-Gleichgewichten<br />
Theorem (Existenzsatz Nash, gemischte Erweiterung)<br />
Die gemischte Erweiterung e<strong>in</strong>es endlichen Spiels <strong>in</strong> Normalform<br />
besitzt e<strong>in</strong> Nash-Gleichgewicht.<br />
Hatten bereits:<br />
Theorem (Existenzsatz Nash)<br />
Gegeben sei e<strong>in</strong> Spiel G <strong>in</strong> Normalform. Wenn für jeden Spieler<br />
i ∈ N gilt:<br />
S i ist e<strong>in</strong>e kompakte und konvexe Teilmenge des endlich<br />
dimensionalen euklidischen Raums,<br />
u i : S → R ist stetig, und<br />
u i (·, s −i ) : S i → R ist quasikonkav <strong>in</strong> s i .<br />
Dann existiert e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> G.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Existenz von Nash-Gleichgewichten<br />
Wir wissen:<br />
Σ ist e<strong>in</strong>e kompakte und konvexe Teilmenge des endlich<br />
dimensionalen euklidischen Raums,<br />
U i : Σ → R ist stetig,<br />
U i (·, σ −i ) : Σ i → R ist quasikonkav <strong>in</strong> σ i .<br />
Daher erfüllt <strong>die</strong> gemischte Erweiterung <strong>die</strong> Vorraussetzungen beim<br />
allgeme<strong>in</strong>eren Existenzsatz und ist daher e<strong>in</strong>e Implikation des<br />
allgeme<strong>in</strong>eren Theorems.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Existenz von Nash-Gleichgewichten<br />
Theorem (Nash 1950)<br />
Die gemischte Erweiterung e<strong>in</strong>es endlichen Spiels <strong>in</strong> Normalform<br />
besitzt e<strong>in</strong> Nash-Gleichgewicht.<br />
Beweis 1950: wendet Kakutanis Fixpunktsatz (1941) auf <strong>die</strong><br />
Beste-Antwort-Korrespondenz an<br />
Beweis 1951: verwendet Brouwers (1910/12) Fixpunktsatz für<br />
Funktionen<br />
Literatur: Border, Kim C. (1988): Fixed Po<strong>in</strong>t Theorems with<br />
Applications to Economics and Game Theory, Cambridge<br />
University Press.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Brouwers Fixpunktsatz<br />
Theorem (Brouwer 1910/12)<br />
Ist X e<strong>in</strong>e<br />
nicht-leere,<br />
kompakte, (d.h. beschränkt und abgeschlossen) und<br />
konvexe Teilmenge e<strong>in</strong>es R n und<br />
ist <strong>die</strong> Abbildung f : X → X stetig,<br />
dann gibt es e<strong>in</strong>en Fixpunkt von f , d.h., e<strong>in</strong> x ∗ ∈ X , so daß<br />
f (x ∗ ) = x ∗ .<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beweisidee für Existenzsatz<br />
Theorem (Nash 1950)<br />
Die gemischte Erweiterung e<strong>in</strong>es endlichen Spiels <strong>in</strong> Normalform<br />
besitzt e<strong>in</strong> Nash-Gleichgewicht.<br />
Beweisidee.<br />
Fakt: Σ ist nichtleer, konvex und kompakt.<br />
Konstruiere e<strong>in</strong>e stetige Abbildung T : Σ → Σ.<br />
Zeige, daß deren Fixpunkte Nash-Gleichgewichte s<strong>in</strong>d.<br />
Brouwers Fixpunktsatz garantiert dann <strong>die</strong> Existenz.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beweis #1<br />
Def<strong>in</strong>iere für alle i ∈ N und s i ∈ S i e<strong>in</strong>e Fkt φ si : Σ → R :<br />
φ si (σ) := max(0, u i (s i , σ −i ) − u i (σ i , σ −i )).<br />
Def<strong>in</strong>iere T = (T i ) i∈N : Σ → Σ für i ∈ N, s i ∈ S i und σ ∈ Σ<br />
T i (σ)(s i ) :=<br />
σ i(s i ) + φ si (σ)<br />
1 + ∑ s i ′ ∈S φ<br />
i s ′<br />
i<br />
(σ)<br />
Fakt: T ist stetig, und Σ ist nicht-leer, kompakt und konvex.<br />
Interpretation: Die Funktion T bildet e<strong>in</strong> gemischtes<br />
Strategienprofil σ <strong>in</strong> e<strong>in</strong> gemischtes Strategienprofil σ ′ ab, so<br />
dass <strong>die</strong> Wahrsche<strong>in</strong>lichkeit der re<strong>in</strong>en besten Antworten auf<br />
σ −i erhöht wird und Nicht-Beste-Antworten mit ger<strong>in</strong>gerer<br />
Wahrsche<strong>in</strong>lichkeit versehen werden.<br />
Brouwers Fixpunktsatz garantiert dann <strong>die</strong> Existenz e<strong>in</strong>es<br />
Fixpunktes σ ∗ ∈ Σ.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beweis #2<br />
Fakt: Für jedes i es gibt e<strong>in</strong> s ′′<br />
i<br />
∈ S i so daß σ ∗ i (s′′ i ) > 0 und<br />
φ s ′′(σ ∗ ) = max(0, u<br />
i<br />
i (s i ′′ , σ−i) ∗ − u i (σ ∗ )) = 0.<br />
Da σ ∗ Fixpunkt von T ist, gilt<br />
σi ∗ (s i ′′ ) = σ∗ i (s′′ i ) + φ s i<br />
′′ (σ ∗ )<br />
1 + ∑ s i ′ ∈S φ<br />
i s ′<br />
i<br />
(σ ∗ ) .<br />
Wegen σi ∗(s′′<br />
i ) > 0, gilt dann∑ s i ′ ∈S φ<br />
i s ′<br />
i<br />
(σ ∗ ) = 0 und daher<br />
max(0, u i (s i , σ−i ∗ ) − u i(σ ∗ )) = 0, für alle s i ∈ S i .<br />
Doch das heißt, daß ke<strong>in</strong> Spieler e<strong>in</strong>e e<strong>in</strong>seitige<br />
Verbesserungsmöglichkeit <strong>in</strong> re<strong>in</strong>en Strategien hat und damit<br />
auch nicht <strong>in</strong> gemischten. Also ist σ ∗ e<strong>in</strong><br />
Nash-Gleichgewicht.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Extensive Spiele<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Extensive Spiele — Motivation<br />
Bislang hatten wir angenommen, dass <strong>die</strong> Spieler simultan<br />
entscheiden.<br />
Was ist nun, wenn e<strong>in</strong>e feste Reihenfolge der Entscheidungen<br />
festgelegt ist?<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Extensive Spiele — Beispiel Markte<strong>in</strong>tritt<br />
zwei Unternehmen:<br />
e<strong>in</strong> Monopolist, M<br />
e<strong>in</strong> potentieller Konkurrent, K<br />
K überlegt Markte<strong>in</strong>tritt<br />
M muß entscheiden, ob er bei Markte<strong>in</strong>tritt,<br />
<strong>die</strong>sen zuläßt ⇒ sie teilen sich den Markt, z.B. Cournot Duopol<br />
oder abwehrt, d.h. auf e<strong>in</strong>mal e<strong>in</strong>e solche Menge produziert,<br />
dass sich der Markte<strong>in</strong>tritt für K nicht lohnt ⇒ Verluste für<br />
beide<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Markte<strong>in</strong>trittspiel — simultane Entscheidungen<br />
Darstellung des Spiels <strong>in</strong> strategischer Form (Vere<strong>in</strong>fachtes<br />
Modell):<br />
accept<br />
fight<br />
1<br />
−1<br />
<strong>in</strong><br />
1<br />
−1<br />
out<br />
2<br />
0<br />
2<br />
0<br />
zwei Gleichgewichte <strong>in</strong> re<strong>in</strong>en Strategien:<br />
NE(G) = {(fight, out), (accept, <strong>in</strong>)}<br />
e<strong>in</strong>es unplausibel, wenn <strong>die</strong> Reihenfolge e<strong>in</strong>e Rolle spielt<br />
(beruht auf unglaubwürdiger Drohung)<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Markte<strong>in</strong>trittspiel als extensive Form<br />
Darstellung als extensives Spiel (wobei <strong>die</strong> Reihenfolge e<strong>in</strong>e<br />
Rolle spielt):<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Extensive Spiele — Beispiel Markte<strong>in</strong>tritt<br />
Wenn <strong>die</strong> Reihenfolge e<strong>in</strong>e Rolle spielt, benutzen wir <strong>die</strong><br />
Rückwärts<strong>in</strong>duktion:<br />
Falls M entscheiden muß, wird sie niemals K bekämpfen.<br />
<strong>die</strong>s weiß K und daher wählt K den Markte<strong>in</strong>tritt.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Extensive Spiele — Beispiel Stackelberg Duopol<br />
zwei Unternehmen (wie im Cournot Model), aber <strong>die</strong> Firmen<br />
entscheiden h<strong>in</strong>tere<strong>in</strong>ander:<br />
F 1 (Stackelberg leader) entscheidet zuerst, welche Menge sie<br />
anbietet<br />
danach entscheided F 2 .<br />
Macht <strong>die</strong>s e<strong>in</strong>en Unterschied?<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Formale Darstellung von Spielen <strong>in</strong> extensiver Form<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Formale Darstellung von Spielen <strong>in</strong> extensiver Form<br />
Def<strong>in</strong>ition<br />
E<strong>in</strong> Spiel <strong>in</strong> extensiver Form mit vollständiger Information ist e<strong>in</strong><br />
Tupel<br />
wobei<br />
((X , ⊳), N, P, A, p, u)<br />
Spielbaum (X , ⊳): Abfolge der Zugmöglichkeiten,<br />
Spielausgänge<br />
Menge der Spieler N: Akteure plus ”<br />
Zufall“<br />
Spielerpartition P: Wer zieht wann?<br />
Aktionspartition A: Welche Züge s<strong>in</strong>d möglich?<br />
System der Zufallswahrsche<strong>in</strong>lichkeiten p: Wie zieht ”<br />
Zufall“?<br />
Auszahlungsfunktionen u: repräsentiert <strong>die</strong> Präferenzen der<br />
Spieler<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Spielbaum, (X , ⊳)<br />
endliche Knotenmenge X ; |X | > 1<br />
Vorgängerrelation ⊳ auf X<br />
nicht notwendigerweise vollständig.<br />
asymmetrisch,d.h. gibt e<strong>in</strong> o ∈ X , so daß o ⊳ x für alle x ∈ X .<br />
und transitiv, x, x ′ , x ′′ ∈ X , x ′ ⊳ x, x ′′ ⊳ x und x ′ ≠ x ′′<br />
implizieren x ′ ⊳ x ′′ oder x ′′ ⊳ x ′ .<br />
unmittelbarer Vorgänger von x ∈ X \ {o}:<br />
V (x) := {y ∈ X : y ⊳ x}<br />
Menge der unmittelbaren Nachfolger von x ∈ X :<br />
N (x) := {y ∈ X : x ⊳ y}<br />
Menge der Endknoten Z := {x ∈ X : N(x) = ∅} ke<strong>in</strong>e<br />
Nachfolger.<br />
Menge der Entscheidungsknoten K := X \Z<br />
Pfad von x ∈ X : ϕ (o) = ∅, ϕ (x) = ϕ (V (x)) ∪ {x}<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beispiel — Spielbaum, (X , ⊳)<br />
Hier ist zum Beispiel:<br />
Menge der Knoten, X = {x 1 , ..., x 5 },<br />
Menge der Entscheidungsknoten, K = {x 1 , x 2 },<br />
Menge der Endknoten Z = {x 3 , x 4 , x 5 }<br />
Vorgänger von x 2 : V (x 2 ) = x 1 ,<br />
Nachfolger von x 2 : N(x 2 ) = {x 4 , x 5 }.<br />
Pfad von x 4 : ϕ(x 4 ) = {x 1 , x 2 }.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Menge der Spieler, Spielerpartition N, P<br />
N, wie zuvor nur der Spieler ”<br />
Natur“, bzw. ”<br />
Zufall“,<br />
bezeichnet als 0, ist enthalten.<br />
P ist e<strong>in</strong>e Partition (P i ) i∈N<br />
von K, den Entscheidungsknoten<br />
P i , Menge der Knoten, an denen i entscheidet.<br />
P 0 Menge der Knoten, an denen der Zufall entscheidet (kann<br />
leer se<strong>in</strong>).<br />
für x ∈ K bezeichnet i (x) den an K ziehenden Spieler<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beispiel — Menge der Spieler, Spielerpartition N, P<br />
Hier:<br />
N = {M, K, 0}.<br />
ke<strong>in</strong> Zufall P 0 = ∅.<br />
P K = {x 1 }, der Konkurrent zieht zuerst.<br />
P M = {x 2 }, danach der Monopolist.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Aktionspartition A<br />
A ist e<strong>in</strong>e Partition von X \ {o}<br />
Elemente a von A heißen Aktionen<br />
für alle a ∈ A gilt<br />
V (a) ∈ P i für e<strong>in</strong> i ∈ N<br />
d.h. a ∈ A s<strong>in</strong>d <strong>die</strong> Menge der Aktionen für Spieler i ∈ N an<br />
der Stelle P i , wenn Spieler i ∈ N entscheiden muss.<br />
Menge der Aktionen an x ∈ K: A x<br />
Menge der Aktionen von i ∈ I : A i<br />
für alle x ∈ X \ {o} bezeichnet a (x) <strong>die</strong> Aktion, <strong>in</strong> der x liegt<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Aktionspartition<br />
Hier:<br />
mögliche Aktionen von Spieler K an x 1 ∈ P K : {<strong>in</strong>, out}.<br />
Aktion <strong>in</strong> führt zu Knoten x 2 , Aktion out führt zu Knoten x 3<br />
mögliche Aktionen von Sp. K an x 1 ∈ P K : {accept, fight}.<br />
Aktion accept führt zu Knoten x 4 , Aktion fight führt zu<br />
Knoten x 5<br />
Tim Hellmann E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Auszahlungsfunktionen<br />
u = (u i ) i∈N\{0}<br />
u i : Z → R<br />
u i Erwartungsnutzenfunktion<br />
stellt Spieler is Präferenzen über<br />
Wahrsche<strong>in</strong>lichkeitsverteilungen über Z dar<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Zufallsmechnismus<br />
Zufallsspieler 0 ”<br />
entscheidet“ an den Knoten <strong>in</strong> P 0 .<br />
System von Zufallswahrsche<strong>in</strong>lichkeiten p<br />
p h ordnet den Aktionen a ∈ A h Wahrsche<strong>in</strong>lichkeiten p h (a) zu<br />
p h (a) > 0<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beispiele und Strategien <strong>in</strong> extensiven Spielen<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beispiel — E<strong>in</strong> etwas komplexerer Baum<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beispiel — E<strong>in</strong> etwas komplexerer Baum<br />
Die Menge der Knoten X = {x 1 , x 2 , ..., x 30 }.<br />
Endknoten:<br />
Z = {x 4 , x 6 , x 8 , x 11 , x 13 , x 15 , x 16 , x 17 , x 18 , x 19 , x 21 , x 23 , x 24 , ..., x 30 }.<br />
Entscheidungsknoten:<br />
K = {x 1 , x − 2, x 3 , x 5 , x 7 , x 9 , x 10 , x 12 , x 14 , x 20 , x 22 }.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beispiel — E<strong>in</strong> etwas komplexerer Baum<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beispiel — E<strong>in</strong> etwas komplexerer Baum<br />
Die Spieler N = {0, 1, 2, 3}, wobei Zufall schwarz, Sp.1 gelb,<br />
Sp.2 blau, Sp.3, rot.<br />
Spielerpatition, z.B. P 1 = {x 1 , x 9 , x 10 }.<br />
Aktionspartition für Spieler 1,<br />
A 1 = {(a, b, c, d), (e, f ), (g, h)}.<br />
Aktionspartition für Spieler 1 an Knoten x 1 , A x1 = {a, b, c, d}.<br />
Zufallszüge an P 0 = {x 2 , x 5 } mit den entsprechenden<br />
Wahrsche<strong>in</strong>lichkeiten.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Re<strong>in</strong>e Strategien<br />
Def<strong>in</strong>ition<br />
Die Menge der re<strong>in</strong>en Strategien für Spieler i ∈ N\ {0} <strong>in</strong> e<strong>in</strong>em<br />
extensiven Spiel Γ is gegeben durch A i := ∏ x∈P i<br />
A x .<br />
re<strong>in</strong>e Strategie a i legt für jeden Entscheidungsknoten x ∈ P i<br />
e<strong>in</strong>e Aktion a x ∈ A x fest (umfassender Handlungsplan)<br />
Menge der re<strong>in</strong>en Strategiekomb<strong>in</strong>ationen: A : = ∏ i∈N\{0} A i<br />
unter a erreichbare Endknoten<br />
Z (a) := {z ∈ Z|A (ϕ (z)) \A 0 ⊆ {a x |x ∈ K\P 0 }}<br />
Auszahlungen für re<strong>in</strong>e Strategien<br />
⎛<br />
⎞<br />
u i (a) =<br />
∑<br />
∏<br />
⎝u i (z)<br />
p V (a) (a) ⎠<br />
a∈A(ϕ(z))∩A 0<br />
z∈Z(a)<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beispiel — E<strong>in</strong> etwas komplexerer Baum<br />
E<strong>in</strong>e re<strong>in</strong>e Strategie für Sp.1 (gelb) wäre z.B.: a 1 = (a, f , g)<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Gemischte Strategien<br />
Def<strong>in</strong>ition<br />
Die Menge der gemischten Strategien für Spieler i ∈ N <strong>in</strong> e<strong>in</strong>em<br />
extensiven Spiel Γ is gegeben durch Σ i = ∆ (A i ).<br />
∆ (A i ) bezeichnet <strong>die</strong> Menge der W-keitsverteilungen auf den<br />
re<strong>in</strong>en Srategien A i , formal:<br />
∆ (A i ) := {σ i : A i → R| ∑<br />
a i ∈A i<br />
σ i (a i ) = 1 und σ i (a i ) ≥ 0 ∀a i ∈ A i }<br />
für σ i ∈ Σ i bezeichnet σ i (a i ) <strong>die</strong> Wahrsche<strong>in</strong>lichkeit von<br />
a i ∈ A i<br />
gemischte Strategiekomb<strong>in</strong>ationen σ ∈ Σ := ∏ i∈N\{0} Σ i<br />
Auszahlungen für gemischte Strategiekomb<strong>in</strong>ationen<br />
⎛<br />
⎞<br />
u i (σ) := ∑ ∏<br />
⎝u i (a) σ i (a i ) ⎠<br />
a∈A<br />
i∈N\{0}<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Normalform<br />
Def<strong>in</strong>ition<br />
Die Normalform des extensiven Spiels Γ = ((X , ⊳), N, P, A, p, u)<br />
ist das strategische Spiel<br />
)<br />
NF (Γ) =<br />
(N\ {0} , (A i ) i∈N\{0}<br />
, (u i ) i∈N\{0}<br />
.<br />
re<strong>in</strong>e/gemischte Strategie(n)/komb<strong>in</strong>ationen von NF (Γ) s<strong>in</strong>d<br />
auch <strong>die</strong>se von Γ<br />
bei Übergang von Γ zu NF (Γ) gehen Informationen verloren<br />
<strong>die</strong> Reihenfolge f<strong>in</strong>det ke<strong>in</strong>e Beachtung.<br />
Zufall spielt ke<strong>in</strong>e Rolle.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Dom<strong>in</strong>anz und Nash-Gleichgewichte<br />
über <strong>die</strong> Normalform analog zu strategischen Spielen,<br />
beispielsweise<br />
Def<strong>in</strong>ition<br />
E<strong>in</strong>e gemischte Strategiekomb<strong>in</strong>ation σ ∗ ∈ Σ des extensiven Spiels<br />
Γ ist e<strong>in</strong> Nash-Gleichgewicht, wenn σ ∗ e<strong>in</strong> Nash-Gleichgewicht von<br />
NF (Γ) ist, d.h. wenn u i (σ ∗ ) ≥ u i<br />
(<br />
σi , σ ∗ −i)<br />
für alle i ∈ I \ {0} und<br />
σ i ∈ Σ i .<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
E<strong>in</strong> weiteres Beispiel<br />
Baum: X = {x 1 , ..., x 9 }, wobei x 1 ⊳ x 2 , x 3 ; x 2 ⊳ x 4 , x 5 ;<br />
x 3 ⊳ x 6 , x 7 ; und x 5 ⊳ x 8 , x 9 .<br />
Spieler N = {0, 1, 2}, Spielerpartition P 1 = {x 1 , x 5 },<br />
P 2 = {x 2 , x 3 }, P 0 = ∅.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
E<strong>in</strong> weiteres Beispiel<br />
Aktionspartitionen A 1 = {{a, b}, {c, d}},<br />
A 2 = {{A, B}, {C, D}}<br />
re<strong>in</strong>e Strategien A 1 = {(a, c), (a, d)(b, c), (b, d)},<br />
A 2 = {(A, C), (A, D), (B, C), (B, D)}.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
E<strong>in</strong> weiteres Beispiel<br />
e<strong>in</strong>e re<strong>in</strong>e Strategie für Spieler 1, z.B. a 1 = (a, c) (Schwarz)<br />
und für Spieler a 2 = (A, D). (blau)<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
E<strong>in</strong> weiteres Beispiel<br />
e<strong>in</strong>e re<strong>in</strong>e Strategie für Spieler 1, z.B. a 1 = (a, c) (Schwarz)<br />
und für Spieler a 2 = (A, D). (blau)<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
E<strong>in</strong> weiteres Beispiel — Normalform<br />
Darstellung des Spiels <strong>in</strong> strategischer Form:<br />
(a, c)<br />
(a, d)<br />
(b, c)<br />
(b, d)<br />
(A, C) (A, D) (B, C) (B, D)<br />
1 1 0 0<br />
1 1 4 4<br />
1 1 2 2<br />
1 1 2 2<br />
6 3 6 3<br />
6 1 6 1<br />
6 3 6 3<br />
6 1 6 1<br />
Gleichgewichte <strong>in</strong> re<strong>in</strong>en Strategien:<br />
NE(G) = { {(a, c), (A, D)}, {(b, ·), (·, C)} } .<br />
Bei Beachtung der Reihenfolge s<strong>in</strong>d nicht alle s<strong>in</strong>nvoll.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
E<strong>in</strong> weiteres Beispiel — Normalform<br />
Darstellung des Spiels <strong>in</strong> strategischer Form:<br />
(a, c)<br />
(a, d)<br />
(b, c)<br />
(b, d)<br />
(A, C) (A, D) (B, C) (B, D)<br />
1<br />
1 0<br />
0<br />
1<br />
1<br />
4 4<br />
1<br />
1<br />
2 2<br />
1<br />
1<br />
2 2<br />
6 3<br />
6 3<br />
6<br />
1<br />
6<br />
1<br />
6 3<br />
6 3<br />
6<br />
1<br />
6<br />
1<br />
Gleichgewichte <strong>in</strong> re<strong>in</strong>en Strategien:<br />
NE(G) = { {(a, c), (A, D)}, {(b, ·), (·, C)} } .<br />
Bei Beachtung der Reihenfolge s<strong>in</strong>d nicht alle s<strong>in</strong>nvoll.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
E<strong>in</strong> weiteres Beispiel — Normalform<br />
→<br />
Das Gleichgewicht {(a, c), (A, D)} (Schwarz) sieht nicht<br />
rational aus.<br />
Spieler 1, weiß, dass falls er b spielt, Spieler 2 dann C spielt,<br />
also würden dann beide 6 erhalten.<br />
Wir brauchen e<strong>in</strong> anderes Gleichgewichtskonzept!<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Verhaltensstrategien und teilspielperfekte<br />
Gleichgewichte<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Verhaltensstrategien<br />
Def<strong>in</strong>ition<br />
E<strong>in</strong>e Verhaltensstrategie für Spieler i ∈ N <strong>in</strong> e<strong>in</strong>em extensiven Spiel<br />
mit perfekter Er<strong>in</strong>nerung ist e<strong>in</strong>e Menge von<br />
Wahrsche<strong>in</strong>lichkeitsverteilungen b i , so dass b i (x, ·) e<strong>in</strong>e<br />
Wahrsche<strong>in</strong>lichkeitsverteilung auf A x ist.<br />
lokale Strategien für jedes x ∈ K\P 0 : b i (x, ·) ∈ ∆ (A x ) wobei<br />
b i (x, a) <strong>die</strong> Wahrsche<strong>in</strong>lichkeit e<strong>in</strong>er Aktion a ∈ A x ist.<br />
Menge der Verhaltensstrategien von i ∈ N\ {0} :<br />
B i := ∏<br />
x∈P i<br />
{b i (x, ·) ∈ ∆ (A x )}<br />
Menge der Verhaltensstrategiekomb<strong>in</strong>ationen: B = ∏ i∈N B i<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Verhaltensstrategien<br />
Auszahlungen für Verhaltensstrategiekomb<strong>in</strong>ationen<br />
⎛<br />
⎞<br />
u i (b) := ∑ ∏ ∏<br />
⎝u i (a)<br />
b i (x, a x ) ⎠<br />
a∈A i∈N\{0} x∈P i \P 0<br />
Unterschied zu re<strong>in</strong>en/gemischten Strategien?<br />
e<strong>in</strong>e re<strong>in</strong>e Strategie ist e<strong>in</strong> umfassender Handlungsplan.<br />
e<strong>in</strong>e gemischte Strategie ist e<strong>in</strong>e Wahrsche<strong>in</strong>lichkeitsverteilung<br />
über alle re<strong>in</strong>en Strategien.<br />
e<strong>in</strong>e Verhaltensstrategie ist e<strong>in</strong>e Menge von<br />
Wahrsche<strong>in</strong>lichkeitsverteilungen, <strong>die</strong> für jeden<br />
Entscheidungsknoten von Sp. i ∈ N e<strong>in</strong>e<br />
Wahrsche<strong>in</strong>lichkeitsverteilung über <strong>die</strong> Menge der möglichen<br />
Aktionen ist.<br />
e<strong>in</strong>e re<strong>in</strong>e Strategie ist sowohl e<strong>in</strong>e gemischte als auch e<strong>in</strong>e<br />
Verhaltensstrategie.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Verhaltensstrategien, Agentennormalform<br />
Def<strong>in</strong>ition<br />
Die Agentennormalform des extensiven Spiels Γ ist das strategische<br />
Spiel<br />
)<br />
ANF (Γ) =<br />
(K\P 0 , (A x ) x∈K\P0<br />
, (u x ) x∈K\P0<br />
,<br />
wobei u x = u i(x) für alle x ∈ K\P 0 .<br />
Jeder Entscheidungsknoten wird e<strong>in</strong> eigener Spieler.<br />
Die Nutzenfunktion wird von dem Spieler übernommen der an<br />
dem Knoten x ∈ K \ P 0 enstcheidet.<br />
Die re<strong>in</strong>en Strategien s<strong>in</strong>d für jeden Knoten/Spieler<br />
x ∈ K \ P 0 <strong>die</strong> möglichen Aktionen A x and x.<br />
re<strong>in</strong>e Strategiekomb<strong>in</strong>ationen von ANF (Γ) s<strong>in</strong>d <strong>die</strong>se von Γ<br />
gemischte Strategiekomb<strong>in</strong>ationen von ANF (Γ) s<strong>in</strong>d<br />
Verhaltensstrategiekomb<strong>in</strong>ationen von Γ!!!<br />
auch beim Übergang von Γ zu ANF (Γ) gehen Informationen<br />
verloren.<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Verhaltensstrategien, Nash-Gleichgewicht<br />
Die Def<strong>in</strong>ition e<strong>in</strong>es Nash-Gleichgewichts <strong>in</strong> Verhaltensstrategien<br />
analog:<br />
Def<strong>in</strong>ition<br />
E<strong>in</strong>e Verhaltensstrategiekomb<strong>in</strong>ation b ∗ ∈ Σ des extensiven Spiels<br />
Γ ist e<strong>in</strong> Nash-Gleichgewicht, wenn u i (b ∗ ) ≥ u i<br />
(<br />
bi , b ∗ −i)<br />
für alle<br />
i ∈ N\ {0} und b i ∈ B i .<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Teilspiele<br />
Teilbaum von (X , ⊳) bei x ∈ K : (T x , ⊳ x )<br />
T x := {x ′ ∈ X |x ′ = x oder x ⊳ x ′ }<br />
⊳ x :=⊳ | Tx , E<strong>in</strong>schränkung von ⊳ auf T x<br />
Wurzel: x; K x := K ∩ T x , Z x := Z ∩ T x<br />
bei jedem x ∈ K beg<strong>in</strong>nt e<strong>in</strong> Teilspiel<br />
Γ x = ((T x , ⊳ x ), N x , P x , A x , p x , u x )<br />
von Γ, so dass<br />
N x := {0} ∪ {i ∈ N|Pi x ≠ ∅} , wobei Pi x := P i ∩ T x<br />
P x := {Pi x |i ∈ N x }<br />
A x := ⋃ y∈T A x y ; A x i := A i ∩ A x for all i ∈ N x<br />
p x := {p y |y ∈ P0 x}<br />
ui x := u i | Z x for all i ∈ N x \ {0}<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beispiel, Teilspiele<br />
Gesucht Teilspiel Γ x 2<br />
!<br />
Schneide e<strong>in</strong>fach den Rest weg...<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beispiel, Teilspiele<br />
Gesucht Teilspiel Γ x 2<br />
!<br />
Schneide e<strong>in</strong>fach den Rest weg...<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Beispiel, Teilspiele<br />
Γ x 2<br />
ist also das Tupel<br />
Γ x 2<br />
= ((T x 2<br />
, ⊳ x 2<br />
), N x 2<br />
, P x 2<br />
, A x 2<br />
, p x 2<br />
, u x 2<br />
)<br />
mit<br />
T x2<br />
N x2<br />
P x2<br />
0<br />
= {x 2 , x 4 , x 5 , x 8 , x 9 } (<strong>die</strong> übrig gebliebenen Knoten).<br />
= {0, 1, 2}, beide Spieler können noch entscheiden.<br />
= ∅, Px2 1 = {x 5}, P x2<br />
2 = {x 2} (<strong>die</strong> Spielerpartitionen im<br />
Teilspiel).<br />
A x2<br />
1<br />
= {(c, d)} Ax2 2<br />
Teilspiel).<br />
= {(A, B)} (<strong>die</strong> Aktionspartitionen im<br />
p x2 = ∅, da P x2<br />
0 = ∅ (<strong>die</strong> Zufallszüge im Teilspiel).<br />
u x2 = u i | x4,x 8,x 9<br />
(<strong>die</strong> e<strong>in</strong>geschränkte Nutzenfunktion im<br />
Teilspiel).<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>
Teilspielperfekte Gleichgewichte<br />
Def<strong>in</strong>ition<br />
E<strong>in</strong>e Verhaltensstrategiekomb<strong>in</strong>ation b ∗ ∈ B des extensiven Spiels<br />
Γ ist e<strong>in</strong> teilspielperfektes Gleichgewicht, wenn <strong>in</strong> allen Teispielen<br />
Γ x von Γ <strong>die</strong> Restriktion von b ∗ auf K x \P0 x e<strong>in</strong> Nash-Gleichgewicht<br />
ist.<br />
da Γ o = Γ, ist jedes teilspielperfekte Gleichgewicht auch e<strong>in</strong><br />
Nash-Gleichgewicht<br />
enthält Γ ke<strong>in</strong>e echten Teilspiele, dann fallen beide Konzepte<br />
zusammen<br />
Tim Hellmann<br />
E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>