Spieltheorie - IMW
Spieltheorie - IMW
Spieltheorie - IMW
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Einführung<br />
rationale Individuen, die ”<br />
das Beste für sich herausholen wollen”<br />
◮ Nutzenmaximierung des Haushaltes<br />
◮ Gewinnmaximierung des Unternehmers<br />
Nebenbedingungen: technologische Sachverhalte,<br />
Nachfragebedingungen, staatliche Regulierung<br />
Möglichkeiten der Unternehmen: Aktionsparameter (Preis,<br />
Produkt, Innovation, Differenzierung, etc.)<br />
1 / 22
Ein-/Mehr-Personenentscheidungssituationen<br />
Ein-Personen-E.: Anpassung der Person an die Umweltzustände<br />
(triviales Spiel ohne Mitspieler); spieltheoretisch uninteressant,<br />
aber für uns sinnvoller Spezialfall als Referenz; was macht eine<br />
Firma wenn sie allein am Markt ist (Monopol)<br />
Mehr-P.-E.: Anpassung an die Umweltzustände und an die<br />
Anpassungen” (das Verhalten) der anderen, die zu erwarten sind;<br />
”<br />
” echte“ Spielsituation 2 / 22
Ein-Personen-Spiel, am Beispiel Monopol<br />
triviales Spiel;<br />
Ziel:<br />
die optimale Menge ist<br />
die Lösung ist daher:<br />
max Π(x)<br />
x<br />
arg max Π(x)<br />
x<br />
max Π(x) = Π(x ∗ )<br />
x<br />
für alle x ∗ aus arg max Π(x)<br />
x<br />
arg max x Π(x) kann mehrere Elemente enthalten, wird aber in den<br />
meisten Fällen bei uns nur ein Element enthalten; dann gilt einfach<br />
x ∗ = arg max x Π(x); quadratische Gewinnfunktion (Abb. folgt)<br />
3 / 22
Quadratische Gewinnfunktion Monopolist<br />
4 / 22
Simultane und Sequentielle Spiele<br />
Eine wichtige Unterscheidung für die Analyse von Spielen ist die<br />
zeitliche Struktur.<br />
Wenn die Spieler gleichzeitig (simultan) entscheiden, dann kann<br />
wird das Spiel in Normalform dargestellt.<br />
Oder es gibt eine zeitliche Aufeinanderfolge von Entscheidungen:<br />
Spieler 1 entscheidet zum Zeitpunkt 1, Spieler 2 sieht das und<br />
entscheidet danach, zum Zeitpunkt 2. Die zeitliche Struktur wird<br />
in der Darstellung der extensiven Form berücksichtigt.<br />
5 / 22
Mehr-Personen-Spiel<br />
Charakteristik eines Spiels: gewählte Strategien der Spieler<br />
beeinflußen die eigene Auszahlung und die der anderen Spieler;<br />
z.B.:<br />
Π 1 (x 1 , x 2 ), Π 2 (x 1 , x 2 )<br />
Vektor (x 1 , x 2 ) ist eine Strategiekombination; besagt für jede<br />
Firma, welche Menge er wählt.<br />
Bsp.: ”<br />
Hasenfußspiel”, Variante 1 (ökonomisch): zwei<br />
symmetrische Möglichkeiten, viel produzieren, wenig produzieren;<br />
Preis steht in negativem Zusammenhang mit Menge; es gibt<br />
folgende erschöpfende Matrix aus Entscheidungen und Resultaten:<br />
6 / 22
Mehr-Personen-Spiel in Normalform<br />
U 1<br />
U 2<br />
wenig viel<br />
wenig 100, 100 25, 150<br />
viel 150, 25 -10, -10<br />
Variante 2 (klassisch): zwei Autofahrer fahren aufeinander zu, wer<br />
ausweicht ist ein Hasenfuß, der andere ein Siegertyp; weichen beide<br />
aus, ist es besser für jeden als der alleinige Hasenfuß zu sein, aber<br />
schlechter als der Sieger; weicht keiner aus, beide z.B. tot, was<br />
noch schlechter ist als Hasenfuß zu sein;<br />
Anm.: Auszahlungen können auch Nutzenniveaus sein, die mit<br />
Aktionskombinationen verbunden sind (wie in Variante 2)<br />
7 / 22
Spiel<br />
Spiel besteht aus:<br />
◮ Spielern: Individuen, die Entscheidungen treffen; sind sich<br />
bewußt, dass ihre Aktionen den anderen beeinflußen, und dass<br />
sie von den Aktionen der anderen beeinflußt werden; U1 und<br />
U2<br />
◮ Strategien: aus welchen Aktionen kann ein Spieler wählen.<br />
Z.B. {hoch, niedrig}.<br />
◮ Auszahlungen: ordnet jeder möglichen Kombination von<br />
Aktionen aller Spieler (Strategienkombination) eine<br />
Auszahlung für jeden Spieler zu; z.B. (wenig, wenig)<br />
→ (100, 100).<br />
8 / 22
Spiel in Normalform<br />
Normalform eines Spiels wird auch strategische Form genannt.<br />
Diese Form der Darstellung besteht aus<br />
◮ der Menge der Spieler: I = {1, . . . , i, . . . , n}<br />
◮ der Menge der Strategien, die dem Spieler i zur Verfügung<br />
stehen: S i , für alle i = 1, . . . , n<br />
◮ den Auszahlungen, die Spieler i erhält, wenn jeder Spieler<br />
j = 1, . . . , n eine Strategie s j ∈ S j wählt: u i (s 1 , . . . , s i , . . . , s n )<br />
9 / 22
Industrieökonomisches Spiel<br />
Ein wichtiges Beispiel ist der Cournot-Mengenwettbewerb, der als<br />
Spiel modelliert wird:<br />
◮ Menge der Firmen: I = {1, . . . , i, . . . , n}<br />
◮ eine Firma i wählt als Strategie eine Produktionsmenge<br />
s i ∈ S i = {s i |s i ≥ 0}<br />
◮ Firmen produzieren für einen Markt mit inverser<br />
Nachfragefunktion: 1<br />
p = p(Q) = p(s 1 + s 2 + . . . + s n )<br />
und eine Firma i hat die Kostenfunktion C i (s i ). Die<br />
Auszahlung der Firma i ist dann gegeben durch den Gewinn<br />
Π i (s 1 , . . . , s n ) = p(s 1 + . . . + s n )s i − C i (s i ).<br />
1 Sei Q = Q(p) eine Nachfragefunktion, die die nachgefragte Menge eines<br />
Gutes für jeden Preis p angibt. Dann nennt man p = Q −1 (Q) = p(Q) die<br />
inverse Nachfragefunktion.<br />
10 / 22
Gleichgewicht<br />
Frage, die sich stellt: gegeben unsere Annahmen (Rationalität), wie<br />
wird das beschriebene Spiel ausgehen Welche Strategien werden<br />
die Firmen wählen<br />
2 wichtige Lösungskonzepte:<br />
◮ dominante Strategien<br />
◮ Nash-Gleichgewicht (NP 1994)<br />
11 / 22
Dominante Strategien<br />
manche Spiele, wie das Gefangenendilemma, haben eine dominante<br />
Strategie<br />
eine Strategie ist dominant wenn sie immer zur besten Auszahlung<br />
führt, unabhängig davon, was die anderen Mitspieler machen<br />
Bsp. ”<br />
Prisoners Dilemma”, Variante 1 (ökonomisch): zwei Hotels<br />
können einen hohen Preis setzen oder einen niedrigen, wiederum<br />
negativer Zusammenhang Preis-Menge; Auszahlungen gemäß<br />
Verhaltensmatrix:<br />
12 / 22
Mehr-Personen-Spiele in Normalform<br />
U 1<br />
U 2<br />
hoch niedrig<br />
hoch 100, 100 25, 150<br />
niedrig 150, 25 30, 30<br />
Unabhängig davon, was das andere Hotel macht, ist es besser,<br />
einen niedrigen Preis zu setzen<br />
Dilemma: (hoch, hoch) wäre eine Verbesserung für beide Hotels<br />
( ”<br />
Pareto-besser”), aber bei unkoordinierten Handlungen nicht<br />
erreichbar<br />
13 / 22
Mehr-Personen-Spiele in Normalform<br />
Variante 2 (klassisch): 2 Verbrecher werden bei einem Delikt<br />
gefasst; es gibt ein schweres Delikt, und ein kleineres Delikt; nur<br />
das kleine kann nachgewiesen werden, dafür bekommt jeder 2<br />
Jahre; für das große braucht man eine Zeugenaussage von<br />
mindestens einem Verbrecher; wenn einer gesteht, wird der andere<br />
verurteilt, bekommt 10 Jahre, der Geständige als Kronzeuge 0<br />
Jahre; gestehen beide, bekommen beide 8 Jahre<br />
U 2<br />
gestehen schweigen<br />
U 1<br />
gestehen 8, 8 0, 10<br />
schweigen 10, 0 2, 2<br />
14 / 22
Dominante Strategie<br />
Strategie x d 1<br />
heißt dominant, wenn<br />
und es gibt ein x 2 :<br />
Π 1 (x d 1 , x 2 ) ≥ Π 1 (x 1 , x 2 ) ∀x 1 ≠ x d 1 , ∀x 2 ,<br />
Π 1 (x d 1 , x 2 ) > Π 1 (x 1 , x 2 ) ∀x 1 ≠ x d 1 .<br />
Strategie x d 1<br />
heißt streng dominant, wenn<br />
Π 1 (x d 1 , x 2 ) > Π 1 (x 1 , x 2 ) ∀x 1 ≠ x d 1 , ∀x 2 .<br />
Strategien x 1 ≠ x d 1<br />
heißen dominierte Strategien.<br />
Im Prisoner’s Dilemma: niedrig (gestehen) ist streng dominant,<br />
hoch (nicht gestehen) ist dominiert.<br />
15 / 22
Nash-Gleichgewicht<br />
Wenn es keine dominanten Strategien gibt (z.B. Hasenfußpiel),<br />
dann hilft Nash-Gleichgewicht bei Gleichgewichtslösung;<br />
Strategiekombination, bei der niemand einen Anreiz hat,<br />
abzuweichen;<br />
Definition: (x1 N, x 2 N ) ist ein NG falls<br />
Π 1 (x N 1 , x N 2 ) ≥ Π 1 (x 1 , x N 2 )<br />
Π 2 (x N 1 , x N 2 ) ≥ Π 2 (x N 1 , x 2 ) ∀x 2 .<br />
∀x 1 , und<br />
16 / 22
Nash-Gleichgewicht<br />
Methode zum Auffinden eines Nash-Gleichgewichts:<br />
1. suche alle besten Antworten auf alle möglichen<br />
Strategiewahlen der Gegner<br />
2. suche Strategiekombinationen, die mit allen besten Antworten<br />
vereinbar sind<br />
beste Antworten heißen auch Reaktionskorrespondenz oder<br />
Reaktionsfunktion (auch wenn sie simultan sind); z.B.:<br />
x R 1 (x 2 ) = arg max<br />
x 1<br />
Π 1 (x 1 , x 2 )<br />
Eine Mengenkombination (x1 N, x 2 N) ist ein NG wenn x 1 N ∈ x 1 R(x 2 N)<br />
und x2<br />
N ∈ x 2 R(x 1 N ). Bei Eindeutigkeit kann ∈ durch = ersetzt<br />
werden.<br />
17 / 22
Auffinden des NG im Hasenfußpiel<br />
wenig<br />
U 2<br />
viel<br />
U 1<br />
wenig 100, 100 25, 150<br />
viel 150, 25 -10, -10<br />
◮ beste Antwort für U1 wenn U2 wenig: viel<br />
◮ beste Antwort für U1 wenn U2 viel: wenig<br />
◮ beste Antwort für U2 wenn U1 wenig: viel<br />
◮ beste Antwort für U2 wenn U1 viel: wenig<br />
beide besten Antworten sind vereinbar miteinander; es gibt zwei<br />
NG, aber es ist ungewiß, welches der beiden beobachtet werden<br />
wird<br />
18 / 22
Mehr-Personen-Spiele in extensiver Form<br />
bisher: simultane Entscheidungen; bei sequentiellen<br />
Entscheidungen ist die Formulierung in extensiver Form nötig, die<br />
angibt, welcher Spieler wann am Zug ist (und was er dann über die<br />
vorherigen Spielzüge weiß)<br />
Bsp.: Markteintrittsspiel, oder Eintrittsabschreckung, mit 2 Stufen<br />
(oder 2 Zeitpunkten): ein Monopolist bedient einen Markt, hat<br />
Profit von 5; Konkurrent überlegt, ob sich Eintritt lohnt; wenn<br />
Monopolist Eintritt akzeptiert, setzen sie gemeinsam einen<br />
profitablen Preis (friedlich); Monopolist kann aber auch einen<br />
Preiskrieg beginnen, beide haben einen Gewinn von -1; wenn kein<br />
Eintritt erfolgt, gibt es keinen Preiskrieg; Abfolge:<br />
1: Unternehmen 1 entscheidet über Eintritt/Nicht-Eintritt<br />
2: Unternehmen 2 ( ”<br />
Etablierter”, incumbent) entscheidet<br />
zwischen ”<br />
aggressivem” und ”<br />
friedlichem” Verhalten<br />
Kann der Monopolist den Eintritt durch Drohung verhindern<br />
19 / 22
Mehr-Personen-Spiele in extensiver Form<br />
Darstellung der extensiven Form mit Hilfe eines Spielbaums:<br />
Spiel besteht aus Teilspielen; jedes Spiel hat sich selbst als<br />
Teilspiel; Strategiekombination ist ein teilspielperfektes NG wenn<br />
es für alle Teilspiele ein NG ist;<br />
Strategiekombination: eine S. für einen Spieler gibt für jeden<br />
Knoten an, wie er sich an diesem Knoten verhalten soll bzw. wird;<br />
auch für Knoten, die wegen Nicht-Teilspielperfektheit nicht<br />
erreichbar sind;<br />
20 / 22
Mehr-Personen-Spiele in extensiver Form<br />
Lösungsmöglichkeit: Rückwärtsinduktion<br />
1. löse alle Teilspiele der letzten Stufe<br />
2. löse alle Teilspiele der vorletzten Stufe: gegeben das Resultat<br />
der letzten Stufe, suche nach dem besten Resultat, das auf<br />
der vorletzten Stufe erreichbar ist; nur Auszahlungen, die auf<br />
jeder Stufe eine b.A. sind, sind erreichbar<br />
. . .<br />
n. löse das erste Teilspiel; gegeben das optimale Verhalten auf<br />
allen nachfolgendenden Stufen, wähle den besten Zug auf der<br />
ersten Stufe<br />
daher: nur (tritt ein, friedlich) ist ein NG<br />
ist die Drohung von U2: ”<br />
wenn du eintrittst, dann werde ich<br />
aggressiv” glaubwürdig<br />
nein, da es auf Stufe 2 kein NG ist; Teilspielperfektheit entlarvt<br />
” leere Drohungen” 21 / 22
Beschreibung in extensiver Form<br />
Elemente des Spielbaums:<br />
◮ das Spiel beginnt mit einem eindeutigen Anfangsknoten und<br />
endet an den Endknoten, welche die Auszahlungen der Spieler<br />
angeben<br />
◮ alle Knoten außer den Endknoten sind Entscheidungsknoten,<br />
an denen einer der Spieler eine Aktion wählt<br />
◮ die einzelnen Knoten befinden sich in einer Reihenfolge,<br />
welche die zeitliche Struktur des Spieles beschreibt<br />
◮ an jedem Knoten trifft ein Spieler eine Entscheidung, und<br />
durch dessen Entscheidung wird der nächste Knoten erreicht<br />
22 / 22