Gemischte Strategien (1)
Gemischte Strategien (1)
Gemischte Strategien (1)
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
(zu 4.1 Reine/gemischte <strong>Strategien</strong>)<br />
<strong>Gemischte</strong> <strong>Strategien</strong> (1)<br />
• Zurück zu „Schnick-Schnack-Schnuck“:<br />
Bart<br />
Stein Papier Schere<br />
Stein 0 , 0 -1 , 1 1 , -1<br />
Papier 1 , -1 0 , 0 -1 , 1<br />
Schere -1 , 1 1 , -1 0 , 0<br />
• Gut wäre eine unvorhersehbare Strategie,<br />
z. B. eine Strategie, die zufällig eine der reinen<br />
<strong>Strategien</strong> (Stein, Papier, Schere) auswählt,<br />
also eine „gemischte Strategie“:<br />
Lisa
<strong>Gemischte</strong> <strong>Strategien</strong> (2)<br />
• Definition: Eine gemischte Strategie ist eine<br />
Wahrscheinlichkeitsverteilung über die<br />
reinen <strong>Strategien</strong><br />
• Der Spieler wählt hier nicht die zu spielende<br />
Strategie selbst, sondern nur die<br />
Wahrscheinlichkeiten für die reinen<br />
<strong>Strategien</strong><br />
• Das tatsächliche Ergebnis überlässt er einem<br />
Zufallsmechanismus, der die tatsächlich<br />
gespielte Strategie bestimmt<br />
(Quelle: Rieck S. 79)
Polizistin und Drogenhändler (1)<br />
• Ein Drogenhändler betreibt sein Geschäft entweder an<br />
einer Straßenecke oder im Park.<br />
• Jeden Tag entscheidet er, ob Straße oder Park;<br />
unter den Kunden spricht sich das herum;<br />
die Polizistin bekommt davon nichts mit<br />
• Die Polizistin muss jeden Tag entscheiden, ob sie auf den<br />
Straßen oder im Park patrouilliert<br />
• Ohne Eingreifen der Polizei werden täglich 100 Drogen-<br />
Geschäfte abgewickelt<br />
• Die Auszahlung für den Drogenhändler ist die Anzahl a der<br />
Drogengeschäfte, die er abwickelt<br />
• Die Auszahlung für die Polizistin ist die Anzahl der Drogen-<br />
Geschäfte, die sie verhindert (100 – a)
Polizistin und Drogenhändler (2)<br />
Händler<br />
Polizistin<br />
Straßen Park<br />
Straßen 80 , 20 0 , 100<br />
Park 10 , 90 60 , 40<br />
-Wenn beide im Park sind, verhindert die Polizistin 60 Geschäfte; der Park ist zu groß,<br />
um alle Geschäfte zu verhindern (40)<br />
-Wenn der Händler im Park logiert und die Polizistin nur auf den Straßen<br />
patrouilliert, laufen alle Geschäfte (100); keines wird verhindert (0)<br />
-Wenn die Polizistin die Straßen abgeht und der Händler an einer der Straßenecken<br />
ist, verhindert sie 80 Geschäfte; nur 20 laufen noch<br />
-Wenn die Polizistin im Park Streife geht und der Händler an einer der Straßenecken<br />
anbietet, laufen fast alle Geschäfte (90); 10 werden durch vorbeifahrende<br />
Streifenwägen verhindert
Polizistin und Drogenhändler (3)<br />
• In diesem Spiel gibt es kein Nash-Gleichgewicht:<br />
• Wenn der Händler sich für den Park entscheidet,<br />
dann zieht‘s die Polizistin auch dahin; schlecht für<br />
den Händler, der sich dann an eine Straßenecke<br />
absetzt, …<br />
• Wenn die Polizistin im Park erwartet wird, verzieht<br />
sich der Händler am besten an eine der<br />
Straßenecken; schlecht für die Polizistin, die dann<br />
raus auf die Straßen geht, …<br />
• Es gibt keine „stabile“ Situation, in der keiner<br />
einen Anreiz hätte, abzuweichen!
Polizistin und Drogenhändler (4)<br />
• Beide sind sozusagen „auf der Flucht“<br />
• Jeder der beiden täte besser daran, eine „location“ zu<br />
wählen, mit welcher der/die andere nicht sicher<br />
rechnen kann<br />
• Z. B. könnte der Händler öfter seinen Platz wechseln.<br />
Aber nach welchem Schema?<br />
• Und wie könnte die Polizistin darauf reagieren?<br />
• Solche Fragen versucht man, mit „gemischten<br />
<strong>Strategien</strong>“ zu beantworten<br />
• Wir wissen bereits, dass dort Wahrscheinlichkeiten<br />
eine Rolle spielen, und dass die Auszahlungen als<br />
Erwartungswerte anzusetzen sind
Polizistin und Drogenhändler (5)<br />
• Um eine Lösung abzuleiten, wenn beide Spieler gemischte<br />
<strong>Strategien</strong> verwenden, müssen wir das Spiel neu<br />
definieren:<br />
• Polizistin und Händler haben je 2 reine <strong>Strategien</strong> (Straßen,<br />
Park)<br />
• Beide haben die Option, ihre reinen <strong>Strategien</strong> zu mischen<br />
• In diesem Spiel sei eine gemischte Strategie eine Zahl<br />
zwischen 0 und 1, wobei diese Zahl die Wahrscheinlichkeit<br />
der Strategie „Straßen“ ist<br />
• Für die Polizistin sei p die Wahrscheinlichkeit, dass sie auf<br />
den Straßen patrouilliert, (1 – p) dass sie im Park ist<br />
• Für den Händler sei d die Wahrscheinlichkeit, dass er<br />
„Straßen“ wählt, (1 – d), dass er im Park ist
Polizistin und Drogenhändler (6)<br />
Angenommen, der Händler entscheidet sich mit der Wahrscheinlichkeit d für „Straßen“.<br />
Wenn die Polizistin mit der Wahrscheinlichkeit p auf den Straßen patrouilliert, ergibt sich<br />
die erwartete Auszahlung V für die Polizistin mit:<br />
VPO(p,d) = p*d*80 + p*(1-d)*0 + (1-p)*d*10 + (1-p)+(1-d)*60 = 60 – 60 p – 50 d + 130 pd<br />
Für den Händler (Drug Dealer) ergibt sich:<br />
VDD(p,d) = p*d*20 + p*(1-d)*100 + (1-p)*d*90 + (1-p)+(1-d)*40 = 40 + 60 p + 50 d – 130 pd
Polizistin und Drogenhändler (7)<br />
• Was haben wir von dieser komplizierten Transformation?<br />
• Wir können immer ein Nash-Gleichgewicht ableiten, auch<br />
wenn das Originalspiel mit reinen <strong>Strategien</strong> keines hat!<br />
• Dazu bilden wir die erwartete Auszahlung für die Polizistin<br />
aus ihren beiden reinen <strong>Strategien</strong> ab, in Abhängigkeit von<br />
d (der gemischten Strategie des Händlers)<br />
• Zu beachten: Eine reine Strategie ist nur ein Spezialfall<br />
einer gemischten Strategie; die reine Strategie „Straßen“<br />
entspricht der Bedingung p=1, die reine Strategie „Park“<br />
der Bedingung p=0<br />
• In diesem Fall sind:<br />
VPO(1,d) = 60 – 60 – 50 d + 130 d = 80 d (bei „Straßen“)<br />
VPO (0,d) = 60 – 50 d<br />
(bei „Park“)
Polizistin und Drogenhändler (8)<br />
Erwartete Auszahlungen VPO an die Polizistin<br />
„Straßen“<br />
„Park“
Polizistin und Drogenhändler (9)<br />
Beste Antwort (Best Reply) der Polizistin
Polizistin und Drogenhändler (10)<br />
Nash-Gleichgewicht in gemischten <strong>Strategien</strong>
Polizistin und Drogenhändler (11)<br />
• VPO(p,d) = p*d*80 + p*(1-d)*0 + (1-p)*d*10 + (1-p)*(1-d)*60<br />
• VDD(p,d) = p*d*20 + p*(1-d)*100 + (1-p)*d*90 + (1-p)*(1-d)*40<br />
• Wenn wir p = 5/13 und d = 6/13 setzen, ergibt sich<br />
für die Auszahlung VPO an die Polizistin:<br />
5/13*6/13*80 + 5/13*7/13*0 + 8/13*6/13*10 + 8/13*7/13*60 =<br />
30/169*80 + 35/169*0 + 48/169*10 + 56/169*60 =<br />
14,2 + 2,8 + 19,9 =<br />
36,9<br />
für die Auszahlung VDD an den Händler:<br />
30/169*20 + 35/169*100 + 48/169*90 + 56/169*40 =<br />
3,6 + 20,7 + 25,6 + 13,3 =<br />
63,2
Ermittlung des Nash-Gleichgewicht in gemischten <strong>Strategien</strong><br />
Wie sind wir gerade eben beim Bi-Matrix-Spiel vorgegangen?<br />
1. Auf die reinen <strong>Strategien</strong> des Originalspiels Wahrscheinlichkeiten<br />
aufsetzen:<br />
Polizistin<br />
Straßen (d)<br />
Händler<br />
Park (1-d)<br />
Straßen (p) 80 , 20 0 , 100<br />
Park (1-p) 10 , 90 60 , 40<br />
2. Erwartete Auszahlung an die Polizistin in Abhängigkeit von d für<br />
ihre reine Strategie „Straßen“ (p=1) bilden<br />
3. Erwartete Auszahlung an die Polizistin in Abhängigkeit von d für<br />
ihre reine Strategie „Park“ (p=0) bilden<br />
4. Durch Gleichsetzen der Auszahlungen in 2. und 3. die<br />
Gleichgewichts-Wahrscheinlichkeit d* für den Händler ermitteln<br />
5. Analog: Gleichgewichts-Wahrscheinlichkeit p* für die Polizistin<br />
6. Auf Basis von p* und d*: Erwartete Auszahlungen errechnen
Zu einigen Eigenschaften des Nash-Gleichgewichts<br />
in gemischten <strong>Strategien</strong> (1)<br />
• Dass der Händler seine Strategie unvorhersehbar<br />
macht, indem er mischt (6/13<br />
„Straßen“, 7/13 „Park“), erscheint rational<br />
• Dass er dazu irgendeinen Zufallsgenerator<br />
einschaltet, der festlegt, was er an einem Tag<br />
macht, leuchtet weniger ein<br />
• Wie kann z. B. ein Münz-Wurf das optimale<br />
Verhalten aufzeigen?
Einige Eigenschaften des Nash-Gleichgewichts<br />
in gemischten <strong>Strategien</strong> (2)<br />
• Allgemein ist ein Zufallsgenerator nicht die beste<br />
Lösung, eine Entscheidung zu treffen<br />
• Aber ihn nutzen, um Strategie-Optionen auszuwählen,<br />
zwischen denen man indifferent ist, das ist perfekt<br />
rational<br />
• Wenn z. B. „Straßen“ und „Park“ für den Händler die<br />
gleiche Auszahlung erbringen, dann kann er locker den<br />
Zufall entscheiden lassen<br />
• Das ist genau die Situation im Nash-Gleichgewicht mit<br />
gemischten <strong>Strategien</strong>; das haben wir auch bei der<br />
grafischen Ableitung des Gleichgewichts ausgenutzt
Einige Eigenschaften des Nash-Gleichgewichts<br />
in gemischten <strong>Strategien</strong> (3)<br />
• Angenommen, die Polizistin patrouilliert zu p=5/13 auf den<br />
Straßen,<br />
H<br />
P<br />
5/13<br />
8/13<br />
Straßen (d)<br />
Park (1-d)<br />
Straßen 80 , 20 0 , 100<br />
Park 10 , 90 60 , 40<br />
dann hat der Händler bei seinen beiden reinen <strong>Strategien</strong> diese<br />
Auszahlungen:<br />
„Straßen“: 5/13*20 + 8/13*90 = 820/13<br />
„Park“: 5/13*100 + 8/13*40 = 820/13<br />
• So ist es für den Händler auch optimal, sich mit d=6/13 (oder<br />
irgendeinem anderen d) an einer der Straßenecken einzufinden
Einige Eigenschaften des Nash-Gleichgewichts<br />
in gemischten <strong>Strategien</strong> (4)<br />
• Wenn es optimal ist, zwischen einer Menge von reinen<br />
<strong>Strategien</strong> zu mischen, dann muss ein Spieler die gleiche<br />
erwartete Auszahlung aus den reinen <strong>Strategien</strong><br />
bekommen<br />
• Wenn z. B. der Händler mischt, dann muss die Polizistin<br />
so mischen, dass der Händler indifferent bzgl. seiner<br />
Optionen wird<br />
• Die Gleichgewichts-Strategie für die Polizistin ist daher der<br />
Wert von p, bei dem die erwarteten Auszahlungen des<br />
Händlers aus seinen reinen <strong>Strategien</strong> gleich sind:<br />
p*20 + (1-p)*90 = p*100 + (1-p)*40 p = 5/13<br />
• Damit haben wir ein elegantes Verfahren zur Ermittlung<br />
des Nash-Gleichgewichts in gemischten <strong>Strategien</strong>
Einige Eigenschaften des Nash-Gleichgewichts<br />
in gemischten <strong>Strategien</strong> (5)<br />
• Bemerkenswert:<br />
Wir nutzen die erwarteten Auszahlungen<br />
an die Polizistin, um die Gleichgewichts-<br />
Strategie des Händlers zu bestimmen<br />
(und umgekehrt)
Einige Eigenschaften des Nash-Gleichgewichts<br />
in gemischten <strong>Strategien</strong> (6)<br />
• Ein „Trick“ zur Entrümpelung des Spiels:<br />
Bevor man in die aufwendige Berechnung des<br />
Nash-Gleichgewichts in gemischten <strong>Strategien</strong><br />
einsteigt, erst mal mit IDSDS alle strikt<br />
dominierten reinen <strong>Strategien</strong> eliminieren<br />
• Strikt dominierten <strong>Strategien</strong> würde bei der<br />
Ableitung des Nash-Gleichgewichts eine<br />
Wahrscheinlichkeit von 0 zugeordnet werden;<br />
sie würden damit keine Rolle spielen
Nachsatz zum Nash-Gleichgewicht<br />
(Quelle: Harrington S. 191)<br />
• „Jedes endliche Spiel hat ein Nash-<br />
Gleichgewicht in gemischten <strong>Strategien</strong>“<br />
(John Nash)<br />
• „In fast allen endlichen Spielen gibt es eine<br />
endliche ungerade Anzahl von Nash-<br />
Gleichgewichten in gemischten <strong>Strategien</strong>“<br />
(Robert Wilson)
Übung (1)<br />
Finden Sie ein Nash-Gleichgewicht in gemischten <strong>Strategien</strong><br />
und berechnen Sie die erwarteten Auszahlungen<br />
(Quelle: Harrington S. 191)<br />
Spaltenspieler<br />
Zeilenspieler<br />
Links Rechts<br />
Oben 8 , 2 1 , 6<br />
Unten 3 , 5 4 , 1