30.12.2013 Aufrufe

Gemischte Strategien (1)

Gemischte Strategien (1)

Gemischte Strategien (1)

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

(zu 4.1 Reine/gemischte <strong>Strategien</strong>)<br />

<strong>Gemischte</strong> <strong>Strategien</strong> (1)<br />

• Zurück zu „Schnick-Schnack-Schnuck“:<br />

Bart<br />

Stein Papier Schere<br />

Stein 0 , 0 -1 , 1 1 , -1<br />

Papier 1 , -1 0 , 0 -1 , 1<br />

Schere -1 , 1 1 , -1 0 , 0<br />

• Gut wäre eine unvorhersehbare Strategie,<br />

z. B. eine Strategie, die zufällig eine der reinen<br />

<strong>Strategien</strong> (Stein, Papier, Schere) auswählt,<br />

also eine „gemischte Strategie“:<br />

Lisa


<strong>Gemischte</strong> <strong>Strategien</strong> (2)<br />

• Definition: Eine gemischte Strategie ist eine<br />

Wahrscheinlichkeitsverteilung über die<br />

reinen <strong>Strategien</strong><br />

• Der Spieler wählt hier nicht die zu spielende<br />

Strategie selbst, sondern nur die<br />

Wahrscheinlichkeiten für die reinen<br />

<strong>Strategien</strong><br />

• Das tatsächliche Ergebnis überlässt er einem<br />

Zufallsmechanismus, der die tatsächlich<br />

gespielte Strategie bestimmt<br />

(Quelle: Rieck S. 79)


Polizistin und Drogenhändler (1)<br />

• Ein Drogenhändler betreibt sein Geschäft entweder an<br />

einer Straßenecke oder im Park.<br />

• Jeden Tag entscheidet er, ob Straße oder Park;<br />

unter den Kunden spricht sich das herum;<br />

die Polizistin bekommt davon nichts mit<br />

• Die Polizistin muss jeden Tag entscheiden, ob sie auf den<br />

Straßen oder im Park patrouilliert<br />

• Ohne Eingreifen der Polizei werden täglich 100 Drogen-<br />

Geschäfte abgewickelt<br />

• Die Auszahlung für den Drogenhändler ist die Anzahl a der<br />

Drogengeschäfte, die er abwickelt<br />

• Die Auszahlung für die Polizistin ist die Anzahl der Drogen-<br />

Geschäfte, die sie verhindert (100 – a)


Polizistin und Drogenhändler (2)<br />

Händler<br />

Polizistin<br />

Straßen Park<br />

Straßen 80 , 20 0 , 100<br />

Park 10 , 90 60 , 40<br />

-Wenn beide im Park sind, verhindert die Polizistin 60 Geschäfte; der Park ist zu groß,<br />

um alle Geschäfte zu verhindern (40)<br />

-Wenn der Händler im Park logiert und die Polizistin nur auf den Straßen<br />

patrouilliert, laufen alle Geschäfte (100); keines wird verhindert (0)<br />

-Wenn die Polizistin die Straßen abgeht und der Händler an einer der Straßenecken<br />

ist, verhindert sie 80 Geschäfte; nur 20 laufen noch<br />

-Wenn die Polizistin im Park Streife geht und der Händler an einer der Straßenecken<br />

anbietet, laufen fast alle Geschäfte (90); 10 werden durch vorbeifahrende<br />

Streifenwägen verhindert


Polizistin und Drogenhändler (3)<br />

• In diesem Spiel gibt es kein Nash-Gleichgewicht:<br />

• Wenn der Händler sich für den Park entscheidet,<br />

dann zieht‘s die Polizistin auch dahin; schlecht für<br />

den Händler, der sich dann an eine Straßenecke<br />

absetzt, …<br />

• Wenn die Polizistin im Park erwartet wird, verzieht<br />

sich der Händler am besten an eine der<br />

Straßenecken; schlecht für die Polizistin, die dann<br />

raus auf die Straßen geht, …<br />

• Es gibt keine „stabile“ Situation, in der keiner<br />

einen Anreiz hätte, abzuweichen!


Polizistin und Drogenhändler (4)<br />

• Beide sind sozusagen „auf der Flucht“<br />

• Jeder der beiden täte besser daran, eine „location“ zu<br />

wählen, mit welcher der/die andere nicht sicher<br />

rechnen kann<br />

• Z. B. könnte der Händler öfter seinen Platz wechseln.<br />

Aber nach welchem Schema?<br />

• Und wie könnte die Polizistin darauf reagieren?<br />

• Solche Fragen versucht man, mit „gemischten<br />

<strong>Strategien</strong>“ zu beantworten<br />

• Wir wissen bereits, dass dort Wahrscheinlichkeiten<br />

eine Rolle spielen, und dass die Auszahlungen als<br />

Erwartungswerte anzusetzen sind


Polizistin und Drogenhändler (5)<br />

• Um eine Lösung abzuleiten, wenn beide Spieler gemischte<br />

<strong>Strategien</strong> verwenden, müssen wir das Spiel neu<br />

definieren:<br />

• Polizistin und Händler haben je 2 reine <strong>Strategien</strong> (Straßen,<br />

Park)<br />

• Beide haben die Option, ihre reinen <strong>Strategien</strong> zu mischen<br />

• In diesem Spiel sei eine gemischte Strategie eine Zahl<br />

zwischen 0 und 1, wobei diese Zahl die Wahrscheinlichkeit<br />

der Strategie „Straßen“ ist<br />

• Für die Polizistin sei p die Wahrscheinlichkeit, dass sie auf<br />

den Straßen patrouilliert, (1 – p) dass sie im Park ist<br />

• Für den Händler sei d die Wahrscheinlichkeit, dass er<br />

„Straßen“ wählt, (1 – d), dass er im Park ist


Polizistin und Drogenhändler (6)<br />

Angenommen, der Händler entscheidet sich mit der Wahrscheinlichkeit d für „Straßen“.<br />

Wenn die Polizistin mit der Wahrscheinlichkeit p auf den Straßen patrouilliert, ergibt sich<br />

die erwartete Auszahlung V für die Polizistin mit:<br />

VPO(p,d) = p*d*80 + p*(1-d)*0 + (1-p)*d*10 + (1-p)+(1-d)*60 = 60 – 60 p – 50 d + 130 pd<br />

Für den Händler (Drug Dealer) ergibt sich:<br />

VDD(p,d) = p*d*20 + p*(1-d)*100 + (1-p)*d*90 + (1-p)+(1-d)*40 = 40 + 60 p + 50 d – 130 pd


Polizistin und Drogenhändler (7)<br />

• Was haben wir von dieser komplizierten Transformation?<br />

• Wir können immer ein Nash-Gleichgewicht ableiten, auch<br />

wenn das Originalspiel mit reinen <strong>Strategien</strong> keines hat!<br />

• Dazu bilden wir die erwartete Auszahlung für die Polizistin<br />

aus ihren beiden reinen <strong>Strategien</strong> ab, in Abhängigkeit von<br />

d (der gemischten Strategie des Händlers)<br />

• Zu beachten: Eine reine Strategie ist nur ein Spezialfall<br />

einer gemischten Strategie; die reine Strategie „Straßen“<br />

entspricht der Bedingung p=1, die reine Strategie „Park“<br />

der Bedingung p=0<br />

• In diesem Fall sind:<br />

VPO(1,d) = 60 – 60 – 50 d + 130 d = 80 d (bei „Straßen“)<br />

VPO (0,d) = 60 – 50 d<br />

(bei „Park“)


Polizistin und Drogenhändler (8)<br />

Erwartete Auszahlungen VPO an die Polizistin<br />

„Straßen“<br />

„Park“


Polizistin und Drogenhändler (9)<br />

Beste Antwort (Best Reply) der Polizistin


Polizistin und Drogenhändler (10)<br />

Nash-Gleichgewicht in gemischten <strong>Strategien</strong>


Polizistin und Drogenhändler (11)<br />

• VPO(p,d) = p*d*80 + p*(1-d)*0 + (1-p)*d*10 + (1-p)*(1-d)*60<br />

• VDD(p,d) = p*d*20 + p*(1-d)*100 + (1-p)*d*90 + (1-p)*(1-d)*40<br />

• Wenn wir p = 5/13 und d = 6/13 setzen, ergibt sich<br />

für die Auszahlung VPO an die Polizistin:<br />

5/13*6/13*80 + 5/13*7/13*0 + 8/13*6/13*10 + 8/13*7/13*60 =<br />

30/169*80 + 35/169*0 + 48/169*10 + 56/169*60 =<br />

14,2 + 2,8 + 19,9 =<br />

36,9<br />

für die Auszahlung VDD an den Händler:<br />

30/169*20 + 35/169*100 + 48/169*90 + 56/169*40 =<br />

3,6 + 20,7 + 25,6 + 13,3 =<br />

63,2


Ermittlung des Nash-Gleichgewicht in gemischten <strong>Strategien</strong><br />

Wie sind wir gerade eben beim Bi-Matrix-Spiel vorgegangen?<br />

1. Auf die reinen <strong>Strategien</strong> des Originalspiels Wahrscheinlichkeiten<br />

aufsetzen:<br />

Polizistin<br />

Straßen (d)<br />

Händler<br />

Park (1-d)<br />

Straßen (p) 80 , 20 0 , 100<br />

Park (1-p) 10 , 90 60 , 40<br />

2. Erwartete Auszahlung an die Polizistin in Abhängigkeit von d für<br />

ihre reine Strategie „Straßen“ (p=1) bilden<br />

3. Erwartete Auszahlung an die Polizistin in Abhängigkeit von d für<br />

ihre reine Strategie „Park“ (p=0) bilden<br />

4. Durch Gleichsetzen der Auszahlungen in 2. und 3. die<br />

Gleichgewichts-Wahrscheinlichkeit d* für den Händler ermitteln<br />

5. Analog: Gleichgewichts-Wahrscheinlichkeit p* für die Polizistin<br />

6. Auf Basis von p* und d*: Erwartete Auszahlungen errechnen


Zu einigen Eigenschaften des Nash-Gleichgewichts<br />

in gemischten <strong>Strategien</strong> (1)<br />

• Dass der Händler seine Strategie unvorhersehbar<br />

macht, indem er mischt (6/13<br />

„Straßen“, 7/13 „Park“), erscheint rational<br />

• Dass er dazu irgendeinen Zufallsgenerator<br />

einschaltet, der festlegt, was er an einem Tag<br />

macht, leuchtet weniger ein<br />

• Wie kann z. B. ein Münz-Wurf das optimale<br />

Verhalten aufzeigen?


Einige Eigenschaften des Nash-Gleichgewichts<br />

in gemischten <strong>Strategien</strong> (2)<br />

• Allgemein ist ein Zufallsgenerator nicht die beste<br />

Lösung, eine Entscheidung zu treffen<br />

• Aber ihn nutzen, um Strategie-Optionen auszuwählen,<br />

zwischen denen man indifferent ist, das ist perfekt<br />

rational<br />

• Wenn z. B. „Straßen“ und „Park“ für den Händler die<br />

gleiche Auszahlung erbringen, dann kann er locker den<br />

Zufall entscheiden lassen<br />

• Das ist genau die Situation im Nash-Gleichgewicht mit<br />

gemischten <strong>Strategien</strong>; das haben wir auch bei der<br />

grafischen Ableitung des Gleichgewichts ausgenutzt


Einige Eigenschaften des Nash-Gleichgewichts<br />

in gemischten <strong>Strategien</strong> (3)<br />

• Angenommen, die Polizistin patrouilliert zu p=5/13 auf den<br />

Straßen,<br />

H<br />

P<br />

5/13<br />

8/13<br />

Straßen (d)<br />

Park (1-d)<br />

Straßen 80 , 20 0 , 100<br />

Park 10 , 90 60 , 40<br />

dann hat der Händler bei seinen beiden reinen <strong>Strategien</strong> diese<br />

Auszahlungen:<br />

„Straßen“: 5/13*20 + 8/13*90 = 820/13<br />

„Park“: 5/13*100 + 8/13*40 = 820/13<br />

• So ist es für den Händler auch optimal, sich mit d=6/13 (oder<br />

irgendeinem anderen d) an einer der Straßenecken einzufinden


Einige Eigenschaften des Nash-Gleichgewichts<br />

in gemischten <strong>Strategien</strong> (4)<br />

• Wenn es optimal ist, zwischen einer Menge von reinen<br />

<strong>Strategien</strong> zu mischen, dann muss ein Spieler die gleiche<br />

erwartete Auszahlung aus den reinen <strong>Strategien</strong><br />

bekommen<br />

• Wenn z. B. der Händler mischt, dann muss die Polizistin<br />

so mischen, dass der Händler indifferent bzgl. seiner<br />

Optionen wird<br />

• Die Gleichgewichts-Strategie für die Polizistin ist daher der<br />

Wert von p, bei dem die erwarteten Auszahlungen des<br />

Händlers aus seinen reinen <strong>Strategien</strong> gleich sind:<br />

p*20 + (1-p)*90 = p*100 + (1-p)*40 p = 5/13<br />

• Damit haben wir ein elegantes Verfahren zur Ermittlung<br />

des Nash-Gleichgewichts in gemischten <strong>Strategien</strong>


Einige Eigenschaften des Nash-Gleichgewichts<br />

in gemischten <strong>Strategien</strong> (5)<br />

• Bemerkenswert:<br />

Wir nutzen die erwarteten Auszahlungen<br />

an die Polizistin, um die Gleichgewichts-<br />

Strategie des Händlers zu bestimmen<br />

(und umgekehrt)


Einige Eigenschaften des Nash-Gleichgewichts<br />

in gemischten <strong>Strategien</strong> (6)<br />

• Ein „Trick“ zur Entrümpelung des Spiels:<br />

Bevor man in die aufwendige Berechnung des<br />

Nash-Gleichgewichts in gemischten <strong>Strategien</strong><br />

einsteigt, erst mal mit IDSDS alle strikt<br />

dominierten reinen <strong>Strategien</strong> eliminieren<br />

• Strikt dominierten <strong>Strategien</strong> würde bei der<br />

Ableitung des Nash-Gleichgewichts eine<br />

Wahrscheinlichkeit von 0 zugeordnet werden;<br />

sie würden damit keine Rolle spielen


Nachsatz zum Nash-Gleichgewicht<br />

(Quelle: Harrington S. 191)<br />

• „Jedes endliche Spiel hat ein Nash-<br />

Gleichgewicht in gemischten <strong>Strategien</strong>“<br />

(John Nash)<br />

• „In fast allen endlichen Spielen gibt es eine<br />

endliche ungerade Anzahl von Nash-<br />

Gleichgewichten in gemischten <strong>Strategien</strong>“<br />

(Robert Wilson)


Übung (1)<br />

Finden Sie ein Nash-Gleichgewicht in gemischten <strong>Strategien</strong><br />

und berechnen Sie die erwarteten Auszahlungen<br />

(Quelle: Harrington S. 191)<br />

Spaltenspieler<br />

Zeilenspieler<br />

Links Rechts<br />

Oben 8 , 2 1 , 6<br />

Unten 3 , 5 4 , 1

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!