Gemischte Strategien (1)

(zu 4.1 Reine/gemischte Strategien) 

Gemischte Strategien (1) 

• Zurück zu „Schnick-Schnack-Schnuck“: 

Bart 

Stein Papier Schere 

Stein 0 , 0 -1 , 1 1 , -1 

Papier 1 , -1 0 , 0 -1 , 1 

Schere -1 , 1 1 , -1 0 , 0 

• Gut wäre eine unvorhersehbare Strategie, 

z. B. eine Strategie, die zufällig eine der reinen 

Strategien (Stein, Papier, Schere) auswählt, 

also eine „gemischte Strategie“: 

Lisa

Gemischte Strategien (2) 

• Definition: Eine gemischte Strategie ist eine 

Wahrscheinlichkeitsverteilung über die 

reinen Strategien 

• Der Spieler wählt hier nicht die zu spielende 

Strategie selbst, sondern nur die 

Wahrscheinlichkeiten für die reinen 

Strategien 

• Das tatsächliche Ergebnis überlässt er einem 

Zufallsmechanismus, der die tatsächlich 

gespielte Strategie bestimmt 

(Quelle: Rieck S. 79)

Polizistin und Drogenhändler (1) 

• Ein Drogenhändler betreibt sein Geschäft entweder an 

einer Straßenecke oder im Park. 

• Jeden Tag entscheidet er, ob Straße oder Park; 

unter den Kunden spricht sich das herum; 

die Polizistin bekommt davon nichts mit 

• Die Polizistin muss jeden Tag entscheiden, ob sie auf den 

Straßen oder im Park patrouilliert 

• Ohne Eingreifen der Polizei werden täglich 100 Drogen- 

Geschäfte abgewickelt 

• Die Auszahlung für den Drogenhändler ist die Anzahl a der 

Drogengeschäfte, die er abwickelt 

• Die Auszahlung für die Polizistin ist die Anzahl der Drogen- 

Geschäfte, die sie verhindert (100 – a)


Händler 

Polizistin 

Straßen Park 

Straßen 80 , 20 0 , 100 

Park 10 , 90 60 , 40 

-Wenn beide im Park sind, verhindert die Polizistin 60 Geschäfte; der Park ist zu groß, 

um alle Geschäfte zu verhindern (40) 

-Wenn der Händler im Park logiert und die Polizistin nur auf den Straßen 

patrouilliert, laufen alle Geschäfte (100); keines wird verhindert (0) 

-Wenn die Polizistin die Straßen abgeht und der Händler an einer der Straßenecken 

ist, verhindert sie 80 Geschäfte; nur 20 laufen noch 

-Wenn die Polizistin im Park Streife geht und der Händler an einer der Straßenecken 

anbietet, laufen fast alle Geschäfte (90); 10 werden durch vorbeifahrende 

Streifenwägen verhindert


• In diesem Spiel gibt es kein Nash-Gleichgewicht: 

• Wenn der Händler sich für den Park entscheidet, 

dann zieht‘s die Polizistin auch dahin; schlecht für 

den Händler, der sich dann an eine Straßenecke 

absetzt, … 

• Wenn die Polizistin im Park erwartet wird, verzieht 

sich der Händler am besten an eine der 

Straßenecken; schlecht für die Polizistin, die dann 

raus auf die Straßen geht, … 

• Es gibt keine „stabile“ Situation, in der keiner 

einen Anreiz hätte, abzuweichen!


• Beide sind sozusagen „auf der Flucht“ 

• Jeder der beiden täte besser daran, eine „location“ zu 

wählen, mit welcher der/die andere nicht sicher 

rechnen kann 

• Z. B. könnte der Händler öfter seinen Platz wechseln. 

Aber nach welchem Schema? 

• Und wie könnte die Polizistin darauf reagieren? 

• Solche Fragen versucht man, mit „gemischten 

Strategien“ zu beantworten 

• Wir wissen bereits, dass dort Wahrscheinlichkeiten 

eine Rolle spielen, und dass die Auszahlungen als 

Erwartungswerte anzusetzen sind


• Um eine Lösung abzuleiten, wenn beide Spieler gemischte 

Strategien verwenden, müssen wir das Spiel neu 

definieren: 

• Polizistin und Händler haben je 2 reine Strategien (Straßen, 

Park) 

• Beide haben die Option, ihre reinen Strategien zu mischen 

• In diesem Spiel sei eine gemischte Strategie eine Zahl 

zwischen 0 und 1, wobei diese Zahl die Wahrscheinlichkeit 

der Strategie „Straßen“ ist 

• Für die Polizistin sei p die Wahrscheinlichkeit, dass sie auf 

den Straßen patrouilliert, (1 – p) dass sie im Park ist 

• Für den Händler sei d die Wahrscheinlichkeit, dass er 

„Straßen“ wählt, (1 – d), dass er im Park ist


Angenommen, der Händler entscheidet sich mit der Wahrscheinlichkeit d für „Straßen“. 

Wenn die Polizistin mit der Wahrscheinlichkeit p auf den Straßen patrouilliert, ergibt sich 

die erwartete Auszahlung V für die Polizistin mit: 

VPO(p,d) = p*d*80 + p*(1-d)*0 + (1-p)*d*10 + (1-p)+(1-d)*60 = 60 – 60 p – 50 d + 130 pd 

Für den Händler (Drug Dealer) ergibt sich: 

VDD(p,d) = p*d*20 + p*(1-d)*100 + (1-p)*d*90 + (1-p)+(1-d)*40 = 40 + 60 p + 50 d – 130 pd


• Was haben wir von dieser komplizierten Transformation? 

• Wir können immer ein Nash-Gleichgewicht ableiten, auch 

wenn das Originalspiel mit reinen Strategien keines hat! 

• Dazu bilden wir die erwartete Auszahlung für die Polizistin 

aus ihren beiden reinen Strategien ab, in Abhängigkeit von 

d (der gemischten Strategie des Händlers) 

• Zu beachten: Eine reine Strategie ist nur ein Spezialfall 

einer gemischten Strategie; die reine Strategie „Straßen“ 

entspricht der Bedingung p=1, die reine Strategie „Park“ 

der Bedingung p=0 

• In diesem Fall sind: 

VPO(1,d) = 60 – 60 – 50 d + 130 d = 80 d (bei „Straßen“) 

VPO (0,d) = 60 – 50 d 

(bei „Park“)


Erwartete Auszahlungen VPO an die Polizistin 

„Straßen“ 

„Park“


Beste Antwort (Best Reply) der Polizistin


Nash-Gleichgewicht in gemischten Strategien


• VPO(p,d) = p*d*80 + p*(1-d)*0 + (1-p)*d*10 + (1-p)*(1-d)*60 

• VDD(p,d) = p*d*20 + p*(1-d)*100 + (1-p)*d*90 + (1-p)*(1-d)*40 

• Wenn wir p = 5/13 und d = 6/13 setzen, ergibt sich 

für die Auszahlung VPO an die Polizistin: 

5/13*6/13*80 + 5/13*7/13*0 + 8/13*6/13*10 + 8/13*7/13*60 = 

30/169*80 + 35/169*0 + 48/169*10 + 56/169*60 = 

14,2 + 2,8 + 19,9 = 

36,9 

für die Auszahlung VDD an den Händler: 

30/169*20 + 35/169*100 + 48/169*90 + 56/169*40 = 

3,6 + 20,7 + 25,6 + 13,3 = 

63,2

Ermittlung des Nash-Gleichgewicht in gemischten Strategien 

Wie sind wir gerade eben beim Bi-Matrix-Spiel vorgegangen? 

1. Auf die reinen Strategien des Originalspiels Wahrscheinlichkeiten 

aufsetzen: 

Polizistin 

Straßen (d) 

Händler 

Park (1-d) 

Straßen (p) 80 , 20 0 , 100 

Park (1-p) 10 , 90 60 , 40 

2. Erwartete Auszahlung an die Polizistin in Abhängigkeit von d für 

ihre reine Strategie „Straßen“ (p=1) bilden 

3. Erwartete Auszahlung an die Polizistin in Abhängigkeit von d für 

ihre reine Strategie „Park“ (p=0) bilden 

4. Durch Gleichsetzen der Auszahlungen in 2. und 3. die 

Gleichgewichts-Wahrscheinlichkeit d* für den Händler ermitteln 

5. Analog: Gleichgewichts-Wahrscheinlichkeit p* für die Polizistin 

6. Auf Basis von p* und d*: Erwartete Auszahlungen errechnen

Zu einigen Eigenschaften des Nash-Gleichgewichts 

in gemischten Strategien (1) 

• Dass der Händler seine Strategie unvorhersehbar 

macht, indem er mischt (6/13 

„Straßen“, 7/13 „Park“), erscheint rational 

• Dass er dazu irgendeinen Zufallsgenerator 

einschaltet, der festlegt, was er an einem Tag 

macht, leuchtet weniger ein 

• Wie kann z. B. ein Münz-Wurf das optimale 

Verhalten aufzeigen?

Einige Eigenschaften des Nash-Gleichgewichts 


• Allgemein ist ein Zufallsgenerator nicht die beste 

Lösung, eine Entscheidung zu treffen 

• Aber ihn nutzen, um Strategie-Optionen auszuwählen, 

zwischen denen man indifferent ist, das ist perfekt 

rational 

• Wenn z. B. „Straßen“ und „Park“ für den Händler die 

gleiche Auszahlung erbringen, dann kann er locker den 

Zufall entscheiden lassen 

• Das ist genau die Situation im Nash-Gleichgewicht mit 

gemischten Strategien; das haben wir auch bei der 

grafischen Ableitung des Gleichgewichts ausgenutzt



• Angenommen, die Polizistin patrouilliert zu p=5/13 auf den 

Straßen, 

H 

P 

5/13 

8/13 

Straßen (d) 

Park (1-d) 

Straßen 80 , 20 0 , 100 

Park 10 , 90 60 , 40 

dann hat der Händler bei seinen beiden reinen Strategien diese 

Auszahlungen: 

„Straßen“: 5/13*20 + 8/13*90 = 820/13 

„Park“: 5/13*100 + 8/13*40 = 820/13 

• So ist es für den Händler auch optimal, sich mit d=6/13 (oder 

irgendeinem anderen d) an einer der Straßenecken einzufinden



• Wenn es optimal ist, zwischen einer Menge von reinen 

Strategien zu mischen, dann muss ein Spieler die gleiche 

erwartete Auszahlung aus den reinen Strategien 

bekommen 

• Wenn z. B. der Händler mischt, dann muss die Polizistin 

so mischen, dass der Händler indifferent bzgl. seiner 

Optionen wird 

• Die Gleichgewichts-Strategie für die Polizistin ist daher der 

Wert von p, bei dem die erwarteten Auszahlungen des 

Händlers aus seinen reinen Strategien gleich sind: 

p*20 + (1-p)*90 = p*100 + (1-p)*40 p = 5/13 

• Damit haben wir ein elegantes Verfahren zur Ermittlung 

des Nash-Gleichgewichts in gemischten Strategien



• Bemerkenswert: 

Wir nutzen die erwarteten Auszahlungen 

an die Polizistin, um die Gleichgewichts- 

Strategie des Händlers zu bestimmen 

(und umgekehrt)



• Ein „Trick“ zur Entrümpelung des Spiels: 

Bevor man in die aufwendige Berechnung des 

Nash-Gleichgewichts in gemischten Strategien 

einsteigt, erst mal mit IDSDS alle strikt 

dominierten reinen Strategien eliminieren 

• Strikt dominierten Strategien würde bei der 

Ableitung des Nash-Gleichgewichts eine 

Wahrscheinlichkeit von 0 zugeordnet werden; 

sie würden damit keine Rolle spielen

Nachsatz zum Nash-Gleichgewicht 

(Quelle: Harrington S. 191) 

• „Jedes endliche Spiel hat ein Nash- 

Gleichgewicht in gemischten Strategien“ 

(John Nash) 

• „In fast allen endlichen Spielen gibt es eine 

endliche ungerade Anzahl von Nash- 

Gleichgewichten in gemischten Strategien“ 

(Robert Wilson)

Übung (1) 

Finden Sie ein Nash-Gleichgewicht in gemischten Strategien 

und berechnen Sie die erwarteten Auszahlungen 

(Quelle: Harrington S. 191) 

Spaltenspieler 

Zeilenspieler 

Links Rechts 

Oben 8 , 2 1 , 6 

Unten 3 , 5 4 , 1

Gemischte Strategien (1)

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?