Spieltheorie
Spieltheorie
Spieltheorie
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
3 Gemischte Strategien<br />
Es gilt für alle i ∈ N:<br />
U i (α −i , β i )<br />
Def. α, β<br />
= U i ( lim<br />
n→∞ (αn −i, β n i ))<br />
Stetigkeit<br />
= lim<br />
n→∞ U i(α n −i, β n i )<br />
β n i<br />
beste Antwort auf αn −i<br />
≥<br />
lim<br />
n→∞ U i(α n −i , β′ i ) für alle β′ i ∈ ∆(A i)<br />
Stetigkeit<br />
= U i ( lim<br />
n→∞ αn −i, β ′ i) für alle β ′ i ∈ ∆(A i )<br />
Def. α i<br />
= Ui (α −i , β ′ i) für alle β ′ i ∈ ∆(A i )<br />
Also ist β i eine beste Antwort auf α −i für alle i ∈ N, damit β ∈ B(α) und schließlich<br />
(α, β) ∈ Graph(B).<br />
Lemma 7. Sei G = 〈N, (A i ), (u i )〉 ein endliches strategisches Spiel. Dann ist α ∗ ∈ ∏ i ∆(A i)<br />
ein Nash-Gleichgewicht in gemischten Strategien gdw. für jeden Spieler i ∈ N jede reine<br />
Strategie aus der Unterstützungsmenge von α ∗ i eine beste Antwort auf α∗ −i ist.<br />
Für den einzelnen Spieler ist es also – wenn die anderen Spieler ihre gemischten Strategien<br />
beibehalten – egal, ob er seine gemischte Strategie oder eine Einzelaktion daraus spielt.<br />
Beweis. Sei zunächst α ∗ ein Nash-Gleichgewicht mit a i ∈ supp(αi ∗). Angenommen, a i ist<br />
keine beste Antwort auf α−i ∗ . Wegen der Linearität von U i kann Spieler i seine Auszahlung<br />
verbessern, indem er Gewicht von a i auf andere Aktionen in supp(αi ∗ ) verteilt. Also<br />
war αi ∗ keine beste Antwort und somit im Widerspruch zur Voraussetzung α ∗ kein Nash-<br />
Gleichgewicht.<br />
Für die andere Richtung der Äquivalenz nehmen wir an, dass α ∗ kein Nash-Gleichgewicht ist.<br />
Dann muss es ein i ∈ N und eine Strategie α i ′ mit der Eigenschaft geben, dass U i(α−i ∗ , α′ i ) ><br />
U i (α−i ∗ , α∗ i ). Wegen der Linearität von U i muss es eine Aktion a ′ i ∈ supp(α′ i ) geben, die<br />
höheren Nutzen als eine Aktion a ′′<br />
i ∈ supp(α∗ i ) bringt; supp(α∗ i ) besteht also nicht nur aus<br />
besten Antworten auf α−i ∗ .<br />
Bemerkung 37. Ist G = 〈{ 1, 2 }, (A i ), (u i )〉 mit A 1 = { T, B } und A 2 = { L, R } ein<br />
Zwei-Spieler-Spiel mit je zwei möglichen Aktionen und ist (α ∗ 1, α ∗ 2) mit α ∗ 1(T) = 1 und<br />
0 < α ∗ 2(L) < 1 ein Nash-Gleichgewicht in G, so ist auch mindestens eines der Profile (T, L)<br />
und (T, R) ein Nash-Gleichgewicht in G.<br />
Nach Voraussetzung sind sowohl L als auch R beste Antworten auf T. Angenommen, T<br />
wäre weder auf L noch auf R eine beste Antwort. Dann wäre B sowohl auf L als auch<br />
auf R eine bessere Antwort als T. Wegen der Linearität des erwarteten Nutzens wäre B<br />
auch eine bessere Antwort als T auf α ∗ 2, im Widerspruch zu der Annahme, dass (α ∗ 1, α ∗ 2) ein<br />
Nash-Gleichgewicht in G ist.<br />
Betrachte zum Beispiel das Nash-Gleichgewicht ({ T ↦→ 1, B ↦→ 0 }, { L ↦→ 1 10 , R ↦→ 9 10<br />
}) in<br />
dem Spiel<br />
17