24.12.2014 Aufrufe

Spieltheorie - IMW

Spieltheorie - IMW

Spieltheorie - IMW

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Einführung<br />

rationale Individuen, die ”<br />

das Beste für sich herausholen wollen”<br />

◮ Nutzenmaximierung des Haushaltes<br />

◮ Gewinnmaximierung des Unternehmers<br />

Nebenbedingungen: technologische Sachverhalte,<br />

Nachfragebedingungen, staatliche Regulierung<br />

Möglichkeiten der Unternehmen: Aktionsparameter (Preis,<br />

Produkt, Innovation, Differenzierung, etc.)<br />

1 / 22


Ein-/Mehr-Personenentscheidungssituationen<br />

Ein-Personen-E.: Anpassung der Person an die Umweltzustände<br />

(triviales Spiel ohne Mitspieler); spieltheoretisch uninteressant,<br />

aber für uns sinnvoller Spezialfall als Referenz; was macht eine<br />

Firma wenn sie allein am Markt ist (Monopol)<br />

Mehr-P.-E.: Anpassung an die Umweltzustände und an die<br />

Anpassungen” (das Verhalten) der anderen, die zu erwarten sind;<br />

”<br />

” echte“ Spielsituation 2 / 22


Ein-Personen-Spiel, am Beispiel Monopol<br />

triviales Spiel;<br />

Ziel:<br />

die optimale Menge ist<br />

die Lösung ist daher:<br />

max Π(x)<br />

x<br />

arg max Π(x)<br />

x<br />

max Π(x) = Π(x ∗ )<br />

x<br />

für alle x ∗ aus arg max Π(x)<br />

x<br />

arg max x Π(x) kann mehrere Elemente enthalten, wird aber in den<br />

meisten Fällen bei uns nur ein Element enthalten; dann gilt einfach<br />

x ∗ = arg max x Π(x); quadratische Gewinnfunktion (Abb. folgt)<br />

3 / 22


Quadratische Gewinnfunktion Monopolist<br />

4 / 22


Simultane und Sequentielle Spiele<br />

Eine wichtige Unterscheidung für die Analyse von Spielen ist die<br />

zeitliche Struktur.<br />

Wenn die Spieler gleichzeitig (simultan) entscheiden, dann kann<br />

wird das Spiel in Normalform dargestellt.<br />

Oder es gibt eine zeitliche Aufeinanderfolge von Entscheidungen:<br />

Spieler 1 entscheidet zum Zeitpunkt 1, Spieler 2 sieht das und<br />

entscheidet danach, zum Zeitpunkt 2. Die zeitliche Struktur wird<br />

in der Darstellung der extensiven Form berücksichtigt.<br />

5 / 22


Mehr-Personen-Spiel<br />

Charakteristik eines Spiels: gewählte Strategien der Spieler<br />

beeinflußen die eigene Auszahlung und die der anderen Spieler;<br />

z.B.:<br />

Π 1 (x 1 , x 2 ), Π 2 (x 1 , x 2 )<br />

Vektor (x 1 , x 2 ) ist eine Strategiekombination; besagt für jede<br />

Firma, welche Menge er wählt.<br />

Bsp.: ”<br />

Hasenfußspiel”, Variante 1 (ökonomisch): zwei<br />

symmetrische Möglichkeiten, viel produzieren, wenig produzieren;<br />

Preis steht in negativem Zusammenhang mit Menge; es gibt<br />

folgende erschöpfende Matrix aus Entscheidungen und Resultaten:<br />

6 / 22


Mehr-Personen-Spiel in Normalform<br />

U 1<br />

U 2<br />

wenig viel<br />

wenig 100, 100 25, 150<br />

viel 150, 25 -10, -10<br />

Variante 2 (klassisch): zwei Autofahrer fahren aufeinander zu, wer<br />

ausweicht ist ein Hasenfuß, der andere ein Siegertyp; weichen beide<br />

aus, ist es besser für jeden als der alleinige Hasenfuß zu sein, aber<br />

schlechter als der Sieger; weicht keiner aus, beide z.B. tot, was<br />

noch schlechter ist als Hasenfuß zu sein;<br />

Anm.: Auszahlungen können auch Nutzenniveaus sein, die mit<br />

Aktionskombinationen verbunden sind (wie in Variante 2)<br />

7 / 22


Spiel<br />

Spiel besteht aus:<br />

◮ Spielern: Individuen, die Entscheidungen treffen; sind sich<br />

bewußt, dass ihre Aktionen den anderen beeinflußen, und dass<br />

sie von den Aktionen der anderen beeinflußt werden; U1 und<br />

U2<br />

◮ Strategien: aus welchen Aktionen kann ein Spieler wählen.<br />

Z.B. {hoch, niedrig}.<br />

◮ Auszahlungen: ordnet jeder möglichen Kombination von<br />

Aktionen aller Spieler (Strategienkombination) eine<br />

Auszahlung für jeden Spieler zu; z.B. (wenig, wenig)<br />

→ (100, 100).<br />

8 / 22


Spiel in Normalform<br />

Normalform eines Spiels wird auch strategische Form genannt.<br />

Diese Form der Darstellung besteht aus<br />

◮ der Menge der Spieler: I = {1, . . . , i, . . . , n}<br />

◮ der Menge der Strategien, die dem Spieler i zur Verfügung<br />

stehen: S i , für alle i = 1, . . . , n<br />

◮ den Auszahlungen, die Spieler i erhält, wenn jeder Spieler<br />

j = 1, . . . , n eine Strategie s j ∈ S j wählt: u i (s 1 , . . . , s i , . . . , s n )<br />

9 / 22


Industrieökonomisches Spiel<br />

Ein wichtiges Beispiel ist der Cournot-Mengenwettbewerb, der als<br />

Spiel modelliert wird:<br />

◮ Menge der Firmen: I = {1, . . . , i, . . . , n}<br />

◮ eine Firma i wählt als Strategie eine Produktionsmenge<br />

s i ∈ S i = {s i |s i ≥ 0}<br />

◮ Firmen produzieren für einen Markt mit inverser<br />

Nachfragefunktion: 1<br />

p = p(Q) = p(s 1 + s 2 + . . . + s n )<br />

und eine Firma i hat die Kostenfunktion C i (s i ). Die<br />

Auszahlung der Firma i ist dann gegeben durch den Gewinn<br />

Π i (s 1 , . . . , s n ) = p(s 1 + . . . + s n )s i − C i (s i ).<br />

1 Sei Q = Q(p) eine Nachfragefunktion, die die nachgefragte Menge eines<br />

Gutes für jeden Preis p angibt. Dann nennt man p = Q −1 (Q) = p(Q) die<br />

inverse Nachfragefunktion.<br />

10 / 22


Gleichgewicht<br />

Frage, die sich stellt: gegeben unsere Annahmen (Rationalität), wie<br />

wird das beschriebene Spiel ausgehen Welche Strategien werden<br />

die Firmen wählen<br />

2 wichtige Lösungskonzepte:<br />

◮ dominante Strategien<br />

◮ Nash-Gleichgewicht (NP 1994)<br />

11 / 22


Dominante Strategien<br />

manche Spiele, wie das Gefangenendilemma, haben eine dominante<br />

Strategie<br />

eine Strategie ist dominant wenn sie immer zur besten Auszahlung<br />

führt, unabhängig davon, was die anderen Mitspieler machen<br />

Bsp. ”<br />

Prisoners Dilemma”, Variante 1 (ökonomisch): zwei Hotels<br />

können einen hohen Preis setzen oder einen niedrigen, wiederum<br />

negativer Zusammenhang Preis-Menge; Auszahlungen gemäß<br />

Verhaltensmatrix:<br />

12 / 22


Mehr-Personen-Spiele in Normalform<br />

U 1<br />

U 2<br />

hoch niedrig<br />

hoch 100, 100 25, 150<br />

niedrig 150, 25 30, 30<br />

Unabhängig davon, was das andere Hotel macht, ist es besser,<br />

einen niedrigen Preis zu setzen<br />

Dilemma: (hoch, hoch) wäre eine Verbesserung für beide Hotels<br />

( ”<br />

Pareto-besser”), aber bei unkoordinierten Handlungen nicht<br />

erreichbar<br />

13 / 22


Mehr-Personen-Spiele in Normalform<br />

Variante 2 (klassisch): 2 Verbrecher werden bei einem Delikt<br />

gefasst; es gibt ein schweres Delikt, und ein kleineres Delikt; nur<br />

das kleine kann nachgewiesen werden, dafür bekommt jeder 2<br />

Jahre; für das große braucht man eine Zeugenaussage von<br />

mindestens einem Verbrecher; wenn einer gesteht, wird der andere<br />

verurteilt, bekommt 10 Jahre, der Geständige als Kronzeuge 0<br />

Jahre; gestehen beide, bekommen beide 8 Jahre<br />

U 2<br />

gestehen schweigen<br />

U 1<br />

gestehen 8, 8 0, 10<br />

schweigen 10, 0 2, 2<br />

14 / 22


Dominante Strategie<br />

Strategie x d 1<br />

heißt dominant, wenn<br />

und es gibt ein x 2 :<br />

Π 1 (x d 1 , x 2 ) ≥ Π 1 (x 1 , x 2 ) ∀x 1 ≠ x d 1 , ∀x 2 ,<br />

Π 1 (x d 1 , x 2 ) > Π 1 (x 1 , x 2 ) ∀x 1 ≠ x d 1 .<br />

Strategie x d 1<br />

heißt streng dominant, wenn<br />

Π 1 (x d 1 , x 2 ) > Π 1 (x 1 , x 2 ) ∀x 1 ≠ x d 1 , ∀x 2 .<br />

Strategien x 1 ≠ x d 1<br />

heißen dominierte Strategien.<br />

Im Prisoner’s Dilemma: niedrig (gestehen) ist streng dominant,<br />

hoch (nicht gestehen) ist dominiert.<br />

15 / 22


Nash-Gleichgewicht<br />

Wenn es keine dominanten Strategien gibt (z.B. Hasenfußpiel),<br />

dann hilft Nash-Gleichgewicht bei Gleichgewichtslösung;<br />

Strategiekombination, bei der niemand einen Anreiz hat,<br />

abzuweichen;<br />

Definition: (x1 N, x 2 N ) ist ein NG falls<br />

Π 1 (x N 1 , x N 2 ) ≥ Π 1 (x 1 , x N 2 )<br />

Π 2 (x N 1 , x N 2 ) ≥ Π 2 (x N 1 , x 2 ) ∀x 2 .<br />

∀x 1 , und<br />

16 / 22


Nash-Gleichgewicht<br />

Methode zum Auffinden eines Nash-Gleichgewichts:<br />

1. suche alle besten Antworten auf alle möglichen<br />

Strategiewahlen der Gegner<br />

2. suche Strategiekombinationen, die mit allen besten Antworten<br />

vereinbar sind<br />

beste Antworten heißen auch Reaktionskorrespondenz oder<br />

Reaktionsfunktion (auch wenn sie simultan sind); z.B.:<br />

x R 1 (x 2 ) = arg max<br />

x 1<br />

Π 1 (x 1 , x 2 )<br />

Eine Mengenkombination (x1 N, x 2 N) ist ein NG wenn x 1 N ∈ x 1 R(x 2 N)<br />

und x2<br />

N ∈ x 2 R(x 1 N ). Bei Eindeutigkeit kann ∈ durch = ersetzt<br />

werden.<br />

17 / 22


Auffinden des NG im Hasenfußpiel<br />

wenig<br />

U 2<br />

viel<br />

U 1<br />

wenig 100, 100 25, 150<br />

viel 150, 25 -10, -10<br />

◮ beste Antwort für U1 wenn U2 wenig: viel<br />

◮ beste Antwort für U1 wenn U2 viel: wenig<br />

◮ beste Antwort für U2 wenn U1 wenig: viel<br />

◮ beste Antwort für U2 wenn U1 viel: wenig<br />

beide besten Antworten sind vereinbar miteinander; es gibt zwei<br />

NG, aber es ist ungewiß, welches der beiden beobachtet werden<br />

wird<br />

18 / 22


Mehr-Personen-Spiele in extensiver Form<br />

bisher: simultane Entscheidungen; bei sequentiellen<br />

Entscheidungen ist die Formulierung in extensiver Form nötig, die<br />

angibt, welcher Spieler wann am Zug ist (und was er dann über die<br />

vorherigen Spielzüge weiß)<br />

Bsp.: Markteintrittsspiel, oder Eintrittsabschreckung, mit 2 Stufen<br />

(oder 2 Zeitpunkten): ein Monopolist bedient einen Markt, hat<br />

Profit von 5; Konkurrent überlegt, ob sich Eintritt lohnt; wenn<br />

Monopolist Eintritt akzeptiert, setzen sie gemeinsam einen<br />

profitablen Preis (friedlich); Monopolist kann aber auch einen<br />

Preiskrieg beginnen, beide haben einen Gewinn von -1; wenn kein<br />

Eintritt erfolgt, gibt es keinen Preiskrieg; Abfolge:<br />

1: Unternehmen 1 entscheidet über Eintritt/Nicht-Eintritt<br />

2: Unternehmen 2 ( ”<br />

Etablierter”, incumbent) entscheidet<br />

zwischen ”<br />

aggressivem” und ”<br />

friedlichem” Verhalten<br />

Kann der Monopolist den Eintritt durch Drohung verhindern<br />

19 / 22


Mehr-Personen-Spiele in extensiver Form<br />

Darstellung der extensiven Form mit Hilfe eines Spielbaums:<br />

Spiel besteht aus Teilspielen; jedes Spiel hat sich selbst als<br />

Teilspiel; Strategiekombination ist ein teilspielperfektes NG wenn<br />

es für alle Teilspiele ein NG ist;<br />

Strategiekombination: eine S. für einen Spieler gibt für jeden<br />

Knoten an, wie er sich an diesem Knoten verhalten soll bzw. wird;<br />

auch für Knoten, die wegen Nicht-Teilspielperfektheit nicht<br />

erreichbar sind;<br />

20 / 22


Mehr-Personen-Spiele in extensiver Form<br />

Lösungsmöglichkeit: Rückwärtsinduktion<br />

1. löse alle Teilspiele der letzten Stufe<br />

2. löse alle Teilspiele der vorletzten Stufe: gegeben das Resultat<br />

der letzten Stufe, suche nach dem besten Resultat, das auf<br />

der vorletzten Stufe erreichbar ist; nur Auszahlungen, die auf<br />

jeder Stufe eine b.A. sind, sind erreichbar<br />

. . .<br />

n. löse das erste Teilspiel; gegeben das optimale Verhalten auf<br />

allen nachfolgendenden Stufen, wähle den besten Zug auf der<br />

ersten Stufe<br />

daher: nur (tritt ein, friedlich) ist ein NG<br />

ist die Drohung von U2: ”<br />

wenn du eintrittst, dann werde ich<br />

aggressiv” glaubwürdig<br />

nein, da es auf Stufe 2 kein NG ist; Teilspielperfektheit entlarvt<br />

” leere Drohungen” 21 / 22


Beschreibung in extensiver Form<br />

Elemente des Spielbaums:<br />

◮ das Spiel beginnt mit einem eindeutigen Anfangsknoten und<br />

endet an den Endknoten, welche die Auszahlungen der Spieler<br />

angeben<br />

◮ alle Knoten außer den Endknoten sind Entscheidungsknoten,<br />

an denen einer der Spieler eine Aktion wählt<br />

◮ die einzelnen Knoten befinden sich in einer Reihenfolge,<br />

welche die zeitliche Struktur des Spieles beschreibt<br />

◮ an jedem Knoten trifft ein Spieler eine Entscheidung, und<br />

durch dessen Entscheidung wird der nächste Knoten erreicht<br />

22 / 22

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!