06.11.2014 Aufrufe

1. Vorlesung (pdf) - Universität Paderborn

1. Vorlesung (pdf) - Universität Paderborn

1. Vorlesung (pdf) - Universität Paderborn

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Spieltheorie Übersicht<br />

<strong>1.</strong> Einleitung<br />

2. Spiele und Nash Equilibria<br />

3. Eigennützige Schritte<br />

4. Das Auslastungsspiel<br />

5. PLS<br />

6. Der Preis der Anarchie<br />

7. Das Wardrop-Modell<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>1


<strong>1.</strong> Einleitung<br />

• Wir betrachten Systeme, in denen eigenständige Agenten Aktionen ausführen, die nur dem<br />

Zweck dienen, ihren persönlichen Nutzen zu steigern (bzw. ihre persönlichen Kosten zu senken).<br />

• Der persönliche Nutzen hängt aber vom Verhalten aller Agenten ab.<br />

• Es gibt keine zentrale Kontrolle, die die Agenten zu Handlungen zwingen kann.<br />

• Ebenfalls vom Verhalten aller Agenten hängt aber auch ein sozialer Nutzen ab, der z.B. das<br />

Wohlbefinden“ des Gesamtsystems beschreibt.<br />

”<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>2


Fragen:<br />

• Was sind stabile Zustände in diesen dynamischen Systemen ? Wie entwickeln sich solche<br />

Systeme über die Zeit ?<br />

• Wie ist das Verhältnis des sozialen Nutzens in diesen dynamischen Systemen zum sozialen<br />

Nutzen, den man erhalten würde, wenn man eine ”<br />

diktatorische“ zentrale Kontrolle hätte ?<br />

• Wie sollten diese dynamischen Systeme konstruiert werden, damit in allen stabilen Zuständen<br />

der soziale Nutzen ein globales Optimum annimmt ?<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>3


Beispiel: Braess-Paradoxon<br />

Situation<br />

Optimum<br />

stabiler Zustand<br />

s<br />

100 −><br />

t<br />

s<br />

x<br />

50<br />

50<br />

100<br />

100<br />

50<br />

50<br />

x<br />

t<br />

s<br />

x<br />

50<br />

50<br />

100<br />

100<br />

50<br />

50<br />

x<br />

t<br />

150<br />

150<br />

In einem Verkehrsnetzwerk wollen 100 Autofahrer von s nach t fahren. Jeder Autofahrer ist daran interessiert,<br />

daß er persönlich möglichst schnell in t ankommt. Er hat zwei Wege (oben,unten) zur Auswahl. Die Straßen<br />

des Verkehrsnetzes haben unterschiedliche Verzögerungen, teilweise abhängig von der Anzahl der Fahrzeuge, die<br />

sie benutzen, teilweise unabhängig davon. Die persönliche Verzögerung eines Autofahrers ist die Summe der<br />

Verzögerungen der benutzten Kanten, die soziale Verzögerung ist die durchschnittliche Verzögerung, die ein Autofahrer<br />

erfährt.<br />

Es gibt nur einen global optimalen Zustand und einen stabilen Zustand, und beide sind gleich.<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>4


Situation<br />

Optimum<br />

stabiler Zustand<br />

s<br />

x<br />

100<br />

0<br />

100<br />

x<br />

t<br />

s<br />

x<br />

50<br />

50<br />

100<br />

0<br />

0<br />

100<br />

50<br />

50<br />

x<br />

t<br />

s<br />

x<br />

100<br />

100 0<br />

0<br />

100<br />

0 100<br />

100 x<br />

t<br />

150 200<br />

Die Situation ist wie vorher, jedoch hat die Stadtverwaltung sich entschlossen eine Schnellstraße zu bauen, um die<br />

Fahrt von s nach t zu verkürzen.<br />

Ergebnisse:<br />

• Das globale Optimum bleibt unverändert und ist weiterhin eindeutig!<br />

• Das globale Optimum ist nicht stabil.<br />

• Es gibt vier stabile Zustände, in denen alle Autofahrer langsamer sind, als im Netzwerk ohne<br />

die Schnellstraße!<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>5


Modellierung als Spiel<br />

Wir modellieren dynamische Systeme mit eigenständig agierenden Agenten als Spiele.<br />

• Die Agenten sind die Spieler.<br />

• Das System selbst ist das ”<br />

Spielfeld“, bzw. beschreibt die Spielregeln.<br />

• Die privaten Nutzenfunktionen beschreiben die Auszahlungen an die Spieler abhängig von den<br />

Aktionen, die alle Spieler ausgeführt haben.<br />

• Die soziale Nutzenfunktion beschreibt die Auszahlung an den Spielleiter und ist ebenfalls<br />

abhängig von den Aktionen, die alle Spieler ausgeführt haben.<br />

• Spieler = Autofahrer<br />

• Spielfeld = Verkehrsnetz<br />

• Spielregeln = Verzögerungsfunktionen an den Kanten<br />

• Auszahlungen = Verzögerungen<br />

• Aktionen = Auswahl des Weges<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>6


2. Spiele und Nash Equilibria<br />

Situation: n Spieler 1, . . . , n spielen ein (einzügiges) Spiel. S i 1 ≤ i ≤ n ist die Menge der<br />

Strategien (= Aktionen) von Spieler i. u i : S 1 × . . . × S n → R ist die Nutzenfunktion für<br />

Spieler i.<br />

Die S i sind (vorerst) endliche und nichtleere Mengen.<br />

Das Spiel kann dann beschrieben werden durch<br />

G = (n, S 1 , . . . S n , u 1 , . . . , u n ).<br />

Definition Es sei G = (n, S 1 , . . . , S n , u 1 , . . . , u n ) ein Spiel. Ein n-Tupel (s 1 , . . . , s n ) ∈<br />

S 1 × . . . × S n ist im Nash Equilibrium, falls für alle i ∈ {1, . . . , n} gilt:<br />

∀s ′ i ∈ S i : u i (s 1 , . . . , s i−1 , s i , s i+1 , . . . , s n ) ≥ u i (s 1 , . . . , s i−1 , s ′ i , s i+1, . . . , s n )<br />

Im Nash Equilibrium will kein Spieler seine Strategie ändern, solange die anderen Spieler<br />

bei ihrer gewählten Strategie bleiben ⇒ stabiler Zustand<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>7


Beispiele: (Bi-)Matrixspiele<br />

Bach-Stravinsky<br />

Mozart-Mahler<br />

Gefangenendilemma<br />

Münzseiten<br />

s 21 s 22<br />

s 11 2,1 0,0<br />

s 12 0,0 1,2<br />

s 21 s 22<br />

s 11 2,2 0,0<br />

s 12 0,0 1,1<br />

L G<br />

L 1,1 5,0<br />

G 0,5 4,4<br />

K Z<br />

K 1,-1 -1,1<br />

Z -1,1 1,-1<br />

2<br />

Nash-Equilibria<br />

Minderwertiges<br />

Nash-Equilibrium<br />

eindeutiges<br />

Nash-Equilibrium<br />

kein<br />

Nash-Equilibrium<br />

Stein-Schere-Papier<br />

St Sch P<br />

St 0,0 1,-1 -1,1<br />

Sch -1,1 0,0 1,-1<br />

P 1,-1 -1,1 0,0<br />

kein Nash-Equilibrium<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>8


Gemischte Nash Equilibria<br />

• Jeder Spieler randomisiert seine Strategiewahl.<br />

• Damit verhält sich Spieler i gemäß einer Verteilungsfunktion Π i<br />

Strategien S i (→ konvexe Menge von Strategien)<br />

• Spieler i maximiert dann den erwarteten Nutzen<br />

auf der Menge seiner<br />

u i (Π 1 , . . . , Π n ) =<br />

X<br />

nY<br />

( Π k (s k ))u i (s 1 , . . . , s n )<br />

(s 1 ,...,sn)∈S 1 ×...×Sn k=1<br />

Definition Es sei G = (n, S 1 , . . . , S n , u 1 , . . . , u n ) ein Spiel. Ein n-Tupel (Π 1 , . . . , Π n ) ist<br />

im gemischten Nash-Equilibrium, falls für alle i ∈ {1, . . . , n} gilt:<br />

∀Π ′ i auf S i : u i (Π 1 , . . . , Π i−1 , Π i , Π i+1 , . . . , Π n ) ≥ u i (Π 1 , . . . , Π i−1 , Π ′ i , Π i+1, . . . , Π n )<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>9


Darstellung eines Spiels in Normalform<br />

G = (n, S, U)<br />

n Anzahl der Spieler<br />

s i Strategie von Spieler i, i ∈ {1, . . . , n}<br />

s Strategietupel: s = (s 1 , . . . , s n )<br />

s −i Strategientupel der Gegenspieler von i,<br />

s −i = (s 1 , . . . , s i−1 , s i+1 , . . . , s n )<br />

Wir schreiben: s = (s i , s −i )<br />

S i Strategieraum (Menge der möglichen Strategien)<br />

für Spieler i<br />

S = S 1 × . . . × S n , s ∈ S<br />

S −i = S 1 × . . . × S i−1 × S i+1 × S n , s −i ∈ S −i<br />

u i Nutzenfunktion von Spieler i u i : S → R<br />

U = (u 1 , . . . , u n )<br />

∆(S i ) = Menge der gemischten Strategien des Spielers i<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>10


3. Eigennützige Schritte<br />

Definition: Sei (s 1 , ..., s n ) ∈ S = S 1 × ... × S n , i ∈ [1, n], s ′ i<br />

∈ S i . Ein Übergang<br />

(s 1 , ..., s n ) ↦→ (s 1 , ..., s i−1 , s ′ i , s i+1, ..., s n ) heißt eigennütziger Schritt falls u i (s 1 , ..., s n ) <<br />

u i (s 1 , ..., s i−1 , s ′ i , s i+1, ..., s n ).<br />

Selfish Step Algorithmus:<br />

while (s 1 , ..., s n ) ist kein Nash Equilibrium<br />

perform eigennützigen Schritt<br />

Definition: G S = (S, E S ) mit E S = {(s, es); s, es ∈ S, s ↦→ es ist eigennütziger Schritt} heißt<br />

Nash-Graph.<br />

Beachte:<br />

(a) Ein reines Nash Equilibrium entspricht einem Knoten in G S mit Ausgangsgrad 0.<br />

(b) Hat G S keine gerichteten Kreise so existiert ein reines Nash Equilibrium.<br />

(c) G S kann Pfade exponentieller Länge enthalten.<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>11


Beispiel: Routing Spiel<br />

7 Spieler, 3 Kanten, Spieler i hat Gewicht w i<br />

s i = {1, 2, 3}∀i = 1, ..., 7<br />

u i (s 1 , ..., s 7 ) = − P s j =s i<br />

w j<br />

1<br />

4<br />

2<br />

1<br />

2<br />

2<br />

2<br />

1<br />

2<br />

2<br />

2<br />

2<br />

1<br />

2<br />

2<br />

4<br />

3<br />

2<br />

2<br />

4<br />

3<br />

4 4 4<br />

3<br />

4<br />

3<br />

4<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>12


4. Das Auslastungsspiel<br />

Literatur:<br />

• R. W. Rosenthal. A class of games possessing pure-strategy Nash equilibria.<br />

International Journal of Game Theory 2, pp. 65 – 67. 1973.<br />

• D. S. Johnson, Chr. H. Papadimitriou, M. Yannakakis. How easy is local search?<br />

Proceedings of the 26th IEEE FOCS, pp. 39 – 42. 1985.<br />

• A. Fabrikant, Chr. H. Papadimitriou, K. Talwar. The Complexity of Pure Nash Equilibria.<br />

Proceedings of the 36th ACM STOC. 2004.<br />

• D. Fotakis, S. Kontogiannis, P. Spirakis. Selfish Unsplittable Flows.<br />

Proceedings of the ICALP ’04. 2004.<br />

Schwerpunkte:<br />

• allgemeines Auslastungsspiel (z.B. Netzwerkauslastung in allgemeinen Netzwerken)<br />

• Koordinationsfaktor: Leistungsverlust durch fehlende Koordination<br />

• Existenz von reinen Nash Equilibrien / Berechnung reiner Nash Equilibrien<br />

• PLS-Vollständigkeit<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>13


Auslastungsspiel:<br />

• n Spieler 1, ..., n,<br />

• E endliche Menge von Betriebsmitteln,<br />

• Strategiemenge S i ⊆ Pot(E) für jeden Spieler i, 1 ≤ i ≤ n,<br />

• Verzögerungsfunktion d e : {1, ..., n} → N für jedes e ∈ E, d e (j) nicht-fallend in j.<br />

Private Kosten bei Strategiewahl s = (s 1 , ..., s n ) ∈ S 1 × ... × S n :<br />

• f s (e) = |{i; e ∈ s i }| ist Zahl der Spieler die Betriebsmittel e benutzen,<br />

• d e (f s (e)) ist Verzögerung durch Betriebsmittel e,<br />

• c i (s) = P e∈s<br />

d e (f s (e)) sind private Kosten von Spieler i.<br />

i<br />

Reines Nash Equilibrium s = (s 1 , ..., s n ) ∈ S 1 × ... × S n :<br />

Für jeden Spieler i gilt c i (s 1 , ..., s i , ..., s n ) ≤ c i (s 1 , ..., s ′ i , ..., s n) für alle s ′ i ∈ S i.<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>14


Netzwerk-Auslastungsspiel:<br />

• G = (V, E) gerichteter Graph,<br />

• n Spieler 1, ..., n,<br />

• a i ∈ V , b i ∈ V sind Start- und Zielknoten für Spieler i, 1 ≤ i ≤ n,<br />

• S i ⊆ Pot(E) ist Menge der Wege von a i nach b i für jedes i, 1 ≤ i ≤ n,<br />

• Verzögerungsfunktion d e : {1, ..., n} → N für jedes e ∈ E, d e (j) nicht-fallend in j.<br />

Netzwerk-Auslastungsspiel ist genau dann symmetrisch, wenn a 1 = ... = a n und b 1 = ... = b n .<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>15


Satz<br />

Sei I = (n, E, S 1 , ..., S n , {d e } e∈E ) eine Instanz des Auslastungsspiels. I besitzt mindestens<br />

ein reines Nash Equilibrium.<br />

Beweis:<br />

Definiere Potentialfunktion h : (S 1 × ... × S n ) → N durch h(s) = P e∈E<br />

fs(e)<br />

P<br />

j=1<br />

d e (j).<br />

Wenn s = (s 1 , ..., s i , ..., s n ) und s ′ = (s 1 , ..., s ′ i , ..., s n), dann gilt:<br />

h(s) − h(s ′ P<br />

) = d e (f s (e)) −<br />

P d e (f s ′(e))<br />

e∈s i −s ′ e∈s<br />

i<br />

′ i −s i<br />

= c i (s) − c i (s ′ ).<br />

Hieraus folgt:<br />

h(s) minimal ⇒ s ist Nash Equilibrium.<br />

□<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>16


Folgerung 1:<br />

Sei I = (n, E, S 1 , . . . , S n , {d e } e∈E ) eine Instanz des Auslastungsspiels.<br />

Ein reines Nashequilibrium für I kann in<br />

0<br />

0 @ X e∈E<br />

1<br />

nX<br />

d e (j) A<br />

j=1<br />

eigennützigen Schritten berechnet werden.<br />

Folgerung 2:<br />

Wenn die Funktionen {d e } e∈E alle polynomiell in n beschränkt sind und ein eigennütziger Schritt<br />

in Polynomzeit berechnet werden kann, dann kann ein reines Nashequilibrium in Polynomzeit<br />

berechnet werden.<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>17


Min Cost Flow Instanz:<br />

• G = (V, E) gerichteter Graph,<br />

• Kosten c ij für Kante (i, j) ∈ E,<br />

• Kapazität u ij für Kante (i, j) ∈ E,<br />

• Anforderung b(i) für i ∈ V , P b(i) = 0.<br />

i∈V<br />

Min Cost Flow<br />

Min Cost Flow Problem:<br />

Minimiere<br />

unter den Bedingungen<br />

P<br />

(i,j)∈E<br />

P<br />

{j;(i,j)∈E}<br />

c ij x ij<br />

x ij −<br />

P<br />

{j;(j,i)∈E}<br />

x ji = b(i) für alle i ∈ V ,<br />

0 ≤ x ij ≤ u ij für alle (i, j) ∈ E.<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>18


Satz<br />

Das Min Cost Flow Problem kann in Polynomzeit gelöst werden.<br />

Laufzeiten von Min Cost Flow Algorithmen:<br />

Es sei U = max<br />

i,j<br />

Algorithmus<br />

u ij und C = max<br />

i,j<br />

Capacity scaling algorithm<br />

Cost scaling algorithm<br />

Double scaling algorithm<br />

c ij .<br />

Laufzeit<br />

O((m log U)(m + n log n))<br />

O((n 3 log(nC))<br />

O(nm log U log(nC))<br />

Minimum mean cylcle-canceling algorithm O(n 2 m 3 log n)<br />

Repeated capacity scaling algorithm<br />

Enhanced capacity scaling algorithm<br />

O((m 2 log n)(m + n log n))<br />

O((m log n)(m + n log n))<br />

Tabelle aus: Ahuja, Magnanti, Orlin. Network Flows. Prentice Hall, 1993.<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>19


Satz<br />

Sei I = (n, V, E, a, b, {d e } e∈E ) eine Instanz für das symmetrische Netzwerk-Auslastungsspiel.<br />

Ein reines Nash Equilibrium für I kann in Polynomzeit berechnet werden.<br />

Beweisidee:<br />

Minimum von h(s) := P e∈E<br />

fs(e)<br />

P<br />

j=1<br />

d e (j) auf (V, E, a, b) als Min Cost Flow berechnen:<br />

2/3<br />

2/4<br />

3<br />

4<br />

2<br />

2<br />

A,B<br />

a<br />

1/2 b A,B ⇒<br />

A,B<br />

a<br />

1 2<br />

b<br />

A,B<br />

4/6<br />

1/5<br />

6 5<br />

4<br />

1<br />

Jede Kante e ∈ E wird durch n parallele Kanten mit Kapazität 1 und Kosten d e (1), ..., d e (n)<br />

ersetzt. Min Cost Flow für neues Netzwerk minimiert h(s).<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>20


5. Die Komplexitätsklasse PLS<br />

Bei einem Optimierungsproblem sucht man für gewöhnlich nach einem globalen Optimum. Dies<br />

ist eine zulässige Lösung, die eine gegebene Zielfunktion minimiert bzw. maximiert.<br />

PLS (polynomial time local search) ist eine Klasse von lokalen Suchproblemen. Man sucht hier<br />

also nach zulässigen Lösungen, von denen man nur lokale Optimalität fordert.<br />

Für kein PLS-vollständiges Problem L ist ein Algorithmus bekannt, der ein lokales Optimum für<br />

L in Polynomialzeit berechnen kann.<br />

Literatur zu PLS:<br />

David S. Johnson, Christos H. Papadimitriou, Mihalis Yannakakis. How easy is local search?<br />

Proceedings of the 26th IEEE FOCS, pp. 39 – 42. 1985.<br />

Alejandro A. Schäffer, Mihalis Yannakakis. Simple local search problems that are hard to solve.<br />

SIAM Journal on Computing, pp. 56 – 87. 199<strong>1.</strong><br />

Alex Fabrikant, Christos H. Papadimitriou, Kunal Talwar. The Complexity of Pure Nash Equilibria.<br />

Proceedings of the 36th ACM STOC, pp. 604 – 612. 2004.<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>21


Definition:<br />

Ein PLS (polynomial-time local search) Problem L = (D L , F L , c L , N) ist wie folgt spezifiziert:<br />

• D L ⊆ {0, 1} ∗ ist Menge der Probleminstanzen<br />

(Entscheidung ob x ∈ D L oder x ∉ D L in Polynomialzeit möglich),<br />

• jede Probleminstanz x ∈ D L hat eine endliche Menge F L (x) zulässiger Lösungen,<br />

• jede zulässige Lösung s ∈ F L (x) hat einen nicht-negativen Kostenwert c L (s, x), eine<br />

Nachbarschaft N(s, x) ⊆ F L (x) und eine Codierung polynomieller Länge (in |x|).<br />

Außerdem müssen die folgenden 3 Polynomialzeit-Algorithmen existieren:<br />

• gegeben x ∈ D L gibt Algorithmus A L eine zulässige Lösung s ∈ F L (x) zurück,<br />

• gegeben einen Bitstring s gibt Algorithmus B L im Fall s ∈ F L (x) den Kostenwert c L (s, x)<br />

zurück, im Fall s ∉ F L (x) wird zurückgegeben, dass s keine zulässige Lösung ist,<br />

• gegeben eine Instanz x ∈ L und eine zulässige Lösung s ∈ F L (x) gibt der Algorithmus C L<br />

eine bessere Nachbarschaftslösung N(s, x) zurück oder gibt zurück, dass es keine bessere<br />

Lösung in der Nachbarschaft gibt.<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>2


Komplexität der Equilibriums-Berechnung für Auslastungsspiele:<br />

Equilibriums-Berechnung symmetrisches Spiel allgemeines Spiel<br />

Auslastungsspiel PLS-vollständig PLS-vollständig<br />

Netzwerk Aulastungsspiel Polynomialzeit PLS-vollständig<br />

⇒ Schnelle Equilibriums-Berechnung kann nur für symmetrische Netzwerk-Instanzen garantiert<br />

werden.<br />

Ergebnisse aus:<br />

Alex Fabrikant, Christos H. Papadimitriou, Kunal Talwar.<br />

The Complexity of Pure Nash Equilibria.<br />

Proceedings of the 36th ACM STOC. 2004.<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>23


6. Auslastungsspiel: Der Preis der Anarchie<br />

Literatur:<br />

• G. Christodoulou, E. Koutsoupias. The Price of Anarchy of Finite Congestion Games.<br />

Proceedings of the 37th ACM STOC, 2005.<br />

• B. Awerbuch, Y. Azar, A. Epstein. The Price of Routing Unsplittable Flow.<br />

Proceedings of the 37th ACM STOC, 2005.<br />

Bemerkung:<br />

• Hier werden Auslastungspiele ohne Gewichte betrachtet.<br />

• Wir betrachten hier nur reine Nash Equilibrien.<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>24


Private Kosten bei Strategiewahl s = (s 1 , ..., s n ) ∈ S 1 × ... × S n :<br />

• f s (e) = |{i; e ∈ s i }| ist Zahl der Spieler die Betriebsmittel e benutzen,<br />

• d e (f s (e)) ist Verzögerung durch Betriebsmittel e,<br />

• c i (s) = P e∈s i<br />

d e (f s (e)) sind private Kosten von Spieler i.<br />

Soziale Kosten bei Strategiewahl s = (s 1 , ..., s n ) ∈ S 1 × ... × S n :<br />

• Summe der Privaten Kosten<br />

SUM(s) = X i∈[n]<br />

c i (s) = X e∈E<br />

f s (e) · d e (f s (e))<br />

(In der Literatur wurden auch andere soziale Kostenmasse untersucht.)<br />

Preis der Anarchie/Koodinationsrate<br />

• OP T = min s∈S SUM(s) ist optimale Zuweisung<br />

•<br />

P oA pure = sup<br />

s ist NE<br />

SUM(s)<br />

OP T<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>25


P oA pure für (ungewichtete) Auslastungsspiele<br />

P oA pure<br />

symmetrisch<br />

Lineare Latenzfunktionen<br />

de(x) = ae · x + be<br />

mit ae, be ≥ 0 ∀e ∈ E<br />

Latenzfunktionen:<br />

Polynome vom Grad d<br />

de(x) = P d<br />

i=0<br />

ae(i)x i<br />

mit ae(i) ≥ 0 ∀i ∈ {0, ..., d}, ∀e ∈ E<br />

5n−2<br />

2n+1<br />

d Θ(d)<br />

asymmetrisch<br />

5<br />

2<br />

d Θ(d)<br />

Bemerkung:<br />

Ein Auslastungsspiel ohne Gewichte ist genau dann symmetrisch, wenn S i = S j für alle<br />

i ∈ {1, ..., n}, j ∈ {1, ..., n}.<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>26


7. Das Wardrop Modell<br />

• Der Verkehr kann in beliebig kleine Stücke aufgeteilt werden<br />

• Unendlich viele Spieler haben unendlich kleine Anteile am Verkehr<br />

• Der Verkehr wird als reellwertiger Fluss modelliert<br />

s t 1 1<br />

s 2<br />

G<br />

t 2<br />

Edge Latency l e (x)<br />

Eingabe: (G, r, l) mit<br />

• G = (V, E) ist ein gerichteter Graph,<br />

• einer Menge r = {(r i , s i , t i ) ∈ R >0 ×V ×V | i ∈<br />

[k]} von Routing-Wegen, und<br />

• einer Menge l = {l e | e ∈ E} von Verzögerungsfunktionen.<br />

Kosten einer Kante: c e (f e ) = l e (f e )f e<br />

Soziale Kosten: C(f) = P e∈E c e(f e ) = P e∈E l e(f e )f e = P P ∈P l P (f)f P<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>27


Annahmen:<br />

• Für alle i ∈ [k] gibt es mindestens einen Weg von s i nach t i in G.<br />

• Die Verzögerungsfunktionen sind nichtnegativ, nichtfallend und differenzierbar<br />

• Der Verkehr wird als Fluss über Wege P i ∈ P i von s i nach t i in G dargestellt (äquivalent zu<br />

Flüssen f e über Kanten e ∈ E.<br />

Ein optimaler Fluss kann durch Lösung des folgenden nichtlinearen Programms berechnet werden:<br />

N LP : min P e∈E c e(f e ) s.t.<br />

P<br />

P ∈P i<br />

f P = r i<br />

f e = P P ∈P:e∈P f P<br />

f P ≥ 0<br />

∀i ∈ [k]<br />

∀e ∈ E<br />

∀P ∈ P<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>28


Definition: Ein Fluss f in G ist ein Nash Equilibrium (Wardrop Equilibrium), wenn für alle<br />

i ∈ [k] und für alle P 1 , P 2 ∈ P i und alle δ ∈ [0, f P1 ], gilt: l P1 (f) ≤ l P2 ( ˜f), wobei<br />

˜f P =<br />

8<br />

<<br />

:<br />

f P − δ if P = P 1<br />

f P + δ if P = P 2<br />

f P if P ∉ {P 1 , P 2 }.<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>29


Das Netzwerk Design Problem<br />

Situation<br />

Optimum<br />

Nash−Equilibrium<br />

x 1<br />

x 1<br />

x 1<br />

1/2 1/2<br />

1/2 1/2<br />

1/2 1/2<br />

1/2 1/2<br />

1 x<br />

1 x<br />

1 x<br />

3/2 3/2<br />

x 1<br />

x 1<br />

x 1<br />

1/2 1/2<br />

1 0<br />

0 0 0<br />

0 1<br />

1/2 1/2<br />

0 1<br />

1 x<br />

1 x<br />

1 x<br />

3/2<br />

2<br />

Braess’s Paradoxon zeigt, dass das<br />

Hinzufügen von Kanten in das Netzwerk<br />

zu schlechteren sozialen Kosten<br />

eines Nash Equilibriums führen<br />

kann selbst wenn die zusätzlichen<br />

Kanten nur kleine Verzögerungen<br />

verursachen.<br />

Das führt zu der folgenden Frage:<br />

Finde einen Teilgraphen H =<br />

(V, E H ) ⊂ G für den ein<br />

Fluss f eines Nash-Equilibriums für<br />

(H, r, l) minimale soziale Kosten<br />

hat.<br />

Monien, Feldmann, Tscheuschner, Schoppmann<br />

Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>30

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!