1. Vorlesung (pdf) - Universität Paderborn
1. Vorlesung (pdf) - Universität Paderborn
1. Vorlesung (pdf) - Universität Paderborn
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Spieltheorie Übersicht<br />
<strong>1.</strong> Einleitung<br />
2. Spiele und Nash Equilibria<br />
3. Eigennützige Schritte<br />
4. Das Auslastungsspiel<br />
5. PLS<br />
6. Der Preis der Anarchie<br />
7. Das Wardrop-Modell<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>1
<strong>1.</strong> Einleitung<br />
• Wir betrachten Systeme, in denen eigenständige Agenten Aktionen ausführen, die nur dem<br />
Zweck dienen, ihren persönlichen Nutzen zu steigern (bzw. ihre persönlichen Kosten zu senken).<br />
• Der persönliche Nutzen hängt aber vom Verhalten aller Agenten ab.<br />
• Es gibt keine zentrale Kontrolle, die die Agenten zu Handlungen zwingen kann.<br />
• Ebenfalls vom Verhalten aller Agenten hängt aber auch ein sozialer Nutzen ab, der z.B. das<br />
Wohlbefinden“ des Gesamtsystems beschreibt.<br />
”<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>2
Fragen:<br />
• Was sind stabile Zustände in diesen dynamischen Systemen ? Wie entwickeln sich solche<br />
Systeme über die Zeit ?<br />
• Wie ist das Verhältnis des sozialen Nutzens in diesen dynamischen Systemen zum sozialen<br />
Nutzen, den man erhalten würde, wenn man eine ”<br />
diktatorische“ zentrale Kontrolle hätte ?<br />
• Wie sollten diese dynamischen Systeme konstruiert werden, damit in allen stabilen Zuständen<br />
der soziale Nutzen ein globales Optimum annimmt ?<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>3
Beispiel: Braess-Paradoxon<br />
Situation<br />
Optimum<br />
stabiler Zustand<br />
s<br />
100 −><br />
t<br />
s<br />
x<br />
50<br />
50<br />
100<br />
100<br />
50<br />
50<br />
x<br />
t<br />
s<br />
x<br />
50<br />
50<br />
100<br />
100<br />
50<br />
50<br />
x<br />
t<br />
150<br />
150<br />
In einem Verkehrsnetzwerk wollen 100 Autofahrer von s nach t fahren. Jeder Autofahrer ist daran interessiert,<br />
daß er persönlich möglichst schnell in t ankommt. Er hat zwei Wege (oben,unten) zur Auswahl. Die Straßen<br />
des Verkehrsnetzes haben unterschiedliche Verzögerungen, teilweise abhängig von der Anzahl der Fahrzeuge, die<br />
sie benutzen, teilweise unabhängig davon. Die persönliche Verzögerung eines Autofahrers ist die Summe der<br />
Verzögerungen der benutzten Kanten, die soziale Verzögerung ist die durchschnittliche Verzögerung, die ein Autofahrer<br />
erfährt.<br />
Es gibt nur einen global optimalen Zustand und einen stabilen Zustand, und beide sind gleich.<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>4
Situation<br />
Optimum<br />
stabiler Zustand<br />
s<br />
x<br />
100<br />
0<br />
100<br />
x<br />
t<br />
s<br />
x<br />
50<br />
50<br />
100<br />
0<br />
0<br />
100<br />
50<br />
50<br />
x<br />
t<br />
s<br />
x<br />
100<br />
100 0<br />
0<br />
100<br />
0 100<br />
100 x<br />
t<br />
150 200<br />
Die Situation ist wie vorher, jedoch hat die Stadtverwaltung sich entschlossen eine Schnellstraße zu bauen, um die<br />
Fahrt von s nach t zu verkürzen.<br />
Ergebnisse:<br />
• Das globale Optimum bleibt unverändert und ist weiterhin eindeutig!<br />
• Das globale Optimum ist nicht stabil.<br />
• Es gibt vier stabile Zustände, in denen alle Autofahrer langsamer sind, als im Netzwerk ohne<br />
die Schnellstraße!<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>5
Modellierung als Spiel<br />
Wir modellieren dynamische Systeme mit eigenständig agierenden Agenten als Spiele.<br />
• Die Agenten sind die Spieler.<br />
• Das System selbst ist das ”<br />
Spielfeld“, bzw. beschreibt die Spielregeln.<br />
• Die privaten Nutzenfunktionen beschreiben die Auszahlungen an die Spieler abhängig von den<br />
Aktionen, die alle Spieler ausgeführt haben.<br />
• Die soziale Nutzenfunktion beschreibt die Auszahlung an den Spielleiter und ist ebenfalls<br />
abhängig von den Aktionen, die alle Spieler ausgeführt haben.<br />
• Spieler = Autofahrer<br />
• Spielfeld = Verkehrsnetz<br />
• Spielregeln = Verzögerungsfunktionen an den Kanten<br />
• Auszahlungen = Verzögerungen<br />
• Aktionen = Auswahl des Weges<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>6
2. Spiele und Nash Equilibria<br />
Situation: n Spieler 1, . . . , n spielen ein (einzügiges) Spiel. S i 1 ≤ i ≤ n ist die Menge der<br />
Strategien (= Aktionen) von Spieler i. u i : S 1 × . . . × S n → R ist die Nutzenfunktion für<br />
Spieler i.<br />
Die S i sind (vorerst) endliche und nichtleere Mengen.<br />
Das Spiel kann dann beschrieben werden durch<br />
G = (n, S 1 , . . . S n , u 1 , . . . , u n ).<br />
Definition Es sei G = (n, S 1 , . . . , S n , u 1 , . . . , u n ) ein Spiel. Ein n-Tupel (s 1 , . . . , s n ) ∈<br />
S 1 × . . . × S n ist im Nash Equilibrium, falls für alle i ∈ {1, . . . , n} gilt:<br />
∀s ′ i ∈ S i : u i (s 1 , . . . , s i−1 , s i , s i+1 , . . . , s n ) ≥ u i (s 1 , . . . , s i−1 , s ′ i , s i+1, . . . , s n )<br />
Im Nash Equilibrium will kein Spieler seine Strategie ändern, solange die anderen Spieler<br />
bei ihrer gewählten Strategie bleiben ⇒ stabiler Zustand<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>7
Beispiele: (Bi-)Matrixspiele<br />
Bach-Stravinsky<br />
Mozart-Mahler<br />
Gefangenendilemma<br />
Münzseiten<br />
s 21 s 22<br />
s 11 2,1 0,0<br />
s 12 0,0 1,2<br />
s 21 s 22<br />
s 11 2,2 0,0<br />
s 12 0,0 1,1<br />
L G<br />
L 1,1 5,0<br />
G 0,5 4,4<br />
K Z<br />
K 1,-1 -1,1<br />
Z -1,1 1,-1<br />
2<br />
Nash-Equilibria<br />
Minderwertiges<br />
Nash-Equilibrium<br />
eindeutiges<br />
Nash-Equilibrium<br />
kein<br />
Nash-Equilibrium<br />
Stein-Schere-Papier<br />
St Sch P<br />
St 0,0 1,-1 -1,1<br />
Sch -1,1 0,0 1,-1<br />
P 1,-1 -1,1 0,0<br />
kein Nash-Equilibrium<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>8
Gemischte Nash Equilibria<br />
• Jeder Spieler randomisiert seine Strategiewahl.<br />
• Damit verhält sich Spieler i gemäß einer Verteilungsfunktion Π i<br />
Strategien S i (→ konvexe Menge von Strategien)<br />
• Spieler i maximiert dann den erwarteten Nutzen<br />
auf der Menge seiner<br />
u i (Π 1 , . . . , Π n ) =<br />
X<br />
nY<br />
( Π k (s k ))u i (s 1 , . . . , s n )<br />
(s 1 ,...,sn)∈S 1 ×...×Sn k=1<br />
Definition Es sei G = (n, S 1 , . . . , S n , u 1 , . . . , u n ) ein Spiel. Ein n-Tupel (Π 1 , . . . , Π n ) ist<br />
im gemischten Nash-Equilibrium, falls für alle i ∈ {1, . . . , n} gilt:<br />
∀Π ′ i auf S i : u i (Π 1 , . . . , Π i−1 , Π i , Π i+1 , . . . , Π n ) ≥ u i (Π 1 , . . . , Π i−1 , Π ′ i , Π i+1, . . . , Π n )<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>9
Darstellung eines Spiels in Normalform<br />
G = (n, S, U)<br />
n Anzahl der Spieler<br />
s i Strategie von Spieler i, i ∈ {1, . . . , n}<br />
s Strategietupel: s = (s 1 , . . . , s n )<br />
s −i Strategientupel der Gegenspieler von i,<br />
s −i = (s 1 , . . . , s i−1 , s i+1 , . . . , s n )<br />
Wir schreiben: s = (s i , s −i )<br />
S i Strategieraum (Menge der möglichen Strategien)<br />
für Spieler i<br />
S = S 1 × . . . × S n , s ∈ S<br />
S −i = S 1 × . . . × S i−1 × S i+1 × S n , s −i ∈ S −i<br />
u i Nutzenfunktion von Spieler i u i : S → R<br />
U = (u 1 , . . . , u n )<br />
∆(S i ) = Menge der gemischten Strategien des Spielers i<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>10
3. Eigennützige Schritte<br />
Definition: Sei (s 1 , ..., s n ) ∈ S = S 1 × ... × S n , i ∈ [1, n], s ′ i<br />
∈ S i . Ein Übergang<br />
(s 1 , ..., s n ) ↦→ (s 1 , ..., s i−1 , s ′ i , s i+1, ..., s n ) heißt eigennütziger Schritt falls u i (s 1 , ..., s n ) <<br />
u i (s 1 , ..., s i−1 , s ′ i , s i+1, ..., s n ).<br />
Selfish Step Algorithmus:<br />
while (s 1 , ..., s n ) ist kein Nash Equilibrium<br />
perform eigennützigen Schritt<br />
Definition: G S = (S, E S ) mit E S = {(s, es); s, es ∈ S, s ↦→ es ist eigennütziger Schritt} heißt<br />
Nash-Graph.<br />
Beachte:<br />
(a) Ein reines Nash Equilibrium entspricht einem Knoten in G S mit Ausgangsgrad 0.<br />
(b) Hat G S keine gerichteten Kreise so existiert ein reines Nash Equilibrium.<br />
(c) G S kann Pfade exponentieller Länge enthalten.<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>11
Beispiel: Routing Spiel<br />
7 Spieler, 3 Kanten, Spieler i hat Gewicht w i<br />
s i = {1, 2, 3}∀i = 1, ..., 7<br />
u i (s 1 , ..., s 7 ) = − P s j =s i<br />
w j<br />
1<br />
4<br />
2<br />
1<br />
2<br />
2<br />
2<br />
1<br />
2<br />
2<br />
2<br />
2<br />
1<br />
2<br />
2<br />
4<br />
3<br />
2<br />
2<br />
4<br />
3<br />
4 4 4<br />
3<br />
4<br />
3<br />
4<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>12
4. Das Auslastungsspiel<br />
Literatur:<br />
• R. W. Rosenthal. A class of games possessing pure-strategy Nash equilibria.<br />
International Journal of Game Theory 2, pp. 65 – 67. 1973.<br />
• D. S. Johnson, Chr. H. Papadimitriou, M. Yannakakis. How easy is local search?<br />
Proceedings of the 26th IEEE FOCS, pp. 39 – 42. 1985.<br />
• A. Fabrikant, Chr. H. Papadimitriou, K. Talwar. The Complexity of Pure Nash Equilibria.<br />
Proceedings of the 36th ACM STOC. 2004.<br />
• D. Fotakis, S. Kontogiannis, P. Spirakis. Selfish Unsplittable Flows.<br />
Proceedings of the ICALP ’04. 2004.<br />
Schwerpunkte:<br />
• allgemeines Auslastungsspiel (z.B. Netzwerkauslastung in allgemeinen Netzwerken)<br />
• Koordinationsfaktor: Leistungsverlust durch fehlende Koordination<br />
• Existenz von reinen Nash Equilibrien / Berechnung reiner Nash Equilibrien<br />
• PLS-Vollständigkeit<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>13
Auslastungsspiel:<br />
• n Spieler 1, ..., n,<br />
• E endliche Menge von Betriebsmitteln,<br />
• Strategiemenge S i ⊆ Pot(E) für jeden Spieler i, 1 ≤ i ≤ n,<br />
• Verzögerungsfunktion d e : {1, ..., n} → N für jedes e ∈ E, d e (j) nicht-fallend in j.<br />
Private Kosten bei Strategiewahl s = (s 1 , ..., s n ) ∈ S 1 × ... × S n :<br />
• f s (e) = |{i; e ∈ s i }| ist Zahl der Spieler die Betriebsmittel e benutzen,<br />
• d e (f s (e)) ist Verzögerung durch Betriebsmittel e,<br />
• c i (s) = P e∈s<br />
d e (f s (e)) sind private Kosten von Spieler i.<br />
i<br />
Reines Nash Equilibrium s = (s 1 , ..., s n ) ∈ S 1 × ... × S n :<br />
Für jeden Spieler i gilt c i (s 1 , ..., s i , ..., s n ) ≤ c i (s 1 , ..., s ′ i , ..., s n) für alle s ′ i ∈ S i.<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>14
Netzwerk-Auslastungsspiel:<br />
• G = (V, E) gerichteter Graph,<br />
• n Spieler 1, ..., n,<br />
• a i ∈ V , b i ∈ V sind Start- und Zielknoten für Spieler i, 1 ≤ i ≤ n,<br />
• S i ⊆ Pot(E) ist Menge der Wege von a i nach b i für jedes i, 1 ≤ i ≤ n,<br />
• Verzögerungsfunktion d e : {1, ..., n} → N für jedes e ∈ E, d e (j) nicht-fallend in j.<br />
Netzwerk-Auslastungsspiel ist genau dann symmetrisch, wenn a 1 = ... = a n und b 1 = ... = b n .<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>15
Satz<br />
Sei I = (n, E, S 1 , ..., S n , {d e } e∈E ) eine Instanz des Auslastungsspiels. I besitzt mindestens<br />
ein reines Nash Equilibrium.<br />
Beweis:<br />
Definiere Potentialfunktion h : (S 1 × ... × S n ) → N durch h(s) = P e∈E<br />
fs(e)<br />
P<br />
j=1<br />
d e (j).<br />
Wenn s = (s 1 , ..., s i , ..., s n ) und s ′ = (s 1 , ..., s ′ i , ..., s n), dann gilt:<br />
h(s) − h(s ′ P<br />
) = d e (f s (e)) −<br />
P d e (f s ′(e))<br />
e∈s i −s ′ e∈s<br />
i<br />
′ i −s i<br />
= c i (s) − c i (s ′ ).<br />
Hieraus folgt:<br />
h(s) minimal ⇒ s ist Nash Equilibrium.<br />
□<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>16
Folgerung 1:<br />
Sei I = (n, E, S 1 , . . . , S n , {d e } e∈E ) eine Instanz des Auslastungsspiels.<br />
Ein reines Nashequilibrium für I kann in<br />
0<br />
0 @ X e∈E<br />
1<br />
nX<br />
d e (j) A<br />
j=1<br />
eigennützigen Schritten berechnet werden.<br />
Folgerung 2:<br />
Wenn die Funktionen {d e } e∈E alle polynomiell in n beschränkt sind und ein eigennütziger Schritt<br />
in Polynomzeit berechnet werden kann, dann kann ein reines Nashequilibrium in Polynomzeit<br />
berechnet werden.<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>17
Min Cost Flow Instanz:<br />
• G = (V, E) gerichteter Graph,<br />
• Kosten c ij für Kante (i, j) ∈ E,<br />
• Kapazität u ij für Kante (i, j) ∈ E,<br />
• Anforderung b(i) für i ∈ V , P b(i) = 0.<br />
i∈V<br />
Min Cost Flow<br />
Min Cost Flow Problem:<br />
Minimiere<br />
unter den Bedingungen<br />
P<br />
(i,j)∈E<br />
P<br />
{j;(i,j)∈E}<br />
c ij x ij<br />
x ij −<br />
P<br />
{j;(j,i)∈E}<br />
x ji = b(i) für alle i ∈ V ,<br />
0 ≤ x ij ≤ u ij für alle (i, j) ∈ E.<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>18
Satz<br />
Das Min Cost Flow Problem kann in Polynomzeit gelöst werden.<br />
Laufzeiten von Min Cost Flow Algorithmen:<br />
Es sei U = max<br />
i,j<br />
Algorithmus<br />
u ij und C = max<br />
i,j<br />
Capacity scaling algorithm<br />
Cost scaling algorithm<br />
Double scaling algorithm<br />
c ij .<br />
Laufzeit<br />
O((m log U)(m + n log n))<br />
O((n 3 log(nC))<br />
O(nm log U log(nC))<br />
Minimum mean cylcle-canceling algorithm O(n 2 m 3 log n)<br />
Repeated capacity scaling algorithm<br />
Enhanced capacity scaling algorithm<br />
O((m 2 log n)(m + n log n))<br />
O((m log n)(m + n log n))<br />
Tabelle aus: Ahuja, Magnanti, Orlin. Network Flows. Prentice Hall, 1993.<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>19
Satz<br />
Sei I = (n, V, E, a, b, {d e } e∈E ) eine Instanz für das symmetrische Netzwerk-Auslastungsspiel.<br />
Ein reines Nash Equilibrium für I kann in Polynomzeit berechnet werden.<br />
Beweisidee:<br />
Minimum von h(s) := P e∈E<br />
fs(e)<br />
P<br />
j=1<br />
d e (j) auf (V, E, a, b) als Min Cost Flow berechnen:<br />
2/3<br />
2/4<br />
3<br />
4<br />
2<br />
2<br />
A,B<br />
a<br />
1/2 b A,B ⇒<br />
A,B<br />
a<br />
1 2<br />
b<br />
A,B<br />
4/6<br />
1/5<br />
6 5<br />
4<br />
1<br />
Jede Kante e ∈ E wird durch n parallele Kanten mit Kapazität 1 und Kosten d e (1), ..., d e (n)<br />
ersetzt. Min Cost Flow für neues Netzwerk minimiert h(s).<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>20
5. Die Komplexitätsklasse PLS<br />
Bei einem Optimierungsproblem sucht man für gewöhnlich nach einem globalen Optimum. Dies<br />
ist eine zulässige Lösung, die eine gegebene Zielfunktion minimiert bzw. maximiert.<br />
PLS (polynomial time local search) ist eine Klasse von lokalen Suchproblemen. Man sucht hier<br />
also nach zulässigen Lösungen, von denen man nur lokale Optimalität fordert.<br />
Für kein PLS-vollständiges Problem L ist ein Algorithmus bekannt, der ein lokales Optimum für<br />
L in Polynomialzeit berechnen kann.<br />
Literatur zu PLS:<br />
David S. Johnson, Christos H. Papadimitriou, Mihalis Yannakakis. How easy is local search?<br />
Proceedings of the 26th IEEE FOCS, pp. 39 – 42. 1985.<br />
Alejandro A. Schäffer, Mihalis Yannakakis. Simple local search problems that are hard to solve.<br />
SIAM Journal on Computing, pp. 56 – 87. 199<strong>1.</strong><br />
Alex Fabrikant, Christos H. Papadimitriou, Kunal Talwar. The Complexity of Pure Nash Equilibria.<br />
Proceedings of the 36th ACM STOC, pp. 604 – 612. 2004.<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>21
Definition:<br />
Ein PLS (polynomial-time local search) Problem L = (D L , F L , c L , N) ist wie folgt spezifiziert:<br />
• D L ⊆ {0, 1} ∗ ist Menge der Probleminstanzen<br />
(Entscheidung ob x ∈ D L oder x ∉ D L in Polynomialzeit möglich),<br />
• jede Probleminstanz x ∈ D L hat eine endliche Menge F L (x) zulässiger Lösungen,<br />
• jede zulässige Lösung s ∈ F L (x) hat einen nicht-negativen Kostenwert c L (s, x), eine<br />
Nachbarschaft N(s, x) ⊆ F L (x) und eine Codierung polynomieller Länge (in |x|).<br />
Außerdem müssen die folgenden 3 Polynomialzeit-Algorithmen existieren:<br />
• gegeben x ∈ D L gibt Algorithmus A L eine zulässige Lösung s ∈ F L (x) zurück,<br />
• gegeben einen Bitstring s gibt Algorithmus B L im Fall s ∈ F L (x) den Kostenwert c L (s, x)<br />
zurück, im Fall s ∉ F L (x) wird zurückgegeben, dass s keine zulässige Lösung ist,<br />
• gegeben eine Instanz x ∈ L und eine zulässige Lösung s ∈ F L (x) gibt der Algorithmus C L<br />
eine bessere Nachbarschaftslösung N(s, x) zurück oder gibt zurück, dass es keine bessere<br />
Lösung in der Nachbarschaft gibt.<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>2
Komplexität der Equilibriums-Berechnung für Auslastungsspiele:<br />
Equilibriums-Berechnung symmetrisches Spiel allgemeines Spiel<br />
Auslastungsspiel PLS-vollständig PLS-vollständig<br />
Netzwerk Aulastungsspiel Polynomialzeit PLS-vollständig<br />
⇒ Schnelle Equilibriums-Berechnung kann nur für symmetrische Netzwerk-Instanzen garantiert<br />
werden.<br />
Ergebnisse aus:<br />
Alex Fabrikant, Christos H. Papadimitriou, Kunal Talwar.<br />
The Complexity of Pure Nash Equilibria.<br />
Proceedings of the 36th ACM STOC. 2004.<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>23
6. Auslastungsspiel: Der Preis der Anarchie<br />
Literatur:<br />
• G. Christodoulou, E. Koutsoupias. The Price of Anarchy of Finite Congestion Games.<br />
Proceedings of the 37th ACM STOC, 2005.<br />
• B. Awerbuch, Y. Azar, A. Epstein. The Price of Routing Unsplittable Flow.<br />
Proceedings of the 37th ACM STOC, 2005.<br />
Bemerkung:<br />
• Hier werden Auslastungspiele ohne Gewichte betrachtet.<br />
• Wir betrachten hier nur reine Nash Equilibrien.<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>24
Private Kosten bei Strategiewahl s = (s 1 , ..., s n ) ∈ S 1 × ... × S n :<br />
• f s (e) = |{i; e ∈ s i }| ist Zahl der Spieler die Betriebsmittel e benutzen,<br />
• d e (f s (e)) ist Verzögerung durch Betriebsmittel e,<br />
• c i (s) = P e∈s i<br />
d e (f s (e)) sind private Kosten von Spieler i.<br />
Soziale Kosten bei Strategiewahl s = (s 1 , ..., s n ) ∈ S 1 × ... × S n :<br />
• Summe der Privaten Kosten<br />
SUM(s) = X i∈[n]<br />
c i (s) = X e∈E<br />
f s (e) · d e (f s (e))<br />
(In der Literatur wurden auch andere soziale Kostenmasse untersucht.)<br />
Preis der Anarchie/Koodinationsrate<br />
• OP T = min s∈S SUM(s) ist optimale Zuweisung<br />
•<br />
P oA pure = sup<br />
s ist NE<br />
SUM(s)<br />
OP T<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>25
P oA pure für (ungewichtete) Auslastungsspiele<br />
P oA pure<br />
symmetrisch<br />
Lineare Latenzfunktionen<br />
de(x) = ae · x + be<br />
mit ae, be ≥ 0 ∀e ∈ E<br />
Latenzfunktionen:<br />
Polynome vom Grad d<br />
de(x) = P d<br />
i=0<br />
ae(i)x i<br />
mit ae(i) ≥ 0 ∀i ∈ {0, ..., d}, ∀e ∈ E<br />
5n−2<br />
2n+1<br />
d Θ(d)<br />
asymmetrisch<br />
5<br />
2<br />
d Θ(d)<br />
Bemerkung:<br />
Ein Auslastungsspiel ohne Gewichte ist genau dann symmetrisch, wenn S i = S j für alle<br />
i ∈ {1, ..., n}, j ∈ {1, ..., n}.<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>26
7. Das Wardrop Modell<br />
• Der Verkehr kann in beliebig kleine Stücke aufgeteilt werden<br />
• Unendlich viele Spieler haben unendlich kleine Anteile am Verkehr<br />
• Der Verkehr wird als reellwertiger Fluss modelliert<br />
s t 1 1<br />
s 2<br />
G<br />
t 2<br />
Edge Latency l e (x)<br />
Eingabe: (G, r, l) mit<br />
• G = (V, E) ist ein gerichteter Graph,<br />
• einer Menge r = {(r i , s i , t i ) ∈ R >0 ×V ×V | i ∈<br />
[k]} von Routing-Wegen, und<br />
• einer Menge l = {l e | e ∈ E} von Verzögerungsfunktionen.<br />
Kosten einer Kante: c e (f e ) = l e (f e )f e<br />
Soziale Kosten: C(f) = P e∈E c e(f e ) = P e∈E l e(f e )f e = P P ∈P l P (f)f P<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>27
Annahmen:<br />
• Für alle i ∈ [k] gibt es mindestens einen Weg von s i nach t i in G.<br />
• Die Verzögerungsfunktionen sind nichtnegativ, nichtfallend und differenzierbar<br />
• Der Verkehr wird als Fluss über Wege P i ∈ P i von s i nach t i in G dargestellt (äquivalent zu<br />
Flüssen f e über Kanten e ∈ E.<br />
Ein optimaler Fluss kann durch Lösung des folgenden nichtlinearen Programms berechnet werden:<br />
N LP : min P e∈E c e(f e ) s.t.<br />
P<br />
P ∈P i<br />
f P = r i<br />
f e = P P ∈P:e∈P f P<br />
f P ≥ 0<br />
∀i ∈ [k]<br />
∀e ∈ E<br />
∀P ∈ P<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>28
Definition: Ein Fluss f in G ist ein Nash Equilibrium (Wardrop Equilibrium), wenn für alle<br />
i ∈ [k] und für alle P 1 , P 2 ∈ P i und alle δ ∈ [0, f P1 ], gilt: l P1 (f) ≤ l P2 ( ˜f), wobei<br />
˜f P =<br />
8<br />
<<br />
:<br />
f P − δ if P = P 1<br />
f P + δ if P = P 2<br />
f P if P ∉ {P 1 , P 2 }.<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>29
Das Netzwerk Design Problem<br />
Situation<br />
Optimum<br />
Nash−Equilibrium<br />
x 1<br />
x 1<br />
x 1<br />
1/2 1/2<br />
1/2 1/2<br />
1/2 1/2<br />
1/2 1/2<br />
1 x<br />
1 x<br />
1 x<br />
3/2 3/2<br />
x 1<br />
x 1<br />
x 1<br />
1/2 1/2<br />
1 0<br />
0 0 0<br />
0 1<br />
1/2 1/2<br />
0 1<br />
1 x<br />
1 x<br />
1 x<br />
3/2<br />
2<br />
Braess’s Paradoxon zeigt, dass das<br />
Hinzufügen von Kanten in das Netzwerk<br />
zu schlechteren sozialen Kosten<br />
eines Nash Equilibriums führen<br />
kann selbst wenn die zusätzlichen<br />
Kanten nur kleine Verzögerungen<br />
verursachen.<br />
Das führt zu der folgenden Frage:<br />
Finde einen Teilgraphen H =<br />
(V, E H ) ⊂ G für den ein<br />
Fluss f eines Nash-Equilibriums für<br />
(H, r, l) minimale soziale Kosten<br />
hat.<br />
Monien, Feldmann, Tscheuschner, Schoppmann<br />
Universität <strong>Paderborn</strong> Projektgruppe Avesta SS 2006, WS 2006/2007 <strong>1.</strong>30