Table des matières - Gilles Daniel
Table des matières - Gilles Daniel Table des matières - Gilles Daniel
308 Modélisation et simulation multi-agents pour Sciences de l'Homme et de la Société. multiplicité des équilibres de Nash (de deux à une infinité, selon le jeu considéré). Le tableau 14.1. représente le jeu de pure coordination le plus simple sous la forme dite « normale » (ou « stratégique »). Cette forme ne nous permet de connaître ni l’ordre des interventions et les enchaînements possibles, ni l’information dont disposent les joueurs au cours de ces enchaînements. Mais elle nous permet d’identifier les équilibres de Nash non coopératifs. Sur le tableau 14.1, les stratégies du joueur 1 figurent en ligne, et celles du joueur 2 en colonne. Ceux-ci doivent choisir entre deux stratégies dans l’ensemble : S = {A, B}. On désigne par S 1 la stratégie du joueur 1 et par S 2 celle du joueur 2. Les gains associés à chaque couple de stratégies sont désignés par : πi(S i,S j) avec : i ≠ j ∈ {1,2}. Ils sont représentés entre parenthèses dans les cases de la matrice de jeu, le gain du joueur 1 : π 1 d’abord, puis celui du joueur 2 : π 2 ensuite, soit : (π 1 , π 2 ). L’équilibre de Nash est une situation où aucun joueur n’a intérêt à dévier unilatéralement. Le couple de stratégies (S 1 ,S 2 ) = (A, A) est un équilibre de Nash car si le joueur 1 dévie unilatéralement et joue B son gain passe de π 1 (A, A) = 1 à π 1 (B, A) = 0. Il en est de même pour le joueur 2. Le lecteur vérifiera facilement que le couple de stratégies (B, B) est également un équilibre de Nash. Jeu (1) 2 joue S 2 = A 2 joue S 2 = B 1 joue S 1 = A (1, 1) (0, 0) 1 joue S 1 = B (0 , 0) (1 , 1) Tableau 14.1. Jeu de pure coordination. Formellement, dans le cas à 2 joueurs, pour le joueur i, la stratégie S i * ∈ S est un équilibre de Nash si la condition suivante est vérifiée : π i (S i*, S j *) ≥ π i (S i , S j *) pour tout S i ∈ S et tout i, j ∈{1, 2} [14.6] Pour une stratégie donnée (quelconque) de l’autre joueur, on peut définir la meilleure réponse d’un joueur comme la stratégie qui maximise son gain, conditionnellement à cette stratégie donnée de l’autre joueur : { 1, 2} S { π ( S )} ∀i, j ∈ , S ∈arg max ,S [14.7] i j i i S ∈ S i On peut alors également définir un équilibre de Nash comme un ensemble de choix tel que la stratégie de chaque acteur est la meilleure réponse aux stratégies des autres acteurs : * * * { 1, 2} i { πi( i j) } ∀i, j ∈ , S ∈ arg max S ,S [14.8] * Si ∈ S j
Influence sociale, jeux de population et émergence. 309 Par exemple, si mon adversaire joue A, ma meilleure réponse consiste à jouer A également. Si mon adversaire joue B, ma meilleure réponse est B. Dans ces deux cas c’est en effet la stratégie qui maximise mon gain. Ces trois définitions s’étendent facilement à n joueurs en remplaçant la stratégie de l’adversaire S j par le vecteur S −i des stratégies des adversaires du joueur P i . Dans ce qui suit, on supposera que les joueurs choisissent normalement leur meilleure réponse, conditionnellement à leurs croyances sur le comportement des autres joueurs, mais peuvent occasionnellement en dévier : on dira qu’il s’agit d’une meilleure réponse « bruitée ». Le jeu (1) du tableau 14.1 représente une situation de pure coordination avec deux équilibres de Nash. La question de savoir lequel des deux sera choisi est qualifiée dans la littérature de problème de « sélection » d’un équilibre. Dans le cas à deux joueurs, en l’absence d’une référence extérieure, il est impossible de savoir lequel des deux équilibres sera sélectionné. Si, par contre, on introduit une référence extérieure (point focal, [SCH 60]), comme le fait que A vienne avant B dans l’alphabet, on peut imaginer que cet équilibre aura plus de chance d’être sélectionné, en particulier si chaque joueur a des croyances (de premier degré ou au-delà) qui viendraient renforcer ce biais « culturel ». 14.3.1. Jeux de population. Considérons maintenant le cas d’un « jeu de population » [BLU 97] où chaque joueur est apparié avec un autre joueur choisi aléatoirement (sans redondance) dans la population. Les joueurs doivent jouer en « stratégie pure », c’est à dire choisir soit A, soit B. Mais la stratégie qui sera jouée par leur partenaire – adversaire est encore inconnue. Les joueurs doivent donc former des conjectures sur la répartition des stratégies dans la population. Que se passe-t-il, initialement, lorsque que l’on attribue aux joueurs ont des croyances a priori sur la distribution des stratégies dans la population Supposons que le joueur i croit qu’il y a dans la population une proportion σ i de joueurs qui jouent A (de manière complémentaire : (1−σ i ) qui jouent B). Si l’on suppose que les joueurs vont chercher à maximiser leur espérance de gain conditionnellement à leur croyance, le gain espéré de la stratégie S i dans un appariement aléatoire (random pairwise) sera donc égal à : π i (S i, σ i ) = σ i .π i (S i , A) + (1−σ i ).π i (S i , B) [14.9] Le lecteur vérifiera que si le joueur i choisit sa meilleure réponse avec des gains définis par l’équation [14.9], alors il choisira A si σ i > 0,5 et B si σ i < 0,5. On dit qu’il choisit ainsi sa meilleure réponse contre la « stratégie mixte » σ i . Il importe de remarquer que chaque agent i a une croyance spécifique : σ i et qu’il n’y a aucune raison pour que cette croyance soit la même pour tous les agents. Dans le cadre qui nous intéresse ici, les joueurs doivent choisir une stratégie pure dans un jeu de population avec appariement aléatoire et tout se passe comme s’ils faisaient face à un seul joueur qui joue A et (respectivement : B) avec une probabilité σ i et (respectivement : 1−σ i ).
- Page 253 and 254: Des réseaux d’automates aux mod
- Page 255 and 256: Des réseaux d’automates aux mod
- Page 257 and 258: Des réseaux d’automates aux mod
- Page 259 and 260: Des réseaux d’automates aux mod
- Page 261 and 262: Chapitre 12 Modélisation, impléme
- Page 263 and 264: Modélisation, implémentation et e
- Page 265 and 266: Modélisation, implémentation et e
- Page 267 and 268: Modélisation, implémentation et e
- Page 269 and 270: Modélisation, implémentation et e
- Page 271 and 272: Modélisation, implémentation et e
- Page 273 and 274: Modélisation, implémentation et e
- Page 275 and 276: Modélisation, implémentation et e
- Page 277 and 278: Chapitre 13 Apprentissage dans les
- Page 279 and 280: Apprentissage dans les modèles mul
- Page 281 and 282: Apprentissage dans les modèles mul
- Page 283 and 284: Apprentissage dans les modèles mul
- Page 285 and 286: Apprentissage dans les modèles mul
- Page 287 and 288: Apprentissage dans les modèles mul
- Page 289 and 290: Apprentissage dans les modèles mul
- Page 291 and 292: Apprentissage dans les modèles mul
- Page 293 and 294: Apprentissage dans les modèles mul
- Page 295 and 296: Apprentissage dans les modèles mul
- Page 297 and 298: Apprentissage dans les modèles mul
- Page 299 and 300: Chapitre 14 Influence sociale, jeux
- Page 301 and 302: Influence sociale, jeux de populati
- Page 303: Influence sociale, jeux de populati
- Page 307 and 308: Influence sociale, jeux de populati
- Page 309 and 310: Influence sociale, jeux de populati
- Page 311 and 312: Influence sociale, jeux de populati
- Page 313 and 314: Influence sociale, jeux de populati
- Page 315 and 316: Influence sociale, jeux de populati
- Page 317 and 318: Influence sociale, jeux de populati
- Page 319 and 320: Influence sociale, jeux de populati
- Page 321 and 322: Influence sociale, jeux de populati
- Page 323 and 324: Troisième Partie Introduction à l
- Page 325 and 326: Modélisation multi-agents des syst
- Page 327 and 328: Chapitre 15 Approche conceptuelle d
- Page 329 and 330: Approche conceptuelle de l’espace
- Page 331 and 332: Approche conceptuelle de l’espace
- Page 333 and 334: Approche conceptuelle de l’espace
- Page 335 and 336: Approche conceptuelle de l’espace
- Page 337 and 338: Approche conceptuelle de l’espace
- Page 339 and 340: Approche conceptuelle de l’espace
- Page 341 and 342: Approche conceptuelle de l’espace
- Page 343 and 344: Approche conceptuelle de l’espace
- Page 345 and 346: Approche conceptuelle de l’espace
- Page 347 and 348: Approche conceptuelle de l’espace
- Page 349 and 350: Chapitre 16 « A Monte Carlo approa
- Page 351 and 352: « A Monte Carlo approach to diffus
- Page 353 and 354: « A Monte Carlo approach to diffus
308 Modélisation et simulation multi-agents pour Sciences de l'Homme et de la Société.<br />
multiplicité <strong>des</strong> équilibres de Nash (de deux à une infinité, selon le jeu considéré).<br />
Le tableau 14.1. représente le jeu de pure coordination le plus simple sous la forme<br />
dite « normale » (ou « stratégique »). Cette forme ne nous permet de connaître ni<br />
l’ordre <strong>des</strong> interventions et les enchaînements possibles, ni l’information dont<br />
disposent les joueurs au cours de ces enchaînements. Mais elle nous permet<br />
d’identifier les équilibres de Nash non coopératifs.<br />
Sur le tableau 14.1, les stratégies du joueur 1 figurent en ligne, et celles du<br />
joueur 2 en colonne. Ceux-ci doivent choisir entre deux stratégies dans l’ensemble :<br />
S = {A, B}. On désigne par S 1 la stratégie du joueur 1 et par S 2 celle du joueur 2.<br />
Les gains associés à chaque couple de stratégies sont désignés par : πi(S i,S j)<br />
avec :<br />
i ≠ j ∈ {1,2}. Ils sont représentés entre parenthèses dans les cases de la matrice de<br />
jeu, le gain du joueur 1 : π 1 d’abord, puis celui du joueur 2 : π 2 ensuite, soit : (π 1 , π 2 ).<br />
L’équilibre de Nash est une situation où aucun joueur n’a intérêt à dévier<br />
unilatéralement. Le couple de stratégies (S 1 ,S 2 ) = (A, A) est un équilibre de Nash car<br />
si le joueur 1 dévie unilatéralement et joue B son gain passe de π 1 (A, A) = 1 à π 1 (B,<br />
A) = 0. Il en est de même pour le joueur 2. Le lecteur vérifiera facilement que le<br />
couple de stratégies (B, B) est également un équilibre de Nash.<br />
Jeu (1) 2 joue S 2 = A 2 joue S 2 = B<br />
1 joue S 1 = A (1, 1) (0, 0)<br />
1 joue S 1 = B (0 , 0) (1 , 1)<br />
<strong>Table</strong>au 14.1. Jeu de pure coordination.<br />
Formellement, dans le cas à 2 joueurs, pour le joueur i, la stratégie S i * ∈ S est un<br />
équilibre de Nash si la condition suivante est vérifiée :<br />
π i (S i*, S j *) ≥ π i (S i , S j *) pour tout S i ∈ S et tout i, j ∈{1, 2} [14.6]<br />
Pour une stratégie donnée (quelconque) de l’autre joueur, on peut définir la<br />
meilleure réponse d’un joueur comme la stratégie qui maximise son gain,<br />
conditionnellement à cette stratégie donnée de l’autre joueur :<br />
{ 1, 2} S { π ( S )}<br />
∀i, j ∈ , S ∈arg max ,S<br />
[14.7]<br />
i j<br />
i i<br />
S ∈ S<br />
i<br />
On peut alors également définir un équilibre de Nash comme un ensemble de choix tel que la<br />
stratégie de chaque acteur est la meilleure réponse aux stratégies <strong>des</strong> autres acteurs :<br />
*<br />
* *<br />
{ 1, 2} i { πi( i j)<br />
}<br />
∀i, j ∈ , S ∈ arg max S ,S<br />
[14.8]<br />
*<br />
Si<br />
∈ S<br />
j