Table des matières - Gilles Daniel

Table des matières - Gilles Daniel Table des matières - Gilles Daniel

gillesdaniel.com
from gillesdaniel.com More from this publisher
01.01.2015 Views

308 Modélisation et simulation multi-agents pour Sciences de l'Homme et de la Société. multiplicité des équilibres de Nash (de deux à une infinité, selon le jeu considéré). Le tableau 14.1. représente le jeu de pure coordination le plus simple sous la forme dite « normale » (ou « stratégique »). Cette forme ne nous permet de connaître ni l’ordre des interventions et les enchaînements possibles, ni l’information dont disposent les joueurs au cours de ces enchaînements. Mais elle nous permet d’identifier les équilibres de Nash non coopératifs. Sur le tableau 14.1, les stratégies du joueur 1 figurent en ligne, et celles du joueur 2 en colonne. Ceux-ci doivent choisir entre deux stratégies dans l’ensemble : S = {A, B}. On désigne par S 1 la stratégie du joueur 1 et par S 2 celle du joueur 2. Les gains associés à chaque couple de stratégies sont désignés par : πi(S i,S j) avec : i ≠ j ∈ {1,2}. Ils sont représentés entre parenthèses dans les cases de la matrice de jeu, le gain du joueur 1 : π 1 d’abord, puis celui du joueur 2 : π 2 ensuite, soit : (π 1 , π 2 ). L’équilibre de Nash est une situation où aucun joueur n’a intérêt à dévier unilatéralement. Le couple de stratégies (S 1 ,S 2 ) = (A, A) est un équilibre de Nash car si le joueur 1 dévie unilatéralement et joue B son gain passe de π 1 (A, A) = 1 à π 1 (B, A) = 0. Il en est de même pour le joueur 2. Le lecteur vérifiera facilement que le couple de stratégies (B, B) est également un équilibre de Nash. Jeu (1) 2 joue S 2 = A 2 joue S 2 = B 1 joue S 1 = A (1, 1) (0, 0) 1 joue S 1 = B (0 , 0) (1 , 1) Tableau 14.1. Jeu de pure coordination. Formellement, dans le cas à 2 joueurs, pour le joueur i, la stratégie S i * ∈ S est un équilibre de Nash si la condition suivante est vérifiée : π i (S i*, S j *) ≥ π i (S i , S j *) pour tout S i ∈ S et tout i, j ∈{1, 2} [14.6] Pour une stratégie donnée (quelconque) de l’autre joueur, on peut définir la meilleure réponse d’un joueur comme la stratégie qui maximise son gain, conditionnellement à cette stratégie donnée de l’autre joueur : { 1, 2} S { π ( S )} ∀i, j ∈ , S ∈arg max ,S [14.7] i j i i S ∈ S i On peut alors également définir un équilibre de Nash comme un ensemble de choix tel que la stratégie de chaque acteur est la meilleure réponse aux stratégies des autres acteurs : * * * { 1, 2} i { πi( i j) } ∀i, j ∈ , S ∈ arg max S ,S [14.8] * Si ∈ S j

Influence sociale, jeux de population et émergence. 309 Par exemple, si mon adversaire joue A, ma meilleure réponse consiste à jouer A également. Si mon adversaire joue B, ma meilleure réponse est B. Dans ces deux cas c’est en effet la stratégie qui maximise mon gain. Ces trois définitions s’étendent facilement à n joueurs en remplaçant la stratégie de l’adversaire S j par le vecteur S −i des stratégies des adversaires du joueur P i . Dans ce qui suit, on supposera que les joueurs choisissent normalement leur meilleure réponse, conditionnellement à leurs croyances sur le comportement des autres joueurs, mais peuvent occasionnellement en dévier : on dira qu’il s’agit d’une meilleure réponse « bruitée ». Le jeu (1) du tableau 14.1 représente une situation de pure coordination avec deux équilibres de Nash. La question de savoir lequel des deux sera choisi est qualifiée dans la littérature de problème de « sélection » d’un équilibre. Dans le cas à deux joueurs, en l’absence d’une référence extérieure, il est impossible de savoir lequel des deux équilibres sera sélectionné. Si, par contre, on introduit une référence extérieure (point focal, [SCH 60]), comme le fait que A vienne avant B dans l’alphabet, on peut imaginer que cet équilibre aura plus de chance d’être sélectionné, en particulier si chaque joueur a des croyances (de premier degré ou au-delà) qui viendraient renforcer ce biais « culturel ». 14.3.1. Jeux de population. Considérons maintenant le cas d’un « jeu de population » [BLU 97] où chaque joueur est apparié avec un autre joueur choisi aléatoirement (sans redondance) dans la population. Les joueurs doivent jouer en « stratégie pure », c’est à dire choisir soit A, soit B. Mais la stratégie qui sera jouée par leur partenaire – adversaire est encore inconnue. Les joueurs doivent donc former des conjectures sur la répartition des stratégies dans la population. Que se passe-t-il, initialement, lorsque que l’on attribue aux joueurs ont des croyances a priori sur la distribution des stratégies dans la population Supposons que le joueur i croit qu’il y a dans la population une proportion σ i de joueurs qui jouent A (de manière complémentaire : (1−σ i ) qui jouent B). Si l’on suppose que les joueurs vont chercher à maximiser leur espérance de gain conditionnellement à leur croyance, le gain espéré de la stratégie S i dans un appariement aléatoire (random pairwise) sera donc égal à : π i (S i, σ i ) = σ i .π i (S i , A) + (1−σ i ).π i (S i , B) [14.9] Le lecteur vérifiera que si le joueur i choisit sa meilleure réponse avec des gains définis par l’équation [14.9], alors il choisira A si σ i > 0,5 et B si σ i < 0,5. On dit qu’il choisit ainsi sa meilleure réponse contre la « stratégie mixte » σ i . Il importe de remarquer que chaque agent i a une croyance spécifique : σ i et qu’il n’y a aucune raison pour que cette croyance soit la même pour tous les agents. Dans le cadre qui nous intéresse ici, les joueurs doivent choisir une stratégie pure dans un jeu de population avec appariement aléatoire et tout se passe comme s’ils faisaient face à un seul joueur qui joue A et (respectivement : B) avec une probabilité σ i et (respectivement : 1−σ i ).

308 Modélisation et simulation multi-agents pour Sciences de l'Homme et de la Société.<br />

multiplicité <strong>des</strong> équilibres de Nash (de deux à une infinité, selon le jeu considéré).<br />

Le tableau 14.1. représente le jeu de pure coordination le plus simple sous la forme<br />

dite « normale » (ou « stratégique »). Cette forme ne nous permet de connaître ni<br />

l’ordre <strong>des</strong> interventions et les enchaînements possibles, ni l’information dont<br />

disposent les joueurs au cours de ces enchaînements. Mais elle nous permet<br />

d’identifier les équilibres de Nash non coopératifs.<br />

Sur le tableau 14.1, les stratégies du joueur 1 figurent en ligne, et celles du<br />

joueur 2 en colonne. Ceux-ci doivent choisir entre deux stratégies dans l’ensemble :<br />

S = {A, B}. On désigne par S 1 la stratégie du joueur 1 et par S 2 celle du joueur 2.<br />

Les gains associés à chaque couple de stratégies sont désignés par : πi(S i,S j)<br />

avec :<br />

i ≠ j ∈ {1,2}. Ils sont représentés entre parenthèses dans les cases de la matrice de<br />

jeu, le gain du joueur 1 : π 1 d’abord, puis celui du joueur 2 : π 2 ensuite, soit : (π 1 , π 2 ).<br />

L’équilibre de Nash est une situation où aucun joueur n’a intérêt à dévier<br />

unilatéralement. Le couple de stratégies (S 1 ,S 2 ) = (A, A) est un équilibre de Nash car<br />

si le joueur 1 dévie unilatéralement et joue B son gain passe de π 1 (A, A) = 1 à π 1 (B,<br />

A) = 0. Il en est de même pour le joueur 2. Le lecteur vérifiera facilement que le<br />

couple de stratégies (B, B) est également un équilibre de Nash.<br />

Jeu (1) 2 joue S 2 = A 2 joue S 2 = B<br />

1 joue S 1 = A (1, 1) (0, 0)<br />

1 joue S 1 = B (0 , 0) (1 , 1)<br />

<strong>Table</strong>au 14.1. Jeu de pure coordination.<br />

Formellement, dans le cas à 2 joueurs, pour le joueur i, la stratégie S i * ∈ S est un<br />

équilibre de Nash si la condition suivante est vérifiée :<br />

π i (S i*, S j *) ≥ π i (S i , S j *) pour tout S i ∈ S et tout i, j ∈{1, 2} [14.6]<br />

Pour une stratégie donnée (quelconque) de l’autre joueur, on peut définir la<br />

meilleure réponse d’un joueur comme la stratégie qui maximise son gain,<br />

conditionnellement à cette stratégie donnée de l’autre joueur :<br />

{ 1, 2} S { π ( S )}<br />

∀i, j ∈ , S ∈arg max ,S<br />

[14.7]<br />

i j<br />

i i<br />

S ∈ S<br />

i<br />

On peut alors également définir un équilibre de Nash comme un ensemble de choix tel que la<br />

stratégie de chaque acteur est la meilleure réponse aux stratégies <strong>des</strong> autres acteurs :<br />

*<br />

* *<br />

{ 1, 2} i { πi( i j)<br />

}<br />

∀i, j ∈ , S ∈ arg max S ,S<br />

[14.8]<br />

*<br />

Si<br />

∈ S<br />

j

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!