01.01.2015 Views

Table des matières - Gilles Daniel

Table des matières - Gilles Daniel

Table des matières - Gilles Daniel

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Influence sociale, jeux de population et émergence. 315<br />

couples de propositions dont la somme est inférieure ou égale à 100 conduisent à un<br />

gain effectif (c’est un marchandage de Nash). On distingue trois classes de situations :<br />

celles ou le gain <strong>des</strong> agents est nul (car ils ont revendiqué ensemble plus de 100% au<br />

total) ; celles ou l’ensemble du gâteau est attribué : on vérifie que ce sont les trois<br />

équilibres de Nash en stratégie pure ; enfin les situations inefficientes où tout le gâteau<br />

n’est pas attribué (<strong>Table</strong>au 14.5). Parmi les équilibres de Nash, on distingue finalement<br />

un équilibre équitable (M, M) et deux équilibres inéquitables (L,H) et (H,L).<br />

Le processus du jeu de population se déroule de la manière suivante : à chaque pas<br />

de temps, tous les agents, appariés aléatoirement, jouent le « jeu de partage ». Chaque<br />

agent choisit avec une probabilité (1−ε) la stratégie qui correspond à sa « meilleure<br />

réponse » conditionnellement à sa croyance σ i sur la répartition moyenne <strong>des</strong> stratégies<br />

dans la population. Avec une probabilité ε, un agent choisit sa stratégie aléatoirement<br />

avec équiprobabilité : (1/3) (expérimentation consciente, imitation, erreur...). Si<br />

plusieurs stratégies ont un gain anticipé équivalent, l’agent choisit alors aléatoirement<br />

entre les stratégies considérées avec équiprobabilité. Dans le cas général, un joueur<br />

choisit donc sa « meilleure réponse » avec une probabilité : 1−(2.ε)/3.<br />

S2 = H S2 = M S2 = L<br />

S1 = H (0,0) (0,0) (70,30)<br />

S1 = M (0,0) (50, 50) (50,30)<br />

S1 = L (30,70) (30,50) (30,30)<br />

Joueur 1 en ligne, joueur 2 en colonne, gains : (gains 1, gain 2)<br />

14.4.1.2. Les croyances <strong>des</strong> agents<br />

<strong>Table</strong>au 14.5. « jeu de partage ».<br />

La « croyance » initiale d’un agent i sur les stratégies jouées dans la population est<br />

un triplet σ i = (p i , q i , 1−p i −q i ) qui correspond à la fréquence anticipée <strong>des</strong> stratégies (H,<br />

M, L) lors d’une rencontre aléatoire. Elle permet à l’agent de calculer sa meilleure<br />

réponse en espérance de gain contre une stratégie mixte de paramètre σ i . Elle est<br />

construite de telle manière qu’elle puisse être actualisée à chaque période par<br />

l’observation de la dernière stratégie jouée par le partenaire du moment. Plus<br />

spécifiquement, cette croyance est basée sur une mémoire de longueur m qui permet<br />

de calculer σ i comme la fréquence <strong>des</strong> différentes stratégies observées lors <strong>des</strong> m<br />

dernières confrontations. A chaque étape, l’agent met à jour sa croyance en supprimant<br />

de sa mémoire la valeur la plus ancienne et en actualisant sa liste par la dernière<br />

stratégie observée. Cet état de la croyance d’un agent peut être représenté par un point<br />

sur le simplexe (de dimension égale au nombre de stratégies moins une) utilisé pour<br />

représenter les stratégies mixtes de ce jeu (Figure 14.7). Les croyances initiales<br />

peuvent être initialisées de manière aléatoire, ou dans une zone ciblée, pour accélérer<br />

la recherche <strong>des</strong> situations typiques (par exemple, l’axe H-L). Mais une forme initiale

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!