Table des matières - Gilles Daniel
Table des matières - Gilles Daniel Table des matières - Gilles Daniel
286 Modélisation et simulation multi-agents pour Sciences de l'Homme et de la Société. variable. Par ailleurs d’autres facteurs peuvent influencer ces gains, (actions d’autres agents, chocs exogènes, …). En trois mots, l’agent peut avoir de grandes difficultés à reconnaître le lien entre son action et ses gains. Ceci crée un problème d’assignation des gains à l’action, que nous retrouverons plus tard dans ce chapitre. Parmi les très nombreux modèles de renforcement les plus utilisés en modélisation multi-agents, un des plus simples est l’algorithme Derivative-Follower de [GRE 99], dont le champ d’application est restreint aux recherches sur une dimension. Le Q-Learning de [WAT 89] est approprié aux cas où l’agent cherche à résoudre au mieux un problème du type programmation dynamique. Directement inspirés par les travaux en psychologie de [BUS 55] sont les algorithmes de [ROT 95], [ERE 98]. Une des plus puissantes et plus prometteuses approches est cependant celle des algorithmes génétiques, possiblement associés avec des systèmes de classificateurs, qui font l’objet du reste de ce chapitre. 13.3. Systèmes de classificateurs Les systèmes de classificateurs (CS), [HOL 75], sont des mécanismes de décision fondés sur un ensemble fixe de règles. Chacune de ces règles rend possible une action précise (la sortie) lorsque l’information reçue par le CS (l’entrée) satisfait à certaines conditions prédéfinies. Un CS sera en général utilisé de façon répétée dans un environnement qui est affecté par les actions réellement effectuées. Typiquement, le CS reçoit dans chaque période des gains après qu’il ait réalisé une action. Typiquement aussi, la modification de l’environnement influence les signaux et les gains que le CS recevra dans le futur. Le CS reçoit un signal de l’environnement, effectue une action qui modifie l’environnement, réalise un gain qui dépend, directement ou indirectement de cette modification de l’environnement, reçoit un nouveau signal, et ainsi de suite. On reconnaît immédiatement que cette structure apparaît appropriée pour décrire de nombreuses situations socio-économiques, avec une réserve cependant : les agents qui prennent des actions différentes de période en période en fonction des informations qu’ils reçoivent, mais ne modifient jamais leur comportement, c’est-à-dire leur façon d’interpréter une même information et d’y réagir. Le comportement modélisé avec un CS est mécanique, il n’y a pas d’apprentissage. Afin qu’un CS puisse être facilement implémenté numériquement, les signaux d’entrée et de sortie sont typiquement codés comme des chaînes binaires (chaînes de 0 et 1) ou d’entiers. Le codage/décodage de ces chaînes n’est pas essentiel au fonctionnement du CS. Il s’agit d’une opération technique qui permet d’écrire sous forme appropriée pour un traitement par ordinateur les entrées et sorties de l’objet réel ou théorique d’intérêt. Le codage implique une discrétisation de l’espace d’entrée et de l’espace de sortie. Ces points seront repris dans la section sur les algorithmes génétiques.
Apprentissage dans les modèles multi-agents 287 Le fonctionnement d’un CS peut avantageusement être présenté à l’aide de la Figure 13.1., tirée de [BRE 99]. La partie chiffre de la figure est à lire ligne par ligne. Le symbole # veut dire « 0 ou 1 ». Liste de messages (entrées) Base de règles Conditions Actions (sorties) Cond. 1 Cond. 2 1 0 1 0 1 1 1 0 0 0 0 1 1 1 1 1 0 1 # 1 0 1 # # # 0 # # 0 1 1 # 1 1 0 # 1 # # 0 0 # 1 1 0 0 1 1 1 1 0 0 0 0 1 1 1 0 1 0 Figure 13.1. Liste de messages et base de règles d’un CS. La liste de messages décrit (sous forme codée) l’information reçue par le système. Chaque ligne de la liste de messages correspond à un élément particulier d’information. La base de règles contient sur chaque ligne une liste de conditions qui doivent être simultanément satisfaites pour que l’action indiquée à droite de la ligne soit prise en considération comme candidate pour l’action à prendre. Formellement, une condition est satisfaite si, modulo #, elle a la même syntaxe que le message correspondant. Sur la première ligne de la figure 13.1., le message est 101. Les conditions correspondantes, 101 et 1#1, sont toutes deux satisfaites. L’action 011 est donc incluse dans la liste des actions potentiellement possibles. Comme nous le verrons encore, elle ne sera cependant pas nécessairement réalisée. En langage courant cette première ligne pourrait signifier « la température est supérieure à 30 degrés» (message), « si la température est supérieure à 30 degrés» (condition 1) et « si la température est supérieure à 20 degrés et il ne pleut pas» (condition 2),
- Page 231 and 232: Modélisation multi-agents comme co
- Page 233 and 234: Chapitre 11 Des réseaux d’automa
- Page 235 and 236: Des réseaux d’automates aux mod
- Page 237 and 238: Des réseaux d’automates aux mod
- Page 239 and 240: Des réseaux d’automates aux mod
- Page 241 and 242: Des réseaux d’automates aux mod
- Page 243 and 244: Des réseaux d’automates aux mod
- Page 245 and 246: Des réseaux d’automates aux mod
- Page 247 and 248: Des réseaux d’automates aux mod
- Page 249 and 250: Des réseaux d’automates aux mod
- Page 251 and 252: Des réseaux d’automates aux mod
- Page 253 and 254: Des réseaux d’automates aux mod
- Page 255 and 256: Des réseaux d’automates aux mod
- Page 257 and 258: Des réseaux d’automates aux mod
- Page 259 and 260: Des réseaux d’automates aux mod
- Page 261 and 262: Chapitre 12 Modélisation, impléme
- Page 263 and 264: Modélisation, implémentation et e
- Page 265 and 266: Modélisation, implémentation et e
- Page 267 and 268: Modélisation, implémentation et e
- Page 269 and 270: Modélisation, implémentation et e
- Page 271 and 272: Modélisation, implémentation et e
- Page 273 and 274: Modélisation, implémentation et e
- Page 275 and 276: Modélisation, implémentation et e
- Page 277 and 278: Chapitre 13 Apprentissage dans les
- Page 279 and 280: Apprentissage dans les modèles mul
- Page 281: Apprentissage dans les modèles mul
- Page 285 and 286: Apprentissage dans les modèles mul
- Page 287 and 288: Apprentissage dans les modèles mul
- Page 289 and 290: Apprentissage dans les modèles mul
- Page 291 and 292: Apprentissage dans les modèles mul
- Page 293 and 294: Apprentissage dans les modèles mul
- Page 295 and 296: Apprentissage dans les modèles mul
- Page 297 and 298: Apprentissage dans les modèles mul
- Page 299 and 300: Chapitre 14 Influence sociale, jeux
- Page 301 and 302: Influence sociale, jeux de populati
- Page 303 and 304: Influence sociale, jeux de populati
- Page 305 and 306: Influence sociale, jeux de populati
- Page 307 and 308: Influence sociale, jeux de populati
- Page 309 and 310: Influence sociale, jeux de populati
- Page 311 and 312: Influence sociale, jeux de populati
- Page 313 and 314: Influence sociale, jeux de populati
- Page 315 and 316: Influence sociale, jeux de populati
- Page 317 and 318: Influence sociale, jeux de populati
- Page 319 and 320: Influence sociale, jeux de populati
- Page 321 and 322: Influence sociale, jeux de populati
- Page 323 and 324: Troisième Partie Introduction à l
- Page 325 and 326: Modélisation multi-agents des syst
- Page 327 and 328: Chapitre 15 Approche conceptuelle d
- Page 329 and 330: Approche conceptuelle de l’espace
- Page 331 and 332: Approche conceptuelle de l’espace
Apprentissage dans les modèles multi-agents 287<br />
Le fonctionnement d’un CS peut avantageusement être présenté à l’aide de la<br />
Figure 13.1., tirée de [BRE 99]. La partie chiffre de la figure est à lire ligne par<br />
ligne. Le symbole # veut dire « 0 ou 1 ».<br />
Liste de<br />
messages<br />
(entrées)<br />
Base de règles<br />
Conditions<br />
Actions<br />
(sorties)<br />
Cond. 1 Cond. 2<br />
1 0 1<br />
0 1 1<br />
1 0 0<br />
0 0 1<br />
1 1 1<br />
1 0 1<br />
# 1 0<br />
1 # #<br />
# 0 #<br />
# 0 1<br />
1 # 1<br />
1 0 #<br />
1 # #<br />
0 0 #<br />
1 1 0<br />
0 1 1<br />
1 1 0<br />
0 0 0<br />
1 1 1<br />
0 1 0<br />
Figure 13.1. Liste de messages et base de règles d’un CS.<br />
La liste de messages décrit (sous forme codée) l’information reçue par le<br />
système. Chaque ligne de la liste de messages correspond à un élément particulier<br />
d’information. La base de règles contient sur chaque ligne une liste de conditions qui<br />
doivent être simultanément satisfaites pour que l’action indiquée à droite de la ligne<br />
soit prise en considération comme candidate pour l’action à prendre. Formellement,<br />
une condition est satisfaite si, modulo #, elle a la même syntaxe que le message<br />
correspondant. Sur la première ligne de la figure 13.1., le message est 101. Les<br />
conditions correspondantes, 101 et 1#1, sont toutes deux satisfaites. L’action 011 est<br />
donc incluse dans la liste <strong>des</strong> actions potentiellement possibles. Comme nous le<br />
verrons encore, elle ne sera cependant pas nécessairement réalisée. En langage<br />
courant cette première ligne pourrait signifier « la température est supérieure à 30<br />
degrés» (message), « si la température est supérieure à 30 degrés» (condition 1) et<br />
« si la température est supérieure à 20 degrés et il ne pleut pas» (condition 2),