Table des matiÃ¨res - Gilles Daniel

01.01.2015 Views
286 Modélisation et simulation multi-agents pour Sciences de l'Homme et de la Société. variable. Par ailleurs d’autres facteurs peuvent influencer ces gains, (actions d’autres agents, chocs exogènes, …). En trois mots, l’agent peut avoir de grandes difficultés à reconnaître le lien entre son action et ses gains. Ceci crée un problème d’assignation des gains à l’action, que nous retrouverons plus tard dans ce chapitre. Parmi les très nombreux modèles de renforcement les plus utilisés en modélisation multi-agents, un des plus simples est l’algorithme Derivative-Follower de [GRE 99], dont le champ d’application est restreint aux recherches sur une dimension. Le Q-Learning de [WAT 89] est approprié aux cas où l’agent cherche à résoudre au mieux un problème du type programmation dynamique. Directement inspirés par les travaux en psychologie de [BUS 55] sont les algorithmes de [ROT 95], [ERE 98]. Une des plus puissantes et plus prometteuses approches est cependant celle des algorithmes génétiques, possiblement associés avec des systèmes de classificateurs, qui font l’objet du reste de ce chapitre. 13.3. Systèmes de classificateurs Les systèmes de classificateurs (CS), [HOL 75], sont des mécanismes de décision fondés sur un ensemble fixe de règles. Chacune de ces règles rend possible une action précise (la sortie) lorsque l’information reçue par le CS (l’entrée) satisfait à certaines conditions prédéfinies. Un CS sera en général utilisé de façon répétée dans un environnement qui est affecté par les actions réellement effectuées. Typiquement, le CS reçoit dans chaque période des gains après qu’il ait réalisé une action. Typiquement aussi, la modification de l’environnement influence les signaux et les gains que le CS recevra dans le futur. Le CS reçoit un signal de l’environnement, effectue une action qui modifie l’environnement, réalise un gain qui dépend, directement ou indirectement de cette modification de l’environnement, reçoit un nouveau signal, et ainsi de suite. On reconnaît immédiatement que cette structure apparaît appropriée pour décrire de nombreuses situations socio-économiques, avec une réserve cependant : les agents qui prennent des actions différentes de période en période en fonction des informations qu’ils reçoivent, mais ne modifient jamais leur comportement, c’est-à-dire leur façon d’interpréter une même information et d’y réagir. Le comportement modélisé avec un CS est mécanique, il n’y a pas d’apprentissage. Afin qu’un CS puisse être facilement implémenté numériquement, les signaux d’entrée et de sortie sont typiquement codés comme des chaînes binaires (chaînes de 0 et 1) ou d’entiers. Le codage/décodage de ces chaînes n’est pas essentiel au fonctionnement du CS. Il s’agit d’une opération technique qui permet d’écrire sous forme appropriée pour un traitement par ordinateur les entrées et sorties de l’objet réel ou théorique d’intérêt. Le codage implique une discrétisation de l’espace d’entrée et de l’espace de sortie. Ces points seront repris dans la section sur les algorithmes génétiques.

Apprentissage dans les modèles multi-agents 287 Le fonctionnement d’un CS peut avantageusement être présenté à l’aide de la Figure 13.1., tirée de [BRE 99]. La partie chiffre de la figure est à lire ligne par ligne. Le symbole # veut dire « 0 ou 1 ». Liste de messages (entrées) Base de règles Conditions Actions (sorties) Cond. 1 Cond. 2 1 0 1 0 1 1 1 0 0 0 0 1 1 1 1 1 0 1 # 1 0 1 # # # 0 # # 0 1 1 # 1 1 0 # 1 # # 0 0 # 1 1 0 0 1 1 1 1 0 0 0 0 1 1 1 0 1 0 Figure 13.1. Liste de messages et base de règles d’un CS. La liste de messages décrit (sous forme codée) l’information reçue par le système. Chaque ligne de la liste de messages correspond à un élément particulier d’information. La base de règles contient sur chaque ligne une liste de conditions qui doivent être simultanément satisfaites pour que l’action indiquée à droite de la ligne soit prise en considération comme candidate pour l’action à prendre. Formellement, une condition est satisfaite si, modulo #, elle a la même syntaxe que le message correspondant. Sur la première ligne de la figure 13.1., le message est 101. Les conditions correspondantes, 101 et 1#1, sont toutes deux satisfaites. L’action 011 est donc incluse dans la liste des actions potentiellement possibles. Comme nous le verrons encore, elle ne sera cependant pas nécessairement réalisée. En langage courant cette première ligne pourrait signifier « la température est supérieure à 30 degrés» (message), « si la température est supérieure à 30 degrés» (condition 1) et « si la température est supérieure à 20 degrés et il ne pleut pas» (condition 2),

Page 1 and 2: Table des matières PREMIERE PARTIE

Page 3 and 4: Première partie Introduction Depui

Page 5 and 6: Introduction . 9 permettent de form

Page 7 and 8: Chapitre 1 Concepts et méthodologi

Page 9 and 10: Concepts et méthodologies multi-ag












Page 33 and 34: Chapitre 2 Introduction à la modé

Page 35 and 36: Introduction à la modélisation et











Page 57 and 58: Chapitre 3 Explorer les modèles pa

Page 59 and 60: Explorer les modèles par simulatio












Page 83 and 84: Chapitre 4 Evaluation et validation

Page 85 and 86: Evaluation et validation de modèle








Page 101 and 102: Annexe - épistémologie dans une c









Page 119 and 120: Chapitre 5 Sciences sociales comput

Page 121 and 122: Sciences sociales computationnelles








Page 137 and 138: Chapitre 6 La fin des débuts pour

Page 139 and 140: La fin des débuts pour les systèm




Page 147 and 148: Chapitre 7 Les modèles agent en g

Page 149 and 150: Les modèles agent en géographie u








Page 165 and 166: Chapitre 8 Essai d’épistémologi

Page 167 and 168: Essai d’épistémologie de la sim












Page 191 and 192: Chapitre 9 Modéliser avec et pour

Page 193 and 194: Modéliser avec et pour les acteurs










Page 213 and 214: Chapitre 10 Modélisation d’accom

Page 215 and 216: Modélisation d’accompagnement. 2





Page 225 and 226: Deuxième partie Modélisation et s

Page 227 and 228: Modélisation multi-agents comme co



Page 233 and 234: Chapitre 11 Des réseaux d’automa

Page 235 and 236: Des réseaux d’automates aux mod













Page 261 and 262: Chapitre 12 Modélisation, impléme

Page 263 and 264: Modélisation, implémentation et e







Page 277 and 278: Chapitre 13 Apprentissage dans les

Page 279 and 280: Apprentissage dans les modèles mul

Page 281: Apprentissage dans les modèles mul








Page 299 and 300: Chapitre 14 Influence sociale, jeux

Page 301 and 302: Influence sociale, jeux de populati











Page 323 and 324: Troisième Partie Introduction à l

Page 325 and 326: Modélisation multi-agents des syst

Page 327 and 328: Chapitre 15 Approche conceptuelle d

Page 329 and 330: Approche conceptuelle de l’espace










Page 349 and 350: Chapitre 16 « A Monte Carlo approa

Page 351 and 352: « A Monte Carlo approach to diffus











Page 373: « A Monte Carlo approach to diffus

Page 376 and 377: 380 Modélisation et simulation mul

















Page 410: 414 Modélisation et simulation mul

simulation

processus

sciences

ainsi

niveau

exemple

peuvent

nombre

fonction

simulations

gilles

gillesdaniel.com

Table des matiÃ¨res - Gilles Daniel

Table des matiÃ¨res - Gilles Daniel ... View more Table des matiÃ¨res - Gilles Daniel

Delete template?

Save as template ?

Table des matiÃ¨res - Gilles Daniel Table des matiÃ¨res - Gilles Daniel