Table des matiÃ¨res - Gilles Daniel

More documents

Recommendations

Info

284 Modélisation et simulation multi-agents pour Sciences de l'Homme et de la Société. psychologie ou l’informatique lui attachent des connotations diverses, souvent assez floues. Notre but dans cette section est de présenter succinctement quelques définitions fondamentales et généralement admises. Une première distinction d’importance est celle entre apprentissage individuel, apprentissage social, et évolution : Apprentissage individuel : modification du comportement d’un agent économique qui est basée uniquement sur les propres expériences de l’agent. Apprentissage social : modification du comportement d’un agent qui prend en compte les expériences d’autres agents. Typiquement, un modèle d’apprentissage social suppose qu’un agent tend à imiter le comportement d’autres agents – la probabilité qu’il adopte une stratégie donnée étant typiquement une fonction croissante des gains (monétaires ou non) moyens obtenus par les agents qui la suivent déjà. Evolution : modification de la composition de la population par élimination des agents dont les performances se révèlent localement mauvaises. Le mot localement a été mis en italique pour rappeler que dans un modèle multi-agents le succès d’une stratégie dépend de l’instant et de l’endroit précis où elle est appliquée. Une autre distinction est traditionnellement faite entre apprentissage adaptatif (backward looking) et apprentissage anticipatif (forward looking). Apprentissage adaptatif : les agents modifient leur comportement sur la base d’une analyse du succès relatif des actions prises dans le passé. Ils ne font pas d’efforts pour « améliorer » leur environnement. Apprentissage anticipatif : les agents utilisent un modèle de leur environnement pour prédire, sous forme probabiliste typiquement, les conséquences de comportements différents: « Si j’agis de cette façon maintenant, j’obtiendrai probablement ce résultat dans le futur » et modifient leur comportement sur la base de ces prédictions. Il faut souligner qu’il n’est pas certain qu’un comportement plus anticipatif soit toujours favorable pour l’agent. Des règles de comportement simples se révèlent souvent plus avantageuses. En particulier, anticiper nécessite des calculs importants. Si les calculs sont coûteux, il peut être plus favorable pour l’agent de prendre des décisions basées sur des règles de comportement simples que sur un modèle d’anticipation complexe. Diverses réserves d’ordre méthodologique peuvent par ailleurs être faites vis à vis de l’utilisation de règles trop anticipatrices. Les calculs nécessaires peuvent être trop complexes pour être réalistes. Des régressions infinies
Apprentissage dans les modèles multi-agents 285 sont possibles si les agents prennent en compte leurs anticipations dans le modèle qu’ils utilisent. Ceci peut exclure une formation constructive des anticipations, et obliger à se contenter de les définir comme équilibres en points fixes etc.. Voir [HEI 88] pour une dissertation motivante sur des thèmes connexes. Quel que soit le niveau d’anticipation retenu, un apprentissage réussi exige un bon équilibre entre exploitation et exploration. Une fois qu’une stratégie qui semble suffisamment efficace a été trouvée, faut-il l’exploiter (l’utiliser) Ou faut-il continuer à explorer, c’est-à-dire à rechercher d’autres stratégies potentiellement meilleures L’abandon, même temporaire, d’une bonne stratégie est presque certainement coûteux, au moins à court terme. Mais ne pas explorer implique le risque de perdre les gains supplémentaires. La détermination du meilleur compromis est extrêmement difficile même dans le cas de problèmes d’optimisation dynamique bien posés, pour peu qu’ils soient tant soit peu complexes [WIT 75]. Elle semble illusoire dans un contexte d’apprentissage multi-agents. Nous verrons cependant qu’il peut être possible de trouver des compromis satisfaisants. La recherche en modélisation multi-agents utilise de nombreux formalismes pour représenter les phénomènes d’apprentissage. La plupart sont du type renforcement : ils modélisent l’intuition qu’un agent aura tendance à utiliser une action plus fréquemment si elle a été associée à de bons résultats dans le passé, et moins fréquemment dans le cas inverse. Un modèle de renforcement suppose que les agents construisent des règles de comportement du type « Si – Alors » : si cet événement se produit, alors il faut prendre cette action. L’approche trouve ses racines dans les modèles expérimentaux simples de prédiction binaire utilisés depuis plus de cinquante ans en psychologie [BUS 55]. Le cadre expérimental typique auquel ils se réfèrent comprend en général deux leviers surmontés de deux lampes. Un signal indique au sujet qu’il doit prendre une décision – appuyer sur l’un ou l’autre levier. Après qu’il l’ait fait, l’une des deux lampes s’allume. Le sujet reçoit une récompense s’il a choisi le levier situé en dessous de la lampe qui s’est allumée 59 . La situation que nous venons de décrire est très simple car il y a une association immédiate et directe entre action et récompense. On parlera de renforcement direct. En réalité, cependant, le renforcement sera le plus souvent séquentiel : les gains associés à une action ne seront connus que plus tard, possiblement après un délai 59 Supposons que les deux lampes Rouge et Vert s’allument avec des probabilités différentes, disons, 70% et 30%. La meilleure stratégie est de choisir Rouge à chaque répétition. De très nombreuses expériences montrent que les sujets humains ne suivent pas cette stratégie mais tendent à choisir Rouge dans 70% et Vert dans 30% des cas – un résultat connu sous le nom de probability matching theorem. Ce résultat apparemment irrationnel peut cependant être interprété comme un compromis entre exploitation, choisir Rouge, et exploration, essayer Vert, voir ci-dessus.
Page 1 and 2:
Table des matières PREMIERE PARTIE
Page 3 and 4:
Première partie Introduction Depui
Page 5 and 6:
Introduction . 9 permettent de form
Page 7 and 8:
Chapitre 1 Concepts et méthodologi
Page 9 and 10:
Concepts et méthodologies multi-ag
Page 11 and 12:
Page 13 and 14:
Page 15 and 16:
Page 17 and 18:
Page 19 and 20:
Page 21 and 22:
Page 23 and 24:
Page 25 and 26:
Page 27 and 28:
Page 29 and 30:
Page 31 and 32:
Page 33 and 34:
Chapitre 2 Introduction à la modé
Page 35 and 36:
Introduction à la modélisation et
Page 37 and 38:
Page 39 and 40:
Page 41 and 42:
Page 43 and 44:
Page 45 and 46:
Page 47 and 48:
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
Page 55 and 56:
Page 57 and 58:
Chapitre 3 Explorer les modèles pa
Page 59 and 60:
Explorer les modèles par simulatio
Page 61 and 62:
Page 63 and 64:
Page 65 and 66:
Page 67 and 68:
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
Page 75 and 76:
Page 77 and 78:
Page 79 and 80:
Page 81 and 82:
Page 83 and 84:
Chapitre 4 Evaluation et validation
Page 85 and 86:
Evaluation et validation de modèle
Page 87 and 88:
Page 89 and 90:
Page 91 and 92:
Page 93 and 94:
Page 95 and 96:
Page 97 and 98:
Page 99 and 100:
Page 101 and 102:
Annexe - épistémologie dans une c
Page 103 and 104:
Page 105 and 106:
Page 107 and 108:
Page 109 and 110:
Page 111 and 112:
Page 113 and 114:
Page 115 and 116:
Page 117 and 118:
Page 119 and 120:
Chapitre 5 Sciences sociales comput
Page 121 and 122:
Sciences sociales computationnelles
Page 123 and 124:
Page 125 and 126:
Page 127 and 128:
Page 129 and 130:
Page 131 and 132:
Page 133 and 134:
Page 135 and 136:
Page 137 and 138:
Chapitre 6 La fin des débuts pour
Page 139 and 140:
La fin des débuts pour les systèm
Page 141 and 142:
Page 143 and 144:
Page 145 and 146:
Page 147 and 148:
Chapitre 7 Les modèles agent en g
Page 149 and 150:
Les modèles agent en géographie u
Page 151 and 152:
Page 153 and 154:
Page 155 and 156:
Page 157 and 158:
Page 159 and 160:
Page 161 and 162:
Page 163 and 164:
Page 165 and 166:
Chapitre 8 Essai d’épistémologi
Page 167 and 168:
Essai d’épistémologie de la sim
Page 169 and 170:
Page 171 and 172:
Page 173 and 174:
Page 175 and 176:
Page 177 and 178:
Page 179 and 180:
Page 181 and 182:
Page 183 and 184:
Page 185 and 186:
Page 187 and 188:
Page 189 and 190:
Page 191 and 192:
Chapitre 9 Modéliser avec et pour
Page 193 and 194:
Modéliser avec et pour les acteurs
Page 195 and 196:
Page 197 and 198:
Page 199 and 200:
Page 201 and 202:
Page 203 and 204:
Page 205 and 206:
Page 207 and 208:
Page 209 and 210:
Page 211 and 212:
Page 213 and 214:
Chapitre 10 Modélisation d’accom
Page 215 and 216:
Modélisation d’accompagnement. 2
Page 217 and 218:
Page 219 and 220:
Page 221 and 222:
Page 223 and 224:
Page 225 and 226:
Deuxième partie Modélisation et s
Page 227 and 228:
Modélisation multi-agents comme co
Page 229 and 230: Modélisation multi-agents comme co
Page 231 and 232: Modélisation multi-agents comme co
Page 233 and 234: Chapitre 11 Des réseaux d’automa
Page 235 and 236: Des réseaux d’automates aux mod
Page 261 and 262: Chapitre 12 Modélisation, impléme
Page 263 and 264: Modélisation, implémentation et e
Page 277 and 278: Chapitre 13 Apprentissage dans les
Page 279: Apprentissage dans les modèles mul
Page 283 and 284: Apprentissage dans les modèles mul
Page 299 and 300: Chapitre 14 Influence sociale, jeux
Page 301 and 302: Influence sociale, jeux de populati
Page 323 and 324: Troisième Partie Introduction à l
Page 325 and 326: Modélisation multi-agents des syst
Page 327 and 328: Chapitre 15 Approche conceptuelle d
Page 329 and 330: Approche conceptuelle de l’espace
Page 331 and 332:
Approche conceptuelle de l’espace
Page 333 and 334:
Page 335 and 336:
Page 337 and 338:
Page 339 and 340:
Page 341 and 342:
Page 343 and 344:
Page 345 and 346:
Page 347 and 348:
Page 349 and 350:
Chapitre 16 « A Monte Carlo approa
Page 351 and 352:
« A Monte Carlo approach to diffus
Page 353 and 354:
Page 355 and 356:
Page 357 and 358:
Page 359 and 360:
Page 361 and 362:
Page 363 and 364:
Page 365 and 366:
Page 367 and 368:
Page 369 and 370:
Page 371 and 372:
Page 373:
Page 376 and 377:
380 Modélisation et simulation mul
Page 378 and 379:
Page 380 and 381:
Page 382 and 383:
Page 384 and 385:
Page 386 and 387:
Page 388 and 389:
Page 390 and 391:
Page 392 and 393:
Page 394 and 395:
Page 396 and 397:
Page 398 and 399:
Page 400 and 401:
Page 402 and 403:
Page 404 and 405:
Page 406 and 407:
Page 408 and 409:
Page 410:
show all

Table des matiÃ¨res - Gilles Daniel

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?