01.01.2015 Views

Table des matières - Gilles Daniel

Table des matières - Gilles Daniel

Table des matières - Gilles Daniel

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

286 Modélisation et simulation multi-agents pour Sciences de l'Homme et de la Société.<br />

variable. Par ailleurs d’autres facteurs peuvent influencer ces gains, (actions d’autres<br />

agents, chocs exogènes, …). En trois mots, l’agent peut avoir de gran<strong>des</strong> difficultés<br />

à reconnaître le lien entre son action et ses gains. Ceci crée un problème<br />

d’assignation <strong>des</strong> gains à l’action, que nous retrouverons plus tard dans ce chapitre.<br />

Parmi les très nombreux modèles de renforcement les plus utilisés en<br />

modélisation multi-agents, un <strong>des</strong> plus simples est l’algorithme Derivative-Follower<br />

de [GRE 99], dont le champ d’application est restreint aux recherches sur une<br />

dimension. Le Q-Learning de [WAT 89] est approprié aux cas où l’agent cherche à<br />

résoudre au mieux un problème du type programmation dynamique. Directement<br />

inspirés par les travaux en psychologie de [BUS 55] sont les algorithmes de [ROT 95],<br />

[ERE 98]. Une <strong>des</strong> plus puissantes et plus prometteuses approches est cependant<br />

celle <strong>des</strong> algorithmes génétiques, possiblement associés avec <strong>des</strong> systèmes de<br />

classificateurs, qui font l’objet du reste de ce chapitre.<br />

13.3. Systèmes de classificateurs<br />

Les systèmes de classificateurs (CS), [HOL 75], sont <strong>des</strong> mécanismes de décision<br />

fondés sur un ensemble fixe de règles. Chacune de ces règles rend possible une action<br />

précise (la sortie) lorsque l’information reçue par le CS (l’entrée) satisfait à certaines<br />

conditions prédéfinies. Un CS sera en général utilisé de façon répétée dans un<br />

environnement qui est affecté par les actions réellement effectuées. Typiquement, le CS<br />

reçoit dans chaque période <strong>des</strong> gains après qu’il ait réalisé une action. Typiquement<br />

aussi, la modification de l’environnement influence les signaux et les gains que le CS<br />

recevra dans le futur. Le CS reçoit un signal de l’environnement, effectue une action<br />

qui modifie l’environnement, réalise un gain qui dépend, directement ou indirectement<br />

de cette modification de l’environnement, reçoit un nouveau signal, et ainsi de suite.<br />

On reconnaît immédiatement que cette structure apparaît appropriée pour décrire de<br />

nombreuses situations socio-économiques, avec une réserve cependant : les agents qui<br />

prennent <strong>des</strong> actions différentes de période en période en fonction <strong>des</strong> informations<br />

qu’ils reçoivent, mais ne modifient jamais leur comportement, c’est-à-dire leur façon<br />

d’interpréter une même information et d’y réagir. Le comportement modélisé avec un<br />

CS est mécanique, il n’y a pas d’apprentissage.<br />

Afin qu’un CS puisse être facilement implémenté numériquement, les signaux<br />

d’entrée et de sortie sont typiquement codés comme <strong>des</strong> chaînes binaires (chaînes de<br />

0 et 1) ou d’entiers. Le codage/décodage de ces chaînes n’est pas essentiel au<br />

fonctionnement du CS. Il s’agit d’une opération technique qui permet d’écrire sous<br />

forme appropriée pour un traitement par ordinateur les entrées et sorties de l’objet<br />

réel ou théorique d’intérêt. Le codage implique une discrétisation de l’espace<br />

d’entrée et de l’espace de sortie. Ces points seront repris dans la section sur les<br />

algorithmes génétiques.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!