Table des matières - Gilles Daniel

Table des matières - Gilles Daniel Table des matières - Gilles Daniel

gillesdaniel.com
from gillesdaniel.com More from this publisher
01.01.2015 Views

286 Modélisation et simulation multi-agents pour Sciences de l'Homme et de la Société. variable. Par ailleurs d’autres facteurs peuvent influencer ces gains, (actions d’autres agents, chocs exogènes, …). En trois mots, l’agent peut avoir de grandes difficultés à reconnaître le lien entre son action et ses gains. Ceci crée un problème d’assignation des gains à l’action, que nous retrouverons plus tard dans ce chapitre. Parmi les très nombreux modèles de renforcement les plus utilisés en modélisation multi-agents, un des plus simples est l’algorithme Derivative-Follower de [GRE 99], dont le champ d’application est restreint aux recherches sur une dimension. Le Q-Learning de [WAT 89] est approprié aux cas où l’agent cherche à résoudre au mieux un problème du type programmation dynamique. Directement inspirés par les travaux en psychologie de [BUS 55] sont les algorithmes de [ROT 95], [ERE 98]. Une des plus puissantes et plus prometteuses approches est cependant celle des algorithmes génétiques, possiblement associés avec des systèmes de classificateurs, qui font l’objet du reste de ce chapitre. 13.3. Systèmes de classificateurs Les systèmes de classificateurs (CS), [HOL 75], sont des mécanismes de décision fondés sur un ensemble fixe de règles. Chacune de ces règles rend possible une action précise (la sortie) lorsque l’information reçue par le CS (l’entrée) satisfait à certaines conditions prédéfinies. Un CS sera en général utilisé de façon répétée dans un environnement qui est affecté par les actions réellement effectuées. Typiquement, le CS reçoit dans chaque période des gains après qu’il ait réalisé une action. Typiquement aussi, la modification de l’environnement influence les signaux et les gains que le CS recevra dans le futur. Le CS reçoit un signal de l’environnement, effectue une action qui modifie l’environnement, réalise un gain qui dépend, directement ou indirectement de cette modification de l’environnement, reçoit un nouveau signal, et ainsi de suite. On reconnaît immédiatement que cette structure apparaît appropriée pour décrire de nombreuses situations socio-économiques, avec une réserve cependant : les agents qui prennent des actions différentes de période en période en fonction des informations qu’ils reçoivent, mais ne modifient jamais leur comportement, c’est-à-dire leur façon d’interpréter une même information et d’y réagir. Le comportement modélisé avec un CS est mécanique, il n’y a pas d’apprentissage. Afin qu’un CS puisse être facilement implémenté numériquement, les signaux d’entrée et de sortie sont typiquement codés comme des chaînes binaires (chaînes de 0 et 1) ou d’entiers. Le codage/décodage de ces chaînes n’est pas essentiel au fonctionnement du CS. Il s’agit d’une opération technique qui permet d’écrire sous forme appropriée pour un traitement par ordinateur les entrées et sorties de l’objet réel ou théorique d’intérêt. Le codage implique une discrétisation de l’espace d’entrée et de l’espace de sortie. Ces points seront repris dans la section sur les algorithmes génétiques.

Apprentissage dans les modèles multi-agents 287 Le fonctionnement d’un CS peut avantageusement être présenté à l’aide de la Figure 13.1., tirée de [BRE 99]. La partie chiffre de la figure est à lire ligne par ligne. Le symbole # veut dire « 0 ou 1 ». Liste de messages (entrées) Base de règles Conditions Actions (sorties) Cond. 1 Cond. 2 1 0 1 0 1 1 1 0 0 0 0 1 1 1 1 1 0 1 # 1 0 1 # # # 0 # # 0 1 1 # 1 1 0 # 1 # # 0 0 # 1 1 0 0 1 1 1 1 0 0 0 0 1 1 1 0 1 0 Figure 13.1. Liste de messages et base de règles d’un CS. La liste de messages décrit (sous forme codée) l’information reçue par le système. Chaque ligne de la liste de messages correspond à un élément particulier d’information. La base de règles contient sur chaque ligne une liste de conditions qui doivent être simultanément satisfaites pour que l’action indiquée à droite de la ligne soit prise en considération comme candidate pour l’action à prendre. Formellement, une condition est satisfaite si, modulo #, elle a la même syntaxe que le message correspondant. Sur la première ligne de la figure 13.1., le message est 101. Les conditions correspondantes, 101 et 1#1, sont toutes deux satisfaites. L’action 011 est donc incluse dans la liste des actions potentiellement possibles. Comme nous le verrons encore, elle ne sera cependant pas nécessairement réalisée. En langage courant cette première ligne pourrait signifier « la température est supérieure à 30 degrés» (message), « si la température est supérieure à 30 degrés» (condition 1) et « si la température est supérieure à 20 degrés et il ne pleut pas» (condition 2),

Apprentissage dans les modèles multi-agents 287<br />

Le fonctionnement d’un CS peut avantageusement être présenté à l’aide de la<br />

Figure 13.1., tirée de [BRE 99]. La partie chiffre de la figure est à lire ligne par<br />

ligne. Le symbole # veut dire « 0 ou 1 ».<br />

Liste de<br />

messages<br />

(entrées)<br />

Base de règles<br />

Conditions<br />

Actions<br />

(sorties)<br />

Cond. 1 Cond. 2<br />

1 0 1<br />

0 1 1<br />

1 0 0<br />

0 0 1<br />

1 1 1<br />

1 0 1<br />

# 1 0<br />

1 # #<br />

# 0 #<br />

# 0 1<br />

1 # 1<br />

1 0 #<br />

1 # #<br />

0 0 #<br />

1 1 0<br />

0 1 1<br />

1 1 0<br />

0 0 0<br />

1 1 1<br />

0 1 0<br />

Figure 13.1. Liste de messages et base de règles d’un CS.<br />

La liste de messages décrit (sous forme codée) l’information reçue par le<br />

système. Chaque ligne de la liste de messages correspond à un élément particulier<br />

d’information. La base de règles contient sur chaque ligne une liste de conditions qui<br />

doivent être simultanément satisfaites pour que l’action indiquée à droite de la ligne<br />

soit prise en considération comme candidate pour l’action à prendre. Formellement,<br />

une condition est satisfaite si, modulo #, elle a la même syntaxe que le message<br />

correspondant. Sur la première ligne de la figure 13.1., le message est 101. Les<br />

conditions correspondantes, 101 et 1#1, sont toutes deux satisfaites. L’action 011 est<br />

donc incluse dans la liste <strong>des</strong> actions potentiellement possibles. Comme nous le<br />

verrons encore, elle ne sera cependant pas nécessairement réalisée. En langage<br />

courant cette première ligne pourrait signifier « la température est supérieure à 30<br />

degrés» (message), « si la température est supérieure à 30 degrés» (condition 1) et<br />

« si la température est supérieure à 20 degrés et il ne pleut pas» (condition 2),

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!