Table des matières - Gilles Daniel

Table des matières - Gilles Daniel Table des matières - Gilles Daniel

gillesdaniel.com
from gillesdaniel.com More from this publisher
01.01.2015 Views

76 Modélisation et simulation multi-agents pour Sciences de l'Homme et de la Société. 91], ou [KOB 97] : l’effet d’un facteur à n niveaux est alors décomposé en effets polynomiaux de degrés 1 à n-1 (effet linéaire, quadratique, etc.). L’ANOVA est en fait une méthode bien adaptée au mélange de facteurs qualitatifs et quantitatifs et elle permet, lorsqu’elle est prolongée par l’étude des moyennes, de connaître assez finement l’effet des facteurs et leurs interactions. Pour le modèle gambusies, la transformation logarithmique des données conduit à des réponses sensiblement linéaires (non figurées). On se contente donc de deux niveaux par paramètre, sauf pour le taux de croissance qui affiche la plus grande non linéarité avant transformation et qui en reçoit quatre. Soit 7 paramètres à deux niveaux et un paramètre à quatre niveaux, 2 7 *4 = 512 combinaisons. Le modèle étant stochastique chaque combinaison est répétée 10 fois et nous obtenons un total de 5120 simulations. La part de variance expliquée par les paramètres et leurs interactions est de 94%, en ne gardant que les interactions d'ordre 2. Cela signifie que les 512 combinaisons de paramètres du plan d'expérience peuvent être bien prédites sans tenir compte des interactions d'ordre supérieur. Outre le contrôle sur la part de variance expliquée, cette bonne prédiction doit être vérifiée en analysant le graphe des résidus, c'est à dire le graphe des écarts entre les 512 valeurs du modèle et celles prédites par l'ANOVA (non figuré). Remarquons qu'il est toujours possible d'améliorer à la fois la variance expliquée et la qualité des ajustements en augmentant l'ordre des interactions. Mais un ordre élevé signe presque toujours la présence de fortes non linéarités, non suffisamment réduites par les transformations éventuelles, et probablement mal décrites par les quelques niveaux retenus. On touche alors à la limite de l'ANOVA qui risque dans ce cas de donner des résultats biaisés. Sur notre exemple, la figure 3.6 indique que l'interaction la plus élevée porte sur le couple taux de croissance / taille maximale et reste très modeste. Les paramètres ont donc un effet essentiellement additif sur le logarithme de la sortie (ou plus exactement sur son écart par rapport à la moyenne). Par ailleurs, sur cette même figure, le taux de croissance représente l'effet linéaire de ce paramètre. Les deux autres effets, quadratique et cubique, autorisés par le fait que nous avions pris quatre niveaux pour ce paramètre, sont insignifiants. Ce résultat confirme a posteriori l'efficacité de la transformation logarithmique. En définitive, cette analyse révèle que pour une réponse en échelle logarithmique, la liaison entre la réponse du modèle et les paramètres est sensiblement linéaire et peu sensible aux interactions. Une conséquence importante est que les résultats obtenus lors des analyses locales ont alors une portée beaucoup plus globale. La description plus complète de l'analyse du modèle gambusies pourra être trouvée dans [GIN 06].

Explorer les modèles par simulation : application aux analyses de sensibilité. 77 Taille maximale Taux de croissance Survie adulte Fécondité Seuil fécondité Survie juvénile Durée gestation Taux de crois. : Taille maximale Seuil métamorphose Taux de crois. :Fécondité Taille maximale : Fécondité 0 200 400 600 800 1000 1200 1400 Somme des carrés des écarts Figure 3.6. Analyse de variance du modèle gambusies. Somme des carrés des écarts à la moyenne expliquée par chaque facteur et par les principales interactions. 3.4.3.2. Décomposition de Sobol La décomposition de Sobol est une décomposition orthogonale de la variance d'une fonction en termes d’effets principaux et d’interactions de ses facteurs d’entrée. Cette décomposition généralise celle de l’analyse de variance à des fonctions définies sur des supports continus. Il lui est associée une décomposition analogue (additive) de la variance : s D = Var(M ) = ∑ D i + ∑ D ij + ...+ D 1...s [3.9] i=1 i< j où M désigne la sortie considérée, D sa variance, D i la part de l'effet principal du facteur i dans cette variance, et les D multi-indicés les interactions. Le coefficient de sensibilité associé à l’effet principal du paramètre i est alors défini par D i /D, de même pour les interactions. Outre l'effet principal et les interactions, on peut également définir la sensibilité totale d’un paramètre comme la somme des coefficients de sensibilité associés à tous les effets factoriels dans lesquels ce paramètre intervient. Ce sont les mêmes notions que dans l'ANOVA. Pour estimer sans biais l'effet principal d'un paramètre, le principe est d'effectuer des paires de simulations en tirant aléatoirement, pour ce paramètre, une valeur commune aux deux simulations, et en tirant aléatoirement et indépendamment des

76 Modélisation et simulation multi-agents pour Sciences de l'Homme et de la Société.<br />

91], ou [KOB 97] : l’effet d’un facteur à n niveaux est alors décomposé en effets<br />

polynomiaux de degrés 1 à n-1 (effet linéaire, quadratique, etc.). L’ANOVA est en<br />

fait une méthode bien adaptée au mélange de facteurs qualitatifs et quantitatifs et<br />

elle permet, lorsqu’elle est prolongée par l’étude <strong>des</strong> moyennes, de connaître assez<br />

finement l’effet <strong>des</strong> facteurs et leurs interactions.<br />

Pour le modèle gambusies, la transformation logarithmique <strong>des</strong> données conduit<br />

à <strong>des</strong> réponses sensiblement linéaires (non figurées). On se contente donc de deux<br />

niveaux par paramètre, sauf pour le taux de croissance qui affiche la plus grande non<br />

linéarité avant transformation et qui en reçoit quatre. Soit 7 paramètres à deux<br />

niveaux et un paramètre à quatre niveaux, 2 7 *4 = 512 combinaisons. Le modèle<br />

étant stochastique chaque combinaison est répétée 10 fois et nous obtenons un total<br />

de 5120 simulations. La part de variance expliquée par les paramètres et leurs<br />

interactions est de 94%, en ne gardant que les interactions d'ordre 2. Cela signifie<br />

que les 512 combinaisons de paramètres du plan d'expérience peuvent être bien<br />

prédites sans tenir compte <strong>des</strong> interactions d'ordre supérieur. Outre le contrôle sur la<br />

part de variance expliquée, cette bonne prédiction doit être vérifiée en analysant le<br />

graphe <strong>des</strong> résidus, c'est à dire le graphe <strong>des</strong> écarts entre les 512 valeurs du modèle<br />

et celles prédites par l'ANOVA (non figuré). Remarquons qu'il est toujours possible<br />

d'améliorer à la fois la variance expliquée et la qualité <strong>des</strong> ajustements en augmentant<br />

l'ordre <strong>des</strong> interactions. Mais un ordre élevé signe presque toujours la présence de<br />

fortes non linéarités, non suffisamment réduites par les transformations éventuelles,<br />

et probablement mal décrites par les quelques niveaux retenus. On touche alors à la<br />

limite de l'ANOVA qui risque dans ce cas de donner <strong>des</strong> résultats biaisés.<br />

Sur notre exemple, la figure 3.6 indique que l'interaction la plus élevée porte sur<br />

le couple taux de croissance / taille maximale et reste très mo<strong>des</strong>te. Les paramètres<br />

ont donc un effet essentiellement additif sur le logarithme de la sortie (ou plus<br />

exactement sur son écart par rapport à la moyenne). Par ailleurs, sur cette même<br />

figure, le taux de croissance représente l'effet linéaire de ce paramètre. Les deux<br />

autres effets, quadratique et cubique, autorisés par le fait que nous avions pris quatre<br />

niveaux pour ce paramètre, sont insignifiants. Ce résultat confirme a posteriori<br />

l'efficacité de la transformation logarithmique. En définitive, cette analyse révèle<br />

que pour une réponse en échelle logarithmique, la liaison entre la réponse du modèle<br />

et les paramètres est sensiblement linéaire et peu sensible aux interactions. Une<br />

conséquence importante est que les résultats obtenus lors <strong>des</strong> analyses locales ont<br />

alors une portée beaucoup plus globale. La <strong>des</strong>cription plus complète de l'analyse du<br />

modèle gambusies pourra être trouvée dans [GIN 06].

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!