Traitement et analyse de séries chronologiques continues de ...

Traitement et analyse de séries chronologiques continues de ... Traitement et analyse de séries chronologiques continues de ...

theses.insa.lyon.fr
from theses.insa.lyon.fr More from this publisher
14.09.2014 Views

Partie 2 – Chapitre 6 : Test des modèles - Une distribution tronquée, sur un ou deux côtés de la distribution, montrant que l’espace des paramètres possibles de la distribution a priori n’est pas assez large. Les corrélations des paramètres sont dans la majorité des études analysées par des représentations graphiques de type « Scatter Plot » (e.g. Kanso et al. 2005b; Dotto et al. 2009; Laloy et al. 2010). Elles permettent une première appréciation de la forme multi-dimensionnelle des distributions a posteriori. Une absence de structuration du nuage de points met en évidence l’indépendance de deux paramètres, tandis qu’une corrélation suffisamment marquée révèle une surparamétrisation inutile du modèle. Un des deux paramètres peut être simplement déduit comme une fonction de l’autre, et cette dernière incorporée dans la structure du modèle. La fonction peut être estimée à partir de la corrélation observée. Des corrélations fortes peuvent être à l’origine de la faible identifiabilité de groupes de paramètres auxquels les résultats du modèle sont sensibles. La Figure 6.2 montre l’exemple d’une corrélation entre les paramètres d’accumulation et d’érosion du modèle d’Alley et Smith, mise en évidence par Kanso et al. (2005b) qui ont testé le modèle avec la méthode d’analyse bayésienne à l’échelle d’une rue. Dero Daccu Figure 6.2. Exemple de la corrélation trouvée entre les paramètres Daccu et Dero du modèle d’Alley et Smith (1981) d’accumulation des sédiments sur la surface en temps sec testé par Kanso et al (2005b) ; résultat d’un calage à l’échelle d’une rue Quels que soient les problèmes d’identifiabilité mis en évidence, ces derniers sont à relier à la formulation des équations auxquelles ils se rapportent. Pour une amélioration du modèle, ces équations doivent donc être modifiées ou de nouvelles formulations proposées. Analyse de l’effet d’apprentissage du processus inférentiel La comparaison des distributions a posteriori et a priori permet d’estimer l’effet d’apprentissage du processus inférentiel (Reichert 2009). Plusieurs cas sont possibles : - Les distributions a posteriori des paramètres sont plus resserrées : le processus inférentiel a permis d’améliorer la connaissance des paramètres du modèle. - Les formes des deux distributions sont proches : les observations utilisées pour le calage ne contiennent pas ou peu d’informations permettant d’améliorer la connaissance du modélisateur. - Les distributions présentent des changements de position et/ou de forme significatifs. Cette situation met en évidence une divergence entre ce que révèlent les nouvelles observations et l’information a priori. 94

Partie 2 – Chapitre 6 : Test des modèles Analyse de sensibilité du modèle aux paramètres L’influence des paramètres sur les résultats du modèle peut être évaluée a posteriori par une analyse de sensibilité basée sur l’étude des distributions a posteriori. L’objectif d’une telle analyse est d’identifier les paramètres qui contribuent le plus à l’incertitude sur la réponse du modèle. Ce sont en effet ces paramètres qui, mal identifiés, risquent d’avoir le plus d’influence en prédiction. Du fait de l’information donnée par l’échantillonnage suivant la distribution a posteriori, il est possible d’appliquer des études de sensibilité des paramètres à l’échelle globale ( c’est-à-dire en considérant l’espace entier des possibles). La méthode d’Hornberger et Spear (1981), à l’origine de la méthode GLUE, peut par exemple être appliquée. Les méthodes de décomposition de variance basées sur le calcul d’indices de sensibilité peuvent également être utilisées (Saltelli et al. 1999), comme dans l’étude récente de (Vezzaro 2008) pour l’étude d’un modèle de qualité des RUTP. Un autre exemple de technique est la méthode de « Morris screening » (Campolongo et Braddock 1999; Cropp et Braddock 2002). Pour une présentation plus détaillée des techniques possibles, nous renvoyons par exemple au guide pratique récemment proposé par (Saltelli et al. 2004). L’approche globale la plus simple consiste à tracer la valeur de la fonction de vraisemblance dans le plan des paramètres considérés deux à deux, sous forme d’un nuage de points. Cette représentation permet de mettre en évidence les valeurs des paramètres pour lesquelles la vraisemblance n’est pas sensible. Ceci donne donc indirectement une idée de l’influence de chaque paramètre sur la réponse du modèle. Cette méthode a été appliquée récemment par Kanso et al. (2005a) pour le test de modèles de RUTP. Il faut cependant garder à l’esprit la limite de cette approche : du fait de la projection de l’espace entier des paramètres dans un plan, pour des raisons pratiques de lecture des graphiques, l’analyse graphique peut parfois conduire à une mauvaise interprétation de l’identifiabilité des paramètres par rapport à l’information apportée par l’analyse des distributions a posteriori (Vrugt, communication personnelle). Nous n’avons pas identifié, au moment de notre rédaction, de méthodes plus quantitatives que la lecture des graphiques. Une approche bibliographique complémentaire serait utile sur cette question (voir par exemple Saltelli et al. 2004). 6.2.2 Application du principe d’apprentissage Si le principe d’apprentissage bayésien s’applique au départ pour la détermination des distributions a posteriori des paramètres, il peut également être envisagé d’un point de vue plus général pour le test des modèles. En effet, le point de départ du calage d’un modèle est une information a priori sur i) les distributions des paramètres mais également sur ii) la structure du modèle et iii) l’hypothèse des caractéristiques des résidus. L’apprentissage est également envisagé au départ pour les calages successifs d’un même modèle au fur et à mesure que de nouveaux jeux d’observations sont disponibles. Mais il peut tout aussi bien être appliqué pour un même jeu d’observations avec pour objectif l’amélioration de la structure du modèle testé. C’est par exemple le principe de l’analyse proposée par Reichert (2009) pour l’identification de la structure d’un modèle. Des calages successifs du modèle sont effectués et les informations apportées par l’analyse des résultats (analyse des paramètres, vérification des hypothèses sur les résidus) sont utilisées pour tester une version améliorée de la structure du modèle. Les calages itératifs sont mis en œuvre jusqu’à parvenir à une structure optimale, ou au moins améliorée, du modèle. Le nombre 95

Partie 2 – Chapitre 6 : Test <strong>de</strong>s modèles<br />

- Une distribution tronquée, sur un ou <strong>de</strong>ux côtés <strong>de</strong> la distribution, montrant que<br />

l’espace <strong>de</strong>s paramètres possibles <strong>de</strong> la distribution a priori n’est pas assez large.<br />

Les corrélations <strong>de</strong>s paramètres sont dans la majorité <strong>de</strong>s étu<strong>de</strong>s analysées par <strong>de</strong>s<br />

représentations graphiques <strong>de</strong> type « Scatter Plot » (e.g. Kanso <strong>et</strong> al. 2005b; Dotto <strong>et</strong> al. 2009;<br />

Laloy <strong>et</strong> al. 2010). Elles perm<strong>et</strong>tent une première appréciation <strong>de</strong> la forme multi-dimensionnelle<br />

<strong>de</strong>s distributions a posteriori. Une absence <strong>de</strong> structuration du nuage <strong>de</strong> points m<strong>et</strong> en évi<strong>de</strong>nce<br />

l’indépendance <strong>de</strong> <strong>de</strong>ux paramètres, tandis qu’une corrélation suffisamment marquée révèle une<br />

surparamétrisation inutile du modèle. Un <strong>de</strong>s <strong>de</strong>ux paramètres peut être simplement déduit<br />

comme une fonction <strong>de</strong> l’autre, <strong>et</strong> c<strong>et</strong>te <strong>de</strong>rnière incorporée dans la structure du modèle. La<br />

fonction peut être estimée à partir <strong>de</strong> la corrélation observée. Des corrélations fortes peuvent être<br />

à l’origine <strong>de</strong> la faible i<strong>de</strong>ntifiabilité <strong>de</strong> groupes <strong>de</strong> paramètres auxquels les résultats du modèle<br />

sont sensibles. La Figure 6.2 montre l’exemple d’une corrélation entre les paramètres<br />

d’accumulation <strong>et</strong> d’érosion du modèle d’Alley <strong>et</strong> Smith, mise en évi<strong>de</strong>nce par Kanso <strong>et</strong> al.<br />

(2005b) qui ont testé le modèle avec la métho<strong>de</strong> d’<strong>analyse</strong> bayésienne à l’échelle d’une rue.<br />

Dero<br />

Daccu<br />

Figure 6.2. Exemple <strong>de</strong> la corrélation trouvée entre les paramètres Daccu <strong>et</strong> Dero du modèle d’Alley <strong>et</strong> Smith<br />

(1981) d’accumulation <strong>de</strong>s sédiments sur la surface en temps sec testé par Kanso <strong>et</strong> al (2005b) ; résultat d’un<br />

calage à l’échelle d’une rue<br />

Quels que soient les problèmes d’i<strong>de</strong>ntifiabilité mis en évi<strong>de</strong>nce, ces <strong>de</strong>rniers sont à relier à<br />

la formulation <strong>de</strong>s équations auxquelles ils se rapportent. Pour une amélioration du modèle, ces<br />

équations doivent donc être modifiées ou <strong>de</strong> nouvelles formulations proposées.<br />

Analyse <strong>de</strong> l’eff<strong>et</strong> d’apprentissage du processus inférentiel<br />

La comparaison <strong>de</strong>s distributions a posteriori <strong>et</strong> a priori perm<strong>et</strong> d’estimer l’eff<strong>et</strong><br />

d’apprentissage du processus inférentiel (Reichert 2009). Plusieurs cas sont possibles :<br />

- Les distributions a posteriori <strong>de</strong>s paramètres sont plus resserrées : le processus<br />

inférentiel a permis d’améliorer la connaissance <strong>de</strong>s paramètres du modèle.<br />

- Les formes <strong>de</strong>s <strong>de</strong>ux distributions sont proches : les observations utilisées pour le<br />

calage ne contiennent pas ou peu d’informations perm<strong>et</strong>tant d’améliorer la<br />

connaissance du modélisateur.<br />

- Les distributions présentent <strong>de</strong>s changements <strong>de</strong> position <strong>et</strong>/ou <strong>de</strong> forme<br />

significatifs. C<strong>et</strong>te situation m<strong>et</strong> en évi<strong>de</strong>nce une divergence entre ce que révèlent<br />

les nouvelles observations <strong>et</strong> l’information a priori.<br />

94

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!