Traitement et analyse de séries chronologiques continues de ...
Traitement et analyse de séries chronologiques continues de ... Traitement et analyse de séries chronologiques continues de ...
Partie 2 – Chapitre 6 : Test des modèles - Une distribution tronquée, sur un ou deux côtés de la distribution, montrant que l’espace des paramètres possibles de la distribution a priori n’est pas assez large. Les corrélations des paramètres sont dans la majorité des études analysées par des représentations graphiques de type « Scatter Plot » (e.g. Kanso et al. 2005b; Dotto et al. 2009; Laloy et al. 2010). Elles permettent une première appréciation de la forme multi-dimensionnelle des distributions a posteriori. Une absence de structuration du nuage de points met en évidence l’indépendance de deux paramètres, tandis qu’une corrélation suffisamment marquée révèle une surparamétrisation inutile du modèle. Un des deux paramètres peut être simplement déduit comme une fonction de l’autre, et cette dernière incorporée dans la structure du modèle. La fonction peut être estimée à partir de la corrélation observée. Des corrélations fortes peuvent être à l’origine de la faible identifiabilité de groupes de paramètres auxquels les résultats du modèle sont sensibles. La Figure 6.2 montre l’exemple d’une corrélation entre les paramètres d’accumulation et d’érosion du modèle d’Alley et Smith, mise en évidence par Kanso et al. (2005b) qui ont testé le modèle avec la méthode d’analyse bayésienne à l’échelle d’une rue. Dero Daccu Figure 6.2. Exemple de la corrélation trouvée entre les paramètres Daccu et Dero du modèle d’Alley et Smith (1981) d’accumulation des sédiments sur la surface en temps sec testé par Kanso et al (2005b) ; résultat d’un calage à l’échelle d’une rue Quels que soient les problèmes d’identifiabilité mis en évidence, ces derniers sont à relier à la formulation des équations auxquelles ils se rapportent. Pour une amélioration du modèle, ces équations doivent donc être modifiées ou de nouvelles formulations proposées. Analyse de l’effet d’apprentissage du processus inférentiel La comparaison des distributions a posteriori et a priori permet d’estimer l’effet d’apprentissage du processus inférentiel (Reichert 2009). Plusieurs cas sont possibles : - Les distributions a posteriori des paramètres sont plus resserrées : le processus inférentiel a permis d’améliorer la connaissance des paramètres du modèle. - Les formes des deux distributions sont proches : les observations utilisées pour le calage ne contiennent pas ou peu d’informations permettant d’améliorer la connaissance du modélisateur. - Les distributions présentent des changements de position et/ou de forme significatifs. Cette situation met en évidence une divergence entre ce que révèlent les nouvelles observations et l’information a priori. 94
Partie 2 – Chapitre 6 : Test des modèles Analyse de sensibilité du modèle aux paramètres L’influence des paramètres sur les résultats du modèle peut être évaluée a posteriori par une analyse de sensibilité basée sur l’étude des distributions a posteriori. L’objectif d’une telle analyse est d’identifier les paramètres qui contribuent le plus à l’incertitude sur la réponse du modèle. Ce sont en effet ces paramètres qui, mal identifiés, risquent d’avoir le plus d’influence en prédiction. Du fait de l’information donnée par l’échantillonnage suivant la distribution a posteriori, il est possible d’appliquer des études de sensibilité des paramètres à l’échelle globale ( c’est-à-dire en considérant l’espace entier des possibles). La méthode d’Hornberger et Spear (1981), à l’origine de la méthode GLUE, peut par exemple être appliquée. Les méthodes de décomposition de variance basées sur le calcul d’indices de sensibilité peuvent également être utilisées (Saltelli et al. 1999), comme dans l’étude récente de (Vezzaro 2008) pour l’étude d’un modèle de qualité des RUTP. Un autre exemple de technique est la méthode de « Morris screening » (Campolongo et Braddock 1999; Cropp et Braddock 2002). Pour une présentation plus détaillée des techniques possibles, nous renvoyons par exemple au guide pratique récemment proposé par (Saltelli et al. 2004). L’approche globale la plus simple consiste à tracer la valeur de la fonction de vraisemblance dans le plan des paramètres considérés deux à deux, sous forme d’un nuage de points. Cette représentation permet de mettre en évidence les valeurs des paramètres pour lesquelles la vraisemblance n’est pas sensible. Ceci donne donc indirectement une idée de l’influence de chaque paramètre sur la réponse du modèle. Cette méthode a été appliquée récemment par Kanso et al. (2005a) pour le test de modèles de RUTP. Il faut cependant garder à l’esprit la limite de cette approche : du fait de la projection de l’espace entier des paramètres dans un plan, pour des raisons pratiques de lecture des graphiques, l’analyse graphique peut parfois conduire à une mauvaise interprétation de l’identifiabilité des paramètres par rapport à l’information apportée par l’analyse des distributions a posteriori (Vrugt, communication personnelle). Nous n’avons pas identifié, au moment de notre rédaction, de méthodes plus quantitatives que la lecture des graphiques. Une approche bibliographique complémentaire serait utile sur cette question (voir par exemple Saltelli et al. 2004). 6.2.2 Application du principe d’apprentissage Si le principe d’apprentissage bayésien s’applique au départ pour la détermination des distributions a posteriori des paramètres, il peut également être envisagé d’un point de vue plus général pour le test des modèles. En effet, le point de départ du calage d’un modèle est une information a priori sur i) les distributions des paramètres mais également sur ii) la structure du modèle et iii) l’hypothèse des caractéristiques des résidus. L’apprentissage est également envisagé au départ pour les calages successifs d’un même modèle au fur et à mesure que de nouveaux jeux d’observations sont disponibles. Mais il peut tout aussi bien être appliqué pour un même jeu d’observations avec pour objectif l’amélioration de la structure du modèle testé. C’est par exemple le principe de l’analyse proposée par Reichert (2009) pour l’identification de la structure d’un modèle. Des calages successifs du modèle sont effectués et les informations apportées par l’analyse des résultats (analyse des paramètres, vérification des hypothèses sur les résidus) sont utilisées pour tester une version améliorée de la structure du modèle. Les calages itératifs sont mis en œuvre jusqu’à parvenir à une structure optimale, ou au moins améliorée, du modèle. Le nombre 95
- Page 72 and 73: Partie 2 - Chapitre 4 : Le concept
- Page 74 and 75: Partie 2 - Chapitre 4 : Le concept
- Page 76 and 77: Partie 2 - Chapitre 4 : Le concept
- Page 78 and 79: Partie 2 - Chapitre 4 : Le concept
- Page 80 and 81: Partie 2 - Chapitre 4 : Le concept
- Page 83 and 84: Partie 2 - Chapitre 5 : Les méthod
- Page 85 and 86: Partie 2 - Chapitre 5 : Les méthod
- Page 87 and 88: Partie 2 - Chapitre 5 : Les méthod
- Page 89 and 90: Partie 2 - Chapitre 5 : Les méthod
- Page 91 and 92: Partie 2 - Chapitre 5 : Les méthod
- Page 93 and 94: Partie 2 - Chapitre 5 : Les méthod
- Page 95 and 96: Partie 2 - Chapitre 5 : Les méthod
- Page 97 and 98: Partie 2 - Chapitre 5 : Les méthod
- Page 99 and 100: Partie 2 - Chapitre 5 : Les méthod
- Page 101 and 102: Partie 2 - Chapitre 5 : Les méthod
- Page 103 and 104: Partie 2 - Chapitre 5 : Les méthod
- Page 105 and 106: Partie 2 - Chapitre 5 : Les méthod
- Page 107 and 108: Partie 2 - Chapitre 5 : Les méthod
- Page 109 and 110: Partie 2 - Chapitre 5 : Les méthod
- Page 111 and 112: Partie 2 - Chapitre 5 : Les méthod
- Page 113 and 114: Partie 2 - Chapitre 5 : Les méthod
- Page 115 and 116: Partie 2 - Chapitre 5 : Les méthod
- Page 117 and 118: Partie 2 - Chapitre 6 : Test des mo
- Page 119 and 120: Partie 2 - Chapitre 6 : Test des mo
- Page 121: Partie 2 - Chapitre 6 : Test des mo
- Page 125 and 126: Partie 2 - Chapitre 6 : Test des mo
- Page 127: Partie 2 - Chapitre 6 : Test des mo
- Page 131: Partie 3 Construction de la base de
- Page 135 and 136: Partie 3 - Chapitre 7 : Présentati
- Page 137 and 138: Partie 3 - Chapitre 7 : Présentati
- Page 139 and 140: Partie 3 - Chapitre 7 : Présentati
- Page 141 and 142: Partie 3 - Chapitre 7 : Présentati
- Page 143 and 144: Partie 3 - Chapitre 8 : Traitement
- Page 145 and 146: Partie 3 - Chapitre 8 : Traitement
- Page 147 and 148: Partie 3 - Chapitre 8 : Traitement
- Page 149 and 150: Partie 3 - Chapitre 8 : Traitement
- Page 151 and 152: Partie 3 - Chapitre 8 : Traitement
- Page 153 and 154: Partie 3 - Chapitre 9 : Présentati
- Page 155 and 156: Partie 3 - Chapitre 9 : Présentati
- Page 157 and 158: Partie 3 - Chapitre 9 : Présentati
- Page 159 and 160: Partie 3 - Chapitre 9 : Présentati
- Page 161 and 162: Partie 3 - Chapitre 9 : Présentati
- Page 163 and 164: Partie 3 - Chapitre 9 : Présentati
- Page 165 and 166: Partie 3 - Chapitre 9 : Présentati
- Page 167 and 168: Partie 3 - Chapitre 9 : Présentati
- Page 169 and 170: Partie 3 - Chapitre 9 : Présentati
- Page 171: Partie 3 - Chapitre 9 : Présentati
Partie 2 – Chapitre 6 : Test <strong>de</strong>s modèles<br />
- Une distribution tronquée, sur un ou <strong>de</strong>ux côtés <strong>de</strong> la distribution, montrant que<br />
l’espace <strong>de</strong>s paramètres possibles <strong>de</strong> la distribution a priori n’est pas assez large.<br />
Les corrélations <strong>de</strong>s paramètres sont dans la majorité <strong>de</strong>s étu<strong>de</strong>s analysées par <strong>de</strong>s<br />
représentations graphiques <strong>de</strong> type « Scatter Plot » (e.g. Kanso <strong>et</strong> al. 2005b; Dotto <strong>et</strong> al. 2009;<br />
Laloy <strong>et</strong> al. 2010). Elles perm<strong>et</strong>tent une première appréciation <strong>de</strong> la forme multi-dimensionnelle<br />
<strong>de</strong>s distributions a posteriori. Une absence <strong>de</strong> structuration du nuage <strong>de</strong> points m<strong>et</strong> en évi<strong>de</strong>nce<br />
l’indépendance <strong>de</strong> <strong>de</strong>ux paramètres, tandis qu’une corrélation suffisamment marquée révèle une<br />
surparamétrisation inutile du modèle. Un <strong>de</strong>s <strong>de</strong>ux paramètres peut être simplement déduit<br />
comme une fonction <strong>de</strong> l’autre, <strong>et</strong> c<strong>et</strong>te <strong>de</strong>rnière incorporée dans la structure du modèle. La<br />
fonction peut être estimée à partir <strong>de</strong> la corrélation observée. Des corrélations fortes peuvent être<br />
à l’origine <strong>de</strong> la faible i<strong>de</strong>ntifiabilité <strong>de</strong> groupes <strong>de</strong> paramètres auxquels les résultats du modèle<br />
sont sensibles. La Figure 6.2 montre l’exemple d’une corrélation entre les paramètres<br />
d’accumulation <strong>et</strong> d’érosion du modèle d’Alley <strong>et</strong> Smith, mise en évi<strong>de</strong>nce par Kanso <strong>et</strong> al.<br />
(2005b) qui ont testé le modèle avec la métho<strong>de</strong> d’<strong>analyse</strong> bayésienne à l’échelle d’une rue.<br />
Dero<br />
Daccu<br />
Figure 6.2. Exemple <strong>de</strong> la corrélation trouvée entre les paramètres Daccu <strong>et</strong> Dero du modèle d’Alley <strong>et</strong> Smith<br />
(1981) d’accumulation <strong>de</strong>s sédiments sur la surface en temps sec testé par Kanso <strong>et</strong> al (2005b) ; résultat d’un<br />
calage à l’échelle d’une rue<br />
Quels que soient les problèmes d’i<strong>de</strong>ntifiabilité mis en évi<strong>de</strong>nce, ces <strong>de</strong>rniers sont à relier à<br />
la formulation <strong>de</strong>s équations auxquelles ils se rapportent. Pour une amélioration du modèle, ces<br />
équations doivent donc être modifiées ou <strong>de</strong> nouvelles formulations proposées.<br />
Analyse <strong>de</strong> l’eff<strong>et</strong> d’apprentissage du processus inférentiel<br />
La comparaison <strong>de</strong>s distributions a posteriori <strong>et</strong> a priori perm<strong>et</strong> d’estimer l’eff<strong>et</strong><br />
d’apprentissage du processus inférentiel (Reichert 2009). Plusieurs cas sont possibles :<br />
- Les distributions a posteriori <strong>de</strong>s paramètres sont plus resserrées : le processus<br />
inférentiel a permis d’améliorer la connaissance <strong>de</strong>s paramètres du modèle.<br />
- Les formes <strong>de</strong>s <strong>de</strong>ux distributions sont proches : les observations utilisées pour le<br />
calage ne contiennent pas ou peu d’informations perm<strong>et</strong>tant d’améliorer la<br />
connaissance du modélisateur.<br />
- Les distributions présentent <strong>de</strong>s changements <strong>de</strong> position <strong>et</strong>/ou <strong>de</strong> forme<br />
significatifs. C<strong>et</strong>te situation m<strong>et</strong> en évi<strong>de</strong>nce une divergence entre ce que révèlent<br />
les nouvelles observations <strong>et</strong> l’information a priori.<br />
94