Traitement et analyse de séries chronologiques continues de ...

Traitement et analyse de séries chronologiques continues de ... Traitement et analyse de séries chronologiques continues de ...

theses.insa.lyon.fr
from theses.insa.lyon.fr More from this publisher
14.09.2014 Views

Partie 2 – Chapitre 4 : Le concept d’incertitude en modélisation en hydrologie urbaine polluants, il semble plus pertinent d’utiliser le coefficient de Nash et Sutcliffe qui donne moins de poids relatifs aux valeurs élevéesau sein des chroniques simulées. L’adoption de l’approche statistique n’est a priori pertinente que si le modélisateur est capable d’évaluer effectivement la distribution statistique des résidus, ce qui est rarement le cas. L’adoption de fonctions objectif intuitives dérivées du critère des Moindre Carrés est indirectement une réponse à ce problème, mettant en évidence la limite de la distinction des points de vue statistique et intuitif que nous avons proposée. Il semble important de rappeler que dans le cas d’un calage simple, seul compte l’objectif du modélisateur. Les performances du modèle seront, lors de son utilisation en prédiction, à l’image des performances du modèle en calage sur la base du critère d’optimisation choisi. L’application de la méthode probabiliste, malgré la violation de ses hypothèses statistique, n’a comme impact potentiel que de ne pas satisfaire les objectifs du modélisateur. Pour ce qui est des fonctions multi-objectifs, elles sont, à notre connaissance, formulées de manière intuitive dans les études de la qualité des RUTP (Muschalla 2008; Gamerith et al. 2008; Mannina et Viviani 2010). 4.2.2.2 Algorithmes de calage L’algorithme de calage est défini comme la procédure qui consiste à rechercher les valeurs du jeu de paramètres optimisant la fonction objectif retenue (minimisation ou maximisation). Cette dernière est en effet comme une fonction des paramètres du modèle, à savoir une surface dont la dimension est égale au nombre de paramètres. L’objectif est de déterminer les valeurs des paramètres correspondant à l’optimum de cette surface. Etant donné le caractère fastidieux d’un calage manuel, d’autant plus que le nombre de paramètres de calage est élevé, des procédures automatiques sont dans la majorité des cas adoptées. Différentes méthodes peuvent être utilisées suivant la complexité du modèle et de la surface de réponse de la fonction objectif. Cas des modèles linéaires Dans le cas d’un modèle linéaire et avec une fonction objectif simple, il peut être possible d’obtenir les valeurs du jeu optimal par une résolution analytique directe. Ces dernières correspondent aux valeurs pour lesquelles les dérivées de la fonction objectif s’annulent. Le cas du modèle linéaire associé au critère de la SCE est l’exemple le plus connu. La dérivation de l’expression de la SCE par rapport à chacun des paramètres conduit à l’obtention d’un système de n équations à n inconnues à solution unique (voir paragraphe 5.2.1). Un autre exemple de méthode adaptée au modèle linéaire est la méthode des moindres carrés robustes. Cette dernière est basée sur le critère de la somme des écarts pondérés, qui est minimisée de manière itérative. A chaque itération, les poids sont attribués en fonction des valeurs des résidus obtenus à l’issue de l’itération précédente et de manière à ce que l’influence des outliers soit minimale. Le principe détaillé de la méthode et les manières possibles d’attribuer les poids sont présentés dans Dembélé (2010). Il semble important de rappeler la signification du terme outlier. Les outliers correspondent théoriquement aux observations différant significativement de l’ensemble des données simulées et a priori imputables à des erreurs de mesure. Cependant de tels points peuvent tout aussi bien être fiables et refléter simplement l’incapacité de la structure du modèle à les reproduire. L’application de la méthode des moindres carrés robustes n’est dans ce cas qu’un moyen de ne pas trop leur donner de poids dans le calage, suivant les objectifs du modélisateur. 48

Partie 2 – Chapitre 4 : Le concept d’incertitude en modélisation en hydrologie urbaine Cas des modèles complexes Dès lors que l’expression de f(θ,X) est non linéaire et trop complexe pour être linéarisée, il est impossible de formuler une expression analytique des dérivées partielles. De plus, la surface de réponse de la fonction est susceptible de présenter des non linéarités importantes, des optimums locaux ou des discontinuités (Duan et al. 1992). Ces effets sont d’autant plus marqués que la structure du modèle est mal identifiée. Dans ce cas, l’emploi d’algorithmes d’optimisation numérique, capables d’identifier de manière fiable et efficace l’optimum global de la surface de réponse, devient nécessaire. Les méthodes principalement utilisées à l’heure actuelle en hydrologie urbaine incluent les algorithmes génétiques ou dérivés de l a théorie de l’évolution (Duan et al. 1992) ainsi que la méthode de Levenberg-Marquardt (Levenberg 1944; Marquardt 1963). Cette dernière est implémentée notamment dans les outils de calage automatique PEST (Doherty 1999) et CALIMERO (Kleidorfer et al. 2009). La méthode de Levenberg-Marquardt a récemment été utilisée pour le calage des modèles de qualité des RUTP (Kleidorfer 2009; Kleidorfer et al. 2009; Dembélé et Becouze 2010). Des algorithmes de calage spécifiques à l’optimisation de fonctions multi-objectifs, basés sur des stratégies d’évolution et la théorie des jeux optimum de Pareto, ont également été développés ces dix dernières années (Madsen 2000; Muschalla 2008; Gamerith et al. 2008). 4.2.3 Calcul de l’incertitude de prédiction L’incertitude sur les prédictions est évaluée à partir de l’analyse de l’incertitude avec laquelle les données observées de calage sont reproduites. Comme pour le calage simple, cette projection n’est fiable que si la série de données utilisée pour le calage est suffisamment représentative des processus observés. D’un point de vue statistique, l’idée de base est de caractériser les résidus entre les données observées et simulées avec le jeu optimal, puis, à partir de cette caractérisation, de les reproduire en prédiction. Il est donc fait l’hypothèse que les résidus en prédiction auront la même nature que les résidus obtenus sur la période de calage. La caractérisation statistique des résidus consiste à déterminer leur densité de probabilité, c’est-à-dire la forme de leur distribution, leurs degrés d’auto-corrélation et d’homoscédasticité. L’intervalle de prédiction est ensuite déterminé par des simulations de Monte Carlo à partir de cette caractérisation. L’intervalle de prédiction est calculé en prenant en compte deux sources d’incertitude : - L’incertitude liée à l’estimation du jeu optimal de paramètres lui-même déterminé lors de la procédure de calage. Cette incertitude provient du fait que plusieurs jeux de paramètres peuvent donner des valeurs proches du critère de performance. Le jeu optimal est celui qui en probabilité donne les meilleurs résultats. - L’incertitude résiduelle entre les valeurs simulées et observées. Pour chacune des simulations obtenues par la propagation de l’incertitude des paramètres dans le modèle, il reste un écart avec les observations. L’incertitude de prédiction totale est la résultante de ces deux sources d’incertitude et est calculée de manière à contenir un certain pourcentage des observations. Le principe de l’estimation de l’incertitude de prédiction d’un point de vue statistique, avec l’exemple d’un 49

Partie 2 – Chapitre 4 : Le concept d’incertitu<strong>de</strong> en modélisation en hydrologie urbaine<br />

polluants, il semble plus pertinent d’utiliser le coefficient <strong>de</strong> Nash <strong>et</strong> Sutcliffe qui donne moins<br />

<strong>de</strong> poids relatifs aux valeurs élevéesau sein <strong>de</strong>s chroniques simulées.<br />

L’adoption <strong>de</strong> l’approche statistique n’est a priori pertinente que si le modélisateur est<br />

capable d’évaluer effectivement la distribution statistique <strong>de</strong>s résidus, ce qui est rarement le cas.<br />

L’adoption <strong>de</strong> fonctions objectif intuitives dérivées du critère <strong>de</strong>s Moindre Carrés est<br />

indirectement une réponse à ce problème, m<strong>et</strong>tant en évi<strong>de</strong>nce la limite <strong>de</strong> la distinction <strong>de</strong>s<br />

points <strong>de</strong> vue statistique <strong>et</strong> intuitif que nous avons proposée. Il semble important <strong>de</strong> rappeler<br />

que dans le cas d’un calage simple, seul compte l’objectif du modélisateur. Les performances du<br />

modèle seront, lors <strong>de</strong> son utilisation en prédiction, à l’image <strong>de</strong>s performances du modèle en<br />

calage sur la base du critère d’optimisation choisi. L’application <strong>de</strong> la métho<strong>de</strong> probabiliste,<br />

malgré la violation <strong>de</strong> ses hypothèses statistique, n’a comme impact potentiel que <strong>de</strong> ne pas<br />

satisfaire les objectifs du modélisateur.<br />

Pour ce qui est <strong>de</strong>s fonctions multi-objectifs, elles sont, à notre connaissance, formulées <strong>de</strong><br />

manière intuitive dans les étu<strong>de</strong>s <strong>de</strong> la qualité <strong>de</strong>s RUTP (Muschalla 2008; Gamerith <strong>et</strong> al.<br />

2008; Mannina <strong>et</strong> Viviani 2010).<br />

4.2.2.2 Algorithmes <strong>de</strong> calage<br />

L’algorithme <strong>de</strong> calage est défini comme la procédure qui consiste à rechercher les valeurs<br />

du jeu <strong>de</strong> paramètres optimisant la fonction objectif r<strong>et</strong>enue (minimisation ou maximisation).<br />

C<strong>et</strong>te <strong>de</strong>rnière est en eff<strong>et</strong> comme une fonction <strong>de</strong>s paramètres du modèle, à savoir une surface<br />

dont la dimension est égale au nombre <strong>de</strong> paramètres. L’objectif est <strong>de</strong> déterminer les valeurs<br />

<strong>de</strong>s paramètres correspondant à l’optimum <strong>de</strong> c<strong>et</strong>te surface. Etant donné le caractère fastidieux<br />

d’un calage manuel, d’autant plus que le nombre <strong>de</strong> paramètres <strong>de</strong> calage est élevé, <strong>de</strong>s<br />

procédures automatiques sont dans la majorité <strong>de</strong>s cas adoptées. Différentes métho<strong>de</strong>s peuvent<br />

être utilisées suivant la complexité du modèle <strong>et</strong> <strong>de</strong> la surface <strong>de</strong> réponse <strong>de</strong> la fonction objectif.<br />

Cas <strong>de</strong>s modèles linéaires<br />

Dans le cas d’un modèle linéaire <strong>et</strong> avec une fonction objectif simple, il peut être possible<br />

d’obtenir les valeurs du jeu optimal par une résolution analytique directe. Ces <strong>de</strong>rnières<br />

correspon<strong>de</strong>nt aux valeurs pour lesquelles les dérivées <strong>de</strong> la fonction objectif s’annulent. Le cas<br />

du modèle linéaire associé au critère <strong>de</strong> la SCE est l’exemple le plus connu. La dérivation <strong>de</strong><br />

l’expression <strong>de</strong> la SCE par rapport à chacun <strong>de</strong>s paramètres conduit à l’obtention d’un système<br />

<strong>de</strong> n équations à n inconnues à solution unique (voir paragraphe 5.2.1).<br />

Un autre exemple <strong>de</strong> métho<strong>de</strong> adaptée au modèle linéaire est la métho<strong>de</strong> <strong>de</strong>s moindres carrés<br />

robustes. C<strong>et</strong>te <strong>de</strong>rnière est basée sur le critère <strong>de</strong> la somme <strong>de</strong>s écarts pondérés, qui est<br />

minimisée <strong>de</strong> manière itérative. A chaque itération, les poids sont attribués en fonction <strong>de</strong>s<br />

valeurs <strong>de</strong>s résidus obtenus à l’issue <strong>de</strong> l’itération précé<strong>de</strong>nte <strong>et</strong> <strong>de</strong> manière à ce que l’influence<br />

<strong>de</strong>s outliers soit minimale. Le principe détaillé <strong>de</strong> la métho<strong>de</strong> <strong>et</strong> les manières possibles<br />

d’attribuer les poids sont présentés dans Dembélé (2010). Il semble important <strong>de</strong> rappeler la<br />

signification du terme outlier. Les outliers correspon<strong>de</strong>nt théoriquement aux observations<br />

différant significativement <strong>de</strong> l’ensemble <strong>de</strong>s données simulées <strong>et</strong> a priori imputables à <strong>de</strong>s<br />

erreurs <strong>de</strong> mesure. Cependant <strong>de</strong> tels points peuvent tout aussi bien être fiables <strong>et</strong> refléter<br />

simplement l’incapacité <strong>de</strong> la structure du modèle à les reproduire. L’application <strong>de</strong> la métho<strong>de</strong><br />

<strong>de</strong>s moindres carrés robustes n’est dans ce cas qu’un moyen <strong>de</strong> ne pas trop leur donner <strong>de</strong> poids<br />

dans le calage, suivant les objectifs du modélisateur.<br />

48

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!