Traitement et analyse de séries chronologiques continues de ...

Traitement et analyse de séries chronologiques continues de ... Traitement et analyse de séries chronologiques continues de ...

theses.insa.lyon.fr
from theses.insa.lyon.fr More from this publisher
14.09.2014 Views

Partie 2 – Chapitre 4 : Le concept d’incertitude en modélisation en hydrologie urbaine Tableau 4.1. Fonctions objectif citées dans la littérature en hydrologie urbaine : nom du critère, type d’optimisation, formule, valeurs minimum et maximum des critères et objectifs associés à leur utilisation Critère Optimisation Formule Min Max Objectifs Biais Coefficient de détermination r² Somme des écarts quadratiques absolue (SCE) Racine carrée de la variance des résidus (RMSE) Somme des écarts absolus Somme des écarts quadratiques relatifs Somme des écarts pondérés Coefficient de Nash et Sutcliffe (1970) Index d’ajustement (Willmott et al. 1985) 1 Max N N i1 N i1 N f( x) i1 y f ( xi) f ( x) yi y N f ( xi) f ( x) yi y i1 i1 i i Min 2 N i1 f ( x ) 2 Min i yi Min Min 2 2 0 1 f ( xi) yi 0 N 0 i1 N i1 N f ( x ) 2 i yi Min Max Max 1 N i1 N f ( xi) yi 0 2 N f ( xi) y i i1 y 0 i 0 w i1 1 N i1 N N i1 i1 i f ( x ) y y i i y i 2 f ( x ) y i f ( x ) f ( x) y f ( x) i i i 2 2 2 1 0 1 Estimer les valeurs observées en moyenne (ex : bilan de masse) Evaluer la relation linéaire entre les observations et les simulations Donner le même poids à toutes les observations, sous l’hypothèse d’une structure parfaite Donner moins de poids aux fortes valeurs par rapport à la SCE Cette liste s’inspire notamment des récentes synthèses de Kleidorfer (2009) et Dembélé (2010), qui proposent une analyse critique de fonctions couramment utilisées. Les critères recensés peuvent être présentés selon les groupes suivants : - Le critère de biais et le coefficient de détermination, r² : ce sont les critères les plus simples dont l’utilisation pertinente reste limitée à des cas bien déterminés. Le biais permet l’estimation de la performance moyenne d’un modèle et r² l’évaluation de la relation linéaire entre les observations et les simulations. Ce 46

Partie 2 – Chapitre 4 : Le concept d’incertitude en modélisation en hydrologie urbaine dernier critère est insensible aux erreurs additives et proportionnelles, surestimant ainsi l’impact des outliers en comparaison des valeurs proches de la moyenne. - La somme des carrés des écarts (SCE) : nous avons intentionnellement considéré ce critère dans la classification des fonctions que nous qualifions d’ « intuitives ». En effet si, au départ, la SCE est dérivée de la théorie statistique, ce critère est très souvent utilisé sans vérification des caractéristiques statistiques des résidus. D’autre part c’est à partir de cette formule que d’autres critères ont été intuitivement proposés afin de pallier ses limites. Ces dernières se situent à deux niveaux. Mathématiquement, la SCE donne le même poids à chacun des termes de la somme quadratique. Ceci implique que, dans le cas où les valeurs élevées sont mal reproduites (les résidus sont hétéroscédastiques et ne reflètent plus un bruit aléatoire normalement distribué), ces dernières seront plus élevées en valeur absolue et donc pèseront plus dans la valeur du critère. D’autre part la SCE a la même unité que le carré des grandeurs observées et simulées. Sa valeur dépend donc directement de la quantité de données simulées (longueur de la chronique de pluie simulée ou nombre d’événements simulés) et de leurs valeurs absolues. Ces éléments rendent difficile l’interprétation de la valeur du critère, particulièrement lorsque l’objectif est de comparer les résultats pour différents jeux de calage ou entre différents modèles. - Les critères dérivés de la SCE : la RMSE, la somme des écarts absolus, la somme des écarts quadratiques relatifs et pondérés. La RMSE présente les mêmes caractéristiques que le critère de la SCE, à l’unité et la valeur absolue près. Les trois autres fonctions dérivées ont été proposées afin de pallier le problème d’hétéroscédasticité des résidus en donnant moins de poids par rapport à la SCE aux valeurs de résidus élevées (Kanso et Chebbo 2002). - Le coefficient de Nash et Sutcliffe (1970) et l’index d’ajustement de Willmott et al. (1985) : l’intérêt de ces deux critères est de ramener les valeurs de la fonction objectif entre et 1 et sans unité, ce qui facilite leur interprétation et les comparaisons. Le coefficient de Nash et Sutcliffe est particulièrement utilisé en hydrologie urbaine et pour la modélisation de la qualité des RUTP (Gamerith et al. 2008; Dotto et al. 2009; Dembélé et Becouze 2010; Freni et al. 2010a). Il représente le rapport de la SCE à la variance des données observées, soustrait de 1. Une valeur négative de ce coefficient indique que la valeur moyenne des observations est un meilleur prédicteur que les simulations du modèle. Choix de la fonction Le choix du critère d’optimisation est subjectif et dépend d’abord de l’objectif de modélisation. Par exemple, si le modélisateur cherche à privilégier les fortes valeurs, le choix du critère de SCE ou de RMSE peut s’avérer pertinent, même si l’hypothèse d’homoscédasticité n’est pas vérifiée. Dans le cas des modèles simples, par exemple de type multi-régression, où on détermine des valeurs discrètes évenementielles (masses ou concentrations) et où l’hypothèse de structure du modèle est acceptable (c’est-à-dire les résidus se rapprochent d’une distribution normale), la RMSE peut être utilisée. Dans le cas des modèles simulant en continu les flux 47

Partie 2 – Chapitre 4 : Le concept d’incertitu<strong>de</strong> en modélisation en hydrologie urbaine<br />

<strong>de</strong>rnier critère est insensible aux erreurs additives <strong>et</strong> proportionnelles, surestimant<br />

ainsi l’impact <strong>de</strong>s outliers en comparaison <strong>de</strong>s valeurs proches <strong>de</strong> la moyenne.<br />

- La somme <strong>de</strong>s carrés <strong>de</strong>s écarts (SCE) : nous avons intentionnellement considéré<br />

ce critère dans la classification <strong>de</strong>s fonctions que nous qualifions d’ « intuitives ».<br />

En eff<strong>et</strong> si, au départ, la SCE est dérivée <strong>de</strong> la théorie statistique, ce critère est<br />

très souvent utilisé sans vérification <strong>de</strong>s caractéristiques statistiques <strong>de</strong>s résidus.<br />

D’autre part c’est à partir <strong>de</strong> c<strong>et</strong>te formule que d’autres critères ont été<br />

intuitivement proposés afin <strong>de</strong> pallier ses limites. Ces <strong>de</strong>rnières se situent à <strong>de</strong>ux<br />

niveaux. Mathématiquement, la SCE donne le même poids à chacun <strong>de</strong>s termes <strong>de</strong><br />

la somme quadratique. Ceci implique que, dans le cas où les valeurs élevées sont<br />

mal reproduites (les résidus sont hétéroscédastiques <strong>et</strong> ne reflètent plus un bruit<br />

aléatoire normalement distribué), ces <strong>de</strong>rnières seront plus élevées en valeur<br />

absolue <strong>et</strong> donc pèseront plus dans la valeur du critère. D’autre part la SCE a la<br />

même unité que le carré <strong>de</strong>s gran<strong>de</strong>urs observées <strong>et</strong> simulées. Sa valeur dépend<br />

donc directement <strong>de</strong> la quantité <strong>de</strong> données simulées (longueur <strong>de</strong> la chronique <strong>de</strong><br />

pluie simulée ou nombre d’événements simulés) <strong>et</strong> <strong>de</strong> leurs valeurs absolues. Ces<br />

éléments ren<strong>de</strong>nt difficile l’interprétation <strong>de</strong> la valeur du critère, particulièrement<br />

lorsque l’objectif est <strong>de</strong> comparer les résultats pour différents jeux <strong>de</strong> calage ou<br />

entre différents modèles.<br />

- Les critères dérivés <strong>de</strong> la SCE : la RMSE, la somme <strong>de</strong>s écarts absolus, la somme<br />

<strong>de</strong>s écarts quadratiques relatifs <strong>et</strong> pondérés. La RMSE présente les mêmes<br />

caractéristiques que le critère <strong>de</strong> la SCE, à l’unité <strong>et</strong> la valeur absolue près. Les<br />

trois autres fonctions dérivées ont été proposées afin <strong>de</strong> pallier le problème<br />

d’hétéroscédasticité <strong>de</strong>s résidus en donnant moins <strong>de</strong> poids par rapport à la SCE<br />

aux valeurs <strong>de</strong> résidus élevées (Kanso <strong>et</strong> Chebbo 2002).<br />

- Le coefficient <strong>de</strong> Nash <strong>et</strong> Sutcliffe (1970) <strong>et</strong> l’in<strong>de</strong>x d’ajustement <strong>de</strong> Willmott <strong>et</strong><br />

al. (1985) : l’intérêt <strong>de</strong> ces <strong>de</strong>ux critères est <strong>de</strong> ramener les valeurs <strong>de</strong> la fonction<br />

objectif entre <strong>et</strong> 1 <strong>et</strong> sans unité, ce qui facilite leur interprétation <strong>et</strong> les<br />

comparaisons. Le coefficient <strong>de</strong> Nash <strong>et</strong> Sutcliffe est particulièrement utilisé en<br />

hydrologie urbaine <strong>et</strong> pour la modélisation <strong>de</strong> la qualité <strong>de</strong>s RUTP (Gamerith <strong>et</strong><br />

al. 2008; Dotto <strong>et</strong> al. 2009; Dembélé <strong>et</strong> Becouze 2010; Freni <strong>et</strong> al. 2010a). Il<br />

représente le rapport <strong>de</strong> la SCE à la variance <strong>de</strong>s données observées, soustrait <strong>de</strong><br />

1. Une valeur négative <strong>de</strong> ce coefficient indique que la valeur moyenne <strong>de</strong>s<br />

observations est un meilleur prédicteur que les simulations du modèle.<br />

Choix <strong>de</strong> la fonction<br />

Le choix du critère d’optimisation est subjectif <strong>et</strong> dépend d’abord <strong>de</strong> l’objectif <strong>de</strong><br />

modélisation. Par exemple, si le modélisateur cherche à privilégier les fortes valeurs, le choix<br />

du critère <strong>de</strong> SCE ou <strong>de</strong> RMSE peut s’avérer pertinent, même si l’hypothèse d’homoscédasticité<br />

n’est pas vérifiée. Dans le cas <strong>de</strong>s modèles simples, par exemple <strong>de</strong> type multi-régression, où on<br />

détermine <strong>de</strong>s valeurs discrètes évenementielles (masses ou concentrations) <strong>et</strong> où l’hypothèse <strong>de</strong><br />

structure du modèle est acceptable (c’est-à-dire les résidus se rapprochent d’une distribution<br />

normale), la RMSE peut être utilisée. Dans le cas <strong>de</strong>s modèles simulant en continu les flux<br />

47

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!