Traitement et analyse de séries chronologiques continues de ...
Traitement et analyse de séries chronologiques continues de ... Traitement et analyse de séries chronologiques continues de ...
Partie 2 – Chapitre 4 : Le concept d’incertitude en modélisation en hydrologie urbaine Tableau 4.1. Fonctions objectif citées dans la littérature en hydrologie urbaine : nom du critère, type d’optimisation, formule, valeurs minimum et maximum des critères et objectifs associés à leur utilisation Critère Optimisation Formule Min Max Objectifs Biais Coefficient de détermination r² Somme des écarts quadratiques absolue (SCE) Racine carrée de la variance des résidus (RMSE) Somme des écarts absolus Somme des écarts quadratiques relatifs Somme des écarts pondérés Coefficient de Nash et Sutcliffe (1970) Index d’ajustement (Willmott et al. 1985) 1 Max N N i1 N i1 N f( x) i1 y f ( xi) f ( x) yi y N f ( xi) f ( x) yi y i1 i1 i i Min 2 N i1 f ( x ) 2 Min i yi Min Min 2 2 0 1 f ( xi) yi 0 N 0 i1 N i1 N f ( x ) 2 i yi Min Max Max 1 N i1 N f ( xi) yi 0 2 N f ( xi) y i i1 y 0 i 0 w i1 1 N i1 N N i1 i1 i f ( x ) y y i i y i 2 f ( x ) y i f ( x ) f ( x) y f ( x) i i i 2 2 2 1 0 1 Estimer les valeurs observées en moyenne (ex : bilan de masse) Evaluer la relation linéaire entre les observations et les simulations Donner le même poids à toutes les observations, sous l’hypothèse d’une structure parfaite Donner moins de poids aux fortes valeurs par rapport à la SCE Cette liste s’inspire notamment des récentes synthèses de Kleidorfer (2009) et Dembélé (2010), qui proposent une analyse critique de fonctions couramment utilisées. Les critères recensés peuvent être présentés selon les groupes suivants : - Le critère de biais et le coefficient de détermination, r² : ce sont les critères les plus simples dont l’utilisation pertinente reste limitée à des cas bien déterminés. Le biais permet l’estimation de la performance moyenne d’un modèle et r² l’évaluation de la relation linéaire entre les observations et les simulations. Ce 46
Partie 2 – Chapitre 4 : Le concept d’incertitude en modélisation en hydrologie urbaine dernier critère est insensible aux erreurs additives et proportionnelles, surestimant ainsi l’impact des outliers en comparaison des valeurs proches de la moyenne. - La somme des carrés des écarts (SCE) : nous avons intentionnellement considéré ce critère dans la classification des fonctions que nous qualifions d’ « intuitives ». En effet si, au départ, la SCE est dérivée de la théorie statistique, ce critère est très souvent utilisé sans vérification des caractéristiques statistiques des résidus. D’autre part c’est à partir de cette formule que d’autres critères ont été intuitivement proposés afin de pallier ses limites. Ces dernières se situent à deux niveaux. Mathématiquement, la SCE donne le même poids à chacun des termes de la somme quadratique. Ceci implique que, dans le cas où les valeurs élevées sont mal reproduites (les résidus sont hétéroscédastiques et ne reflètent plus un bruit aléatoire normalement distribué), ces dernières seront plus élevées en valeur absolue et donc pèseront plus dans la valeur du critère. D’autre part la SCE a la même unité que le carré des grandeurs observées et simulées. Sa valeur dépend donc directement de la quantité de données simulées (longueur de la chronique de pluie simulée ou nombre d’événements simulés) et de leurs valeurs absolues. Ces éléments rendent difficile l’interprétation de la valeur du critère, particulièrement lorsque l’objectif est de comparer les résultats pour différents jeux de calage ou entre différents modèles. - Les critères dérivés de la SCE : la RMSE, la somme des écarts absolus, la somme des écarts quadratiques relatifs et pondérés. La RMSE présente les mêmes caractéristiques que le critère de la SCE, à l’unité et la valeur absolue près. Les trois autres fonctions dérivées ont été proposées afin de pallier le problème d’hétéroscédasticité des résidus en donnant moins de poids par rapport à la SCE aux valeurs de résidus élevées (Kanso et Chebbo 2002). - Le coefficient de Nash et Sutcliffe (1970) et l’index d’ajustement de Willmott et al. (1985) : l’intérêt de ces deux critères est de ramener les valeurs de la fonction objectif entre et 1 et sans unité, ce qui facilite leur interprétation et les comparaisons. Le coefficient de Nash et Sutcliffe est particulièrement utilisé en hydrologie urbaine et pour la modélisation de la qualité des RUTP (Gamerith et al. 2008; Dotto et al. 2009; Dembélé et Becouze 2010; Freni et al. 2010a). Il représente le rapport de la SCE à la variance des données observées, soustrait de 1. Une valeur négative de ce coefficient indique que la valeur moyenne des observations est un meilleur prédicteur que les simulations du modèle. Choix de la fonction Le choix du critère d’optimisation est subjectif et dépend d’abord de l’objectif de modélisation. Par exemple, si le modélisateur cherche à privilégier les fortes valeurs, le choix du critère de SCE ou de RMSE peut s’avérer pertinent, même si l’hypothèse d’homoscédasticité n’est pas vérifiée. Dans le cas des modèles simples, par exemple de type multi-régression, où on détermine des valeurs discrètes évenementielles (masses ou concentrations) et où l’hypothèse de structure du modèle est acceptable (c’est-à-dire les résidus se rapprochent d’une distribution normale), la RMSE peut être utilisée. Dans le cas des modèles simulant en continu les flux 47
- Page 24 and 25: Liste des variables DTS E f f -1 du
- Page 26 and 27: Liste des variables S Pond somme po
- Page 29: Introduction générale 1
- Page 32 and 33: Introduction générale et al. (200
- Page 34 and 35: Introduction générale Structure d
- Page 37: Partie 1 : La modélisation de la q
- Page 40 and 41: Partie 1 - Chapitre 1 : Introductio
- Page 42 and 43: Partie 1 - Chapitre 1 : Introductio
- Page 45 and 46: Partie 1 - Chapitre 2 : Approches d
- Page 47 and 48: Partie 1 - Chapitre 2 : Approches d
- Page 49 and 50: Partie 1 - Chapitre 2 : Approches d
- Page 51 and 52: Partie 1 - Chapitre 2 : Approches d
- Page 53 and 54: Partie 1 - Chapitre 2 : Approches d
- Page 55 and 56: Partie 1 - Chapitre 2 : Approches d
- Page 57: Partie 1 - Chapitre 2 : Approches d
- Page 60 and 61: Partie 1 - Chapitre 3 : Choix des a
- Page 62 and 63: Partie 1 - Chapitre 3 : Choix des a
- Page 65: Partie 2 Test des modèles et incer
- Page 68 and 69: Partie 2 - Test des modèles et inc
- Page 70 and 71: Partie 2 - Chapitre 4 : Le concept
- Page 72 and 73: Partie 2 - Chapitre 4 : Le concept
- Page 76 and 77: Partie 2 - Chapitre 4 : Le concept
- Page 78 and 79: Partie 2 - Chapitre 4 : Le concept
- Page 80 and 81: Partie 2 - Chapitre 4 : Le concept
- Page 83 and 84: Partie 2 - Chapitre 5 : Les méthod
- Page 85 and 86: Partie 2 - Chapitre 5 : Les méthod
- Page 87 and 88: Partie 2 - Chapitre 5 : Les méthod
- Page 89 and 90: Partie 2 - Chapitre 5 : Les méthod
- Page 91 and 92: Partie 2 - Chapitre 5 : Les méthod
- Page 93 and 94: Partie 2 - Chapitre 5 : Les méthod
- Page 95 and 96: Partie 2 - Chapitre 5 : Les méthod
- Page 97 and 98: Partie 2 - Chapitre 5 : Les méthod
- Page 99 and 100: Partie 2 - Chapitre 5 : Les méthod
- Page 101 and 102: Partie 2 - Chapitre 5 : Les méthod
- Page 103 and 104: Partie 2 - Chapitre 5 : Les méthod
- Page 105 and 106: Partie 2 - Chapitre 5 : Les méthod
- Page 107 and 108: Partie 2 - Chapitre 5 : Les méthod
- Page 109 and 110: Partie 2 - Chapitre 5 : Les méthod
- Page 111 and 112: Partie 2 - Chapitre 5 : Les méthod
- Page 113 and 114: Partie 2 - Chapitre 5 : Les méthod
- Page 115 and 116: Partie 2 - Chapitre 5 : Les méthod
- Page 117 and 118: Partie 2 - Chapitre 6 : Test des mo
- Page 119 and 120: Partie 2 - Chapitre 6 : Test des mo
- Page 121 and 122: Partie 2 - Chapitre 6 : Test des mo
- Page 123 and 124: Partie 2 - Chapitre 6 : Test des mo
Partie 2 – Chapitre 4 : Le concept d’incertitu<strong>de</strong> en modélisation en hydrologie urbaine<br />
<strong>de</strong>rnier critère est insensible aux erreurs additives <strong>et</strong> proportionnelles, surestimant<br />
ainsi l’impact <strong>de</strong>s outliers en comparaison <strong>de</strong>s valeurs proches <strong>de</strong> la moyenne.<br />
- La somme <strong>de</strong>s carrés <strong>de</strong>s écarts (SCE) : nous avons intentionnellement considéré<br />
ce critère dans la classification <strong>de</strong>s fonctions que nous qualifions d’ « intuitives ».<br />
En eff<strong>et</strong> si, au départ, la SCE est dérivée <strong>de</strong> la théorie statistique, ce critère est<br />
très souvent utilisé sans vérification <strong>de</strong>s caractéristiques statistiques <strong>de</strong>s résidus.<br />
D’autre part c’est à partir <strong>de</strong> c<strong>et</strong>te formule que d’autres critères ont été<br />
intuitivement proposés afin <strong>de</strong> pallier ses limites. Ces <strong>de</strong>rnières se situent à <strong>de</strong>ux<br />
niveaux. Mathématiquement, la SCE donne le même poids à chacun <strong>de</strong>s termes <strong>de</strong><br />
la somme quadratique. Ceci implique que, dans le cas où les valeurs élevées sont<br />
mal reproduites (les résidus sont hétéroscédastiques <strong>et</strong> ne reflètent plus un bruit<br />
aléatoire normalement distribué), ces <strong>de</strong>rnières seront plus élevées en valeur<br />
absolue <strong>et</strong> donc pèseront plus dans la valeur du critère. D’autre part la SCE a la<br />
même unité que le carré <strong>de</strong>s gran<strong>de</strong>urs observées <strong>et</strong> simulées. Sa valeur dépend<br />
donc directement <strong>de</strong> la quantité <strong>de</strong> données simulées (longueur <strong>de</strong> la chronique <strong>de</strong><br />
pluie simulée ou nombre d’événements simulés) <strong>et</strong> <strong>de</strong> leurs valeurs absolues. Ces<br />
éléments ren<strong>de</strong>nt difficile l’interprétation <strong>de</strong> la valeur du critère, particulièrement<br />
lorsque l’objectif est <strong>de</strong> comparer les résultats pour différents jeux <strong>de</strong> calage ou<br />
entre différents modèles.<br />
- Les critères dérivés <strong>de</strong> la SCE : la RMSE, la somme <strong>de</strong>s écarts absolus, la somme<br />
<strong>de</strong>s écarts quadratiques relatifs <strong>et</strong> pondérés. La RMSE présente les mêmes<br />
caractéristiques que le critère <strong>de</strong> la SCE, à l’unité <strong>et</strong> la valeur absolue près. Les<br />
trois autres fonctions dérivées ont été proposées afin <strong>de</strong> pallier le problème<br />
d’hétéroscédasticité <strong>de</strong>s résidus en donnant moins <strong>de</strong> poids par rapport à la SCE<br />
aux valeurs <strong>de</strong> résidus élevées (Kanso <strong>et</strong> Chebbo 2002).<br />
- Le coefficient <strong>de</strong> Nash <strong>et</strong> Sutcliffe (1970) <strong>et</strong> l’in<strong>de</strong>x d’ajustement <strong>de</strong> Willmott <strong>et</strong><br />
al. (1985) : l’intérêt <strong>de</strong> ces <strong>de</strong>ux critères est <strong>de</strong> ramener les valeurs <strong>de</strong> la fonction<br />
objectif entre <strong>et</strong> 1 <strong>et</strong> sans unité, ce qui facilite leur interprétation <strong>et</strong> les<br />
comparaisons. Le coefficient <strong>de</strong> Nash <strong>et</strong> Sutcliffe est particulièrement utilisé en<br />
hydrologie urbaine <strong>et</strong> pour la modélisation <strong>de</strong> la qualité <strong>de</strong>s RUTP (Gamerith <strong>et</strong><br />
al. 2008; Dotto <strong>et</strong> al. 2009; Dembélé <strong>et</strong> Becouze 2010; Freni <strong>et</strong> al. 2010a). Il<br />
représente le rapport <strong>de</strong> la SCE à la variance <strong>de</strong>s données observées, soustrait <strong>de</strong><br />
1. Une valeur négative <strong>de</strong> ce coefficient indique que la valeur moyenne <strong>de</strong>s<br />
observations est un meilleur prédicteur que les simulations du modèle.<br />
Choix <strong>de</strong> la fonction<br />
Le choix du critère d’optimisation est subjectif <strong>et</strong> dépend d’abord <strong>de</strong> l’objectif <strong>de</strong><br />
modélisation. Par exemple, si le modélisateur cherche à privilégier les fortes valeurs, le choix<br />
du critère <strong>de</strong> SCE ou <strong>de</strong> RMSE peut s’avérer pertinent, même si l’hypothèse d’homoscédasticité<br />
n’est pas vérifiée. Dans le cas <strong>de</strong>s modèles simples, par exemple <strong>de</strong> type multi-régression, où on<br />
détermine <strong>de</strong>s valeurs discrètes évenementielles (masses ou concentrations) <strong>et</strong> où l’hypothèse <strong>de</strong><br />
structure du modèle est acceptable (c’est-à-dire les résidus se rapprochent d’une distribution<br />
normale), la RMSE peut être utilisée. Dans le cas <strong>de</strong>s modèles simulant en continu les flux<br />
47