Traitement et analyse de séries chronologiques continues de ...

14.09.2014 Views
Partie 2 – Chapitre 6 : Test des modèles Tests d’évaluation externe L’évaluation externe d’un modèle consiste à partager les observations en deux échantillons. La comparaison des performances du modèle pour les observations de calage et celles de l’évaluation permet au modélisateur d’estimer la capacité prédictive du modèle : - Des performances comparables sur les deux séries d’observation indiquent une bonne capacité prédictive : le modèle donne des résultats en prédiction à l’image de ceux obtenus en calage. - Une performance en évaluation plus faible qu’en calage met en évidence une difficulté du modèle à prédire de nouvelles observations. Les données utilisées en évaluation contiennent une part d’information non représentée dans le jeu de calage que le modèle reproduit de manière trop spécifique. Les conclusions de ce type de test dépendent de la manière dont sont réparties les données dans les deux échantillons et de leur contenu informatif. La taille et le contenu informatif du jeu d’observations disponible doivent être suffisants afin de garantir que l’échantillon de calage est suffisamment représentatif des processus simulés et de leur variabilité. Pour l’obtention de performances comparables sur les deux périodes, une répartition optimale de 60 % - 40 % des données entre calage et évaluation plutôt que le partage traditionnel 50 % - 50 % est préconisée par Mourad et al. (2005). Test d’évaluation interne Dans l’évaluation interne, les observations utilisées pour l’évaluation sont sélectionnées sur la base de techniques de rééchantillonnage. La plus simple de ces techniques consiste à effectuer la même opération qu’en évaluation externe, mais un grand nombre de fois en choisissant les échantillons de calage et d’évaluation par des tirages aléatoires sans remise dans l’échantillon de départ. La performance du modèle en prédiction est ensuite évaluée à partir des performances de chaque tirage. Parmi les méthodes de validation croisée les plus appliquées, Mourad (2005) cite les techniques de Bootsrap (Efron 1979) et le Jacknife (Caceci 1989). Plus récemment Dembélé (2010) a utilisé la technique de LOOCV (Leave-One-Out Cross Validation) (Rudemo 1982). Le principe est présenté Figure 6.1. i = 1 i = i +1 N 1 C N - Calage du modèle pour la i ème combinaison - Calcul du critère de performance - Estimation de l’observation restante avec le modèle non i = N ? oui - Estimation de la performance de calage : moyenne, variance - Estimation de la performance en prédiction Figure 6.1. Procédure d’évaluation du pouvoir prédictif d’un modèle par la technique de LOOCV (Leave-One-Out Cross validation) (Source : Dembélé, 2010) 90

Partie 2 – Chapitre 6 : Test des modèles Pour un nombre N d’observations, le principe consiste pour chacune des N combinaisons de N-1 observations parmi N, à caler le modèle avec les N-1 observations et à simuler l’observation restante avec le modèle calé. La performance globale de calage est ensuite estimée par la moyenne des N performances. La performance globale de prédiction est estimée à partir des N valeurs simulées à chaque calage. Les méthodes internes sont plutôt recommandées dans les cas où un nombre limité d’observations est disponible. En effet, elles permettent de bien mettre en évidence l’influence de chacune des observations sur la performance du modèle en calage et en évaluation. Leur utilisation pour un échantillon de grande taille n’est a priori pas adaptée, d’une part parce que les temps de calcul risquent de devenir très longs si le modèle testé est complexe et d’autre part parce que chaque observation a une influence moindre sur le calage du modèle. Cependant, dans le cas de modèles simples où les temps de calage sont faibles, leur application peut être intéressante pour la détection d’observations de type outliers ou présentant un comportement significativement différent du reste des observations. Il est important de souligner, qu’externes ou internes, ces méthodes de test sont une manière d’évaluer l’incertitude liée à la représentativité des données (cf. paragraphe 4.3.1). Cette étape d’évaluation est actuellement appliquée de manière quasi systématique dans les études de modélisation de la qualité des RUTP (e.g. Dembélé 2010; Mourad et al. 2005; Muschalla et al. 2008; Dotto et al. 2009). 6.1.2 Les critères mathématiques de performance Pour un jeu d’observations donné (calage ou évaluation), la performance du modèle est évaluée au moyen de critères mathématiques reflétant l’adéquation entre la simulation optimale et les observations. Parmi les critères possibles, nous retrouvons l’ensemble des fonctions objectif présentées dans le paragraphe 4.2.2, avec leurs avantages et leurs inconvénients. Il semble logique de choisir comme critère de performance le même critère que celui utilisé pour l’optimisation des paramètres lors du calage. Cependant, il peut ne pas convenir pour une comparaison des résultats en calage et en évaluation. Par exemple dans le cas où une analyse des incertitudes est effectuée, le critère d’optimisation est la valeur de la vraisemblance ou de son logarithme. Or, cette dernière présente le même inconvénient que le critère de la RMSE, dont la valeur dépend du type de variable simulée et du nombre d’observations utilisées. Dans ce cas, un autre type de critère peut être adopté, comme par exemple le critère de Nash utilisé dans un grand nombre d’études de modélisation de la qualité des RUTP (Gamerith et al. 2008; Dotto et al. 2009; Dembélé et Becouze 2010; Freni et al. 2010a). Suivant l’objectif du modélisateur, il peut également être pertinent de calculer plusieurs critères de performance. D’une manière générale Schaefli et Gupta (2007), stipulent, sur la base d’une analyse critique du critère de Nash et Sutcliffe (1970), qu’il n’existe pas de critères mathématiques convenant de manière universelle mais que le choix d’un critère approprié et la manière dont il est interprété dépendent plutôt du contexte et des objectifs du modélisateur. 6.1.3 Vérification des hypothèses sur les résidus Dans le cas où les incertitudes sur les paramètres ont été prises en compte lors du calage, que ce soit par la statistique classique ou bayésienne, une autre manière d’évaluer la cohérence 91

Page 1: N° d’ordre 2011ISAL0018 Année 2

Page 5 and 6: Remerciements Je voudrais d’abord

Page 7: Traitement et analyse de séries ch

Page 11: Table des matières

Page 14 and 15: Tables des matières 3.2.1 Test de

Page 16 and 17: Tables des matières CHAPITRE 9 : P

Page 18 and 19: Tables des matières 14.3.4 Calcul

Page 21: Liste des abréviations DCO Demande

Page 24 and 25: Liste des variables DTS E f f -1 du

Page 26 and 27: Liste des variables S Pond somme po

Page 29: Introduction générale 1

Page 32 and 33: Introduction générale et al. (200

Page 34 and 35: Introduction générale Structure d

Page 37: Partie 1 : La modélisation de la q

Page 40 and 41: Partie 1 - Chapitre 1 : Introductio

Page 42 and 43: Partie 1 - Chapitre 1 : Introductio

Page 45 and 46: Partie 1 - Chapitre 2 : Approches d






Page 57: Partie 1 - Chapitre 2 : Approches d

Page 60 and 61: Partie 1 - Chapitre 3 : Choix des a

Page 62 and 63: Partie 1 - Chapitre 3 : Choix des a

Page 65: Partie 2 Test des modèles et incer

Page 68 and 69: Partie 2 - Test des modèles et inc

Page 70 and 71: Partie 2 - Chapitre 4 : Le concept






Page 83 and 84: Partie 2 - Chapitre 5 : Les méthod

















Page 117: Partie 2 - Chapitre 6 : Test des mo

Page 121 and 122: Partie 2 - Chapitre 6 : Test des mo



Page 127: Partie 2 - Chapitre 6 : Test des mo

Page 131: Partie 3 Construction de la base de

Page 135 and 136: Partie 3 - Chapitre 7 : Présentati




Page 143 and 144: Partie 3 - Chapitre 8 : Traitement














Page 171: Partie 3 - Chapitre 9 : Présentati

Page 175: Partie 4 - Analyse des données Int

Page 178 and 179: Partie 4 - Chapitre 10 : Variabilit







Page 192 and 193: Partie 4 - Chapitre 11 : Estimation























Page 239 and 240: Partie 4 - Analyse des données : C

Page 241: Partie 5 Choix des modèles et mét

Page 245 and 246: Partie 5 - Chapitre 13 : Modèles d







Page 259: Partie 5 - Chapitre 13 : Modèles d










Page 280 and 281: Partie 5 - Chapitre 15 : Méthodolo





Page 291: Partie 6 - Résultats des tests Int

Page 294 and 295: Partie 6 - Chapitre 16 : Test des m






















Page 339: Partie 6 - Chapitre 17 : Test des m

Page 343 and 344: Conclusion générale Retour sur la

Page 345 and 346: Conclusion générale évidence la

Page 347 and 348: Conclusion générale données acqu

Page 349: Bibliographie 321

Page 352 and 353: Bibliographie Bertrand-Krajewski J.

Page 354 and 355: Bibliographie Bujon G. (1988). Pré

Page 356 and 357: Bibliographie Dorval F. 2010. Const

Page 358 and 359: Bibliographie Gupta K. et Saul Adri

Page 360 and 361: Bibliographie Kuczera G. et Parent

Page 362 and 363: Bibliographie Muschalla D., Schneid

Page 364 and 365: Bibliographie monitoring data. Proc

Page 366 and 367: Bibliographie Vrugt J. et Bouten W.

Page 369: Annexes Annexe 1 Métadier M. et Be

Page 372 and 373: Annexes INTRODUCTION Les exigences

Page 374 and 375: Annexes correspondante (équation 3

Page 376 and 377: Annexes Figure 26. Relations [MES]-

Page 378 and 379: Annexes avec m Xi le flux de pollua

Page 380 and 381: Annexes MES 2000 Masses événement

Page 382 and 383: Annexes capteurs, utilisation des r

Page 384 and 385: Annexes ANNEXE A Cette annexe prés

Page 387 and 388: Annexes From mess to mass: a method

Page 389 and 390: Annexes Sensor uncertainties. Calib

Page 391 and 392: Annexes terminated. Else Test 2 is

Page 393 and 394: Annexes hydrologic events. Event lo

Page 395 and 396: Annexes a b c 1500 TSS (kg) COD (kg

Page 397 and 398: Annexes test and apply the enhanced

Page 399 and 400: Annexes Assessing dry weather flow

Page 401 and 402: Annexes t f 2 2 2 2 2 2 u( M X )

Page 403 and 404: Annexes M M M X _ WW X X _ DW 2 (

Page 405 and 406: Annexes class 4. This regression co

Page 407 and 408: Annexes The analysis of the evoluti

Page 409: Annexes Lacour C., Joannis C. and C

partie

calage

chapitre

variables

pluie

incertitudes

valeurs

chassieu

flux

fonction

traitement

analyse

chronologiques

continues

theses.insa-lyon.fr

Traitement et analyse de séries chronologiques continues de ...

Traitement et analyse de séries chronologiques continues de ... ... View more Traitement et analyse de séries chronologiques continues de ...

Delete template?

Save as template ?

Traitement et analyse de séries chronologiques continues de ... Traitement et analyse de séries chronologiques continues de ...