Traitement et analyse de séries chronologiques continues de ...

Traitement et analyse de séries chronologiques continues de ... Traitement et analyse de séries chronologiques continues de ...

theses.insa.lyon.fr
from theses.insa.lyon.fr More from this publisher
14.09.2014 Views

Partie 5 – Chapitre 13 : Modèles de type multi-régression l’objet sont en effet très nombreuses (cf. paragraphe 2.1.2) et les caractéristiques des sites et les formulations des modèles optimaux très variables. Nous nous sommes particulièrement intéressés aux travaux basés sur un nombre important de données, notamment les études récentes. Le Tableau 13.1 présente les trois études retenues pour la sélection de modèles pour les MES et la DCO. Tableau 13.1. Etudes retenues pour la sélection de modèles de type multi-régression antérieurs : nombre de sites de mesure, taille et type des bassins versants instrumentés (réseau et activité), nombre de mesure par site (N), types de régression, variables expliquées et explicatives des modèles optimaux Polluant MES DCO MES Référence INSA- SOGREAH (1999) Dembelé (2010) Vaze et Chiew (2003) Nombre de sites Taille (ha) Type de BV - - - - 1 (France) 3 (Australie) 42 107 - 227 N Unitaire résidentiel 64 Unitaire Résidentiel Type de régression Linéaire sur le Log Linéaire sur le Log Variable Expliqué e CME CME Variables explicatives DTS H Im 5 DTS/H D p 14-20 Linéaire Masse I(t) Les travaux de Vaze et Chiew (2003) et Dembelé (Dembélé et al. 2010; Dembélé et Becouze 2010) reposent sur des bases de données récentes acquises par les techniques traditionnelles d’échantillonnage par prélèvements. Nous avons décidé de tester l’approche testée par Vaze et Chiew (2003) pour l’estimation des masses de MES, dans la mesure où ce modèle est original par rapport aux autres formulations (cf. paragraphe 2.1.2) et que les résultats obtenus sur les données australiennes sont encourageants. De plus, les conclusions de Francey (2010) qui a plus récemment testé le modèle vont également en ce sens. Le modèle proposé par Dembélé et al. (2009) pour les CME de MES a été établi pour les données du bassin versant parisien du Marais. Il nous a semblé intéressant de tester ce modèle sur les sites d’étude lyonnais. Enfin nous nous sommes également intéressés à un modèle générique proposé dans le logiciel CANOE et déjà testé par Mourad et al. (2005b) pour les MES et la DCO, également sur les données du Marais. 13.1.2 Modèles retenus Les expressions développées des quatre modèles retenus, notées de M1 à M4, sont données dans le Tableau 13.2. 218

Partie 5 – Chapitre 13 : Modèles de type multi-régression Tableau 13.2. Expressions des modèles antérieurs retenus, p 0 à p 3 les paramètres de calage, pour les modèles M1 à M4 Nom du modèle Référence Formule Nombre de paramètres de calage CME p DTS H I 4 p1 p2 p3 M1 Insa/Sogreah, 1999 MES 0 m5 p1 p2 p3 M2 Insa/Sogreah, 1999 CME p DTS H I 4 M3 Dembélé, 2009 M4 Vaze et Chiew, 2003 DCO 0 m5 p1 DTS CME MES p0 D H p2 p n MES 0 p1 () 2 i1 M p I i 3 13.2 Méthode de construction des modèles locaux Deux méthodes, implémentées sous Matlab, ont été testées : une méthode de sélection semiautomatique des variables et la méthode de recherche systématique (cf. paragraphe 2.1.3.1). La motivation pour le test d’une méthode semi-automatique est double. Il s’agit d’une part de la méthode principalement utilisée dans la littérature jusqu’ici. Cette méthode représente d’autre part une alternative à la simple recherche par essai-erreur qui reste prédominante dans la plupart des études opérationnelles. De plus, l’utilisation d’outils d’analyse automatiques pour l’obtention de résultats fiables semble indispensable, dès lors que les tailles des bases de données deviennent importantes. La méthode de recherche systématique nous a semblé intéressante, dans la mesure où elle ne nécessite aucune analyse préalable approfondie de la part du modélisateur et que son application nécessite des temps de calcul très courts. Dès lors qu’elle répond aux objectifs visés et qu’un outil de calcul pour sa mise en œuvre est disponible, cette méthode apparaît adaptée à un contexte opérationnel. De plus, elle garantit l’obtention d’un modèle optimal au vu du critère mathématique considéré. La comparaison des résultats avec ceux de la méthode semi - automatique permet ainsi de tester la fiabilité de cette dernière. Pour les deux méthodes, nous avons considéré l’ensemble des 263 et 239 événements respectivement pour Chassieu et Ecully. 13.2.1 Méthode de sélection semi-automatique La méthode comprend les étapes suivantes : 1. Recensement des variables explicatives potentielles 2. Analyse des corrélations entre les variables : - Analyse des coefficients de corrélation linéaire - Analyse en Composantes Principales (ACP) 3. Pré-sélection des variables : - Rejet des variables très faiblement corrélées avec la variable expliquée. - Mise en évidence de groupes de variables explicatives significative corrélées entre elles : sélection d’une ou plusieurs variables dans chaque sous-groupe, la/les plus corrélée/s à la variable expliquée. 4. Sélection des variables par une méthode de sélection pas à pas (stepwise) à partir des variables présélectionnées. 219

Partie 5 – Chapitre 13 : Modèles <strong>de</strong> type multi-régression<br />

l’obj<strong>et</strong> sont en eff<strong>et</strong> très nombreuses (cf. paragraphe 2.1.2) <strong>et</strong> les caractéristiques <strong>de</strong>s sites <strong>et</strong> les<br />

formulations <strong>de</strong>s modèles optimaux très variables. Nous nous sommes particulièrement<br />

intéressés aux travaux basés sur un nombre important <strong>de</strong> données, notamment les étu<strong>de</strong>s<br />

récentes.<br />

Le Tableau 13.1 présente les trois étu<strong>de</strong>s r<strong>et</strong>enues pour la sélection <strong>de</strong> modèles pour les<br />

MES <strong>et</strong> la DCO.<br />

Tableau 13.1. Etu<strong>de</strong>s r<strong>et</strong>enues pour la sélection <strong>de</strong> modèles <strong>de</strong> type multi-régression antérieurs : nombre <strong>de</strong> sites<br />

<strong>de</strong> mesure, taille <strong>et</strong> type <strong>de</strong>s bassins versants instrumentés (réseau <strong>et</strong> activité), nombre <strong>de</strong> mesure par site (N),<br />

types <strong>de</strong> régression, variables expliquées <strong>et</strong> explicatives <strong>de</strong>s modèles optimaux<br />

Polluant<br />

MES<br />

DCO<br />

MES<br />

Référence<br />

INSA-<br />

SOGREAH<br />

(1999)<br />

Dembelé<br />

(2010)<br />

Vaze <strong>et</strong> Chiew<br />

(2003)<br />

Nombre<br />

<strong>de</strong> sites<br />

Taille<br />

(ha)<br />

Type<br />

<strong>de</strong> BV<br />

- - - -<br />

1<br />

(France)<br />

3<br />

(Australie)<br />

42<br />

107 - 227<br />

N<br />

Unitaire<br />

rési<strong>de</strong>ntiel 64<br />

Unitaire<br />

Rési<strong>de</strong>ntiel<br />

Type <strong>de</strong><br />

régression<br />

Linéaire<br />

sur le Log<br />

Linéaire<br />

sur le Log<br />

Variable<br />

Expliqué<br />

e<br />

CME<br />

CME<br />

Variables<br />

explicatives<br />

DTS<br />

H<br />

Im 5<br />

DTS/H<br />

D p<br />

14-20 Linéaire Masse I(t)<br />

Les travaux <strong>de</strong> Vaze <strong>et</strong> Chiew (2003) <strong>et</strong> Dembelé (Dembélé <strong>et</strong> al. 2010; Dembélé <strong>et</strong><br />

Becouze 2010) reposent sur <strong>de</strong>s bases <strong>de</strong> données récentes acquises par les techniques<br />

traditionnelles d’échantillonnage par prélèvements. Nous avons décidé <strong>de</strong> tester l’approche<br />

testée par Vaze <strong>et</strong> Chiew (2003) pour l’estimation <strong>de</strong>s masses <strong>de</strong> MES, dans la mesure où ce<br />

modèle est original par rapport aux autres formulations (cf. paragraphe 2.1.2) <strong>et</strong> que les résultats<br />

obtenus sur les données australiennes sont encourageants. De plus, les conclusions <strong>de</strong> Francey<br />

(2010) qui a plus récemment testé le modèle vont également en ce sens.<br />

Le modèle proposé par Dembélé <strong>et</strong> al. (2009) pour les CME <strong>de</strong> MES a été établi pour les<br />

données du bassin versant parisien du Marais. Il nous a semblé intéressant <strong>de</strong> tester ce modèle<br />

sur les sites d’étu<strong>de</strong> lyonnais.<br />

Enfin nous nous sommes également intéressés à un modèle générique proposé dans le<br />

logiciel CANOE <strong>et</strong> déjà testé par Mourad <strong>et</strong> al. (2005b) pour les MES <strong>et</strong> la DCO, également sur<br />

les données du Marais.<br />

13.1.2 Modèles r<strong>et</strong>enus<br />

Les expressions développées <strong>de</strong>s quatre modèles r<strong>et</strong>enus, notées <strong>de</strong> M1 à M4, sont données<br />

dans le Tableau 13.2.<br />

218

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!