14.09.2014 Views

Traitement et analyse de séries chronologiques continues de ...

Traitement et analyse de séries chronologiques continues de ...

Traitement et analyse de séries chronologiques continues de ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Partie 1 – Chapitre 2 : Approches <strong>de</strong> modélisation <strong>de</strong> la qualité <strong>de</strong>s RUTP<br />

avec X i l’intensité <strong>de</strong> la pluie ou le volume ruisselé au pas <strong>de</strong> temps i <strong>et</strong> n p le nombre <strong>de</strong> pas <strong>de</strong><br />

temps <strong>de</strong> l’événement pluvieux.<br />

Shaw <strong>et</strong> al. (2010) ont également montré, à partir <strong>de</strong> l’utilisation <strong>de</strong> données <strong>de</strong> pluie radar<br />

que la combinaison <strong>de</strong>s <strong>de</strong>ux variables, volume ruisselé <strong>et</strong> somme <strong>de</strong> l’énergie cinétique <strong>de</strong> la<br />

pluie sur une pério<strong>de</strong> <strong>de</strong> 30 minutes avant le pic <strong>de</strong> débit, perm<strong>et</strong>tent d’expliquer 81 % <strong>de</strong> la<br />

variance <strong>de</strong>s flux <strong>de</strong> MES.<br />

2.1.3 Considérations épistémologiques<br />

Historiquement le modèle <strong>de</strong> régression linéaire a été développé avec pour objectifs :<br />

i) d’utiliser le modèle en prédiction <strong>et</strong> ii) <strong>de</strong> décrire les relations entre la variable Y <strong>et</strong> les<br />

variables X i (Tomassone 1992). C’est ce <strong>de</strong>uxième objectif qui justifie l’utilisation du terme<br />

« <strong>analyse</strong> <strong>de</strong> régression » : il s’agit <strong>de</strong> mieux comprendre les processus mis en jeu. Aussi les<br />

variables X i sont-elles appelées les variables explicatives <strong>et</strong> Y la variable expliquée. De plus, il<br />

est souvent fait l’hypothèse que les variables explicatives sont indépendantes. C<strong>et</strong>te hypothèse<br />

perm<strong>et</strong> <strong>de</strong> quantifier l’importance <strong>de</strong> chaque variable, en fonction <strong>de</strong>s valeurs <strong>et</strong> du signe <strong>de</strong>s<br />

paramètres qui s’y rapportent. Un coefficient négatif par exemple signifie que la variable<br />

explicative est négativement corrélée à la variable expliquée. Aussi les variables X i sont-elles<br />

aussi appelées variables indépendantes <strong>et</strong> Y la variable dépendante. Dans le domaine <strong>de</strong> la<br />

qualité <strong>de</strong>s eaux pluviales, les variables explicatives considérées ne sont généralement pas<br />

indépendantes, avec <strong>de</strong>s niveaux <strong>de</strong> corrélation variables suivant la formulation <strong>de</strong>s modèles.<br />

Une interprétation ultérieure <strong>de</strong>s valeurs <strong>de</strong>s coefficients est donc difficile <strong>et</strong> les modèles restent<br />

avant tout reproductifs <strong>et</strong> non explicatifs. Seront cependant utilisées dans la suite <strong>de</strong> la thèse les<br />

termes <strong>de</strong> variable expliquées <strong>et</strong> explicatives pour désigner les variables Y <strong>et</strong> X i .<br />

2.1.4 Métho<strong>de</strong> <strong>de</strong> construction <strong>de</strong>s modèles <strong>de</strong> type multirégression<br />

L’objectif lors <strong>de</strong> la construction d’un modèle local est <strong>de</strong> sélectionner la meilleure<br />

combinaison possible <strong>de</strong> variables explicatives pour la prédiction du polluant considéré. Un<br />

modèle spécifique est donc construit pour chacune <strong>de</strong>s variables expliquées considérées. Il faut<br />

cependant prendre en compte qu’il n’existe pas toujours un seul modèle optimal, mais plusieurs<br />

combinaisons <strong>de</strong> variables pourront donner <strong>de</strong>s résultats comparables. Ceci est dû au fait que la<br />

plupart <strong>de</strong>s variables explicatives testées pour la prédiction <strong>de</strong> la qualité <strong>de</strong>s RUTP sont<br />

corrélées (e.g. le volume ruisselé <strong>et</strong> l’intensité <strong>de</strong> la pluie).<br />

2.1.4.1 Les métho<strong>de</strong>s <strong>de</strong> sélection <strong>de</strong>s variables<br />

Métho<strong>de</strong>s <strong>de</strong> sélection automatique<br />

Dans la plupart <strong>de</strong>s étu<strong>de</strong>s, <strong>de</strong>s métho<strong>de</strong>s statistiques <strong>de</strong> sélection automatique, type pas à<br />

pas (stepwise), en avant (forward) ou en arrière (backward), sont utilisées pour la sélection <strong>de</strong>s<br />

variables (e.g. Sag<strong>et</strong> <strong>et</strong> al. 1998; Irish <strong>et</strong> al. 1998; Brezonik <strong>et</strong> Sta<strong>de</strong>lmann 2002). Par rapport à<br />

un test manuel <strong>de</strong>s combinaisons par essai-erreur, l’avantage <strong>de</strong> ces métho<strong>de</strong>s est leur rapidité <strong>et</strong><br />

leur facilité d’application, étant donnée leur implémentation dans la plupart <strong>de</strong>s logiciels <strong>de</strong><br />

calcul. Cependant la validité <strong>de</strong> leur application est critiquée par <strong>de</strong> nombreux auteurs<br />

(Tomassone 1992; Dembélé <strong>et</strong> al. 2010) du fait <strong>de</strong> la violation <strong>de</strong> l’hypothèse d’indépendance<br />

entre les variables expliquées.<br />

19

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!