14.09.2014 Views

Traitement et analyse de séries chronologiques continues de ...

Traitement et analyse de séries chronologiques continues de ...

Traitement et analyse de séries chronologiques continues de ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Partie 1 – Chapitre 2 : Approches <strong>de</strong> modélisation <strong>de</strong> la qualité <strong>de</strong>s RUTP<br />

La sélection par <strong>analyse</strong> <strong>de</strong>s corrélations<br />

Certains auteurs préfèrent donc s’appuyer sur une <strong>analyse</strong> simple <strong>de</strong>s coefficients <strong>de</strong><br />

régression linéaire (e.g. Dembélé <strong>et</strong> al. 2010), qui perm<strong>et</strong> <strong>de</strong> sélectionner <strong>de</strong>s variables le moins<br />

corrélées possible. Cependant dans le cas <strong>de</strong> la prédiction <strong>de</strong> la qualité <strong>de</strong>s RUTP, les variables<br />

explicatives traditionnellement testées ne sont en général que partiellement corrélées. Ainsi<br />

l’exclusion d’une variable au profit d’une autre qui lui est corrélée n’est pas toujours<br />

pertinente : leur combinaison peut potentiellement améliorer le pouvoir prédictif du modèle, du<br />

fait <strong>de</strong> la part non corrélée entre les <strong>de</strong>ux variables. C<strong>et</strong>te métho<strong>de</strong> <strong>de</strong> sélection reste longue <strong>et</strong><br />

nécessite une expérience du modélisateur pour être appliquée <strong>de</strong> manière fiable.<br />

La sélection par <strong>analyse</strong> systématique<br />

Une autre possibilité pour la construction <strong>de</strong>s modèles locaux est <strong>de</strong> tester <strong>de</strong> manière<br />

automatique toutes les combinaisons <strong>de</strong> variables possibles, comme suggéré par certains auteurs<br />

(Dembélé 2010, communication personnelle). Avec <strong>de</strong>s logiciels <strong>de</strong> simulation puissants, type<br />

Matlab, une recherche systématique peut ne prendre que quelques secon<strong>de</strong>s. L’avantage <strong>de</strong> c<strong>et</strong>te<br />

approche est que l’opérateur est sûr <strong>de</strong> sélectionner le(les) modèles optimal(aux). En revanche<br />

les combinaisons <strong>de</strong> variables sont testées en aveugle, <strong>et</strong> leur choix ne peut pas être orienté par<br />

le modélisateur, à moins <strong>de</strong> restreindre au départ la liste <strong>de</strong>s variables potentielles testées.<br />

2.1.4.2 Analyse <strong>de</strong>s résultats<br />

Métho<strong>de</strong> <strong>de</strong> calage<br />

Quelle que soit la métho<strong>de</strong> employée, les combinaisons <strong>de</strong> variables testées sont évaluées à<br />

chaque fois par calage du modèle avec les observations disponibles. La métho<strong>de</strong> généralement<br />

utilisée est celle <strong>de</strong>s moindres carrés ordinaires (MCO), qui consiste à minimiser la somme <strong>de</strong>s<br />

carrés <strong>de</strong>s écarts entre les variables expliquées observée <strong>et</strong> simulée. C<strong>et</strong>te métho<strong>de</strong> a l’avantage<br />

d’être rapi<strong>de</strong>, étant donné qu’une solution analytique peut être déterminée. Les MCO <strong>et</strong> les<br />

hypothèses associées seront présentées en détail dans le chapitre 2 (paragraphe 5.2.1), nous ne<br />

la détaillerons donc pas ici. Dans le cas <strong>de</strong>s modèles simples linéaires, les hypothèses <strong>de</strong> la<br />

métho<strong>de</strong> sont la plupart du temps vérifiées, aussi leur application est souvent justifiée. Dans une<br />

récente étu<strong>de</strong>, Dembélé (2010) compare différentes métho<strong>de</strong>s possibles pour le calage <strong>de</strong>s<br />

modèles <strong>de</strong> régression <strong>et</strong> propose une <strong>analyse</strong> comparative critique.<br />

Critère <strong>de</strong> performance<br />

Pour évaluer la performance <strong>de</strong>s modèles, différents critères peuvent être utilisés, suivant<br />

les objectifs du modélisateur. En général, la moyenne <strong>de</strong> la somme <strong>de</strong>s carrés <strong>de</strong>s écarts (MSE)<br />

ou la racine carrée <strong>de</strong> la même quantité (RMSE) est considérée, le meilleur modèle étant celui<br />

pour lequel le critère est minimal. C’est le cas par exemple dans les métho<strong>de</strong>s statistiques <strong>de</strong><br />

sélection <strong>de</strong>s variables. Le choix <strong>de</strong> ce critère est cohérent avec l’application <strong>de</strong> la métho<strong>de</strong> <strong>de</strong>s<br />

MCO pour le calage <strong>de</strong>s modèles. Un autre critère est le coefficient <strong>de</strong> Nash <strong>et</strong> Sutcliffe (1970)<br />

qui donne moins d’importance aux gran<strong>de</strong>s valeurs. Les critères possibles, ainsi que leurs<br />

avantages <strong>et</strong> inconvénients, sont présentés plus en détail dans la partie 2 (paragraphe 6.1.2).<br />

20

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!