Traitement et analyse de séries chronologiques continues de ...

Traitement et analyse de séries chronologiques continues de ... Traitement et analyse de séries chronologiques continues de ...

theses.insa.lyon.fr
from theses.insa.lyon.fr More from this publisher
14.09.2014 Views

Partie 2 – Chapitre 4 : Le concept d’incertitude en modélisation en hydrologie urbaine L P yi | M( , xi ) \ i Eq. 4.4 La vraisemblance décrit dont la probabilité des sorties du modèle comme une fonction des paramètres. Si on calcule les valeurs de L ε pour l’ensemble des jeux de paramètres dans l’espace des possibles, la valeur maximale de L ε correspondra au jeu de paramètres qui prédit le mieux les y i en probabilité. θ opt est le jeu qui semble le plus « vrai », sous l’hypothèse de la structure des résidus. Pour des raisons de stabilité numérique et de simplification des calculs, la maximisation de la vraisemblance s’effectue en général sous la forme logtransformée, en anglais loglikelihood. Cette dernière sera notée dans la suite LogL ε . A titre d’exemple, l’hypothèse la plus simple sur la distribution des résidus est la loi normale. Dans ce cas, pour chaque résidu ε i , caractérisé par sa moyenne μ ε et son écart type , sa densité de probabilité f s’exprime : i f i 1 e 2 2 1i 2 Eq. 4.5 Et la vraisemblance des N valeurs de résidus : L N i1 1 e 2 2 1i 2 Eq. 4.6 De plus, il est souvent supposé que les résidus sont de moyenne nulle et homoscédastiques : 0 et i, C, avec C une constante. Eq. 4.7 L’hypothèse d’une distribution normale centrée sur zéro sous-entend que le modèle est bon en moyenne et que les résidus non expliqués sont des termes aléatoires imputables aux incertitudes sur les données. Cela revient donc à dire que la structure choisie du modèle est correcte. Sous ces nouvelles hypothèses, L ε s’écrit : Et la loglikelihood : 2 i 2 N 1 2 L e N 2 i 1 Eq. 4.8 2 i 2 N 1 2 LogL log log e N 2 i 1 Eq. 4.9 N 1 2 2 i LogL N log 2 2 i 1 Eq. 4.10 44

Partie 2 – Chapitre 4 : Le concept d’incertitude en modélisation en hydrologie urbaine Le premier terme étant constant et σ ε également, la maximisation de LogL ε revient donc à minimiser la somme des carrés des écarts (Clarke 1973). Il s’agit donc sous ces hypothèses de la méthode des Moindres Carrés. On note S MC la somme des Moindres Carrés : 2 N N 2 MC i i i i1 i1 Eq. 4.11 S y f x Actuellement en hydrologie urbaine, l’approche statistique est dans la majorité des cas appliquée sous ces hypothèses. Or la distribution des résidus diffère la plupart du temps d’une loi normale avec un effet de Kurtosis lié à la présence de valeurs élevées des résidus. Cette question est abordée plus en détail dans le chapitre 5 lors de la présentation des méthodes statistiques d’évaluation des incertitudes. Point de vue plus intuitif Nous qualifions de point de vue plus intuitif les formulations de fonctions objectif qui ne sont pas directement dérivées de la théorie statistique. Le modélisateur définit une relation mathématique qui reflète l’ajustement entre les simulations et les observations de manière la plus conforme à ses objectif. Deux grands types de fonctions objectifs sont distingués : i) les fonctions simples, c’est-à-dire incluant une seule formule mathématique qui s’applique à l’ensemble des données et ii) les fonctions multi-objectifs incluant dans leur formulation plusieurs parties se rapportant à des objectifs distincts (Gamerith et al. 2008; Blasone et al. 2008a). Nous nous sommes intéressés dans le cadre de ce travail exclusivement au premier type. Le Tableau 4.1 récapitule les fonctions objectif simples principalement citées dans la littérature récente, avec l’indication du type d’optimisation (minimisation, maximisation ou valeur à atteindre), des valeurs minimum et maximum que peuvent prendre les fonctions et les objectifs du modélisateur se rapportant à leur utilisation. 45

Partie 2 – Chapitre 4 : Le concept d’incertitu<strong>de</strong> en modélisation en hydrologie urbaine<br />

<br />

L P yi | M( , xi ) \ i<br />

<br />

Eq. 4.4<br />

La vraisemblance décrit dont la probabilité <strong>de</strong>s sorties du modèle comme une fonction <strong>de</strong>s<br />

paramètres.<br />

Si on calcule les valeurs <strong>de</strong> L ε pour l’ensemble <strong>de</strong>s jeux <strong>de</strong> paramètres dans l’espace <strong>de</strong>s<br />

possibles, la valeur maximale <strong>de</strong> L ε correspondra au jeu <strong>de</strong> paramètres qui prédit le mieux les y i<br />

en probabilité. θ opt est le jeu qui semble le plus « vrai », sous l’hypothèse <strong>de</strong> la structure <strong>de</strong>s<br />

résidus. Pour <strong>de</strong>s raisons <strong>de</strong> stabilité numérique <strong>et</strong> <strong>de</strong> simplification <strong>de</strong>s calculs, la maximisation<br />

<strong>de</strong> la vraisemblance s’effectue en général sous la forme logtransformée, en anglais<br />

loglikelihood. C<strong>et</strong>te <strong>de</strong>rnière sera notée dans la suite LogL ε .<br />

A titre d’exemple, l’hypothèse la plus simple sur la distribution <strong>de</strong>s résidus est la loi<br />

normale. Dans ce cas, pour chaque résidu ε i , caractérisé par sa moyenne μ ε <strong>et</strong> son écart type ,<br />

sa <strong>de</strong>nsité <strong>de</strong> probabilité f <br />

s’exprime :<br />

i<br />

f<br />

<br />

i<br />

1<br />

e<br />

2<br />

<br />

2<br />

<br />

1i<br />

<br />

<br />

2<br />

<br />

<br />

Eq. 4.5<br />

Et la vraisemblance <strong>de</strong>s N valeurs <strong>de</strong> résidus :<br />

L<br />

<br />

<br />

N<br />

i1<br />

1<br />

e<br />

2<br />

<br />

2<br />

<br />

1i<br />

<br />

<br />

2<br />

<br />

<br />

Eq. 4.6<br />

De plus, il est souvent supposé que les résidus sont <strong>de</strong> moyenne nulle <strong>et</strong> homoscédastiques :<br />

0 <strong>et</strong> i,<br />

C, avec C une constante. Eq. 4.7<br />

<br />

<br />

L’hypothèse d’une distribution normale centrée sur zéro sous-entend que le modèle est bon<br />

en moyenne <strong>et</strong> que les résidus non expliqués sont <strong>de</strong>s termes aléatoires imputables aux<br />

incertitu<strong>de</strong>s sur les données. Cela revient donc à dire que la structure choisie du modèle est<br />

correcte. Sous ces nouvelles hypothèses, L ε s’écrit :<br />

<br />

Et la loglikelihood :<br />

<br />

2<br />

i<br />

2<br />

<br />

N <br />

1<br />

2 <br />

L<br />

<br />

e <br />

N<br />

2 i 1<br />

<br />

<br />

Eq. 4.8<br />

2<br />

i <br />

2<br />

<br />

<br />

<br />

<br />

<br />

N <br />

1<br />

2 <br />

LogL log<br />

log e <br />

N<br />

2<br />

i 1<br />

<br />

Eq. 4.9<br />

N<br />

1 2<br />

<br />

<br />

2 i<br />

LogL N log 2 2 <br />

i 1<br />

Eq. 4.10<br />

44

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!