Traitement et analyse de séries chronologiques continues de ...

Traitement et analyse de séries chronologiques continues de ... Traitement et analyse de séries chronologiques continues de ...

theses.insa.lyon.fr
from theses.insa.lyon.fr More from this publisher
14.09.2014 Views

Partie 2 – Chapitre 5 : Les méthodes d’évaluation des incertitudes Le principe de la méthode bayésienne pour l’analyse des incertitudes d’un modèle paramétrique est illustré Figure 5.1. La mise en œuvre de l’inférence bayésienne nécessite donc la définition des éléments suivants : - La distribution a priori des paramètres. - La fonction de vraisemblance. - Une méthode pour échantillonner la distribution des paramètres a posteriori suivant la formule de Bayes et Price (1763). Ces trois points sont discutés dans les paragraphes suivants, ainsi que la méthode utilisée pour l’estimation des intervalles de prédiction. Apprentissage Connaissance a priori f pri,p1 Modèle Connaissance a posteriori f post,p1 Modèle p 1 p 1 X f pri,p2 p 2 … Inférence bayésienne f pri,pn f pri,θ f post,p2 f post,pn p 2 … Y , f(X,θ opt ) Temps IC Par IC Tot p n p n f post,θ f , X, | Y L Y | , X, f ( , ) post Echantillonnage de f post pri Figure 5.1. Représentation schématique du principe de la méthode bayésienne pour l’analyse des incertitudes d’un modèle paramétrique ; les densités de probabilité marginales a priori (f pri ) et a posteriori (f post ) des n paramètres du modèle sont représentées ; en rouge sont indiqués les éléments à définir pour la mise en œuvre de l’inférence bayésienne 5.3.2 Choix de la distribution a priori La plupart du temps, faute de calages antérieurs, une distribution a priori non informative est considérée, sur la base de données et d’études antérieures, l’état de l’art dans le domaine d’étude considéré et l’expérience du modélisateur (Reichert 2009, p.196). Ce dernier définit alors seulement les valeurs minimum et maximum que peut prendre chacun des paramètres. Une distribution uniforme entre ces bornes est généralement considérée. Le choix de telles distributions n’est pas problématique, dans la mesure où la validité de l’hypothèse formulée peut être vérifiée a posteriori par l’analyse des résultats obtenus (voir chapitre 6). 66

Partie 2 – Chapitre 5 : Les méthodes d’évaluation des incertitudes Une autre possibilité suggérée par Reichert (2009) ou Vrugt (2010, communication personnelle) est d’effectuer au préalable un calage simple par la maximisation numérique de la vraisemblance, au moyen d’un algorithme de calage global adapté (type SCE-UA) (cf. paragraphe 4.2.2.2). La distribution a priori peut ensuite être approximée par une distribution multi-normale à l’optimum (Gelman et al. 1995; Reichert 2009). L’application de cette méthode est cependant à considérer avec précaution, du fait de la possibilité que la valeur du jeu optimal diffère suivant les méthodes de calage utilisées (Vrugt et al. 2009). 5.3.3 Choix de la vraisemblance L’hypothèse la plus simple sur les caractéristiques des résidus est celle adoptée dans la méthode des Moindres Carrés Ordinaires (cf. paragraphe 5.2.1). La signification de cette hypothèse a déjà été discutée. Elle est d’autant moins probable que le modèle est complexe et comporte une part déterministe non modélisée. L’adoption d’un modèle d’erreur plus complexe est dans la majorité des cas nécessaire, afin de prendre en compte les caractéristiques des résidus mises en évidence dans la littérature (Xu 2001; Engeland et al. 2005; Yang et al. 2007; Beven 2009; Schoups et Vrugt 2010a; Laloy et al. 2010) : - L’hétéroscédasticité des résidus, c’est-à-dire la variance des résidus obtenus pour les grandes valeurs simulées est systématiquement plus élevée que pour les faibles valeurs. - L’auto-corrélation dans les séries de résidus. - La présence d’un biais dans les résidus ; les résidus ne sont pas nuls en moyenne. - Les effets de Kurtosis et d’asymétrie : par rapport à l’hypothèse de normalité, la forme de densité de probabilité plus resserrée vers les faibles valeurs avec des queues de distribution plus larges et une éventuelle dissymétrie par rapport à la valeur moyenne des résidus. Le Tableau 5.1 présente les formes de vraisemblance pour quelques exemples d’hypothèses sur les caractéristiques des résidus. Pour une démonstration de l’expression des différentes formes, nous renvoyons aux références données dans le Tableau. 67

Partie 2 – Chapitre 5 : Les métho<strong>de</strong>s d’évaluation <strong>de</strong>s incertitu<strong>de</strong>s<br />

Une autre possibilité suggérée par Reichert (2009) ou Vrugt (2010, communication<br />

personnelle) est d’effectuer au préalable un calage simple par la maximisation numérique <strong>de</strong> la<br />

vraisemblance, au moyen d’un algorithme <strong>de</strong> calage global adapté (type SCE-UA)<br />

(cf. paragraphe 4.2.2.2). La distribution a priori peut ensuite être approximée par une<br />

distribution multi-normale à l’optimum (Gelman <strong>et</strong> al. 1995; Reichert 2009). L’application <strong>de</strong><br />

c<strong>et</strong>te métho<strong>de</strong> est cependant à considérer avec précaution, du fait <strong>de</strong> la possibilité que la valeur<br />

du jeu optimal diffère suivant les métho<strong>de</strong>s <strong>de</strong> calage utilisées (Vrugt <strong>et</strong> al. 2009).<br />

5.3.3 Choix <strong>de</strong> la vraisemblance<br />

L’hypothèse la plus simple sur les caractéristiques <strong>de</strong>s résidus est celle adoptée dans la<br />

métho<strong>de</strong> <strong>de</strong>s Moindres Carrés Ordinaires (cf. paragraphe 5.2.1). La signification <strong>de</strong> c<strong>et</strong>te<br />

hypothèse a déjà été discutée. Elle est d’autant moins probable que le modèle est complexe <strong>et</strong><br />

comporte une part déterministe non modélisée. L’adoption d’un modèle d’erreur plus complexe<br />

est dans la majorité <strong>de</strong>s cas nécessaire, afin <strong>de</strong> prendre en compte les caractéristiques <strong>de</strong>s<br />

résidus mises en évi<strong>de</strong>nce dans la littérature (Xu 2001; Engeland <strong>et</strong> al. 2005; Yang <strong>et</strong> al. 2007;<br />

Beven 2009; Schoups <strong>et</strong> Vrugt 2010a; Laloy <strong>et</strong> al. 2010) :<br />

- L’hétéroscédasticité <strong>de</strong>s résidus, c’est-à-dire la variance <strong>de</strong>s résidus obtenus pour<br />

les gran<strong>de</strong>s valeurs simulées est systématiquement plus élevée que pour les<br />

faibles valeurs.<br />

- L’auto-corrélation dans les <strong>séries</strong> <strong>de</strong> résidus.<br />

- La présence d’un biais dans les résidus ; les résidus ne sont pas nuls en moyenne.<br />

- Les eff<strong>et</strong>s <strong>de</strong> Kurtosis <strong>et</strong> d’asymétrie : par rapport à l’hypothèse <strong>de</strong> normalité, la<br />

forme <strong>de</strong> <strong>de</strong>nsité <strong>de</strong> probabilité plus resserrée vers les faibles valeurs avec <strong>de</strong>s<br />

queues <strong>de</strong> distribution plus larges <strong>et</strong> une éventuelle dissymétrie par rapport à la<br />

valeur moyenne <strong>de</strong>s résidus.<br />

Le Tableau 5.1 présente les formes <strong>de</strong> vraisemblance pour quelques exemples d’hypothèses<br />

sur les caractéristiques <strong>de</strong>s résidus. Pour une démonstration <strong>de</strong> l’expression <strong>de</strong>s différentes<br />

formes, nous renvoyons aux références données dans le Tableau.<br />

67

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!