28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

12 C<strong>la</strong>ssification <strong>spectrale</strong> : algorithme <strong>et</strong> étu<strong>de</strong> du paramètre<br />

<strong>de</strong> <strong>la</strong> norme entre chaque couple <strong>de</strong> points, sert <strong>de</strong> pondérateur. Il peut donc, suivant sa valeur,<br />

diminuer l’affinité intra-cluster <strong>et</strong> augmenter celle entre les clusters. Le choix <strong>de</strong> ce paramètre est<br />

donc étudié dans <strong>la</strong> suite.<br />

1.1.2 Problème du choix du paramètre<br />

Dans l’algorithme 1, <strong>la</strong> matrice d’affinité A ∈ MN,N(R), Aij désignant l’affinité entre les obj<strong>et</strong>s<br />

xi <strong>et</strong> xj, possè<strong>de</strong> les propriétés suivantes :<br />

<br />

∀ (i, j), Aij = Aji,<br />

∀ (i, j), 0 ≤ Aij ≤ 1.<br />

Parmi les noyaux <strong>de</strong> Mercer [7, 58], le noyau Gaussien est le plus communément choisi. L’affinité<br />

entre <strong>de</strong>ux points distincts xi <strong>et</strong> xj <strong>de</strong> Rp est alors définie par :<br />

<br />

exp(− xi − xj<br />

Aij =<br />

2<br />

2 /2σ2 ) si i = j,<br />

(1.1)<br />

0 sinon,<br />

où σ est un paramètre <strong>et</strong> .2 est <strong>la</strong> norme euclidienne usuelle. L’expression <strong>de</strong> l’affinité gaussienne<br />

dépend donc d’un paramètre σ. Or, le principe du clustering spectral reposant sur <strong>la</strong> mesure d’affinité,<br />

ce paramètre influe directement sur <strong>la</strong> métho<strong>de</strong>. En eff<strong>et</strong>, σ influe sur <strong>la</strong> séparabilité <strong>de</strong>s<br />

données dans l’espace <strong>de</strong> projection <strong>spectrale</strong> (spectral embedding) comme indiqué dans l’exemple<br />

géométrique <strong>de</strong>s figures 1.2 (a) <strong>et</strong> (b). L’espace <strong>de</strong> projection <strong>spectrale</strong> est tracé pour <strong>de</strong>ux valeurs<br />

différentes <strong>de</strong> σ. Pour <strong>la</strong> première valeur σ = 0.09, les points proj<strong>et</strong>és dans l’espace spectral forment<br />

<strong>de</strong>ux paqu<strong>et</strong>s compacts où les points proj<strong>et</strong>és associés au même cluster sont concentrés autour d’un<br />

seul <strong>et</strong> même point alors que, pour σ = 0.8, les points proj<strong>et</strong>és dans c<strong>et</strong> espace décrivent un arc <strong>de</strong><br />

cercle <strong>et</strong> aucune séparation ou agglomération <strong>de</strong> points ne sont distinguées. Dans ce cas, <strong>la</strong> métho<strong>de</strong><br />

<strong>de</strong> k-means c<strong>la</strong>ssique échoue <strong>et</strong> les clusters sont difficiles <strong>à</strong> déterminer. Il s’en suit les clusterings<br />

respectifs <strong>de</strong>s figures 1.2 (c) <strong>et</strong> (d). Donc un mauvais choix <strong>de</strong> σ a <strong>de</strong>s répercutions sur <strong>la</strong> séparabilité<br />

<strong>de</strong>s clusters dans l’espace propre.<br />

En segmentation d’images [91], ce paramètre est souvent <strong>la</strong>issé libre <strong>et</strong> doit être fixé par les<br />

utilisateurs. Cependant, plusieurs interprétations sur le rôle <strong>de</strong> ce paramètre ont été développées<br />

afin <strong>de</strong> gui<strong>de</strong>r le choix <strong>de</strong> manière automatique ou semi-automatique. Les principales métho<strong>de</strong>s sont<br />

les suivantes.<br />

Seuil<strong>la</strong>ge<br />

Une première approche repose sur l’idée <strong>de</strong> seuil<strong>la</strong>ge [85] via une analyse <strong>de</strong>scriptive <strong>de</strong>s données<br />

[84, 20] ou bien via <strong>la</strong> théorie <strong>de</strong>s graphes [105]. En eff<strong>et</strong>, Perona <strong>et</strong> Freeman [85] définissent σ<br />

comme une distance seuil en <strong>de</strong>ssous <strong>de</strong> <strong>la</strong>quelle <strong>de</strong>ux points sont considérés comme simi<strong>la</strong>ires <strong>et</strong><br />

au-<strong>de</strong>ssus <strong>de</strong> <strong>la</strong>quelle ils sont dissemb<strong>la</strong>bles.<br />

Von luxburg [105] interprète σ comme le rayon du voisinage. Il joue donc un rôle équivalent <strong>à</strong> celui<br />

du ɛ, distance <strong>de</strong> voisinage pour <strong>la</strong> métho<strong>de</strong> graphe <strong>à</strong> ɛ-voisinage. Ces interprétations donnent <strong>de</strong>s<br />

informations sur le rôle que joue le paramètre σ. Cependant, le choix du seuil reste ouvert <strong>et</strong> non<br />

automatisable.<br />

Approche globale<br />

Une secon<strong>de</strong> approche repose sur <strong>de</strong>s définitions globales <strong>de</strong> ce paramètre, principalement basées<br />

sur l’analyse <strong>de</strong>scriptive <strong>de</strong>s données [20] <strong>et</strong> <strong>de</strong>s interprétations physiques. D’après Ng, Jordan,

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!