28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

3.2.1 Implémentation : composantes <strong>de</strong> l’algorithme 91<br />

γ = 3σ fonction <strong>de</strong> σ (distance <strong>de</strong> référence dans le cas d’une distribution uniforme), perm<strong>et</strong><br />

<strong>de</strong> regrouper les points pour connecter les partitions locales.<br />

Comme l’ensemble <strong>de</strong>s données <strong>de</strong> l’interface ne couvre pas le même volume que les autres<br />

sous-domaines pavés, l’hypothèse d’isotropie n’est pas satisfaite <strong>et</strong> un paramètre particulier,<br />

noté σ ∗ , d’affinité Gaussienne doit être considéré sur l’interface. La même idée que celle qui<br />

nous a servi pour définir l’affinité 1.2 dans le cas d’une distribution isotrope est reprise mais<br />

en adaptant le volume adéquat sur l’interface :<br />

σ ∗ V ol(interface)<br />

=<br />

1<br />

p<br />

Ninterface<br />

où V ol(interface) représente le volume réel <strong>de</strong> l’interface <strong>et</strong> Ninterface le nombre <strong>de</strong> points<br />

dans l’interface. Le volume <strong>de</strong> l’interface est fonction <strong>de</strong> <strong>la</strong> <strong>la</strong>rgeur γ, du nombre <strong>de</strong> découpages<br />

q <strong>et</strong> <strong>de</strong>s longueurs l1, .., lp <strong>de</strong>s boîtes sur chaque dimension comme suit <strong>la</strong> formule :<br />

V ol(interface) =<br />

p<br />

i=1<br />

(qi − 1)γ p−1 li − γ p Π p<br />

i=1 (qi − 1). (3.7)<br />

2. Sous-domaines<br />

Chaque processus <strong>de</strong> 1 <strong>à</strong> nbproc a un sous-ensemble <strong>de</strong> données Si, i = 1...nbproc dont les<br />

coordonnées sont incluses dans une sous-boîte géométrique. Le paramètre d’affinité Gaussienne<br />

est défini par l’équation suivante (1.2) avec l’ensemble initial S <strong>de</strong> données :<br />

σ = Dmax<br />

N 1 .<br />

p<br />

Le paramètre est volontairement conservé global <strong>et</strong> basé sur l’ensemble entier <strong>de</strong>s données<br />

pour gar<strong>de</strong>r une distance référence, c’est-<strong>à</strong>-dire un seuil pour <strong>la</strong> partition globale. Gar<strong>de</strong>r<br />

le caractère global du paramètre perm<strong>et</strong> <strong>de</strong> gar<strong>de</strong>r <strong>de</strong>s partitions locales en accord avec <strong>la</strong><br />

partition globale <strong>et</strong> avec une stratégie <strong>de</strong> décomposition en sous-domaines.<br />

C<strong>la</strong>ssification <strong>spectrale</strong> sur les sous-domaines<br />

Outre le choix du paramètre spécifique pour l’interface, quelques éléments <strong>de</strong> l’algorithme doivent<br />

être précisés.<br />

1. Nombre <strong>de</strong> clusters k<br />

Un nombre limite <strong>de</strong> clusters nblimit est fixé a priori (par défaut, nblimit = 20), <strong>et</strong> correspond<br />

le nombre <strong>de</strong> vecteurs propres que l’on va extraire sur chaque sous-problème. Pour<br />

chaque sous-domaine, le nombre <strong>de</strong> c<strong>la</strong>sses k est choisi <strong>de</strong> telle sorte qu’il satisfasse l’équation<br />

(3.3).<br />

2. Espace <strong>de</strong> projection <strong>spectrale</strong><br />

La métho<strong>de</strong> k-means est utilisée pour définir les c<strong>la</strong>sses dans l’espace <strong>de</strong> projection <strong>spectrale</strong>. Il<br />

existe <strong>de</strong> nombreuses étu<strong>de</strong>s sur l’initialisation <strong>de</strong>s centroïds pour éviter les minima locaux via,<br />

entre autres, <strong>de</strong>s estimateurs basés sur <strong>la</strong> distribution <strong>de</strong>s données, <strong>de</strong>s propriétés géométriques,<br />

<strong>de</strong> <strong>la</strong> théorie <strong>de</strong>s graphes [4, 19, 66, 57].<br />

L’étu<strong>de</strong> théorique <strong>de</strong> <strong>la</strong> métho<strong>de</strong> <strong>de</strong> spectral clustering a permis <strong>de</strong> définir une propriété <strong>de</strong><br />

clustering fonction du paramètre σ perm<strong>et</strong>tant <strong>de</strong> prouver <strong>la</strong> séparabilité entre les données

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!