28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

92 Parallélisation <strong>de</strong> <strong>la</strong> c<strong>la</strong>ssification <strong>spectrale</strong><br />

dans l’espace <strong>de</strong> projection. Dans c<strong>et</strong>te partie, nous ne nous intéressons qu’<strong>à</strong> l’initialisation<br />

<strong>de</strong>s k centroïds, une étape difficile <strong>à</strong> définir <strong>et</strong> nous exploitons les propriétés <strong>de</strong>s données dans<br />

c<strong>et</strong> espace. Etant donné que les points sont proj<strong>et</strong>és dans une p-hypersphère unité <strong>et</strong> qu’ils<br />

sont concentrés autour <strong>de</strong> k points (cf figure 1.2) lorsque les données sont bien séparées, les k<br />

centroïds doivent être choisis <strong>de</strong> manière adéquate pour faire converger l’algorithme. Parmi les<br />

points proj<strong>et</strong>és, les centroïds sont choisis tels qu’ils soient les plus éloignés les uns <strong>de</strong>s autres le<br />

long d’une même direction. En d’autres termes, soit Yj. un centroïd <strong>de</strong> l’espace <strong>de</strong> projection<br />

spectral, le centroïd Ym. vérifie :<br />

Etape <strong>de</strong> regroupement<br />

m = arg max<br />

j Yi. − Yj.∞.<br />

La partition finale est formée du regroupement <strong>de</strong>s partitions issues <strong>de</strong>s nbproc − 1 analyses<br />

indépendantes du clustering spectral sur les nbprocs − 1 sous-ensembles <strong>de</strong> S. Le regroupement<br />

est réalisé <strong>à</strong> l’ai<strong>de</strong> <strong>de</strong> <strong>la</strong> partition <strong>de</strong> l’interface <strong>et</strong> <strong>de</strong> <strong>la</strong> re<strong>la</strong>tion d’équivalence (3.3). Si un point<br />

appartient <strong>à</strong> <strong>de</strong>ux c<strong>la</strong>sses différentes, ces <strong>de</strong>ux c<strong>la</strong>sses sont assemblées en un plus grand. En sortie<br />

<strong>de</strong> <strong>la</strong> métho<strong>de</strong> en parallèle, une partition <strong>de</strong> l’ensemble S <strong>de</strong>s données <strong>et</strong> un nombre final <strong>de</strong> c<strong>la</strong>sses<br />

k sont obtenus.<br />

Détails liés <strong>à</strong> <strong>la</strong> programmation<br />

Quelques détails concernant plus spécification <strong>la</strong> programmation <strong>de</strong> <strong>la</strong> métho<strong>de</strong> <strong>de</strong> spectral<br />

clustering parallèle doivent être précisés.<br />

1. Calcul du spectre <strong>de</strong> <strong>la</strong> matrice affinité<br />

Des routines c<strong>la</strong>ssiques <strong>de</strong> <strong>la</strong> librairie LAPACK [6] sont utilisées pour calculer les valeurs<br />

propres <strong>et</strong> les vecteurs propres <strong>de</strong> <strong>la</strong> matrice affinité normalisée re<strong>la</strong>tive <strong>à</strong> chaque sous-ensemble<br />

<strong>de</strong> points.<br />

2. Parallélisation<br />

La parallélisation est effectuée <strong>à</strong> l’ai<strong>de</strong> <strong>de</strong> <strong>la</strong> librairie MPI (Message Passing Interface) qui<br />

perm<strong>et</strong> aux nbproc processus <strong>de</strong> s’exécuter <strong>de</strong> manière autonome durant leur étape <strong>de</strong> clustering.<br />

L’étape <strong>de</strong> découpage <strong>de</strong>s données est menée par le premier processus qui transm<strong>et</strong><br />

ensuite les points <strong>de</strong> chaque sous-domaine au processus correspondant afin que celui-ci puisse<br />

démarrer son clustering indépendamment <strong>de</strong>s autres processus. L’étape <strong>de</strong> regroupement final<br />

<strong>de</strong>s clusters, quant <strong>à</strong> elle, est assurée par le premier processus lorsque toutes les c<strong>la</strong>ssifications<br />

ont été effectuées.<br />

Un exemple du fonctionnement <strong>de</strong> <strong>la</strong> métho<strong>de</strong> est représenté avec le cas d’une cible divisée en<br />

q = 4 sous-boîtes sur <strong>la</strong> figure 3.5. Sur <strong>la</strong> gauche, le résultat du clustering spectral est affiché pour<br />

l’interface. Chaque couleur correspond <strong>à</strong> une c<strong>la</strong>sse. L’interface comprend 13 c<strong>la</strong>sses alors que le<br />

résultat du clustering sur les 4 sous-domaines, représenté sur <strong>la</strong> droite <strong>de</strong> <strong>la</strong> figure 3.5, a défini 4<br />

c<strong>la</strong>sses par sous-domaine. Le résultat global est k = 4 c<strong>la</strong>sses : une c<strong>la</strong>sse représentant un cercle.<br />

3.2.2 Justification <strong>de</strong> <strong>la</strong> cohérence <strong>de</strong> <strong>la</strong> métho<strong>de</strong><br />

Dans c<strong>et</strong>te section, <strong>la</strong> cohérence <strong>de</strong> <strong>la</strong> métho<strong>de</strong> précé<strong>de</strong>mment introduite est étudiée. Notons<br />

par ˆ Sk = Ck ∩ S l’ensemble <strong>de</strong> points pour le sous-domaine k, k ∈ [|1, q + 1|]. L’objectif est <strong>de</strong>

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!