Contributions à l'étude de la classification spectrale et applications
Contributions à l'étude de la classification spectrale et applications
Contributions à l'étude de la classification spectrale et applications
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
92 Parallélisation <strong>de</strong> <strong>la</strong> c<strong>la</strong>ssification <strong>spectrale</strong><br />
dans l’espace <strong>de</strong> projection. Dans c<strong>et</strong>te partie, nous ne nous intéressons qu’<strong>à</strong> l’initialisation<br />
<strong>de</strong>s k centroïds, une étape difficile <strong>à</strong> définir <strong>et</strong> nous exploitons les propriétés <strong>de</strong>s données dans<br />
c<strong>et</strong> espace. Etant donné que les points sont proj<strong>et</strong>és dans une p-hypersphère unité <strong>et</strong> qu’ils<br />
sont concentrés autour <strong>de</strong> k points (cf figure 1.2) lorsque les données sont bien séparées, les k<br />
centroïds doivent être choisis <strong>de</strong> manière adéquate pour faire converger l’algorithme. Parmi les<br />
points proj<strong>et</strong>és, les centroïds sont choisis tels qu’ils soient les plus éloignés les uns <strong>de</strong>s autres le<br />
long d’une même direction. En d’autres termes, soit Yj. un centroïd <strong>de</strong> l’espace <strong>de</strong> projection<br />
spectral, le centroïd Ym. vérifie :<br />
Etape <strong>de</strong> regroupement<br />
m = arg max<br />
j Yi. − Yj.∞.<br />
La partition finale est formée du regroupement <strong>de</strong>s partitions issues <strong>de</strong>s nbproc − 1 analyses<br />
indépendantes du clustering spectral sur les nbprocs − 1 sous-ensembles <strong>de</strong> S. Le regroupement<br />
est réalisé <strong>à</strong> l’ai<strong>de</strong> <strong>de</strong> <strong>la</strong> partition <strong>de</strong> l’interface <strong>et</strong> <strong>de</strong> <strong>la</strong> re<strong>la</strong>tion d’équivalence (3.3). Si un point<br />
appartient <strong>à</strong> <strong>de</strong>ux c<strong>la</strong>sses différentes, ces <strong>de</strong>ux c<strong>la</strong>sses sont assemblées en un plus grand. En sortie<br />
<strong>de</strong> <strong>la</strong> métho<strong>de</strong> en parallèle, une partition <strong>de</strong> l’ensemble S <strong>de</strong>s données <strong>et</strong> un nombre final <strong>de</strong> c<strong>la</strong>sses<br />
k sont obtenus.<br />
Détails liés <strong>à</strong> <strong>la</strong> programmation<br />
Quelques détails concernant plus spécification <strong>la</strong> programmation <strong>de</strong> <strong>la</strong> métho<strong>de</strong> <strong>de</strong> spectral<br />
clustering parallèle doivent être précisés.<br />
1. Calcul du spectre <strong>de</strong> <strong>la</strong> matrice affinité<br />
Des routines c<strong>la</strong>ssiques <strong>de</strong> <strong>la</strong> librairie LAPACK [6] sont utilisées pour calculer les valeurs<br />
propres <strong>et</strong> les vecteurs propres <strong>de</strong> <strong>la</strong> matrice affinité normalisée re<strong>la</strong>tive <strong>à</strong> chaque sous-ensemble<br />
<strong>de</strong> points.<br />
2. Parallélisation<br />
La parallélisation est effectuée <strong>à</strong> l’ai<strong>de</strong> <strong>de</strong> <strong>la</strong> librairie MPI (Message Passing Interface) qui<br />
perm<strong>et</strong> aux nbproc processus <strong>de</strong> s’exécuter <strong>de</strong> manière autonome durant leur étape <strong>de</strong> clustering.<br />
L’étape <strong>de</strong> découpage <strong>de</strong>s données est menée par le premier processus qui transm<strong>et</strong><br />
ensuite les points <strong>de</strong> chaque sous-domaine au processus correspondant afin que celui-ci puisse<br />
démarrer son clustering indépendamment <strong>de</strong>s autres processus. L’étape <strong>de</strong> regroupement final<br />
<strong>de</strong>s clusters, quant <strong>à</strong> elle, est assurée par le premier processus lorsque toutes les c<strong>la</strong>ssifications<br />
ont été effectuées.<br />
Un exemple du fonctionnement <strong>de</strong> <strong>la</strong> métho<strong>de</strong> est représenté avec le cas d’une cible divisée en<br />
q = 4 sous-boîtes sur <strong>la</strong> figure 3.5. Sur <strong>la</strong> gauche, le résultat du clustering spectral est affiché pour<br />
l’interface. Chaque couleur correspond <strong>à</strong> une c<strong>la</strong>sse. L’interface comprend 13 c<strong>la</strong>sses alors que le<br />
résultat du clustering sur les 4 sous-domaines, représenté sur <strong>la</strong> droite <strong>de</strong> <strong>la</strong> figure 3.5, a défini 4<br />
c<strong>la</strong>sses par sous-domaine. Le résultat global est k = 4 c<strong>la</strong>sses : une c<strong>la</strong>sse représentant un cercle.<br />
3.2.2 Justification <strong>de</strong> <strong>la</strong> cohérence <strong>de</strong> <strong>la</strong> métho<strong>de</strong><br />
Dans c<strong>et</strong>te section, <strong>la</strong> cohérence <strong>de</strong> <strong>la</strong> métho<strong>de</strong> précé<strong>de</strong>mment introduite est étudiée. Notons<br />
par ˆ Sk = Ck ∩ S l’ensemble <strong>de</strong> points pour le sous-domaine k, k ∈ [|1, q + 1|]. L’objectif est <strong>de</strong>