28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 3<br />

Parallélisation <strong>de</strong> <strong>la</strong> c<strong>la</strong>ssification<br />

<strong>spectrale</strong><br />

Dans ce chapitre, l’aspect numérique est privilégié. Un <strong>de</strong>s objectifs <strong>de</strong>s métho<strong>de</strong>s <strong>de</strong> c<strong>la</strong>ssification<br />

non supervisée est <strong>de</strong> les appliquer sur <strong>de</strong> grands ensembles <strong>de</strong> données. Or l’étape d’extraction<br />

<strong>de</strong>s vecteurs propres est très coûteuse car <strong>la</strong> matrice d’affinité (1.1) est pleine. Ainsi, <strong>de</strong>s limites en<br />

terme <strong>de</strong> coût numérique apparaissent. Plusieurs approches via le calcul parallèle ont été envisagées<br />

récemment pour pallier ce défaut. En eff<strong>et</strong>, divers auteurs exploitent <strong>de</strong>s techniques d’Algèbre<br />

linéaire comme <strong>la</strong> métho<strong>de</strong> <strong>de</strong> Nyström [44] ou bien <strong>de</strong>s métho<strong>de</strong>s d’Arnoldi [92, 38] pour une implémentation<br />

en parallèle <strong>et</strong> afin <strong>de</strong> réduire le coût numérique. Cependant, <strong>la</strong> matrice affinité entière<br />

est construite <strong>et</strong> utilisée dans l’algorithme. De plus, le problème du choix préa<strong>la</strong>ble du nombre <strong>de</strong><br />

c<strong>la</strong>sses k reste ouvert.<br />

Dans ce chapitre, les propriétés théoriques développées au chapitre précé<strong>de</strong>nt sont exploitées<br />

pour proposer <strong>de</strong>ux nouvelles stratégies <strong>de</strong> clustering spectral par décompositions en sous-domaines.<br />

En appliquant indépendamment l’algorithme sur <strong>de</strong>s sous-domaines particuliers, on montre que <strong>la</strong><br />

réunion <strong>de</strong>s partitions locales représente une partition globale ou une sous-partition <strong>de</strong> l’ensemble<br />

<strong>de</strong>s points. Nous proposons d’appliquer le clustering spectral sur <strong>de</strong>s sous-domaines directement<br />

en divisant l’ensemble <strong>de</strong>s données en sous-ensembles via leurs coordonnées géométriques. Avec un<br />

paramètre global d’affinité gaussienne (1.1) <strong>et</strong> une métho<strong>de</strong> pour déterminer le nombre <strong>de</strong> clusters,<br />

chaque processus applique indépendamment l’algorithme clustering spectral sur <strong>de</strong>s sous ensembles<br />

<strong>de</strong> données <strong>et</strong> fournit une partition locale. Une étape <strong>de</strong> regroupement assure <strong>la</strong> connexion entre<br />

les sous-ensembles <strong>de</strong> points <strong>et</strong> détermine une partition globale <strong>à</strong> partir <strong>de</strong>s locales. Après une<br />

première phase d’expérimentations numériques, une alternative sera proposée puis testée sur <strong>de</strong>s<br />

cas géométriques <strong>et</strong> <strong>de</strong>s cas <strong>de</strong> segmentation d’images. Le potentiel <strong>de</strong> parallélisme <strong>de</strong> l’algorithme<br />

tout comme son comportement numérique <strong>et</strong> ses limitations seront étudiés.<br />

3.1 C<strong>la</strong>ssification <strong>spectrale</strong> parallèle : justification<br />

Il a été démontré [11, 12] que l’affinité gaussienne (1.1) peut être interprétée comme une discrétisation<br />

du noyau <strong>de</strong> <strong>la</strong> chaleur. En particulier, d’après le précé<strong>de</strong>nt chapitre, nous avons montré que<br />

c<strong>et</strong>te matrice est une représentation discrète d’un opérateur <strong>de</strong> <strong>la</strong> chaleur défini sur un domaine,<br />

approprié <strong>de</strong> R p . Grâce aux propriétés <strong>spectrale</strong>s <strong>de</strong> l’équation <strong>de</strong> <strong>la</strong> chaleur, les vecteurs propres<br />

<strong>de</strong> c<strong>et</strong>te matrice sont asymptotiquement une représentation discrète <strong>de</strong> fonctions propres L 2 dont<br />

les supports sont inclus sur une seule composante connexe <strong>à</strong> <strong>la</strong> fois.<br />

Appliquer le clustering spectral revient donc <strong>à</strong> proj<strong>et</strong>er sur le support <strong>de</strong> ces fonctions propres<br />

83

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!