28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Contributions</strong> <strong>à</strong> <strong>l'étu<strong>de</strong></strong> <strong>de</strong> <strong>la</strong> c<strong>la</strong>ssification <strong>spectrale</strong> <strong>et</strong> <strong>applications</strong><br />

Résumé : La c<strong>la</strong>ssification <strong>spectrale</strong> consiste <strong>à</strong> créer, <strong>à</strong> partir <strong>de</strong>s éléments spectraux d'une matrice<br />

d'affinité gaussienne, un espace <strong>de</strong> dimension réduite dans lequel les données sont regroupées en<br />

c<strong>la</strong>sses. C<strong>et</strong>te métho<strong>de</strong> non supervisée est principalement basée sur <strong>la</strong> mesure d'affinité gaussienne,<br />

son paramètre <strong>et</strong> ses éléments spectraux. Cependant, les questions sur <strong>la</strong> séparabilité <strong>de</strong>s c<strong>la</strong>sses<br />

dans l'espace <strong>de</strong> projection spectral <strong>et</strong> sur le choix du paramètre restent ouvertes. Dans un premier<br />

temps, le rôle du paramètre <strong>de</strong> l'affinité gaussienne sera étudié <strong>à</strong> travers <strong>de</strong>s mesures <strong>de</strong> qualités <strong>et</strong><br />

<strong>de</strong>ux heuristiques pour le choix <strong>de</strong> ce paramètre seront proposées puis testées. Ensuite, le<br />

fonctionnement même <strong>de</strong> <strong>la</strong> métho<strong>de</strong> est étudié <strong>à</strong> travers les éléments spectraux <strong>de</strong> <strong>la</strong> matrice<br />

d'affinité gaussienne. En interprétant c<strong>et</strong>te matrice comme <strong>la</strong> discrétisation du noyau <strong>de</strong> <strong>la</strong> chaleur<br />

définie sur l'espace entier <strong>et</strong> en utilisant les éléments finis, les vecteurs propres <strong>de</strong> <strong>la</strong> matrice affinité<br />

sont <strong>la</strong> représentation asymptotique <strong>de</strong> fonctions dont le support est inclus dans une seule<br />

composante connexe. Ces résultats perm<strong>et</strong>tent <strong>de</strong> définir <strong>de</strong>s propriétés <strong>de</strong> c<strong>la</strong>ssification <strong>et</strong> <strong>de</strong>s<br />

conditions sur le paramètre gaussien. A partir <strong>de</strong> ces éléments théoriques, <strong>de</strong>ux stratégies <strong>de</strong><br />

parallélisation par décomposition en sous-domaines sont formulées <strong>et</strong> testées sur <strong>de</strong>s exemples<br />

géométriques <strong>et</strong> <strong>de</strong> traitement d'images. Enfin dans le cadre non supervisé, le c<strong>la</strong>ssification <strong>spectrale</strong><br />

est appliquée, d'une part, dans le domaine <strong>de</strong> <strong>la</strong> génomique pour déterminer différents profils<br />

d'expression <strong>de</strong> gènes d'une légumineuse <strong>et</strong>, d'autre part dans le domaine <strong>de</strong> l'imagerie fonctionnelle<br />

TEP, pour segmenter <strong>de</strong>s régions du cerveau présentant les mêmes courbes d'activités temporelles.<br />

Mots-clés : c<strong>la</strong>ssification non supervisée, c<strong>la</strong>ssification <strong>spectrale</strong>, noyau gaussien, équation <strong>de</strong> <strong>la</strong><br />

chaleur, éléments finis, parallélisation, imagerie médicale.<br />

<strong>Contributions</strong> to the study of spectral clustering and <strong>applications</strong><br />

Abstract : The Spectral Clustering consists in creating, from the spectral elements of a Gaussian<br />

affinity matrix, a low-dimension space in which data are grouped into clusters. This unsupervised<br />

m<strong>et</strong>hod is mainly based on Gaussian affinity measure, its param<strong>et</strong>er and its spectral elements.<br />

However, questions about the separability of clusters in the projection space and the spectral<br />

param<strong>et</strong>er choices remain open. First, the rule of the param<strong>et</strong>er of Gaussian affinity will be<br />

investigated through quality measures and two heuristics for choosing this s<strong>et</strong>ting will be proposed<br />

and tested. Then, the m<strong>et</strong>hod is studied through the spectral element of the Gaussian affinity matrix.<br />

By interpr<strong>et</strong>ing this matrix as the discr<strong>et</strong>ization of the heat kernel <strong>de</strong>fined on the whole space and<br />

using finite elements, the eigenvectors of the affinity matrix are asymptotic representation of<br />

functions whose support is inclu<strong>de</strong>d in one connected component. These results help <strong>de</strong>fine the<br />

properties of clustering and conditions on the Gaussian param<strong>et</strong>er. From these theor<strong>et</strong>ical elements,<br />

two parallelization strategies by <strong>de</strong>composition into sub-domains are formu<strong>la</strong>ted and tested on<br />

geom<strong>et</strong>rical examples and images. Finally, as unsupervised <strong>applications</strong>, the spectral clustering is<br />

applied, first in the field of genomics to i<strong>de</strong>ntify different gene expression profiles of a legume and<br />

the other in the imaging field functional PET, to segment the brain regions with simi<strong>la</strong>r time-activity<br />

curves.<br />

Key-words : clustering, spectral clustering, Gaussian kernel, heat equation, finite elements,<br />

parallelization, medical imaging.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!