28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 2<br />

C<strong>la</strong>ssification <strong>et</strong> éléments spectraux <strong>de</strong> <strong>la</strong><br />

matrice affinité gaussienne<br />

Dans ce chapitre, nous nous intéressons au fonctionnement <strong>de</strong> <strong>la</strong> métho<strong>de</strong> <strong>de</strong> spectral clustering<br />

pour un ensemble fini <strong>de</strong> points afin <strong>de</strong> pouvoir juger <strong>la</strong> qualité du clustering <strong>et</strong> le choix du<br />

paramètre σ. Pour ce<strong>la</strong>, nous proposons d’interpréter l’algorithme <strong>de</strong> Ng, Jordan <strong>et</strong> Weiss [84] sans<br />

l’étape <strong>de</strong> normalisation <strong>et</strong> plus précisément l’espace <strong>de</strong> projection spectral via les équations aux<br />

dérivées partielles <strong>et</strong> <strong>la</strong> théorie <strong>de</strong>s éléments finis. C<strong>et</strong>te interprétation apportera une explication<br />

sur <strong>la</strong> construction <strong>de</strong>s clusters c’est-<strong>à</strong>-dire un sens <strong>à</strong> l’extraction <strong>de</strong>s plus grands vecteurs propres<br />

d’une matrice affinité gaussienne.<br />

2.1 Diverses interprétations<br />

De nombreuses interprétations basées sur <strong>de</strong>s approches probabiliste, d’optimisation ou bien<br />

<strong>de</strong> théorie <strong>de</strong>s graphes <strong>et</strong> d’opérateur dans les espaces fonctionnels du spectral clustering ont été<br />

recensées [105, 32]. Rappelons que c<strong>et</strong>te métho<strong>de</strong> repose seulement sur l’ensemble <strong>de</strong>s données <strong>et</strong> <strong>la</strong><br />

simi<strong>la</strong>rité, notée s, entre les couples <strong>de</strong> points, sans a priori sur <strong>la</strong> forme <strong>de</strong>s clusters.<br />

Partitionnement <strong>de</strong> graphe<br />

A partir <strong>de</strong> <strong>la</strong> seule mesure <strong>de</strong> simi<strong>la</strong>rité entre les points, une représentation possible <strong>de</strong> ces<br />

points consiste <strong>à</strong> les i<strong>de</strong>ntifier par un graphe <strong>de</strong> simi<strong>la</strong>rité, noté G = (V, E). Chaque somm<strong>et</strong> vi ∈ V<br />

du graphe G est un point xi. Deux somm<strong>et</strong>s sont connectés si <strong>la</strong> simi<strong>la</strong>rité sij entre les points xi <strong>et</strong> xj<br />

est positive ou supérieure <strong>à</strong> un seuil prédéfini <strong>et</strong> l’arête du graphe est pondérée par <strong>la</strong> valeur <strong>de</strong> sij. A<br />

partir <strong>de</strong> c<strong>et</strong>te représentation, plusieurs fonctions objectifs basées sur <strong>la</strong> minimisation <strong>de</strong> <strong>la</strong> simi<strong>la</strong>rité<br />

totale entre <strong>de</strong>ux clusters peuvent être minimisées : le ratio <strong>de</strong> coupe [51], <strong>la</strong> coupe normalisée [91] ou<br />

bien <strong>la</strong> coupe min-max [33] incluant aussi <strong>la</strong> maximisation <strong>de</strong> <strong>la</strong> simi<strong>la</strong>rité totale intra-cluster. C<strong>et</strong>te<br />

interprétation est en accord avec le principe même <strong>de</strong> <strong>la</strong> c<strong>la</strong>ssification non supervisée. Cependant,<br />

l’utilisation <strong>de</strong>s premiers vecteurs propres d’un Lap<strong>la</strong>cien <strong>de</strong> graphe comme espace <strong>de</strong> projection<br />

dans lequel les clusters sont constitués est, en général, justifiée avec <strong>de</strong>s arguments heuristiques ou<br />

comme une re<strong>la</strong>xe du problème discr<strong>et</strong> <strong>de</strong> clustering.<br />

33

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!