28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

3.1.3 Définition du nombre <strong>de</strong> c<strong>la</strong>sses k 89<br />

proche du cas idéal <strong>et</strong> donc le partitionnement obtenu est meilleur.<br />

Sur <strong>la</strong> figure 3.3, le ratio ηk = 2 k k(k−1) i=1 rij en fonction du nombre <strong>de</strong> c<strong>la</strong>sses k est représenté<br />

j=i+1<br />

sur <strong>de</strong>ux exemples représentant <strong>de</strong>s c<strong>la</strong>sses aux <strong>de</strong>nsités variées. Rappelons que plus le ratio η est<br />

proche <strong>de</strong> 0, plus <strong>la</strong> matrice réordonnancée a une structure bloc diagonale. Ainsi, on obtient une<br />

partition où les c<strong>la</strong>sses sont séparées par une distance suffisante assurant <strong>de</strong>s vecteurs propres<br />

constants par morceaux. Ainsi, les données proj<strong>et</strong>ées dans l’espace spectral sont concentrées par<br />

c<strong>la</strong>sses <strong>et</strong> séparées. Dans les <strong>de</strong>ux exemples, le minimum est atteint pour <strong>la</strong> valeur <strong>de</strong> k adéquate.<br />

(a) Smiley (b) 6 blocs<br />

(c) Ratio ηk fonction <strong>de</strong> k (d) Ratio ηk fonction <strong>de</strong> k<br />

Figure 3.3 – Exemples pour le choix du nombre <strong>de</strong> cluster k<br />

Par contre, diviser l’ensemble entier <strong>de</strong>s données en sous-ensembles peut aboutir <strong>à</strong> <strong>de</strong>s sousdomaines<br />

ne contenant qu’une seul c<strong>la</strong>sse. Donc si le nombre <strong>de</strong> c<strong>la</strong>sses k satisfaisant l’équation(3.5)<br />

est égal <strong>à</strong> 2 sur un sous-domaine, le numérateur du ratio η2 est comparé <strong>à</strong> son dénominateur. On<br />

définit un seuil β qui représentera <strong>la</strong> proportion pour <strong>la</strong>quelle l’affinité entre les c<strong>la</strong>sses est suffisante<br />

pour déc<strong>la</strong>rer qu’il existe 2 c<strong>la</strong>sses. Donc, si le ratio η2 est plus grand que <strong>la</strong> valeur <strong>de</strong> β, <strong>la</strong> valeur<br />

<strong>de</strong> k est fixée <strong>à</strong> 1 au lieu <strong>de</strong> 2.<br />

D’un point <strong>de</strong> vue numérique, c<strong>et</strong>te heuristique exploite les éléments issus <strong>de</strong>s premières étapes<br />

<strong>de</strong> l’algorithme sans avoir <strong>à</strong> les reprendre : elle revient <strong>à</strong> concaténer <strong>de</strong>s vecteurs propres, <strong>à</strong> appliquer<br />

le k-means pour obtenir <strong>la</strong> partition dans l’espace <strong>de</strong> projection spectral, <strong>et</strong> <strong>à</strong> utiliser directement

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!