Contributions à l'étude de la classification spectrale et applications
Contributions à l'étude de la classification spectrale et applications
Contributions à l'étude de la classification spectrale et applications
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
3.1.3 Définition du nombre <strong>de</strong> c<strong>la</strong>sses k 89<br />
proche du cas idéal <strong>et</strong> donc le partitionnement obtenu est meilleur.<br />
Sur <strong>la</strong> figure 3.3, le ratio ηk = 2 k k(k−1) i=1 rij en fonction du nombre <strong>de</strong> c<strong>la</strong>sses k est représenté<br />
j=i+1<br />
sur <strong>de</strong>ux exemples représentant <strong>de</strong>s c<strong>la</strong>sses aux <strong>de</strong>nsités variées. Rappelons que plus le ratio η est<br />
proche <strong>de</strong> 0, plus <strong>la</strong> matrice réordonnancée a une structure bloc diagonale. Ainsi, on obtient une<br />
partition où les c<strong>la</strong>sses sont séparées par une distance suffisante assurant <strong>de</strong>s vecteurs propres<br />
constants par morceaux. Ainsi, les données proj<strong>et</strong>ées dans l’espace spectral sont concentrées par<br />
c<strong>la</strong>sses <strong>et</strong> séparées. Dans les <strong>de</strong>ux exemples, le minimum est atteint pour <strong>la</strong> valeur <strong>de</strong> k adéquate.<br />
(a) Smiley (b) 6 blocs<br />
(c) Ratio ηk fonction <strong>de</strong> k (d) Ratio ηk fonction <strong>de</strong> k<br />
Figure 3.3 – Exemples pour le choix du nombre <strong>de</strong> cluster k<br />
Par contre, diviser l’ensemble entier <strong>de</strong>s données en sous-ensembles peut aboutir <strong>à</strong> <strong>de</strong>s sousdomaines<br />
ne contenant qu’une seul c<strong>la</strong>sse. Donc si le nombre <strong>de</strong> c<strong>la</strong>sses k satisfaisant l’équation(3.5)<br />
est égal <strong>à</strong> 2 sur un sous-domaine, le numérateur du ratio η2 est comparé <strong>à</strong> son dénominateur. On<br />
définit un seuil β qui représentera <strong>la</strong> proportion pour <strong>la</strong>quelle l’affinité entre les c<strong>la</strong>sses est suffisante<br />
pour déc<strong>la</strong>rer qu’il existe 2 c<strong>la</strong>sses. Donc, si le ratio η2 est plus grand que <strong>la</strong> valeur <strong>de</strong> β, <strong>la</strong> valeur<br />
<strong>de</strong> k est fixée <strong>à</strong> 1 au lieu <strong>de</strong> 2.<br />
D’un point <strong>de</strong> vue numérique, c<strong>et</strong>te heuristique exploite les éléments issus <strong>de</strong>s premières étapes<br />
<strong>de</strong> l’algorithme sans avoir <strong>à</strong> les reprendre : elle revient <strong>à</strong> concaténer <strong>de</strong>s vecteurs propres, <strong>à</strong> appliquer<br />
le k-means pour obtenir <strong>la</strong> partition dans l’espace <strong>de</strong> projection spectral, <strong>et</strong> <strong>à</strong> utiliser directement