Contributions à l'étude de la classification spectrale et applications

More documents

Recommendations

Info

22 Classification spectrale : algorithme et étude du paramètre Mesure de qualité 1.6. Soit k le nombre de clusters. Après avoir appliqué le spectral clustering pour une valeur de k, on définit la matrice de confusion , notée C ∈ Mk,k(R), de la façon suivante : les éléments Cij définissent le nombre de points qui sont assignés au cluster j au lieu du cluster i pour i = j et Cii le nombre de points correctement assignés pour chaque cluster i. On définit alors un pourcentage de points mal-classés, noté Perreur, par : Perreur = k i=j Cij N où N est le nombre de points et k le nombre de clusters. Le pourcentage d’erreur Perreur issu de la matrice de confusion donne une estimation de l’erreur réelle dans la méthode de clustering. Cette mesure est donc testée sur les exemples géométriques précédemment présentés et, sur la figure 1.9, le pourcentage d’erreur Perreur est tracé en fonction des valeurs de σ. Sur certains exemples comme (b), (e) et (f), les premières valeurs de σ ne sont pas testées car pour ces valeurs proches de 0, le conditionnement de la matrice affinité A est mauvais (supérieur à 10 13 ) ce qui ne permet pas de faire converger les algorithmes de recherche de valeurs propres et vecteurs propres. De plus, les valeurs de σ supérieures à l’intervalle considéré pour chaque exemple ne présentent pas d’intérêt car le pourcentage d’erreur Perreur reste supérieur ou égal à celui de la dernière valeur de σ représentée sur la figure 1.9. Les lignes verticales noire, verte et magenta en pointillés indiquent respectivement la valeur du paramètre heuristique (1.2), celle du paramètre heuristique (1.3) et celle définie par Brand [20]. Suivant les exemples, l’intervalle sur lequel il n’y a pas d’erreur de clustering varie considérablement d’un cas à l’autre : par exemple, la longueur de l’intervalle peut être de l’ordre de 0.4 pour (b) ou être inférieure à 0.1 pour (a) et (c). En effet, le pourcentage d’erreur Perreur varie instantanément quand σ n’appartient plus à l’intervalle adéquat. Comparées aux résultats numériques de la figure 1.3, les valeurs d’heuristiques pour lesquelles le partitionnement est incorrect appartiennent à l’intervalle où Perreur est supérieure à 0%. Les valeurs des heuristiques (1.2) et (1.3) correspondent à une valeur de σ avec une erreur de clustering nulle exceptée pour l’heuristique (1.2) avec l’exemple des deux rectangles étirés figure 1.9 (f). Cette mesure valide donc l’influence du paramètre ainsi que les résultats numériques des figures 1.3, 1.7 et 1.8 pour les différentes heuristiques. Ratio de normes de Frobenius La mesure par matrice de confusion donne un très bon outil d’analyse de la qualité du cluster. Elle demande cependant de connaître l’état exact du clustering à obtenir et ne peut donc pas être utilisée pour des applications non supervisées. En particulier, on cherche à évaluer de manière automatique le bon nombre de clusters. Pour ce faire, on propose d’introduire une autre mesure de qualité calculée directement à partir des données internes au calcul. Après validation, cette mesure sera introduite par la suite comme outil de la stratégie parallèle présentée au chapitre 4. Mesure de qualité 1.7. Après avoir appliqué le spectral clustering pour un nombre de clusters k à déterminer mais que l’on fixe a priori, la matrice affinité A définie par (1.1) est réordonnancée par cluster. On obtient la matrice par bloc, notée L, telle que les blocs hors diagonaux représentent les affinités entre les clusters et les blocs diagonaux l’affinité intra-cluster. On évalue les ratios entre les normes de Frobenius des blocs diagonaux et ceux hors-diagonaux pour i, j ∈ 1, .., k et i = j : rij = L(ij) F L (ii) , (1.4) F
1.3.1 Mesures de qualité 23 (a) Smiley (b) Cercles (c) Portions de couronnes (d) Carrés (e) Cible (f) Rectangles étirés Figure 1.9 – Pourcentages d’erreur de clustering en fonction de σ
Page 1: Institut National Polytechnique de
Page 4 and 5: ii TABLE DES MATIÈRES 2.5.1 Expér
Page 7 and 8: Table des figures 1.1 Illustration
Page 9: TABLE DES FIGURES vii 4.8 Etude ave
Page 13 and 14: Remerciements Je tiens tout d’abo
Page 15 and 16: Introduction Les domaines des biolo
Page 17 and 18: adéquates dans un cadre non superv
Page 19 and 20: Chapitre 1 : Classification spectra
Page 21 and 22: Chapitre 1 Classification spectrale
Page 23 and 24: 1.1.1 Algorithme de classification
Page 25 and 26: 1.1.2 Problème du choix du paramè
Page 27 and 28: 1.1.2 Problème du choix du paramè
Page 29 and 30: 1.2.2 Cas d’une distribution isot
Page 31 and 32: 1.3 Validations numériques 19 1.3
Page 33: 1.3.1 Mesures de qualité 21 (a) Sm
Page 37 and 38: 1.3.1 Mesures de qualité 25 (a) Sm
Page 39 and 40: 1.4 Méthodes de classification spe
Page 41 and 42: 1.4.2 Traitement d’images 29 une
Page 43 and 44: 1.4.2 Traitement d’images 31 (a)
Page 45 and 46: Chapitre 2 Classification et élém
Page 47 and 48: 2.2 Présentation du résultat prin
Page 53 and 54: 2.3 Propriétés de classification
Page 55 and 56: 2.3.2 Classification via l’opéra
Page 65 and 66: 2.4.1 Eléments finis de Lagrange 5
Page 67 and 68: 2.4.2 Interprétation des élément
Page 69 and 70: 2.4.3 Propriété de classification
Page 71 and 72: 2.4.3 Propriété de classification
Page 73 and 74: 2.4.4 Condensation de masse 61 Le t
Page 75 and 76: 2.4.4 Condensation de masse 63 Eval
Page 77 and 78: 2.4.4 Condensation de masse 65 (a)
Page 79 and 80: 2.5.1 Expérimentations numériques
Page 81 and 82: 2.5.2 Choix du paramètre gaussien
Page 83 and 84: 2.5.2 Choix du paramètre gaussien
Page 85 and 86:
2.5.2 Choix du paramètre gaussien
Page 87 and 88:
2.5.3 Passage du discret au continu
Page 89 and 90:
2.5.4 Etape de normalisation 77 d
Page 91 and 92:
2.5.5 Cas limites de validité de l
Page 93:
2.5.5 Cas limites de validité de l
Page 96 and 97:
84 Parallélisation de la classific
Page 98 and 99:
Page 100 and 101:
Page 102 and 103:
Page 104 and 105:
Page 106 and 107:
Page 108 and 109:
Page 110 and 111:
Page 112 and 113:
100 Parallélisation de la classifi
Page 114 and 115:
Page 116 and 117:
Page 118 and 119:
Page 120 and 121:
Page 122 and 123:
Page 124 and 125:
Page 126 and 127:
Page 128 and 129:
Page 130 and 131:
Page 132 and 133:
120 Extraction de connaissances app
Page 134 and 135:
Page 136 and 137:
Page 138 and 139:
Page 140 and 141:
Page 142 and 143:
Page 144 and 145:
Page 146 and 147:
Page 148 and 149:
Page 150 and 151:
Page 152 and 153:
Page 154 and 155:
Page 156 and 157:
Page 158 and 159:
Page 160 and 161:
Page 162 and 163:
Page 164 and 165:
Page 167 and 168:
Conclusion et perspectives Dans ce
Page 169 and 170:
4.9.4 Comparaison avec la méthode
Page 171 and 172:
Bibliographie [1] P.D. Acton, L.S.
Page 173 and 174:
BIBLIOGRAPHIE 161 [37] M. Ester, H.
Page 175 and 176:
BIBLIOGRAPHIE 163 [75] R. Maroy, R.
Page 177:
BIBLIOGRAPHIE 165 [114] L. Yen, D.
show all

Contributions à l'étude de la classification spectrale et applications

Create successful ePaper yourself

Delete template?

Save as template?