Contributions à l'étude de la classification spectrale et applications

More documents

Recommendations

Info

36 Classification et éléments spectraux de la matrice affinité gaussienne (a) Exemple de clustering idéal (b) Exemple de sous-clustering (c) Exemple de sur-clustering (d) Exemple de mauvais clustering Figure 2.1 – Définitions du clustering
2.2 Présentation du résultat principal 37 pour tout j ∈ {1, .., k}, Cj ⊂ Pj. Or il existe j ∈ {1, .., k} tel que Cj = Pj. Donc k j=1 Cj = k j=1 Pj = P. Ce qui contredit l’hypothèse que C est une partition. La réciproque est triviale. Supposons maintenant que Ω n’induise pas un k-clustering compatible, c’est-à-dire qu’il existe deux points xi ∈ Pi et xj ∈ Pj avec i = j tels que xi ∈ C1 et xj ∈ C1. S’ils sont assignés au même cluster C1 alors, d’après l’algorithme 2, Yi1 = 0 et Yj1 = 0. En d’autres termes, (X1)i = 0 et (X1)j = 0. Alors, d’après les hypothèses sur les vecteurs propres, xi ∈ P1 et xj ∈ P1 ce qui est faux. Donc la partition C = {C1, .., Ck} est identique au k-clustering induit par Ω. La proposition 2.2 énonce un résultat de clustering immédiat en ce sens qu’il est trivial à réaliser, sous réserve qu’on puisse trouver exactement k vecteurs dont les coordonnées sont non nulles sur une seule des k partitions de points Pj, j = 1, . . . , k. Il est clair que dans la pratique ce ne sera pas le cas, mais nous allons analyser dans ce chapitre sous quelles hypothèses il est possible de se rapprocher de cette situation idéale. Avant toute chose, il est utile de rappeler que l’existence de tels vecteurs rejoint directement l’hypothèse de structure diagonale par bloc de la matrice A, telle que l’exploitent Ng, Jordan et Weiss [84]. En effet, sous l’hypothèse d’une telle structure diagonale par bloc, les vecteurs propres de A peuvent se regrouper en k sous ensembles de vecteurs ayant chacun des composantes non nulles en correspondance avec l’un des k blocs diagonaux de la matrice. La normalisation de la matrice ne sert alors qu’à éviter d’avoir à faire une décomposition spectrale complète de la matrice A et à retrouver (étape qui peut être coûteuse) dans l’ensemble des vecteurs propres la répartition par bloc des composantes non nulles de ces vecteurs (après permutation éventuelle des lignes). En effet, la normalisation garantit simplement que la valeur propre dominante égale à 1 est de multiplicité k, et que les vecteurs propres associés sont une combinaison linéaire de k vecteurs ayant des coordonnées non nulles et constantes relativement à chacun des k blocs diagonaux respectivement. L’une des questions à laquelle nous nous intéressons dans ce chapitre est d’analyser dans quelle mesure la matrice de similarité A est proche de cette situation bloc-diagonale idéale. Ng, Jordan et Weiss [84] abordent cette question en analysant la structure des vecteurs propres de A par le biais de la théorie de la perturbation matricielle. Dans le même esprit, nous analyserons la structure de ces vecteurs propres à l’aide d’un problème continu mettant en jeu l’équation de la chaleur. Dans le cas où l’étape de normalisation est supprimée, la méthode de spectral clustering se résume aux étapes de l’algorithme 2, dans lequel intervient la décomposition spectrale de la matrice d’affinité Gaussienne, explicitée en (2.1). Comme les éléments spectraux de la matrice d’affinité ne fournissent pas explicitement de critère géométrique relativement à un ensemble discret de données, nous nous proposons de revenir à une formulation continue où les clusters sont inclus dans un ouvert Ω fournissant un k-clustering compatible. En interprétant la matrice affinité gaussienne comme la discrétisation du noyau de Green de l’équation de la chaleur et en utilisant les éléments finis, on montre que, pour un ensemble fini de points, les vecteurs propres de la matrice affinité gaussienne sont la représentation asymptotique de fonctions dont le support est inclus dans une seule composante connexe. Ce retour à une formulation continue est effectué à l’aide des éléments finis. Ainsi, les vecteurs propres de la matrice affinité A sont interprétés comme la discrétisation de fonctions propres d’un opérateur. En effet, avec les éléments finis dont les noeuds correspondent aux données d’origine, une représentation d’une fonction est donnée par sa valeur nodale. Donc on peut interpréter la matrice A et ses vecteurs propres comme les représentations respectives d’un opérateur L 2 et d’une fonction L 2 . L’opérateur dont la représentation en éléments finis concorde avec la définition de A est le noyau de l’équation de la chaleur, noté KH, sur R p . Comme le spectre de l’opérateur SH (convolution par KH) est essentiel, les vecteurs propres de A ne peuvent pas être directement interprétés comme
Page 1: Institut National Polytechnique de
Page 4 and 5: ii TABLE DES MATIÈRES 2.5.1 Expér
Page 7 and 8: Table des figures 1.1 Illustration
Page 9: TABLE DES FIGURES vii 4.8 Etude ave
Page 13 and 14: Remerciements Je tiens tout d’abo
Page 15 and 16: Introduction Les domaines des biolo
Page 17 and 18: adéquates dans un cadre non superv
Page 19 and 20: Chapitre 1 : Classification spectra
Page 21 and 22: Chapitre 1 Classification spectrale
Page 23 and 24: 1.1.1 Algorithme de classification
Page 25 and 26: 1.1.2 Problème du choix du paramè
Page 27 and 28: 1.1.2 Problème du choix du paramè
Page 29 and 30: 1.2.2 Cas d’une distribution isot
Page 31 and 32: 1.3 Validations numériques 19 1.3
Page 33 and 34: 1.3.1 Mesures de qualité 21 (a) Sm
Page 39 and 40: 1.4 Méthodes de classification spe
Page 41 and 42: 1.4.2 Traitement d’images 29 une
Page 43 and 44: 1.4.2 Traitement d’images 31 (a)
Page 45 and 46: Chapitre 2 Classification et élém
Page 47: 2.2 Présentation du résultat prin
Page 51 and 52: 2.2 Présentation du résultat prin
Page 53 and 54: 2.3 Propriétés de classification
Page 55 and 56: 2.3.2 Classification via l’opéra
Page 65 and 66: 2.4.1 Eléments finis de Lagrange 5
Page 67 and 68: 2.4.2 Interprétation des élément
Page 69 and 70: 2.4.3 Propriété de classification
Page 71 and 72: 2.4.3 Propriété de classification
Page 73 and 74: 2.4.4 Condensation de masse 61 Le t
Page 75 and 76: 2.4.4 Condensation de masse 63 Eval
Page 77 and 78: 2.4.4 Condensation de masse 65 (a)
Page 79 and 80: 2.5.1 Expérimentations numériques
Page 81 and 82: 2.5.2 Choix du paramètre gaussien
Page 87 and 88: 2.5.3 Passage du discret au continu
Page 89 and 90: 2.5.4 Etape de normalisation 77 d
Page 91 and 92: 2.5.5 Cas limites de validité de l
Page 93: 2.5.5 Cas limites de validité de l
Page 96 and 97: 84 Parallélisation de la classific
Page 98 and 99:
86 Parallélisation de la classific
Page 100 and 101:
Page 102 and 103:
Page 104 and 105:
Page 106 and 107:
Page 108 and 109:
Page 110 and 111:
Page 112 and 113:
100 Parallélisation de la classifi
Page 114 and 115:
Page 116 and 117:
Page 118 and 119:
Page 120 and 121:
Page 122 and 123:
Page 124 and 125:
Page 126 and 127:
Page 128 and 129:
Page 130 and 131:
Page 132 and 133:
120 Extraction de connaissances app
Page 134 and 135:
Page 136 and 137:
Page 138 and 139:
Page 140 and 141:
Page 142 and 143:
Page 144 and 145:
Page 146 and 147:
Page 148 and 149:
Page 150 and 151:
Page 152 and 153:
Page 154 and 155:
Page 156 and 157:
Page 158 and 159:
Page 160 and 161:
Page 162 and 163:
Page 164 and 165:
Page 167 and 168:
Conclusion et perspectives Dans ce
Page 169 and 170:
4.9.4 Comparaison avec la méthode
Page 171 and 172:
Bibliographie [1] P.D. Acton, L.S.
Page 173 and 174:
BIBLIOGRAPHIE 161 [37] M. Ester, H.
Page 175 and 176:
BIBLIOGRAPHIE 163 [75] R. Maroy, R.
Page 177:
BIBLIOGRAPHIE 165 [114] L. Yen, D.
show all

Contributions à l'étude de la classification spectrale et applications

Create successful ePaper yourself

Delete template?

Save as template?