Contributions à l'étude de la classification spectrale et applications

More documents

Recommendations

Info

8 Introduction k à partir de la mesure de qualité sur les normes de Frobenius du chapitre 1, et nous utiliserons l’heuristique définie au chapitre 1 pour fixer le paramètre d’affinité. Enfin, nous testerons cette méthode sur des exemples géométriques et de segmentation d’images en variant le nombre de données et de découpe et nous en étudierons les limites. Chapitre 4 : Extraction de connaissances appliquée à la biologie et l’imagerie médicale Ce chapitre est consacré à la mise en application du matériel théorique et numérique dans un cadre biologique avec l’étude d’expressions de gènes issues de biopuces puis dans un cadre d’imagerie médicale avec la segmentation d’image issue de la tomographie par émission de positons. Dans le cadre de la transcriptomie, des expérimentations basées sur l’inoculation d’une bactérie Ralstonia Solanacearum dans la légumineuse modèle Medicago Truncatula ont dévoilé l’existence de plantes résistantes (mutant HRP). L’observation des gènes concernés par la maladie foliaire et racinaire et l’analyse des gènes issus des plantes résistantes sont nécessaires. On a recours aux puces à ADN, et on observe, à divers instants, les niveaux d’expression d’une partie du génome. L’étude portera sur le classement des gènes suivant leur profil temporel d’expression. Tout d’abord, nous introduirons une méthode de cartes auto organisatrices (ou Self Organizing Maps) [68] et l’adapterons à notre problématique en modifiant la mesure de similarité et les mises à jour de l’algorithme. Cette méthode, connue dans le traitement des données génomiques temporelles [98], servira par la suite de référence et d’outil de comparaison. Ensuite, nous testerons la méthode de clustering spectral et nous comparerons les résultats par rapport à la méthode précédente. Dans le cadre de l’imagerie médicale fonctionnelle quantitative, la Tomographie par Emission de Positons (TEP) dynamique permet de visualiser la concentration au cours du temps d’un traceur marqué par un atome radioactif en chaque point du cerveau étudié. Pour cela, les courbes tempsactivité (TAC) calculées à partir de volume d’intérêt définis sur l’image sont utilisées pour quantifier la cible. Les données TEP sont une séquence d’images 3D temporelles traduisant l’évolution de la radioactivité dans le temps du volume correspondant correspondant au champ de vue de l’appareil. Un première étude est donc menée sur le spectral clustering appliqué aux TAC bruitées. Etant donné le caractère multidimensionnel des données, le choix du paramètre de l’affinité gaussienne et l’heuristique du choix du nombre de clusters sont étudiés en fonction de la mesure de qualité définie par les ratios de normes de Frobenius. Ensuite, le spectral clustering est appliqué sur des cas de segmentation d’images TEP dynamiques. Les résultats seront alors comparés à ceux issus du k-means, la méthode référence pour ce genre de données [112].
Chapitre 1 Classification spectrale : algorithme et étude du paramètre Ce chapitre s’intéresse à la méthode de classification spectrale (ou clustering spectral) et à sa mise en oeuvre. Comme cette méthode repose sur la seule mesure d’affinité entre tous les couples de points, sans a priori sur les formes des classes (ou clusters), nous étudierons plus particulièrement, après une présentation de l’algorithme, le paramètre de l’affinité gaussienne. En effet, son rôle est crucial dans le partitionnement des données et il n’existe pas a priori de moyen pour définir un paramètre optimal, mais un ordre de grandeur peut être accessible. On propose donc deux heuristiques qui seront confrontées aux résultats théoriques dans le chapitre suivant. Dans un premier temps, les diverses définitions, globales et locales, basées sur des interprétations physiques seront présentées. Ensuite nous proposerons une heuristique basée sur un point de vue géométrique et nous introduirons une mesure de qualité pour étudier l’influence de ce paramètre sur les résultats de classification (ou clustering). 1.1 Présentation de la classification spectrale Dans la suite, nous présentons un algorithme de spectral clustering et le choix du paramètre de l’affinité gaussienne sera étudié. 1.1.1 Algorithme de classification spectrale La méthode de clustering spectral consiste à extraire les vecteurs propres associés aux plus grandes valeurs propres d’une matrice affinité normalisée, issue d’un noyau de Mercer [48]. Ces vecteurs propres constituent un espace de dimension réduite dans lequel les données transformées seront linéairement séparables. Deux principales classes d’algorithmes de clustering spectral ont été développées à partir de partitionnement de graphes [104]. La première est fondée sur un partitionnement bipartite récursif à partir du vecteur propre associé à la seconde plus grande valeur propre du graphe du Laplacien normalisé [63, 91], ou vecteur de Fiedler [25] dans le cas non-normalisé. La deuxième classe d’algorithmes n’utilise pas de manière récursive un seul vecteur propre mais propose de projeter les données originales dans un espace défini par les k plus grands vecteurs propres d’une matrice d’adjacence normalisée (ou matrice similaire à celle-ci), et d’appliquer un algorithme standard comme k-means sur ces nouvelles coordonnées [84, 79]. Nous porterons l’étude principalement sur cette dernière classe dans un souci de coût numérique et de simplicité algorithmique. Y.Weiss et al (NJW) [84] présentent cette dernière classe d’algorithmes (c.f. Algorithme 1) pour partitionner un ensemble de points S = {x1, ..., xN} ⊂ R p en k clusters où k est fixé. NJW justifient 9
Page 1: Institut National Polytechnique de
Page 4 and 5: ii TABLE DES MATIÈRES 2.5.1 Expér
Page 7 and 8: Table des figures 1.1 Illustration
Page 9: TABLE DES FIGURES vii 4.8 Etude ave
Page 13 and 14: Remerciements Je tiens tout d’abo
Page 15 and 16: Introduction Les domaines des biolo
Page 17 and 18: adéquates dans un cadre non superv
Page 19: Chapitre 1 : Classification spectra
Page 23 and 24: 1.1.1 Algorithme de classification
Page 25 and 26: 1.1.2 Problème du choix du paramè
Page 27 and 28: 1.1.2 Problème du choix du paramè
Page 29 and 30: 1.2.2 Cas d’une distribution isot
Page 31 and 32: 1.3 Validations numériques 19 1.3
Page 33 and 34: 1.3.1 Mesures de qualité 21 (a) Sm
Page 39 and 40: 1.4 Méthodes de classification spe
Page 41 and 42: 1.4.2 Traitement d’images 29 une
Page 43 and 44: 1.4.2 Traitement d’images 31 (a)
Page 45 and 46: Chapitre 2 Classification et élém
Page 47 and 48: 2.2 Présentation du résultat prin
Page 53 and 54: 2.3 Propriétés de classification
Page 55 and 56: 2.3.2 Classification via l’opéra
Page 65 and 66: 2.4.1 Eléments finis de Lagrange 5
Page 67 and 68: 2.4.2 Interprétation des élément
Page 69 and 70: 2.4.3 Propriété de classification
Page 71 and 72:
2.4.3 Propriété de classification
Page 73 and 74:
2.4.4 Condensation de masse 61 Le t
Page 75 and 76:
2.4.4 Condensation de masse 63 Eval
Page 77 and 78:
2.4.4 Condensation de masse 65 (a)
Page 79 and 80:
2.5.1 Expérimentations numériques
Page 81 and 82:
2.5.2 Choix du paramètre gaussien
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
2.5.3 Passage du discret au continu
Page 89 and 90:
2.5.4 Etape de normalisation 77 d
Page 91 and 92:
2.5.5 Cas limites de validité de l
Page 93:
2.5.5 Cas limites de validité de l
Page 96 and 97:
84 Parallélisation de la classific
Page 98 and 99:
Page 100 and 101:
Page 102 and 103:
Page 104 and 105:
Page 106 and 107:
Page 108 and 109:
Page 110 and 111:
Page 112 and 113:
100 Parallélisation de la classifi
Page 114 and 115:
Page 116 and 117:
Page 118 and 119:
Page 120 and 121:
Page 122 and 123:
Page 124 and 125:
Page 126 and 127:
Page 128 and 129:
Page 130 and 131:
Page 132 and 133:
120 Extraction de connaissances app
Page 134 and 135:
Page 136 and 137:
Page 138 and 139:
Page 140 and 141:
Page 142 and 143:
Page 144 and 145:
Page 146 and 147:
Page 148 and 149:
Page 150 and 151:
Page 152 and 153:
Page 154 and 155:
Page 156 and 157:
Page 158 and 159:
Page 160 and 161:
Page 162 and 163:
Page 164 and 165:
Page 167 and 168:
Conclusion et perspectives Dans ce
Page 169 and 170:
4.9.4 Comparaison avec la méthode
Page 171 and 172:
Bibliographie [1] P.D. Acton, L.S.
Page 173 and 174:
BIBLIOGRAPHIE 161 [37] M. Ester, H.
Page 175 and 176:
BIBLIOGRAPHIE 163 [75] R. Maroy, R.
Page 177:
BIBLIOGRAPHIE 165 [114] L. Yen, D.
show all

Contributions à l'étude de la classification spectrale et applications

Create successful ePaper yourself

Delete template?

Save as template?