Contributions à l'étude de la classification spectrale et applications

More documents

Recommendations

Info

126 Extraction de connaissances appliquée à la biologie et l’imagerie médicale (a) Par ACP (b) Par balayage de profils Figure 4.3 – Initialisations de la méthode SOM (t en abscisse, niveau d’expression en ordonnée) Mesure de similarité Concernant notre problématique, l’utilisation d’une norme (l1, l2, l∞)) ne permet pas de distinguer certains types de profils : le fait de sommer (ou de prendre le maximum pour l∞)les amplitudes entre le vecteur de données et le vecteur poids sur tous les instants peut aboutir à une confusion des profils comme le montre la figure 4.4 : Figure 4.4 – Exemple de profils temporels différents mais de même norme (t en abscisse, niveau d’expression en ordonnée) Dans le cadre de profil temporel, la corrélation entre deux vecteurs x et y est plus adéquate comme mesure de similarité : corr(x, y) = xT y = cos(θ), xy où θ est l’angle formé par les vecteurs x et y. Plus cos(θ) est proche de 1, plus les vecteurs x et y sont colinéaires et décrivent le même profil. A chaque vecteur de données xj ∈ Rp ,j = 1, .., N, on associe p − 1 vecteurs de R2 définis par : X j i = [ti+1 − ti, x i+1 j − xij ]T , ∀i ∈ {1..p − 1}. De même, on associe à chaque vecteur poids mk ∈ Rp , k ∈ {1, .., 3p−1 }, p − 1 vecteurs de R2 définis par : mi k = [ti+1 − ti, m i+1 k − mi k ]T , ∀i ∈ {1..p − 1}. La corrélation entre un vecteur de données xj ∈ Rp et un vecteur poids mi ∈ Rp est définie par
4.2.2 Adaptation de la méthode Self Organizing Maps pour données temporelles d’expression de gènes 127 la relation suivante : Donc le BMU, noté c, est défini par : s(xj, mc) = max k corr(xj, mi) = p−1 (X i=1 j i |M k i ) X j i M k i . corr(xj, mk) = min k −corr(xj, mk). (4.2) L’avantage de cette mesure de similarité est l’incorporation de l’information temporelle dans la méthode de classification. Mise à jour des vecteurs poids Dans le cadre de notre problématique, on dispose d’un ensemble de données conséquent par rapport au nombre de profils (N >> p). Par conséquent, plusieurs centaines voire milliers de gènes seront associés à un neurone (N >> K). Cela implique un réajustement de la fonction d’apprentissage α lors de la mise à jour des vecteurs poids. Le poids associé à la différence d’amplitude entre le vecteur de données et le vecteur poids le plus semblable doit être adapté aux données. Le rayon initial est, par conséquent, défini en fonction du nombre de données N, du nombre de neurones dans la grille K et de l’écart-type des données noté σ : σ K α(0) = N . Dans le cadre de l’étude, K = 3p−1 où p est le nombre d’instants considérés. L’algorithme adapté aux profils temporels d’expression de gène est décrit ci-dessous. Algorithm 5 Algorithme SOM adapté à des données temporelles 1. t=1, 2. arrêt=faux, 3. Pour tout i = 1, .., K initialisation des vecteurs poids par balayage des profils. 4. Répéter (a) Pour tout j = 1, .., N, identifier le vecteur poids mc le plus semblable à xj, vérifiant : s(xj, mc) = min k −corr(xj, mk). (b) Pour tout j = 1, .., N, pour tout i = 1, .., K, mise à jour du vecteur poids mi : avec α(0) = σK N . (c) faire t=t+1 (d) mise à jour (arrêt) 5. Jusqu’à arrêt=vrai ⇔ t = L et t ≤ tmax mi(t + 1) = mi(t) + α(t)h(s(r i , r c ), ɛ)[xj(t) − mi(t)], Remarque 4.1. Ce cas d’étude peut s’avérer complexe si le nombre d’instants augmente. En effet, l’initialisation et le nombre de noeuds du maillage augmentent en puissance de 3 à mesure qu’on ajoute des instants.
Page 1:
Institut National Polytechnique de
Page 4 and 5:
ii TABLE DES MATIÈRES 2.5.1 Expér
Page 7 and 8:
Table des figures 1.1 Illustration
Page 9:
TABLE DES FIGURES vii 4.8 Etude ave
Page 13 and 14:
Remerciements Je tiens tout d’abo
Page 15 and 16:
Introduction Les domaines des biolo
Page 17 and 18:
adéquates dans un cadre non superv
Page 19 and 20:
Chapitre 1 : Classification spectra
Page 21 and 22:
Chapitre 1 Classification spectrale
Page 23 and 24:
1.1.1 Algorithme de classification
Page 25 and 26:
1.1.2 Problème du choix du paramè
Page 27 and 28:
1.1.2 Problème du choix du paramè
Page 29 and 30:
1.2.2 Cas d’une distribution isot
Page 31 and 32:
1.3 Validations numériques 19 1.3
Page 33 and 34:
1.3.1 Mesures de qualité 21 (a) Sm
Page 35 and 36:
Page 37 and 38:
Page 39 and 40:
1.4 Méthodes de classification spe
Page 41 and 42:
1.4.2 Traitement d’images 29 une
Page 43 and 44:
1.4.2 Traitement d’images 31 (a)
Page 45 and 46:
Chapitre 2 Classification et élém
Page 47 and 48:
2.2 Présentation du résultat prin
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
2.3 Propriétés de classification
Page 55 and 56:
2.3.2 Classification via l’opéra
Page 57 and 58:
Page 59 and 60:
Page 61 and 62:
Page 63 and 64:
Page 65 and 66:
2.4.1 Eléments finis de Lagrange 5
Page 67 and 68:
2.4.2 Interprétation des élément
Page 69 and 70:
2.4.3 Propriété de classification
Page 71 and 72:
2.4.3 Propriété de classification
Page 73 and 74:
2.4.4 Condensation de masse 61 Le t
Page 75 and 76:
2.4.4 Condensation de masse 63 Eval
Page 77 and 78:
2.4.4 Condensation de masse 65 (a)
Page 79 and 80:
2.5.1 Expérimentations numériques
Page 81 and 82:
2.5.2 Choix du paramètre gaussien
Page 83 and 84:
Page 85 and 86:
Page 87 and 88: 2.5.3 Passage du discret au continu
Page 89 and 90: 2.5.4 Etape de normalisation 77 d
Page 91 and 92: 2.5.5 Cas limites de validité de l
Page 93: 2.5.5 Cas limites de validité de l
Page 96 and 97: 84 Parallélisation de la classific
Page 112 and 113: 100 Parallélisation de la classifi
Page 132 and 133: 120 Extraction de connaissances app
Page 167 and 168: Conclusion et perspectives Dans ce
Page 169 and 170: 4.9.4 Comparaison avec la méthode
Page 171 and 172: Bibliographie [1] P.D. Acton, L.S.
Page 173 and 174: BIBLIOGRAPHIE 161 [37] M. Ester, H.
Page 175 and 176: BIBLIOGRAPHIE 163 [75] R. Maroy, R.
Page 177: BIBLIOGRAPHIE 165 [114] L. Yen, D.
show all

Contributions à l'étude de la classification spectrale et applications

Create successful ePaper yourself

Delete template?

Save as template?