28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

128 Extraction <strong>de</strong> connaissances appliquée <strong>à</strong> <strong>la</strong> biologie <strong>et</strong> l’imagerie médicale<br />

4.2.3 Simu<strong>la</strong>tions<br />

On considère un ensemble composé <strong>de</strong> 2561 gènes. On dispose <strong>de</strong> données représentant l’expression<br />

(i.e le log-ratio d’expression) <strong>à</strong> trois instants différents (t0 = 0, t1 = 24, t2 = 48) <strong>de</strong> c<strong>et</strong><br />

ensemble <strong>de</strong> gènes pour <strong>de</strong>ux espèces différentes : l’espèce A17 <strong>et</strong> F83. Donc n = 2561 <strong>et</strong> p = 3.<br />

Soit xi ∈ R 3 (resp. y i ∈ R 3 ) l’expression <strong>de</strong> l’espèce A17 (resp. F83) du gène i. De plus, on<br />

définit, pour un gène i, i ∈ {1, .., 2561} l’expression <strong>de</strong> <strong>la</strong> différence entre les <strong>de</strong>ux espèces par<br />

(zi) = (xi − yi) ∈ R 3 . On utilise donc une grille rectangu<strong>la</strong>ire composée <strong>de</strong> 3 2 neurones. La fonction<br />

voisinage h(s(., .), ɛ) est <strong>la</strong> composée d’une gaussienne <strong>et</strong> d’une indicatrice. On restreint <strong>la</strong> mise <strong>à</strong><br />

jour <strong>de</strong>s vecteurs poids aux neurones adjacents au neurone c = arg min<br />

k −s(xj, m k ) i.e ɛ = 1 :<br />

∀j ∈ {1, .., K}, r j ∈ R 3 , h(s(r j , r c ), 1) = e −s(rj ,r c ) I{s(r j ,r c )≤1}<br />

La fonction d’apprentissage α est linéaire :<br />

1 − t<br />

α(t) = α0( ) avec α0 = 3p−1σ N<br />

tmax<br />

<strong>et</strong> σ l’écart-type <strong>de</strong>s données <strong>et</strong> tmax le nombre maximal d’itérations.<br />

La métho<strong>de</strong> SOM adaptée est appliquée <strong>à</strong> chacune <strong>de</strong> ces espèces puis sur <strong>la</strong> différence d’expression<br />

entre les <strong>de</strong>ux espèces. Pour chaque clusters, le vecteur poids après convergence <strong>de</strong> l’algorithme <strong>et</strong><br />

les centroïds <strong>de</strong>s gènes associés aux clusters sont représentés sur les figures 4.5, 4.6 <strong>et</strong> 4.7. Le nombre<br />

<strong>de</strong> gènes appartenant <strong>à</strong> chaque cluster est aussi indiqué sur les figures 4.5, 4.6 <strong>et</strong> 4.7.<br />

Figure 4.5 – Résultats pour l’espèce A17 (t en abscisse, niveau d’expression en ordonnée)

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!