28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

4.2.2 Adaptation <strong>de</strong> <strong>la</strong> métho<strong>de</strong> Self Organizing Maps pour données temporelles<br />

d’expression <strong>de</strong> gènes 127<br />

<strong>la</strong> re<strong>la</strong>tion suivante :<br />

Donc le BMU, noté c, est défini par :<br />

s(xj, mc) = max<br />

k<br />

corr(xj, mi) =<br />

p−1<br />

(X<br />

i=1<br />

j<br />

i |M k i )<br />

X j<br />

i M k i .<br />

corr(xj, mk) = min<br />

k −corr(xj, mk). (4.2)<br />

L’avantage <strong>de</strong> c<strong>et</strong>te mesure <strong>de</strong> simi<strong>la</strong>rité est l’incorporation <strong>de</strong> l’information temporelle dans <strong>la</strong><br />

métho<strong>de</strong> <strong>de</strong> c<strong>la</strong>ssification.<br />

Mise <strong>à</strong> jour <strong>de</strong>s vecteurs poids<br />

Dans le cadre <strong>de</strong> notre problématique, on dispose d’un ensemble <strong>de</strong> données conséquent par<br />

rapport au nombre <strong>de</strong> profils (N >> p). Par conséquent, plusieurs centaines voire milliers <strong>de</strong> gènes<br />

seront associés <strong>à</strong> un neurone (N >> K). Ce<strong>la</strong> implique un réajustement <strong>de</strong> <strong>la</strong> fonction d’apprentissage<br />

α lors <strong>de</strong> <strong>la</strong> mise <strong>à</strong> jour <strong>de</strong>s vecteurs poids. Le poids associé <strong>à</strong> <strong>la</strong> différence d’amplitu<strong>de</strong> entre<br />

le vecteur <strong>de</strong> données <strong>et</strong> le vecteur poids le plus semb<strong>la</strong>ble doit être adapté aux données. Le rayon<br />

initial est, par conséquent, défini en fonction du nombre <strong>de</strong> données N, du nombre <strong>de</strong> neurones dans<br />

<strong>la</strong> grille K <strong>et</strong> <strong>de</strong> l’écart-type <strong>de</strong>s données noté σ :<br />

σ K<br />

α(0) =<br />

N .<br />

Dans le cadre <strong>de</strong> l’étu<strong>de</strong>, K = 3p−1 où p est le nombre d’instants considérés.<br />

L’algorithme adapté aux profils temporels d’expression <strong>de</strong> gène est décrit ci-<strong>de</strong>ssous.<br />

Algorithm 5 Algorithme SOM adapté <strong>à</strong> <strong>de</strong>s données temporelles<br />

1. t=1,<br />

2. arrêt=faux,<br />

3. Pour tout i = 1, .., K initialisation <strong>de</strong>s vecteurs poids par ba<strong>la</strong>yage <strong>de</strong>s profils.<br />

4. Répéter<br />

(a) Pour tout j = 1, .., N, i<strong>de</strong>ntifier le vecteur poids mc le plus semb<strong>la</strong>ble <strong>à</strong> xj, vérifiant :<br />

s(xj, mc) = min<br />

k −corr(xj, mk).<br />

(b) Pour tout j = 1, .., N, pour tout i = 1, .., K, mise <strong>à</strong> jour du vecteur poids mi :<br />

avec α(0) = σK<br />

N .<br />

(c) faire t=t+1<br />

(d) mise <strong>à</strong> jour (arrêt)<br />

5. Jusqu’<strong>à</strong> arrêt=vrai ⇔ t = L <strong>et</strong> t ≤ tmax<br />

mi(t + 1) = mi(t) + α(t)h(s(r i , r c ), ɛ)[xj(t) − mi(t)],<br />

Remarque 4.1. Ce cas d’étu<strong>de</strong> peut s’avérer complexe si le nombre d’instants augmente. En eff<strong>et</strong>,<br />

l’initialisation <strong>et</strong> le nombre <strong>de</strong> noeuds du mail<strong>la</strong>ge augmentent en puissance <strong>de</strong> 3 <strong>à</strong> mesure qu’on<br />

ajoute <strong>de</strong>s instants.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!