Contributions à l'étude de la classification spectrale et applications
Contributions à l'étude de la classification spectrale et applications
Contributions à l'étude de la classification spectrale et applications
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
4.2.2 Adaptation <strong>de</strong> <strong>la</strong> métho<strong>de</strong> Self Organizing Maps pour données temporelles<br />
d’expression <strong>de</strong> gènes 127<br />
<strong>la</strong> re<strong>la</strong>tion suivante :<br />
Donc le BMU, noté c, est défini par :<br />
s(xj, mc) = max<br />
k<br />
corr(xj, mi) =<br />
p−1<br />
(X<br />
i=1<br />
j<br />
i |M k i )<br />
X j<br />
i M k i .<br />
corr(xj, mk) = min<br />
k −corr(xj, mk). (4.2)<br />
L’avantage <strong>de</strong> c<strong>et</strong>te mesure <strong>de</strong> simi<strong>la</strong>rité est l’incorporation <strong>de</strong> l’information temporelle dans <strong>la</strong><br />
métho<strong>de</strong> <strong>de</strong> c<strong>la</strong>ssification.<br />
Mise <strong>à</strong> jour <strong>de</strong>s vecteurs poids<br />
Dans le cadre <strong>de</strong> notre problématique, on dispose d’un ensemble <strong>de</strong> données conséquent par<br />
rapport au nombre <strong>de</strong> profils (N >> p). Par conséquent, plusieurs centaines voire milliers <strong>de</strong> gènes<br />
seront associés <strong>à</strong> un neurone (N >> K). Ce<strong>la</strong> implique un réajustement <strong>de</strong> <strong>la</strong> fonction d’apprentissage<br />
α lors <strong>de</strong> <strong>la</strong> mise <strong>à</strong> jour <strong>de</strong>s vecteurs poids. Le poids associé <strong>à</strong> <strong>la</strong> différence d’amplitu<strong>de</strong> entre<br />
le vecteur <strong>de</strong> données <strong>et</strong> le vecteur poids le plus semb<strong>la</strong>ble doit être adapté aux données. Le rayon<br />
initial est, par conséquent, défini en fonction du nombre <strong>de</strong> données N, du nombre <strong>de</strong> neurones dans<br />
<strong>la</strong> grille K <strong>et</strong> <strong>de</strong> l’écart-type <strong>de</strong>s données noté σ :<br />
σ K<br />
α(0) =<br />
N .<br />
Dans le cadre <strong>de</strong> l’étu<strong>de</strong>, K = 3p−1 où p est le nombre d’instants considérés.<br />
L’algorithme adapté aux profils temporels d’expression <strong>de</strong> gène est décrit ci-<strong>de</strong>ssous.<br />
Algorithm 5 Algorithme SOM adapté <strong>à</strong> <strong>de</strong>s données temporelles<br />
1. t=1,<br />
2. arrêt=faux,<br />
3. Pour tout i = 1, .., K initialisation <strong>de</strong>s vecteurs poids par ba<strong>la</strong>yage <strong>de</strong>s profils.<br />
4. Répéter<br />
(a) Pour tout j = 1, .., N, i<strong>de</strong>ntifier le vecteur poids mc le plus semb<strong>la</strong>ble <strong>à</strong> xj, vérifiant :<br />
s(xj, mc) = min<br />
k −corr(xj, mk).<br />
(b) Pour tout j = 1, .., N, pour tout i = 1, .., K, mise <strong>à</strong> jour du vecteur poids mi :<br />
avec α(0) = σK<br />
N .<br />
(c) faire t=t+1<br />
(d) mise <strong>à</strong> jour (arrêt)<br />
5. Jusqu’<strong>à</strong> arrêt=vrai ⇔ t = L <strong>et</strong> t ≤ tmax<br />
mi(t + 1) = mi(t) + α(t)h(s(r i , r c ), ɛ)[xj(t) − mi(t)],<br />
Remarque 4.1. Ce cas d’étu<strong>de</strong> peut s’avérer complexe si le nombre d’instants augmente. En eff<strong>et</strong>,<br />
l’initialisation <strong>et</strong> le nombre <strong>de</strong> noeuds du mail<strong>la</strong>ge augmentent en puissance <strong>de</strong> 3 <strong>à</strong> mesure qu’on<br />
ajoute <strong>de</strong>s instants.