Contributions à l'étude de la classification spectrale et applications


124 Extraction <strong>de</strong> connaissances appliquée <strong>à</strong> <strong>la</strong> biologie <strong>et</strong> l’imagerie médicale<br />

ses vecteurs données donc il doit être ajusté <strong>à</strong> chaque itération jusqu’<strong>à</strong> convergence <strong>de</strong> l’algorithme.<br />

Le neurone c = arg mink −s(xj, mk) <strong>et</strong> les neurones voisins <strong>à</strong> ɛ du neurone c sont mis <strong>à</strong> jour <strong>à</strong><br />

l’itération t <strong>à</strong> l’ai<strong>de</strong> du noyau <strong>de</strong> voisinage suivant :<br />

hci(t) = α(t)h(s(rc, ri), ɛ).<br />

Le noyau <strong>de</strong> voisinage est composé <strong>de</strong> <strong>de</strong>ux parties :<br />

– fonction <strong>de</strong> voisinage h(s(., .), ɛ) : seuls les voisins les plus proches sont mis <strong>à</strong> jours <strong>à</strong> l’itération<br />

t. En général h(s(., .), ɛ) est une fonction indicatrice, une gaussienne ou <strong>la</strong> composée d’une<br />

gaussienne <strong>et</strong> d’une indicatrice <strong>et</strong> le seuil <strong>de</strong> voisinage est défini par ɛ. Par exemple, pour une<br />

indicatrice : h(s(., .), ɛ) = I s(.,.)≤ɛ<br />

– fonction d’apprentissage α : sert <strong>de</strong> pondération ; il s’agit d’une fonction strictement décroissante<br />

en fonction <strong>de</strong>s itérations t, le rayon initial verifie : α0 = α(0) ∈ [0, 1].<br />

Le critère <strong>de</strong> convergence est défini par <strong>la</strong> différence, entre <strong>de</strong>ux itérations successives, <strong>de</strong> <strong>la</strong> mesure<br />

<strong>de</strong> simi<strong>la</strong>rité <strong>de</strong>s vecteurs <strong>de</strong> données avec leur vecteur représentant. Autrement dit,<br />

∃δ > 0,<br />

N<br />

K<br />

j=1 i=1<br />

I s(xj,mi(t))≤ɛ s(mi(t), xj) −<br />

N<br />

j=1 i=1<br />

K<br />

Is(xj,mi(t−1))≤ɛ s(mi(t − 1), xj) ≤ δ. (4.1)<br />

En cas <strong>de</strong> divergence, on fixe un nombre d’itération maximum noté tmax. On notera L l’itération<br />

vérifiant le critère <strong>de</strong> convergence l’équation (4.1).<br />

L’algorithme <strong>de</strong> c<strong>et</strong>te métho<strong>de</strong> est défini comme suit :<br />

Algorithm 4 Algorithme SOM général<br />

1. t=1,<br />

2. arrêt=faux.<br />

3. Pour tout i = 1, .., K initialisation <strong>de</strong>s vecteurs poids mi = [m1 i , .., mp<br />

i ]T .<br />

4. Répéter<br />

(a) Pour tout j = 1, .., N, i<strong>de</strong>ntifier le vecteur poids mc le plus semb<strong>la</strong>ble <strong>à</strong> xj, vérifiant :<br />

s(xj, mc) = min<br />

k −s(xj, mk).<br />

(b) Pour tout j = 1, .., N, pour tout i = 1, .., K, mise <strong>à</strong> jour du vecteur poids mi :<br />

(c) Faire t=t+1.<br />

(d) Mise <strong>à</strong> jour (arrêt).<br />

5. Jusqu’<strong>à</strong> arrêt=vrai ⇔ t = L <strong>et</strong> t ≤ tmax.<br />

Problèmes liés <strong>à</strong> c<strong>et</strong>te métho<strong>de</strong><br />

mi(t + 1) = mi(t) + α(t)h(s(r i , r c ), ɛ)[xj(t) − mi(t)].<br />

L’algorithme 4 impose <strong>la</strong> définition <strong>de</strong> certains paramètres :

