28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

64 C<strong>la</strong>ssification <strong>et</strong> éléments spectraux <strong>de</strong> <strong>la</strong> matrice affinité gaussienne<br />

Le résidu ψ du résultat principal (section 2.1.1) est fonction <strong>de</strong> <strong>la</strong> distance δ, du pas <strong>de</strong> discrétisation<br />

h <strong>et</strong> du paramètre du noyau Gaussien t qui doit satisfaire l’équation (2.20). Pour finir l’interprétation<br />

du spectral clustering non normalisé, il faut revenir aux vecteurs propres <strong>de</strong> <strong>la</strong> matrice<br />

affinité A, autrement dit, "supprimer" <strong>la</strong> matrice M dans l’équation (2.45). Or M est une matrice<br />

diagonale mais si on avait M = aIn alors le résultat serait immédiat. Le ieme élément <strong>de</strong> M est donné<br />

par : Mi,i = supp(φi)/(p + 1). Deman<strong>de</strong>r <strong>à</strong> avoir M ≈ aIN revient <strong>à</strong> avoir |supp(φi)| ≈ |supp(φj)|,<br />

pour tout (i, j). Ce qui revient encore <strong>à</strong> <strong>de</strong>man<strong>de</strong>r plus <strong>de</strong> régu<strong>la</strong>rité sur le mail<strong>la</strong>ge. En notant Φ <strong>la</strong><br />

moyenne <strong>de</strong>s tailles sur tous les supports <strong>de</strong> φj, ce<strong>la</strong> revient finalement <strong>à</strong> avoir <strong>la</strong> re<strong>la</strong>tion suivante<br />

pour tout j<br />

|supp(φj)| − Φ<br />

→ 0 quand h → 0.<br />

Φ<br />

Avec l’hypothèse <strong>de</strong> régu<strong>la</strong>rité définie dans <strong>la</strong> proposition 2.42, on avait, pour tout j : |supp(φj)| ≈<br />

Cjh p . Ces <strong>de</strong>ux hypothèses ensembles, le support <strong>de</strong> φj vérifie donc :<br />

|supp(φj)| = C0h p + O(h p+1 ). (2.48)<br />

Avec c<strong>et</strong>te <strong>de</strong>rnière hypothèse <strong>de</strong> régu<strong>la</strong>rité du mail<strong>la</strong>ge, <strong>la</strong> matrice M est remp<strong>la</strong>cée par une matrice<br />

homogène <strong>à</strong> une matrice i<strong>de</strong>ntité <strong>et</strong> <strong>la</strong> propriété <strong>de</strong> clustering peut être énoncée avec uniquement <strong>la</strong><br />

matrice affinité A comme suit.<br />

Proposition 2.44. Supposons que les supports <strong>de</strong>s fonctions φj pour tout j vérifient l’équation<br />

(2.48). Soient les Wn,i définis par <strong>la</strong> proposition 2.36. Alors pour t > 0 on a :<br />

(4πt) −p<br />

2 C0h p (A + IN) Wn,i = e −λn,it<br />

<br />

Wn,i + O t, h 2 , hp+1<br />

,<br />

t<br />

h3p+2<br />

t2 où quand (h, t) → 0 avec h 3p+2 /t 2 → 0, h p+1 /t → 0 <strong>et</strong> δ → 0.<br />

<br />

(2.49)<br />

Démonstration. D’après l’hypothèse (2.48) <strong>et</strong> <strong>la</strong> définition (2.43) <strong>de</strong>s éléments <strong>de</strong> M, le résultat est<br />

immédiat.<br />

Avec une con<strong>de</strong>nsation <strong>de</strong> masse <strong>et</strong> une hypothèse d’homogénéité <strong>de</strong> mail<strong>la</strong>ge, <strong>la</strong> propriété <strong>de</strong><br />

spectral clustering est maintenant ramenée sur <strong>la</strong> matrice affinité A. On a donc montré que sous<br />

plusieurs hypothèses sur le paramètre t (ou σ) <strong>et</strong> une isotropie <strong>de</strong> <strong>la</strong> distribution, les vecteurs propres<br />

issus <strong>de</strong> <strong>la</strong> matrice affinité sont proches <strong>de</strong>s ceux <strong>de</strong> l’opérateur <strong>de</strong> <strong>la</strong> chaleur discrétisé avec conditions<br />

<strong>de</strong> Dirichl<strong>et</strong>. En eff<strong>et</strong>, lorsque t/h 2 → 0, les vecteurs propres associés <strong>à</strong> <strong>de</strong>s valeurs propres<br />

proches <strong>de</strong> 0 correspon<strong>de</strong>nt aux fonctions propres discrétisées. Ainsi, les données proj<strong>et</strong>ées dans<br />

l’espace spectral sont concentrées par c<strong>la</strong>sses <strong>et</strong> séparées.<br />

Les images <strong>de</strong> <strong>la</strong> figure 2.9 illustrent le produit entre <strong>la</strong> matrice affinité A <strong>et</strong> les fonctions propres<br />

discrétisées V1,i, i ∈ {1, 2}. De <strong>la</strong> même façon, <strong>la</strong> figure suivante représente les vecteurs propres <strong>de</strong><br />

<strong>la</strong> matrice A qui sont le plus semb<strong>la</strong>ble respectivement <strong>de</strong> <strong>la</strong> fonction propre discrétisée V1,1 <strong>et</strong><br />

V1,2 pour <strong>la</strong> valeur t = th où th représente l’heuristique (1.2) développée dans le chapitre 1 tel que<br />

th = σh<br />

4<br />

Dmax<br />

=<br />

8N 1 .<br />

p<br />

Pour terminer, on peut alors donner le résultat <strong>de</strong> clustering sur <strong>la</strong> matrice A.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!