28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

2.2 Présentation du résultat principal 35<br />

2.2 Présentation du résultat principal<br />

On se propose <strong>de</strong> relier <strong>la</strong> c<strong>la</strong>ssification (ou clustering) d’un ensemble fini <strong>de</strong> points <strong>à</strong> une partition<br />

d’ouverts <strong>de</strong> l’espace R p .<br />

Définition 2.1 (Clustering).<br />

1. On dit qu’un ouvert Ω, réunion finie <strong>de</strong> composantes connexes Ωi, i = {1, .., k} distinctes,<br />

induit un k-clustering sur un ensemble fini <strong>de</strong> points P, si les intersections <strong>de</strong> P avec les Ωi,<br />

constituent une partition C = {C1, .., Ck} <strong>de</strong> P, c’est-<strong>à</strong>-dire que Cj = P ∩ Ωj = ∅, i = 1, .., k,<br />

Ci ∩ Cj = ∅ pour i = j <strong>et</strong> P = k<br />

i=1 Ci.<br />

2. Soit C = {C1, .., Ck} une partition donnée <strong>de</strong> l’ensemble fini <strong>de</strong> points <strong>de</strong> P. On dit qu’un ouvert<br />

Ω, réunion finie <strong>de</strong> composantes connexes Ωi, i = {1, .., k} distinctes, induit un k-clustering<br />

sur P compatible avec <strong>la</strong> partition donnée <strong>de</strong> P si l’ensemble <strong>de</strong>s Cj, j = {1, .., k} est i<strong>de</strong>ntique<br />

<strong>à</strong> l’ensemble <strong>de</strong>s P ∩ Ωi, i = 1, .., k.<br />

Si on considère l’exemple illustré dans <strong>la</strong> figure 2.1, dans lequel les quatre couronnes constituent<br />

<strong>la</strong> partition "naturelle" <strong>de</strong> l’ensemble <strong>de</strong>s points <strong>de</strong> R 2 donné, le cas (a) constitue un clustering<br />

compatible, les autres cas n’étant pas n’étant pas compatibles. Ce cas <strong>de</strong> clustering compatible sera<br />

aussi, dans <strong>la</strong> suite, appelé "clustering idéal".<br />

Remarque 2.2. En d’autres termes, le clustering partitionne suivant les composantes connexes.<br />

Les exemples (b)-(d) peuvent être définis comme suit. Soit C = {C1, .., Ck ′} un partitionnement <strong>de</strong><br />

l’ensemble P.<br />

– le sous clustering (cas (b) <strong>de</strong> <strong>la</strong> figure 2.1) définit le cas où :<br />

k ′ < k <strong>et</strong> ∀i = {1, .., k}, ∃j ∈ {1, .., k ′ }, Pi ⊂ Cj.<br />

– le sur-clustering (cas (c)) définit le cas où :<br />

k ′ > k <strong>et</strong> ∀j = {1, .., k ′ }, ∃i ∈ {1, .., k}, Cj ⊂ Pi;<br />

– un mauvais clustering (cas (d)) représente <strong>de</strong>s clusters dont les points appartiennent <strong>à</strong> plusieurs<br />

composantes connexes sans recouvrir <strong>de</strong> composante connexe entièrement.<br />

Considérons donc maintenant un ensemble fini <strong>de</strong> points P = k<br />

i=1 Pi <strong>et</strong> une partition en k<br />

c<strong>la</strong>sses disjointes 2 <strong>à</strong> 2 induisant un clustering compatible avec <strong>la</strong> partition donnée <strong>de</strong> P.<br />

Proposition 2.3. Supposons qu’il existe k vecteurs propres notés X1, .., Xk <strong>de</strong> <strong>la</strong> matrice A ∈<br />

MN,N(R) définie par (2.1) tels que : pour tout l ∈ {1, .., k} <strong>et</strong> pour tout i ∈ {1, .., N}<br />

<br />

= 0 si xi /∈ Pl,<br />

(Xl)i<br />

= 0 si xi ∈ Pl.<br />

Alors <strong>la</strong> partition C = {C1, .., Ck} issue <strong>de</strong> l’algorithme 2 du spectral clustering définit un clustering<br />

idéal.<br />

Démonstration. Supposons que les vecteurs propres X1, ..Xk <strong>de</strong> <strong>la</strong> matrice affinité A vérifient les<br />

hypothèses du théorème. Supposons que <strong>la</strong> partition C ne définisse pas un clustering idéal c’est-<strong>à</strong>-<br />

dire :<br />

∃j ∈ {1, .., k}, ∀i ∈ {1, .., k}, Cj = Pi ⇐⇒ ∃xi ∈ Pi, xj ∈ Pj avec Pi = Pj tels que<br />

<br />

xi ∈ Cm,<br />

xj ∈ Cm.<br />

Montrons d’abord, c<strong>et</strong>te équivalence. Supposons que Ω n’induise pas un k-clustering compatible.<br />

Supposons qu’il n’existe pas <strong>de</strong>ux points xi ∈ Pi, xj ∈ Pj appartenant au même cluster Cm. Alors

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!