28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

104 Parallélisation <strong>de</strong> <strong>la</strong> c<strong>la</strong>ssification <strong>spectrale</strong><br />

théorème 3.3 <strong>de</strong> sorte <strong>à</strong> définir le clustering sur les points S au sens du théorème 3.5. La difficulté<br />

est encore pour pouvoir appliquer le théorème 3.5 <strong>de</strong> satisfaire l’hypothèse que si ωk i ∩ ωl j = ∅ pour<br />

i ∈ [|1, q|] alors il existe un point x ∈ Sk i ∩ Sl j . Toutefois, le clustering est réalisé sur les points<br />

<strong>de</strong> manière <strong>à</strong> satisfaire<br />

<strong>de</strong> S <strong>et</strong> donc il existe une infinité <strong>de</strong> façon <strong>de</strong> définir <strong>de</strong>s pavés fermés C ′ k<br />

ˆSk = S∩Ck = S∩C ′ k . L’objectif <strong>de</strong> c<strong>et</strong>te partie est <strong>de</strong> définir un ensemble <strong>de</strong> pavés C′ k "convenables"<br />

pour k ∈ [|1, q|].<br />

Soient C1, .., Cq les q sous-domaines qui perm<strong>et</strong>tent le partitionnement géométrique <strong>de</strong> l’ensemble<br />

<strong>de</strong>s<br />

<br />

données S <strong>et</strong> γ représente l’épaisseur du recouvrement pour chaque pavé Cj. On rappelle que<br />

ωk i<br />

pour k ∈ [|1, q|]<br />

k=1..ni sont les clusters issus du pavé Ci. Soient maintenant les ensembles C ′ k<br />

construits <strong>de</strong> <strong>la</strong> manière suivante : on commence avec C ′ i = Ci pour i ∈ [|1, q|] puis on applique <strong>la</strong><br />

règle suivante représentée sur <strong>la</strong> figure3.6 (b),<br />

– si ωk i ∩ ωl j = ∅ <strong>et</strong> ωk i ∩ ωl j ∩ S = ∅ pour i = j alors on pose C′ i := C′ i \Γɛi où Γɛi = ωk i ∩ {x ∈<br />

Ω, d(x, ∂ωl j ) < ɛ} pour ɛ > 0 <strong>et</strong> tel que ɛ < dc <strong>et</strong> Γɛ i ∩ S = ∅. De même, on pose C′ j := C′ j \Γɛj pour un ɛ vérifiant les même hypothèses que précé<strong>de</strong>mment.<br />

Lemme 3.13. Les C ′ k pour k ∈ [|1, q|] vérifient les propriétés suivantes :<br />

1. C ′ k est fermé,<br />

2. Ω ⊂ <br />

k∈[|1,q|] C′ k ,<br />

3. C ′ k ∩ S = ˆ Sk.<br />

Démonstration. Même démonstration que pour le lemme 3.9.<br />

On note par (ω ′ ) k <br />

i<br />

forment un<br />

k=1..ni les clusters issus du pavé C′ i . Par le lemme 3.13, les C′ k<br />

ensemble <strong>de</strong> pavés "convenables" <strong>et</strong> donc par le théorème 3.3, perm<strong>et</strong>tent <strong>de</strong> r<strong>et</strong>rouver les ωk i<br />

obtient alors le résultat suivant.<br />

Théorème 3.14. Supposons que le clustering <strong>de</strong> S est idéal sur chaque Si, i ∈ [|1, q|] <strong>et</strong> que <strong>de</strong><br />

plus, γ > dc. Alors pour tout ¯ SA ∈ S/R S , il existe i ∈ {1, ..n} tel que Ωi ∩ S = <br />

S k i ∈ ¯ SA Sk i .<br />

Réciproquement, pour tout i ∈ {1, .., n}, il existe ¯ SA ∈ S/R S tel que <br />

S k i ∈ ¯ SA<br />

S k i = Ωi ∩ S.<br />

Démonstration. Il suffit <strong>de</strong> montrer que si (ω ′ ) k i ∩ (ω′ ) l j = ∅ pour i ∈ [|1, q|] alors il existe un point<br />

x ∈ Sk i ∩ Sl j , le résultat se déduira du théorème 3.5. Or par <strong>la</strong> définition <strong>de</strong>s C′ k <strong>et</strong> le lemme 3.13,<br />

= ∅.<br />

on a (ω ′ ) k i ∩ (ω′ ) l j ∩ S = ∅ implique (ω′ ) k i ∩ (ω′ ) l j<br />

Donc si, sur chaque sous-domaine, le clustering est idéal alors l’étape <strong>de</strong> regroupement <strong>de</strong> <strong>la</strong><br />

stratégie par interface perm<strong>et</strong> <strong>de</strong> reconstituer les clusters Ωi ∩ S via <strong>la</strong> re<strong>la</strong>tion d’équivalence R S .<br />

Choix du paramètre γ<br />

Dans c<strong>et</strong>te approche, l’ensemble <strong>de</strong>s points perm<strong>et</strong>tant <strong>de</strong> lier les clusters <strong>à</strong> support sur plusieurs<br />

pavés est inclus dans l’ensemble <strong>de</strong>s données <strong>de</strong> chaque sous-domaine. D’après le théorème 3.14,<br />

l’hypothèse γ > dc doit être satisfaite pour regrouper les clusters. Nous faisons l’hypothèse pour<br />

<strong>la</strong> définition <strong>de</strong>s composantes connexes Ωk qu’aucune d’entre elles ne peut être subdivisée en <strong>de</strong>ux<br />

ouverts recouvrant le même sous-ensemble <strong>de</strong> points <strong>de</strong> S <strong>et</strong> <strong>à</strong> distance supérieure <strong>à</strong> γ. La <strong>la</strong>rgeur<br />

<strong>de</strong> <strong>la</strong> ban<strong>de</strong> <strong>de</strong> recouvrement est donc <strong>la</strong> même que celle <strong>de</strong> l’interface dans <strong>la</strong> stratégie <strong>de</strong> spectral<br />

clustering avec intersection c’est-<strong>à</strong>-dire égale <strong>à</strong> 3σ où σ représente <strong>la</strong> distance <strong>de</strong> séparation entre les<br />

points dans le cas d’une distribution uniforme c’est-<strong>à</strong>-dire lorsque les points sont tous équidistants<br />

les uns <strong>de</strong>s autres. Un choix <strong>de</strong> γ = 3σ perm<strong>et</strong> donc a priori <strong>de</strong> pallier les diverses configurations<br />

possibles <strong>de</strong> distributions <strong>de</strong>s points par cluster.<br />

. On

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!