28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

3.2.3 Expérimentations parallèles 95<br />

On note par (ω ′ ) k <br />

i k=1..ni les clusters issus du pavé C′ i . Par le lemme 3.9, les C′ k<br />

forment un<br />

ensemble <strong>de</strong> pavés "convenables" <strong>et</strong> donc par le théorème 3.3, perm<strong>et</strong>tent <strong>de</strong> r<strong>et</strong>rouver les ω k i .<br />

Théorème 3.10. Supposons que <strong>la</strong> c<strong>la</strong>ssification <strong>de</strong> S est idéale sur chaque Si, i ∈ [|1, q + 1|] <strong>et</strong><br />

que <strong>de</strong> plus, γ > dc. Alors pour tout ¯ SA ∈ S/R S , il existe i ∈ {1, ..n} tel que Ωi ∩ S = <br />

S k i ∈ ¯ SA Sk i .<br />

Réciproquement, pour tout i ∈ {1, .., n}, il existe ¯ SA ∈ S/R S tel que <br />

Démonstration. Il suffit <strong>de</strong> montrer que (ω ′ ) k i ∩ (ω′ ) l j<br />

S k i ∈ ¯ SA<br />

S k i = Ωi ∩ S.<br />

= ∅ pour i ∈ [|1, q|] alors il existe un point<br />

<strong>et</strong> le lemme 3.9, on<br />

x ∈ Sk i ∩ Sl j , le résultat se déduira du théorème 3.5. Or par <strong>la</strong> définition <strong>de</strong>s C′ k<br />

a (ω ′ ) k i ∩ (ω′ ) l j ∩ S = ∅ implique (ω′ ) k i ∩ (ω′ ) l j = ∅.<br />

Donc, si sur chaque sous-domaine <strong>la</strong> c<strong>la</strong>ssification est idéale, alors l’étape <strong>de</strong> regroupement <strong>de</strong><br />

<strong>la</strong> stratégie par interface perm<strong>et</strong> <strong>de</strong> reconstituer les clusters Ωi ∩ S via <strong>la</strong> re<strong>la</strong>tion d’équivalence R S .<br />

Choix du paramètre γ<br />

Pour regrouper <strong>de</strong>s clusters <strong>à</strong> support sur plusieurs pavés, il faut vérifier γ > dc d’après le<br />

théorème 3.10 où dc représente le maximum <strong>de</strong> <strong>la</strong> distance minimale entre un point xj <strong>et</strong> son plus<br />

proche voisin sur un sous-domaine différent mais au sein <strong>de</strong> <strong>la</strong> même composante connexe. Par<br />

définition <strong>de</strong> l’ensemble <strong>de</strong>s points correspondant <strong>à</strong> l’interface, <strong>la</strong> <strong>la</strong>rgeur <strong>de</strong> <strong>la</strong> ban<strong>de</strong> γ est fixée<br />

<strong>à</strong> 3σ où σ représente <strong>la</strong> distance <strong>de</strong> référence dans le cas d’une distribution uniforme c’est-<strong>à</strong>-dire<br />

lorsque les points sont supposés tous équidistants les uns <strong>de</strong>s autres. Nous faisons l’hypothèse pour<br />

<strong>la</strong> définition <strong>de</strong>s composantes connexes Ωk qu’aucune d’entre elles ne peut être subdivisée en <strong>de</strong>ux<br />

ouverts recouvrant le même sous-ensemble <strong>de</strong> points <strong>de</strong> S <strong>et</strong> <strong>à</strong> distance supérieure <strong>à</strong> γ. Avec c<strong>et</strong>te<br />

valeur γ = 3σ, <strong>de</strong>s composantes connexes <strong>à</strong> support sur plusieurs sous-domaines ont nécessairement<br />

<strong>de</strong>s points dans <strong>la</strong> zone d’intersection. Par conséquent, pour une distribution donnée, trois différentes<br />

configurations concernant <strong>la</strong> <strong>de</strong>nsité <strong>de</strong> clusters sont envisagées :<br />

– si les clusters sont compacts alors <strong>la</strong> distance entre les points d’un même clusters est strictement<br />

inférieure <strong>à</strong> <strong>la</strong> distance σ,<br />

– si les clusters sont tous <strong>de</strong> faible <strong>de</strong>nsité alors <strong>la</strong> distance entre les points d’un même cluster<br />

est <strong>de</strong> l’ordre <strong>de</strong> σ,<br />

– si un cluster a une <strong>de</strong>nsité variable avec <strong>de</strong>s zones plus <strong>de</strong>nses que d’autres alors d’après<br />

l’hypothèse <strong>la</strong> séparation entre les zones con<strong>de</strong>nsées <strong>et</strong> moins con<strong>de</strong>nsées est inférieure <strong>à</strong> <strong>la</strong><br />

séparation entre <strong>de</strong>ux clusters <strong>et</strong> donc inférieure <strong>à</strong> 3σ.<br />

Donc c<strong>et</strong>te heuristique pour le choix γ = 3σ convient dans tous ces cas <strong>et</strong> satisfait l’inégalité γ > dc<br />

du théorème 3.10.<br />

3.2.3 Expérimentations parallèles<br />

La métho<strong>de</strong> <strong>de</strong> spectral clustering parallèle doit être testée sur <strong>de</strong>s exemples <strong>de</strong> gran<strong>de</strong> taille<br />

représentant <strong>de</strong>s cas <strong>de</strong> clustering non triviaux. Pour ce<strong>la</strong>, <strong>de</strong>ux exemples géométriques 3D issus<br />

d’un mail<strong>la</strong>ge <strong>de</strong> De<strong>la</strong>unay où les données par processeurs sont respectivement équilibrées <strong>et</strong> non<br />

équilibrés sont considérés. Ainsi, en raffinant le mail<strong>la</strong>ge, le comportement <strong>de</strong> <strong>la</strong> stratégie parallèle<br />

sera étudié au fur <strong>et</strong> <strong>à</strong> mesure. Les expérimentations numériques sont réalisées sur le supercalcu<strong>la</strong>teur<br />

Hyperion 1 du CICT (Centre Inter-universitaire <strong>de</strong> Calcul <strong>de</strong> Toulouse). Avec ses 352 noeuds<br />

1. http ://www.calmip.cict.fr/spip/spip.php ?rubrique90

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!