28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

16 C<strong>la</strong>ssification <strong>spectrale</strong> : algorithme <strong>et</strong> étu<strong>de</strong> du paramètre<br />

correctement les points dans certains cas.<br />

Dans le cadre <strong>de</strong>s <strong>applications</strong> génomiques <strong>et</strong> d’imagerie médicale, on a affaire <strong>à</strong> <strong>de</strong> gran<strong>de</strong>s masses<br />

<strong>de</strong> données <strong>et</strong> nous ne disposons d’aucune information a priori sur les clusters. Donc le choix du paramètre<br />

σ ne doit pas être coûteux numériquement <strong>et</strong> doit fournir <strong>de</strong>s informations sur <strong>la</strong> distribution<br />

<strong>de</strong>s points. Une approche globale est donc envisagée pour définir une nouvelle heuristique.<br />

1.2 Heuristiques du paramètre<br />

A l’instar <strong>de</strong>s métho<strong>de</strong>s probabilistes [37], on souhaite intégrer dans <strong>la</strong> définition du paramètre<br />

σ <strong>à</strong> <strong>la</strong> fois <strong>la</strong> dimension du problème <strong>et</strong> <strong>la</strong> notion <strong>de</strong> <strong>de</strong>nsité <strong>de</strong> points dans l’ensemble <strong>de</strong>s données<br />

p-dimensionnelles. Pour gar<strong>de</strong>r l’efficacité <strong>de</strong> <strong>la</strong> métho<strong>de</strong>, une approche globale est privilégiée<br />

où le paramètre est fonction <strong>de</strong>s distances entre les points. Dans ce but, l’ensemble <strong>de</strong> points pdimensionnels<br />

est supposé suffisamment isotropique dans le sens où il n’existe pas <strong>de</strong> direction privilégiée<br />

avec <strong>de</strong> gran<strong>de</strong>s différences <strong>de</strong> gran<strong>de</strong>urs dans les distances entre <strong>de</strong>s points sur une direction.<br />

Deux distributions isotropiques avec diverses amplitu<strong>de</strong>s suivant les directions sont distinguées. Soit<br />

S = {xi, 1 ≤ i ≤ N} un tel ensemble <strong>de</strong> points <strong>et</strong><br />

Dmax = max<br />

1≤i,j≤N xi − xj2 ,<br />

<strong>la</strong> plus gran<strong>de</strong> distance entre toutes les paires <strong>de</strong> points dans S.<br />

1.2.1 Cas d’une distribution isotropique avec mêmes amplitu<strong>de</strong>s suivant chaque<br />

direction<br />

Figure 1.5 – Principe <strong>de</strong> l’heuristique (1.2) dans le cas 2D<br />

Heuristique 1.2. Soit un ensemble <strong>de</strong> points S = {xi, 1 ≤ i ≤ N} dont <strong>la</strong> distribution est isotropique.<br />

Les éléments <strong>de</strong> S sont inclus dans une boîte carrée <strong>de</strong> dimension p <strong>de</strong> côté Dmax =<br />

max<br />

1≤i,j≤N xi − xj2. Alors, on définit une distance référence, notée σ0, définie par :<br />

σ0 = Dmax<br />

N 1<br />

p<br />

(1.2)

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!