28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

122 Extraction <strong>de</strong> connaissances appliquée <strong>à</strong> <strong>la</strong> biologie <strong>et</strong> l’imagerie médicale<br />

Nature <strong>de</strong>s données<br />

Figure 4.2 – Root pathosystems in Medicago Truncatu<strong>la</strong><br />

Les puces <strong>à</strong> ADN perm<strong>et</strong>tent <strong>de</strong> mesurer le niveau d’expression re<strong>la</strong>tif <strong>de</strong> chaque gène dans<br />

un échantillon cellu<strong>la</strong>ire comparé <strong>à</strong> un contrôle <strong>de</strong> référence. Ici le contrôle <strong>de</strong> référence est <strong>la</strong><br />

cellule A17. La puce utilisée est une puce dédiée c’est-<strong>à</strong>-dire une puce où on étudie une partie<br />

précise <strong>et</strong> connue du génome. Les gènes considérés ont <strong>de</strong>s fonctions particulières dans l’exécution<br />

du programme cellu<strong>la</strong>ire <strong>et</strong> sont répertoriés sur le tableau 4.1. Les chiffres obtenus mesurent le<br />

niveau absolu d’expression <strong>de</strong>s gènes, exprimés en log10 (<strong>et</strong> en unités arbitraires). Les données ont<br />

été collectées dans huit expérimentations produit cartésien <strong>de</strong> l’ensemble <strong>de</strong>s lignées par celui <strong>de</strong>s<br />

temps puis normalisées (<strong>et</strong> exprimés en log10). On obtient donc une matrice <strong>de</strong> taille 2561 × 7 <strong>de</strong><br />

mesures répétées <strong>et</strong> <strong>de</strong>pendantes du temps.<br />

Une métho<strong>de</strong> connue pour ses <strong>applications</strong> dans le domaine <strong>de</strong> <strong>la</strong> bioinformatique [98, 99] est <strong>la</strong><br />

métho<strong>de</strong> <strong>à</strong> noyau cartes auto-organisatrices (ou Self Organizing Maps). Dans <strong>la</strong> suite, <strong>la</strong> métho<strong>de</strong><br />

SOM sera présentée <strong>et</strong> adaptée <strong>à</strong> <strong>de</strong>s profils temporels d’expression <strong>de</strong> gène. Puis nous testerons le<br />

spectral clustering dans le cadre <strong>de</strong> c<strong>et</strong>te problématique.<br />

4.2 Métho<strong>de</strong> Self Organizing Maps<br />

Après une présentation <strong>de</strong> <strong>la</strong> métho<strong>de</strong> Self Organizing Maps ou carte <strong>de</strong> Kohonen, les éléments<br />

<strong>de</strong> <strong>la</strong> métho<strong>de</strong> seront adaptés <strong>à</strong> <strong>la</strong> c<strong>la</strong>ssification <strong>de</strong> profils génomiques temporels. Ces données seront<br />

ensuite testées sur les espèces A17, F83 <strong>et</strong> sur l’expression gène <strong>à</strong> gène entre les espèces A17 <strong>et</strong> F83.<br />

4.2.1 Présentation <strong>de</strong> <strong>la</strong> métho<strong>de</strong> Self Organizing Maps<br />

Le "Self Organizing Maps" (SOM) est un <strong>de</strong>s modèles les plus connus dans les réseaux <strong>de</strong><br />

neurones [68, 69]. Il est basé sur une métho<strong>de</strong> <strong>de</strong> scaling multidimensionnel qui proj<strong>et</strong>te les données<br />

dans un espace <strong>de</strong> plus p<strong>et</strong>ite dimension. Un SOM est formé <strong>de</strong> neurones p<strong>la</strong>cés sur une grille<br />

d’une ou <strong>de</strong>ux dimensions. Les neurones <strong>de</strong> <strong>la</strong> carte sont connectés aux neurones adjacents par une<br />

re<strong>la</strong>tion <strong>de</strong> voisinage imposée par <strong>la</strong> structure <strong>de</strong> <strong>la</strong> carte. En général, <strong>la</strong> topologie <strong>de</strong> <strong>la</strong> carte est<br />

rectangu<strong>la</strong>ire ou hexagonale. Le nombre <strong>de</strong> neurones détermine <strong>la</strong> "granu<strong>la</strong>rité" <strong>de</strong> <strong>la</strong> carte ce qui<br />

affecte l’exactitu<strong>de</strong>, <strong>la</strong> précision <strong>et</strong> <strong>la</strong> capacité générale du SOM. On fixe les re<strong>la</strong>tions topologiques

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!