28.06.2013 Views

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

Contributions à l'étude de la classification spectrale et applications

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

132 Extraction <strong>de</strong> connaissances appliquée <strong>à</strong> <strong>la</strong> biologie <strong>et</strong> l’imagerie médicale<br />

d’inhibition suivi <strong>de</strong> répression. La distribution <strong>de</strong>s points dans R 3 étant compacte, seuls les points<br />

extérieurs <strong>à</strong> ce nuage <strong>de</strong> points c’est-<strong>à</strong>-dire les gènes aux amplitu<strong>de</strong>s <strong>et</strong> suj<strong>et</strong>s <strong>à</strong> <strong>de</strong> fortes réactions<br />

<strong>de</strong> répression <strong>et</strong>/ou d’inhibition sont considérés comme clusters. De plus, étant donné que l’objectif<br />

est <strong>de</strong> distinguer le profil sans faire intervenir l’amplitu<strong>de</strong> <strong>de</strong>s valeurs <strong>de</strong>s log-ratios d’expressions <strong>de</strong><br />

gènes, une normalisation <strong>de</strong>s données peut être envisagée. Ainsi <strong>la</strong> distribution <strong>de</strong>s points est plongée<br />

dans une sphère unité où les coordonnées représentent <strong>la</strong> pondération, l’évolution, par rapport au<br />

temps du niveau d’expression du gène <strong>de</strong> l’espèce envisagé. La figure 4.9 regroupe donc le nuage <strong>de</strong><br />

points, le ratio η fonction <strong>de</strong> k <strong>et</strong> le résultat du spectral clustering pour le <strong>de</strong>uxième minimum local<br />

<strong>de</strong> η c’est-<strong>à</strong>-dire pour k = 11 clusters.<br />

Pour juger <strong>et</strong> comparer les résultats <strong>de</strong> <strong>la</strong> métho<strong>de</strong> <strong>de</strong> spectral clustering, nous comparons les<br />

profils <strong>de</strong>s gènes associés <strong>à</strong> un même cluster <strong>à</strong> ceux <strong>de</strong> <strong>la</strong> métho<strong>de</strong> SOM. Pour l’espèce A17, le<br />

cluster regroupant le plus <strong>de</strong> gènes correspond <strong>à</strong> un profil en moyenne constante ce qui est conforme<br />

aux résultats avec les SOM <strong>et</strong> les observations <strong>de</strong>s manipu<strong>la</strong>teurs. Cependant il y a une différence<br />

<strong>de</strong> 418 gènes avec <strong>la</strong> métho<strong>de</strong> SOM : les gènes supplémentaires inclus dans ce cluster <strong>et</strong> les gènes<br />

associés au cluster 1 présentent un profil invariant soit sur [t0, t1] ou bien sur [t1, t2] <strong>et</strong> <strong>de</strong> faibles<br />

amplitu<strong>de</strong>s sur le complémentaire. Les autres clusters représentent <strong>de</strong>s profils marqués d’inhibition<br />

<strong>et</strong>/ou <strong>de</strong> répression.<br />

Etu<strong>de</strong> <strong>de</strong> l’espèce F83<br />

L’étu<strong>de</strong> avec les données brutes <strong>de</strong> l’espèce F83 aboutit <strong>à</strong> considérer seulement 4 clusters dont 3<br />

regroupent 5% <strong>de</strong>s gènes. Les données normalisées sont donc, <strong>à</strong> nouveau, considérées. Et on procè<strong>de</strong><br />

<strong>de</strong> façon simi<strong>la</strong>ire pour déterminer le nombre <strong>de</strong> clusters puis effectuer l’étu<strong>de</strong> <strong>de</strong> <strong>la</strong> qualité du<br />

clustering. On observe que le minimum est atteint pour <strong>la</strong> valeur k = 19 clusters. Pour l’espèce F83,<br />

les différences entre <strong>la</strong> métho<strong>de</strong> SOM <strong>et</strong> <strong>la</strong> métho<strong>de</strong> <strong>de</strong> Spectral Clustering sont moins notables. Le<br />

cluster associé au profil constant/invariant possè<strong>de</strong> quasiment les mêmes gènes. De plus, <strong>de</strong> nouveaux<br />

profils apparaissent comme ceux <strong>de</strong>s clusters 3, 10, 12, 13 <strong>et</strong> 16. Plusieurs clusters représentent<br />

le même profil mais avec <strong>de</strong>s amplitu<strong>de</strong>s différentes. Pour c<strong>et</strong>te espèce, <strong>la</strong> métho<strong>de</strong> <strong>de</strong> spectral<br />

clustering partitionne les données par profil <strong>et</strong> amplitu<strong>de</strong>. En eff<strong>et</strong>, pour l’espèce mutante, les écartstype<br />

ont augmenté respectivement <strong>de</strong> 35%, 14.5% <strong>et</strong> 20% suivant les instants {t0, t1, t2} par rapport<br />

<strong>à</strong> l’espèce A17 <strong>et</strong> les moyennes ont augmenté respectivement <strong>de</strong> 50%, 20% <strong>et</strong> 43%. On distingue<br />

donc <strong>de</strong>s réactions d’inhibition <strong>et</strong>/ou <strong>de</strong> répression marquées dans l’amplitu<strong>de</strong>. Ces <strong>de</strong>rniers forment,<br />

après normalisation <strong>de</strong>s données, <strong>de</strong>s clusters compacts, déterminés ensuite par le spectral clustering.<br />

Donc par rapport aux résultats avec l’espèce A17, les résultats du spectral clustering sont plus<br />

satisfaisants.<br />

Etu<strong>de</strong> <strong>de</strong> <strong>la</strong> différence entre les espèces A17 <strong>et</strong> F83<br />

On considère maintenant <strong>la</strong> différence normalisée, gène <strong>à</strong> gène, <strong>de</strong>s log-ratios d’expressions entre<br />

les espèces A17 <strong>et</strong> F83. En comparaison avec les résultats <strong>de</strong> <strong>la</strong> métho<strong>de</strong> SOM, le profil invariant<br />

contient approximativement le même nombre <strong>de</strong> gènes <strong>et</strong> 8 profils différents sont recensés. Le<br />

nombre <strong>de</strong> gènes associé <strong>à</strong> un même profil est du même ordre <strong>de</strong> gran<strong>de</strong>ur entre les <strong>de</strong>ux métho<strong>de</strong>s.<br />

A nouveau, <strong>de</strong>s clusters ayant le même profils mais d’amplitu<strong>de</strong>s différentes sont dissociés par c<strong>et</strong>te<br />

métho<strong>de</strong>.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!