24.06.2013 Views

Traitement automatique du signal ECG pour l'aide au diagnostic de ...

Traitement automatique du signal ECG pour l'aide au diagnostic de ...

Traitement automatique du signal ECG pour l'aide au diagnostic de ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

CHAPITRE 3. EFFET DU SOUS-ÉCHANTILLONNAGE 25<br />

les k-means. On obtient k centroï<strong>de</strong>s R = {r1, ...rK} qui ne sont pas forcement<br />

(quasi jamais) <strong>de</strong>s données initiales. Pour obtenir un ensemble <strong>de</strong> k nouve<strong>au</strong>x<br />

centroï<strong>de</strong>s Q = {q1, ..., qK} avec Q ⊂ R, une <strong>de</strong>rnière étape est ajoutée : on<br />

remplace chaque ancien centroï<strong>de</strong> ri par la donnée <strong>de</strong> départ pj la plus proche<br />

(<strong>au</strong> sens <strong>de</strong> la même métrique que celle utilisée <strong>pour</strong> les k-means). On obtient<br />

alors les centroï<strong>de</strong>s fin<strong>au</strong>x Q. Si l’on désire en plus savoir quelle donnée <strong>de</strong> départ<br />

est allouée à quel centroï<strong>de</strong>, on peut le déterminer en utilisant la règle <strong>du</strong> plus<br />

proche voisin. Dans le reste <strong>de</strong> ce mémoire, on appellera <strong>au</strong>ssi cette manœuvre<br />

« recentrage ». L’avantage <strong>de</strong> cette technique est d’être be<strong>au</strong>coup plus rapi<strong>de</strong> que<br />

les j-means.<br />

3.1.4 Sélection <strong>de</strong> caractéristiques<br />

Pas moins <strong>de</strong> 249 caractéristiques composent l’ensemble d’apprentissage,<br />

parmi celles-ci, seules quelques-unes doivent être gardées <strong>pour</strong> éviter le surapprentissage.<br />

La sélection <strong>de</strong> caractéristiques est un problème complexe dont<br />

la portée dépasse <strong>de</strong> loin le cadre <strong>de</strong> ce mémoire, cependant plusieurs possibilités<br />

ont été envisagées, en tenant compte <strong>du</strong> fait que la complexité <strong>de</strong>vait rester<br />

acceptable <strong>pour</strong> obtenir <strong>de</strong>s temps <strong>de</strong> calcul raisonnables.<br />

Analyse en Composante Principale :<br />

L’ACP (PCA en anglais) ré<strong>du</strong>it le nombre <strong>de</strong> caractéristiques <strong>de</strong>s données<br />

en créant <strong>de</strong> nouvelles caractéristiques par projection <strong>de</strong>s données sur <strong>de</strong>s axes<br />

minimisant la perte <strong>de</strong> variance. Cette technique est souvent utilisée mais est<br />

non-supervisée : <strong>de</strong> nombreuses caractéristiques étant non pertinentes, cela ré<strong>du</strong>irait<br />

les performances <strong>du</strong> classifieur.<br />

Approche forward :<br />

La procé<strong>du</strong>re forward est un algorithme itératif servant à la recherche <strong>de</strong><br />

sous-ensembles <strong>de</strong> variables optimales. Il démarre avec un ensemble vi<strong>de</strong>, et<br />

ajoute dans cet ensemble, à chaque itération, la variable qui <strong>au</strong>gmente le plus<br />

les performances <strong>du</strong> classifieur. L’algorithme s’arrête quand <strong>au</strong>cune variable ne<br />

permet plus d’<strong>au</strong>gmenter les performances [26].<br />

Validation croisée inter-patient<br />

La plupart <strong>de</strong>s métho<strong>de</strong>s <strong>de</strong> classification <strong>de</strong>s battements cardiaques suivent<br />

un paradigme « intra-patient » : les données d’apprentissage et celles à classifier<br />

sont issues <strong>du</strong> même patient. Cela présuppose que <strong>de</strong>s battements annotés sont<br />

disponibles <strong>pour</strong> chaque patient.<br />

Le paradigme « inter-patient » consiste à classifier <strong>de</strong>s battements d’un patient<br />

sur base d’une base <strong>de</strong> données constituée d’<strong>au</strong>tres patients. Cela implique donc<br />

la généralisation d’un patient à un <strong>au</strong>tre. Les résultats <strong>du</strong> premier paradigme sont

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!