Traitement automatique du signal ECG pour l'aide au diagnostic de ...

More documents

Recommendations

Info

CHAPITRE 3. EFFET DU SOUS-ÉCHANTILLONNAGE 28 L’hypothèse des variances communes cause l’annulation du facteur de normalisation et de la partie quadratique de l’exponentielle de l’Equation (3.13). La frontière de décision entre les classes c et l sera donc linéaire. La région où P r(H = c|X = x) = P r(H = l|X = x) sera linéaire en x, et en p dimensions sera un hyperplan. Il en va de même pour toutes les frontières de décision entre deux classes prises deux à deux. On peut voir que l’Equation (3.15) et la fonction discriminante linéaire yc(x) yc(x) = x T Σ −1 µ T c − 1 2 µT c Σ −1 µ c + log πc (3.16) sont équivalentes en termes de décision, avec H(x) = argmaxc yc(x). En pratique on ne connait pas les paramètres de la distribution gaussienne, et on les estime donc grâce à nos données, en veillant à ce que les expressions des estimateurs maximisent la vraisemblance : ˆπc = Nc/N (3.17) Nc ˆµ c = xi/Nc ˆΣc = i=1 C Nc c=1 i=1 (3.18) (xi − ˆµ c)(xi − ˆµ c)) T /(N − C), (3.19) où Nc est le nombre de battements dans la classe c. Une fois les probabilités à postériori connues pour chaque classe, le classifieur attribue l’échantillon à la classe la plus probable. Pour un LDA non-pondéré, expliqué dans [17], la vraisemblance est définie comme : V = C Nc c=1 n=1 log(gc(x, µ c, Σ)), (3.20) où C est le nombre de classes, Nc le nombre de données d’entraînement dans la classe c, et gk(x, µc, Σ) est la valeur de la distribution gaussienne de moyenne ˆµ et de covariance commune ˆ Σ. Or, la proportion relative des classes influence un tel classifieur : si une classe domine les données d’entrainement, alors le classifieur est hautement influencé par ces classes [1], [28]. Une solution pour contrer ce phénomène a été étudiée dans [17]. Elle consiste à pondérer les contributions de chaque donnée d’apprentissage. Pour un LDA pondéré, la vraisemblance s’écrit donc : C Nc V = ωc log(gc(x, µ c, Σ)). (3.21) c=1 n=1
CHAPITRE 3. EFFET DU SOUS-ÉCHANTILLONNAGE 29 Dans ce cas, le maximum de vraisemblance conduit à : Nc ˆµ c = xi/Nc i=1 C Nc ˆΣc = ωc (xi − ˆµ c)(xi − ˆµ c)) c=1 i=1 T c / ωcNc c=1 comme estimateur des paramètres des gaussiennes. La probabilité à postériori est donc dans les deux cas : avec : P r(H = C|X = x) = (3.22) (3.23) exp(yc) . (3.24) Cl=1 exp(yl) yc(x) = x T Σ −1 µ T c − 1 2 µT c Σ −1 µ c + log πc. (3.25) Une fois les probabilités à postériori connues pour chaque classe, le classifieur attribue l’échantillon à la classe la plus probable. 3.1.6 Evaluation des performances Pour évaluer les performances de notre classifieur, nous allons utiliser la matrice de confusion. Celle-ci est souvent utilisée en apprentissage supervisé, et est un outil permettant de mesurer la qualité d’un système de classification. prédit - prédit + total réel - vrais positifs faux positifs N− réel + faux négatifs vrais négatifs N+ Table 3.4 – Chaque colonne de la matrice représente le nombre d’occurrences d’une classe prédite, tandis que chaque ligne représente le nombre d’occurrences d’une classe réelle. Pour pouvoir exploiter cette matrice, il est souvent nécessaire de le résumer (parfois jusqu’à un simple scalaire). Cela constitue une perte d’information mais est souvent plus commode, notamment pour ce qui est de maximiser. Ici encore certaines métriques sont souvent utilisées, comme la sensibilité ou la spécificité, la précision (d’une classe ou totale) et l’aire sous la courbe de ROC. Soit vp le nombre de vrais positifs, vpc les vrais positifs de la classe c, fp le nombre de faux positifs, fn le nombre de faux négatifs, vn le nombre de vrais négatifs et Nc le nombre d’occurences réelles dans la classe c. La sensibilité se, la spécificité sp, la précision d’une classe c prc et la précision totale prtot sont définies comme :
Page 1 and 2: Université catholique de Louvain E
Page 3 and 4: TABLE DES MATIÈRES 3 3.4 Discussio
Page 5 and 6: CHAPITRE 1. AVANT-PROPOS 5 unk : Bo
Page 7 and 8: CHAPITRE 2. INTRODUCTION 7 2.1 Anat
Page 9 and 10: CHAPITRE 2. INTRODUCTION 9 Figure 2
Page 11 and 12: CHAPITRE 2. INTRODUCTION 11 Les cla
Page 13 and 14: CHAPITRE 2. INTRODUCTION 13 2.6.1 M
Page 15 and 16: CHAPITRE 3. EFFET DU SOUS-ÉCHANTIL
Page 27: CHAPITRE 3. EFFET DU SOUS-ÉCHANTIL
Page 37 and 38: CHAPITRE 4. EFFET DE LA SÉLECTION
Page 43 and 44: CHAPITRE 5. EFFET DES OUTLIERS 43 C
Page 45 and 46: CHAPITRE 5. EFFET DES OUTLIERS 45 c
Page 47 and 48: CHAPITRE 5. EFFET DES OUTLIERS 47 C
Page 49 and 50: CHAPITRE 5. EFFET DES OUTLIERS 49 F
Page 55 and 56: CHAPITRE 6. VALIDATION DU MODÈLE 5
Page 61 and 62: CHAPITRE 7. CONCLUSIONS 61 Chapitre
Page 63 and 64: CHAPITRE 7. CONCLUSIONS 63 7.4 Trav
Page 65 and 66: BIBLIOGRAPHIE 65 [13] R. Jafari, H.

Traitement automatique du signal ECG pour l'aide au diagnostic de ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?