04.07.2013 Views

Exercices et solutions.pdf - IUMSP

Exercices et solutions.pdf - IUMSP

Exercices et solutions.pdf - IUMSP

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Solutions des exercices du Chapitre 2<br />

2.1 Soit X le vecteur à m = 20 composantes contenant les mesures àfaibleniveauprotéique<br />

<strong>et</strong> Y le vecteur à n = 17 composantes contenant les mesures àniveauprotéique élevé.<br />

(a) On pose α =0.25 <strong>et</strong> β =0.75 <strong>et</strong> on obtient:<br />

m(X) =0.453, med(X) =0.750, s(X) =2.805,<br />

[⌊mα⌋] =5,[⌊mβ⌋] = 15, qα(X) =−0.375, qβ(X) =1.385, Iq(X) =1.76;<br />

m(Y )=0.273, med(Y )=0.750, s(Y )=2.007,<br />

[⌊nα⌋] =4,[⌊nβ⌋] = 12, qα(Y )=0.00, qβ(Y )=1.25, Iq(X) =1.25.<br />

Le logiciel R utilise une version lissée de la function de distribution cumulative empirique<br />

dans le calcul des quantiles. Il donne les résultats suivants:<br />

qα(X) =−0.3125, qβ(X) =1.3275, Iq(X) =1.64,<br />

qα(Y )=−0.2500, qβ(X) =1.2500, Iq(X) =1.00.<br />

(b) m(X) >m(Y ), mais les médianes sont identiques. On ne peut pas conclure que ces<br />

résultats soutiennent l’hypotèse.<br />

(c) Après suppression de la donnée 9.00 dans X, onobtient:<br />

m(X) =0.00, med(X) =0.750, s(X) =2.058,<br />

[⌊mα⌋] =4,[⌊mβ⌋] = 14, qα(X) =−1.5, qβ(X) =1.25, Iq(X) =2.75.<br />

Avec R, on obtient Iq =1.635. On remarque que m(X) <strong>et</strong>s(X) changent de façon<br />

importante, tandis que med(X) <strong>et</strong>Iq(X) (version lissée de R) sont presque insensibles<br />

à la suppression de la mesure extrême.<br />

2.2 Soit N le nombre d’étamines. Après élimination de la plus p<strong>et</strong>ite valeur dans les deux<br />

ensembles de données on obtient:<br />

(a) m(N) = 659.32, med(N) = 422, m(log(N)) = 6.056, med(log(N)) = 6.045.<br />

(b) La médiane représente le milieu de la distribution; la moyenne est infuencée par les<br />

valeurs extrêmes (en particulier par les valeurs élevées de N). La moyenne <strong>et</strong> la<br />

médiane de N sont très différentes car la distribution de N est très asymétrique. La<br />

médiane <strong>et</strong> la moyenne de log(N) sonttrès proches, car la distribution de log(N) est<br />

presque symétrique.<br />

(c) On observe que log(med(N)) = 6.045 = med(log(N)).<br />

Ceci s’explique de la façon suivante. Soient n [1] ≤ ...≤ n [99] les valeurs ordonnées de<br />

N. Donc med(N) =n [50] <strong>et</strong> log(med(N)) = log(n [50]). En outre, comme log est une<br />

fonction monotone croissante, les valeurs ordonnées de log(N) sont log(n [1]) ≤ ... ≤<br />

log(n [99]). Donc med(log(N)) = log(n [50]) = log(med(N)).<br />

(g) Avec toutes les données (100), on obtient med(log(N)) = 6.030581 ≈ 6.030685 =<br />

log(med(N)). Il n’y a pas une parfaite égalité car<br />

med(log(N)) = [log(n [50])+log(n [51])]/2 = log[(n [50] + n [51])/2].<br />

(d) Évidemment, la propriété delamédiane que l’on vient d’établir s’étend à tout quantile<br />

(de façon approximative ou exacte selon la définition).<br />

(e) On peut étendre les propriétés susmentionnées à d’autres transformations, pourvu<br />

qu’elle soient monotones croissantes. (Que se passe-t-il pour des transformations<br />

décroissantes ?) La proprété ne vaut pas pour des transformations non monotones:<br />

par exemple, med(sin(N)) = −0.18472 = 0.85554 = sin(med(N)).<br />

(f) On a m(log(N)) = 6.056395 < 6.419214 = log(m(N). La propriété ne vaut pas pour<br />

la moyenne.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!