You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Solutions des exercices du Chapitre 2<br />
2.1 Soit X le vecteur à m = 20 composantes contenant les mesures àfaibleniveauprotéique<br />
<strong>et</strong> Y le vecteur à n = 17 composantes contenant les mesures àniveauprotéique élevé.<br />
(a) On pose α =0.25 <strong>et</strong> β =0.75 <strong>et</strong> on obtient:<br />
m(X) =0.453, med(X) =0.750, s(X) =2.805,<br />
[⌊mα⌋] =5,[⌊mβ⌋] = 15, qα(X) =−0.375, qβ(X) =1.385, Iq(X) =1.76;<br />
m(Y )=0.273, med(Y )=0.750, s(Y )=2.007,<br />
[⌊nα⌋] =4,[⌊nβ⌋] = 12, qα(Y )=0.00, qβ(Y )=1.25, Iq(X) =1.25.<br />
Le logiciel R utilise une version lissée de la function de distribution cumulative empirique<br />
dans le calcul des quantiles. Il donne les résultats suivants:<br />
qα(X) =−0.3125, qβ(X) =1.3275, Iq(X) =1.64,<br />
qα(Y )=−0.2500, qβ(X) =1.2500, Iq(X) =1.00.<br />
(b) m(X) >m(Y ), mais les médianes sont identiques. On ne peut pas conclure que ces<br />
résultats soutiennent l’hypotèse.<br />
(c) Après suppression de la donnée 9.00 dans X, onobtient:<br />
m(X) =0.00, med(X) =0.750, s(X) =2.058,<br />
[⌊mα⌋] =4,[⌊mβ⌋] = 14, qα(X) =−1.5, qβ(X) =1.25, Iq(X) =2.75.<br />
Avec R, on obtient Iq =1.635. On remarque que m(X) <strong>et</strong>s(X) changent de façon<br />
importante, tandis que med(X) <strong>et</strong>Iq(X) (version lissée de R) sont presque insensibles<br />
à la suppression de la mesure extrême.<br />
2.2 Soit N le nombre d’étamines. Après élimination de la plus p<strong>et</strong>ite valeur dans les deux<br />
ensembles de données on obtient:<br />
(a) m(N) = 659.32, med(N) = 422, m(log(N)) = 6.056, med(log(N)) = 6.045.<br />
(b) La médiane représente le milieu de la distribution; la moyenne est infuencée par les<br />
valeurs extrêmes (en particulier par les valeurs élevées de N). La moyenne <strong>et</strong> la<br />
médiane de N sont très différentes car la distribution de N est très asymétrique. La<br />
médiane <strong>et</strong> la moyenne de log(N) sonttrès proches, car la distribution de log(N) est<br />
presque symétrique.<br />
(c) On observe que log(med(N)) = 6.045 = med(log(N)).<br />
Ceci s’explique de la façon suivante. Soient n [1] ≤ ...≤ n [99] les valeurs ordonnées de<br />
N. Donc med(N) =n [50] <strong>et</strong> log(med(N)) = log(n [50]). En outre, comme log est une<br />
fonction monotone croissante, les valeurs ordonnées de log(N) sont log(n [1]) ≤ ... ≤<br />
log(n [99]). Donc med(log(N)) = log(n [50]) = log(med(N)).<br />
(g) Avec toutes les données (100), on obtient med(log(N)) = 6.030581 ≈ 6.030685 =<br />
log(med(N)). Il n’y a pas une parfaite égalité car<br />
med(log(N)) = [log(n [50])+log(n [51])]/2 = log[(n [50] + n [51])/2].<br />
(d) Évidemment, la propriété delamédiane que l’on vient d’établir s’étend à tout quantile<br />
(de façon approximative ou exacte selon la définition).<br />
(e) On peut étendre les propriétés susmentionnées à d’autres transformations, pourvu<br />
qu’elle soient monotones croissantes. (Que se passe-t-il pour des transformations<br />
décroissantes ?) La proprété ne vaut pas pour des transformations non monotones:<br />
par exemple, med(sin(N)) = −0.18472 = 0.85554 = sin(med(N)).<br />
(f) On a m(log(N)) = 6.056395 < 6.419214 = log(m(N). La propriété ne vaut pas pour<br />
la moyenne.