Exercices et solutions.pdf - IUMSP

Solutions des exercices du Chapitre 2 

2.1 Soit X le vecteur à m = 20 composantes contenant les mesures àfaibleniveauprotéique 

et Y le vecteur à n = 17 composantes contenant les mesures àniveauprotéique élevé. 

(a) On pose α =0.25 et β =0.75 et on obtient: 

m(X) =0.453, med(X) =0.750, s(X) =2.805, 

[⌊mα⌋] =5,[⌊mβ⌋] = 15, qα(X) =−0.375, qβ(X) =1.385, Iq(X) =1.76; 

m(Y )=0.273, med(Y )=0.750, s(Y )=2.007, 

[⌊nα⌋] =4,[⌊nβ⌋] = 12, qα(Y )=0.00, qβ(Y )=1.25, Iq(X) =1.25. 

Le logiciel R utilise une version lissée de la function de distribution cumulative empirique 

dans le calcul des quantiles. Il donne les résultats suivants: 

qα(X) =−0.3125, qβ(X) =1.3275, Iq(X) =1.64, 

qα(Y )=−0.2500, qβ(X) =1.2500, Iq(X) =1.00. 

(b) m(X) >m(Y ), mais les médianes sont identiques. On ne peut pas conclure que ces 

résultats soutiennent l’hypotèse. 

(c) Après suppression de la donnée 9.00 dans X, onobtient: 

m(X) =0.00, med(X) =0.750, s(X) =2.058, 

[⌊mα⌋] =4,[⌊mβ⌋] = 14, qα(X) =−1.5, qβ(X) =1.25, Iq(X) =2.75. 

Avec R, on obtient Iq =1.635. On remarque que m(X) ets(X) changent de façon 

importante, tandis que med(X) etIq(X) (version lissée de R) sont presque insensibles 

à la suppression de la mesure extrême. 

2.2 Soit N le nombre d’étamines. Après élimination de la plus petite valeur dans les deux 

ensembles de données on obtient: 

(a) m(N) = 659.32, med(N) = 422, m(log(N)) = 6.056, med(log(N)) = 6.045. 

(b) La médiane représente le milieu de la distribution; la moyenne est infuencée par les 

valeurs extrêmes (en particulier par les valeurs élevées de N). La moyenne et la 

médiane de N sont très différentes car la distribution de N est très asymétrique. La 

médiane et la moyenne de log(N) sonttrès proches, car la distribution de log(N) est 

presque symétrique. 

(c) On observe que log(med(N)) = 6.045 = med(log(N)). 

Ceci s’explique de la façon suivante. Soient n [1] ≤ ...≤ n [99] les valeurs ordonnées de 

N. Donc med(N) =n [50] et log(med(N)) = log(n [50]). En outre, comme log est une 

fonction monotone croissante, les valeurs ordonnées de log(N) sont log(n [1]) ≤ ... ≤ 

log(n [99]). Donc med(log(N)) = log(n [50]) = log(med(N)). 

(g) Avec toutes les données (100), on obtient med(log(N)) = 6.030581 ≈ 6.030685 = 

log(med(N)). Il n’y a pas une parfaite égalité car 

med(log(N)) = [log(n [50])+log(n [51])]/2 = log[(n [50] + n [51])/2]. 

(d) Évidemment, la propriété delamédiane que l’on vient d’établir s’étend à tout quantile 

(de façon approximative ou exacte selon la définition). 

(e) On peut étendre les propriétés susmentionnées à d’autres transformations, pourvu 

qu’elle soient monotones croissantes. (Que se passe-t-il pour des transformations 

décroissantes ?) La proprété ne vaut pas pour des transformations non monotones: 

par exemple, med(sin(N)) = −0.18472 = 0.85554 = sin(med(N)). 

(f) On a m(log(N)) = 6.056395 < 6.419214 = log(m(N). La propriété ne vaut pas pour 

la moyenne.

Previous page

Next page

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

Exercices et solutions.pdf - IUMSP

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?