Introduction aux Probabilités - Université Rennes 2
Introduction aux Probabilités - Université Rennes 2
Introduction aux Probabilités - Université Rennes 2
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
3.6. Corrigés 163<br />
Exercice 3.25 (Sondage)<br />
1. Puisque le sondage est fait avec remise, la loi suivie par X est binomiale de paramètres n<br />
et p. Notons que si le sondage était fait sans remise dans une population totale de taille<br />
N (comme c’est le cas en pratique, puisqu’on n’interroge pas deux fois la même personne),<br />
ce serait une loi hypergéométrique H(N,n,p) (voir les exercices 2.4 et 2.10). Cependant, et<br />
comme déjà mentionné, dès que n est négligeable devant N, ces deux lois sont très proches<br />
l’une de l’autre : en d’autres termes, si le nombre de sondés est très faible par rapport à la<br />
population totale, il y a très peu de chances d’interroger deux fois la même personne lorsqu’on<br />
effectue un tirage avec remise.<br />
2. Il est implicite ici que n est grand et p pas trop proche de 0, de sorte que nous pouvons<br />
approcher la loi binomiale de paramètres n et p par une loi normale de mêmes espérance et<br />
variance, à savoir np et np(1−p) :<br />
B(n,p) ≈ N(np,np(1−p))<br />
Or une loi normale se concentre à 95% dans un intervalle centré en sa moyenne et de rayon<br />
égal à 1,96 fois l’écart-type, soit :<br />
È(X ∈ [np−1.96 np(1−p),np+1.96 np(1−p)]) = 0.95<br />
3. Un estimateur naturel ˆp de p est tout bonnement la proportion empirique d’électeurs favorables<br />
au candidat, c’est-à-dire ˆp = X/n. Puisque E[X] = np, on a E[ˆp] = p. On dit que ˆp<br />
est un estimateur non biaisé de p, c’est-à-dire qu’en moyenne, avec cet estimateur, on ne se<br />
trompe pas.<br />
4. On a vu qu’avec 95% de chances<br />
np−1.96 np(1−p) ≤ X ≤ np+1.96 np(1−p)<br />
d’où l’on déduit aussitôt qu’avec 95% de chances<br />
<br />
p(1−p)<br />
p−1.96 ≤ ˆp =<br />
n<br />
X<br />
<br />
p(1−p)<br />
≤ p+1.96<br />
n n<br />
5. L’étude de la fonctionx ↦→ x(1−x) permet de voir que pour toutx ∈ [0,1], 0 ≤ x(1−x) ≤ 1/4,<br />
maximum atteint pour x = 1/2. De cette majoration et de la question précédente, on déduit<br />
qu’avec 95% de chances<br />
p− 0.98<br />
√ n ≤ p−1.96<br />
d’où un intervalle de confiance à 95% pour p<br />
<br />
p(1−p) p(1−p)<br />
≤ ˆp ≤ p+1.96<br />
n<br />
n<br />
ˆp− 0.98<br />
√ n ≤ p ≤ ˆp+ 0.98<br />
√ n<br />
≤ p+ 0.98<br />
√ n<br />
6. La taille de cet intervalle de confiance à 95% lorsqu’on interroge n personnes est 1.96/ √ n<br />
donc pour 1000 personnes, il est de diamètre 0.062, soit une marge d’erreur de ±3.1%.<br />
7. Pour savoir combien de personnes interroger pour obtenir un intervalle de confiance à 95%<br />
de rayon 2%, il suffit de résoudre<br />
0.98<br />
√n ≤ 0.02 ⇔ n ≥ 2401<br />
Il faut sonder environ 2400 personnes pour atteindre cette précision. Notons qu’en pratique,<br />
ce n’est pas ce type de sondage qui est utilisé, mais plutôt des sondages stratifiés ou par<br />
quotas.<br />
<strong>Probabilités</strong> Arnaud Guyader - <strong>Rennes</strong> 2