26.06.2013 Views

Introduction aux Probabilités - Université Rennes 2

Introduction aux Probabilités - Université Rennes 2

Introduction aux Probabilités - Université Rennes 2

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

3.6. Corrigés 163<br />

Exercice 3.25 (Sondage)<br />

1. Puisque le sondage est fait avec remise, la loi suivie par X est binomiale de paramètres n<br />

et p. Notons que si le sondage était fait sans remise dans une population totale de taille<br />

N (comme c’est le cas en pratique, puisqu’on n’interroge pas deux fois la même personne),<br />

ce serait une loi hypergéométrique H(N,n,p) (voir les exercices 2.4 et 2.10). Cependant, et<br />

comme déjà mentionné, dès que n est négligeable devant N, ces deux lois sont très proches<br />

l’une de l’autre : en d’autres termes, si le nombre de sondés est très faible par rapport à la<br />

population totale, il y a très peu de chances d’interroger deux fois la même personne lorsqu’on<br />

effectue un tirage avec remise.<br />

2. Il est implicite ici que n est grand et p pas trop proche de 0, de sorte que nous pouvons<br />

approcher la loi binomiale de paramètres n et p par une loi normale de mêmes espérance et<br />

variance, à savoir np et np(1−p) :<br />

B(n,p) ≈ N(np,np(1−p))<br />

Or une loi normale se concentre à 95% dans un intervalle centré en sa moyenne et de rayon<br />

égal à 1,96 fois l’écart-type, soit :<br />

È(X ∈ [np−1.96 np(1−p),np+1.96 np(1−p)]) = 0.95<br />

3. Un estimateur naturel ˆp de p est tout bonnement la proportion empirique d’électeurs favorables<br />

au candidat, c’est-à-dire ˆp = X/n. Puisque E[X] = np, on a E[ˆp] = p. On dit que ˆp<br />

est un estimateur non biaisé de p, c’est-à-dire qu’en moyenne, avec cet estimateur, on ne se<br />

trompe pas.<br />

4. On a vu qu’avec 95% de chances<br />

np−1.96 np(1−p) ≤ X ≤ np+1.96 np(1−p)<br />

d’où l’on déduit aussitôt qu’avec 95% de chances<br />

<br />

p(1−p)<br />

p−1.96 ≤ ˆp =<br />

n<br />

X<br />

<br />

p(1−p)<br />

≤ p+1.96<br />

n n<br />

5. L’étude de la fonctionx ↦→ x(1−x) permet de voir que pour toutx ∈ [0,1], 0 ≤ x(1−x) ≤ 1/4,<br />

maximum atteint pour x = 1/2. De cette majoration et de la question précédente, on déduit<br />

qu’avec 95% de chances<br />

p− 0.98<br />

√ n ≤ p−1.96<br />

d’où un intervalle de confiance à 95% pour p<br />

<br />

p(1−p) p(1−p)<br />

≤ ˆp ≤ p+1.96<br />

n<br />

n<br />

ˆp− 0.98<br />

√ n ≤ p ≤ ˆp+ 0.98<br />

√ n<br />

≤ p+ 0.98<br />

√ n<br />

6. La taille de cet intervalle de confiance à 95% lorsqu’on interroge n personnes est 1.96/ √ n<br />

donc pour 1000 personnes, il est de diamètre 0.062, soit une marge d’erreur de ±3.1%.<br />

7. Pour savoir combien de personnes interroger pour obtenir un intervalle de confiance à 95%<br />

de rayon 2%, il suffit de résoudre<br />

0.98<br />

√n ≤ 0.02 ⇔ n ≥ 2401<br />

Il faut sonder environ 2400 personnes pour atteindre cette précision. Notons qu’en pratique,<br />

ce n’est pas ce type de sondage qui est utilisé, mais plutôt des sondages stratifiés ou par<br />

quotas.<br />

<strong>Probabilités</strong> Arnaud Guyader - <strong>Rennes</strong> 2

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!