03.07.2013 Views

UNIVERSIT DU QUBEC MONTRAL - Laboratoire d'études de la ...

UNIVERSIT DU QUBEC MONTRAL - Laboratoire d'études de la ...

UNIVERSIT DU QUBEC MONTRAL - Laboratoire d'études de la ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

2.8 Pondération<br />

L’Ontario est plus peuplée que l’Île-du-Prince-Édouard. Par ailleurs, <strong>la</strong> précision d’un<br />

estimé, par exemple l’erreur-type d’une moyenne, varie en raison inverse du carré du<br />

nombre <strong>de</strong>s unités à partir <strong>de</strong> <strong>la</strong>quelle on calcule cet estimé. Il s’ensuit qu’augmenter un<br />

peu <strong>la</strong> taille d’un petit échantillon augmente beaucoup <strong>la</strong> précision <strong>de</strong>s estimés qu’il sert à<br />

calculer alors qu’augmenter, même <strong>de</strong> beaucoup, <strong>la</strong> taille d’un échantillon déjà grand<br />

n’augmente que peu <strong>la</strong> précision <strong>de</strong>s estimés qu’il sert à calculer.<br />

Pour cette raison, lorsqu’on réalise un sondage au Canada, il est habituel <strong>de</strong> construire<br />

l’échantillon en attribuant proportionnellement moins <strong>de</strong> répondants aux provinces les<br />

plus peuplées et proportionnellement plus <strong>de</strong> répondants aux provinces les moins<br />

peuplées. Ceci permet <strong>de</strong> calculer <strong>de</strong>s estimés qui ont une précision raisonnable même<br />

pour l’Île-du-Prince-Édouard sans que cette forme <strong>de</strong> péréquation ne diminue beaucoup<br />

<strong>la</strong> précision <strong>de</strong>s estimés calculés pour l’Ontario.<br />

Ce<strong>la</strong> dit, pour calculer les estimés eux-mêmes — c.-à-d. <strong>la</strong> moyenne elle-même plutôt<br />

que son erreur-type—, et surtout à l’échelle du Canada tout entier, il faut que les<br />

informations recueillies auprès <strong>de</strong>s individus comptent en fonction <strong>de</strong> leur importance<br />

dans <strong>la</strong> popu<strong>la</strong>tion et non pas en fonction <strong>de</strong> leur importance dans l’échantillon. On résout<br />

ce problème en associant à chaque individu une valeur, que l’on nomme son « poids » ou<br />

son « coefficient <strong>de</strong> pondération », qui représente l’importance <strong>de</strong> cet individu dans <strong>la</strong><br />

popu<strong>la</strong>tion et dont on se sert pour calculer les estimés.<br />

Stata permet d’utiliser différents type <strong>de</strong> poids, dont certains correspon<strong>de</strong>nt à <strong>de</strong>s types <strong>de</strong><br />

données qu’on rencontre peu dans <strong>la</strong> recherche en sciences sociales. La forme <strong>de</strong> poids <strong>la</strong><br />

plus courante en sciences sociales est le poids d’échantillonnage, que nous venons <strong>de</strong><br />

décrire. Stata connaît ces poids sous le nom <strong>de</strong> « probability weights »; on les désigne au<br />

moyen <strong>de</strong> l’option pweights ou <strong>de</strong> son abréviation pw, qui sont toujours p<strong>la</strong>cées entre<br />

crochets.<br />

Les enquêtes <strong>de</strong> Statistique Canada utilisent toutes <strong>de</strong>s p<strong>la</strong>ns <strong>de</strong> sondage complexes qui<br />

exigent que l’on utilise <strong>de</strong>s poids pour obtenir <strong>de</strong>s estimés qui décrivent correctement <strong>la</strong><br />

popu<strong>la</strong>tion. L’usage <strong>de</strong> tels p<strong>la</strong>ns <strong>de</strong> sondage exige également que l’on utilise une<br />

approche spéciale pour calculer les erreurs-types <strong>de</strong>s estimés. Stata permet d’utiliser<br />

différentes approches pour calculer <strong>de</strong>s erreurs-types correctes lorsqu’on utilise <strong>de</strong>s<br />

données obtenues au moyen d’un p<strong>la</strong>n <strong>de</strong> sondage complexe. Règle générale, ceci se fait<br />

en décrivant les caractéristiques du p<strong>la</strong>n <strong>de</strong> sondage au moyen <strong>de</strong> l’instruction svyset<br />

puis en p<strong>la</strong>çant le préfixe svy <strong>de</strong>vant les instructions <strong>de</strong> Stata qui permettent <strong>de</strong> calculer<br />

<strong>de</strong>s estimés simples, comme <strong>de</strong>s moyennes et <strong>de</strong>s proportions, ou plus avancées, comme<br />

<strong>de</strong>s coefficients <strong>de</strong> régression.<br />

L’usage <strong>de</strong>s poids et <strong>de</strong>s approches qui permettent <strong>de</strong> calculer correctement les erreurstypes<br />

dépasse le cadre <strong>de</strong> cet atelier qui est une introduction au logiciel et non un cours <strong>de</strong><br />

statistique ou <strong>de</strong> métho<strong>de</strong>s quantitatives. Pour cette raison, il est important <strong>de</strong> comprendre<br />

que les instructions que l’on voit dans cet atelier permettent d’examiner les données, <strong>de</strong><br />

les transformer et <strong>de</strong> les préparer pour <strong>de</strong>s analyses, mais ne permettent pas <strong>de</strong> réaliser<br />

<strong>de</strong>s calculs dont les résultats soient généralisables à <strong>la</strong> popu<strong>la</strong>tion.<br />

8

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!