17.04.2013 Views

Guide pratique pour la conception d'enquêtes sur les ménages

Guide pratique pour la conception d'enquêtes sur les ménages

Guide pratique pour la conception d'enquêtes sur les ménages

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Estimation des erreurs d’échantillonnage dans <strong>les</strong> données d’enquête 155<br />

7.5.2.<br />

Préparation des fichiers de données aux fins de l’analyse<br />

35. Les données rassemblées au cours des enquêtes menées dans <strong>les</strong> pays en développement ne se<br />

prêtent parfois pas à une analyse al<strong>la</strong>nt au-delà de fréquences et de tabu<strong>la</strong>tions de base. Il y a à ce<strong>la</strong><br />

plusieurs raisons. Premièrement, il se peut que <strong>la</strong> documentation technique concernant <strong>la</strong> <strong>conception</strong><br />

de l’échantillon utilisé soit très limitée, voire inexistante. Deuxièmement, il arrive que <strong>les</strong> fichiers<br />

de données n’aient pas le format, <strong>la</strong> structure et <strong>les</strong> informations requis <strong>pour</strong> permettre une analyse<br />

poussée. Troisièmement, il se peut que <strong>les</strong> logiciels appropriés et <strong>les</strong> compétences techniques voulues<br />

fassent défaut.<br />

36. Si l’on veut pouvoir analyser comme il convient <strong>les</strong> données des enquêtes pas sondage, <strong>la</strong><br />

base de données connexe doit contenir toutes <strong>les</strong> informations reflétant le processus de sélection de<br />

l’échantillon (voir le chapitre 5 <strong>pour</strong> de plus amp<strong>les</strong> détails). En particulier, <strong>la</strong> base de données doit<br />

comporter des étiquettes appropriées <strong>pour</strong> <strong>les</strong> strates prévues par <strong>la</strong> <strong>conception</strong> de l’échantillon,<br />

<strong>les</strong> unités primaires d’échantillonnage (UPE), <strong>les</strong> unités secondaires d’échantillonnage (USE), etc.<br />

Parfois, <strong>les</strong> données et <strong>les</strong> UPE effectivement utilisées <strong>pour</strong> <strong>la</strong> sélection de l’échantillon doivent être<br />

modifiées afin d’estimer <strong>la</strong> variance. Ces modifications sont nécessaires <strong>pour</strong> que <strong>la</strong> <strong>conception</strong> effective<br />

de l’échantillon corresponde à l’une des options disponib<strong>les</strong> au moins des logiciels d’analyses<br />

statistiques (voir <strong>la</strong> section 7.9). Les strates et <strong>les</strong> UPE créées <strong>pour</strong> estimer <strong>la</strong> variance sont parfois<br />

appelées pseudo-strates ou strates de variance, et pseudo-UPE ou UPE de variance. Les variab<strong>les</strong><br />

pertinentes prévues par <strong>la</strong> <strong>conception</strong> de l’échantillon, ainsi que <strong>les</strong> variab<strong>les</strong> créées <strong>pour</strong> l’estimation<br />

de <strong>la</strong> variance, doivent être entrées dans <strong>la</strong> base de données en même temps que <strong>la</strong> documentation<br />

indiquant comment ces variab<strong>les</strong> sont estimées et utilisées. Il faut <strong>pour</strong> estimer <strong>la</strong> variance au moins<br />

trois variab<strong>les</strong>: <strong>la</strong> pondération de l’échantillon, <strong>la</strong> strate (ou pseudo-strate) et l’UPE (ou <strong>la</strong> pseudo-<br />

UPE). Ces trois variab<strong>les</strong> résument <strong>la</strong> <strong>conception</strong> de l’échantillon et leur inclusion dans <strong>la</strong> série de<br />

données permet d’analyser comme il convient <strong>les</strong> informations rassemblées compte tenu des complexités<br />

de <strong>la</strong> <strong>conception</strong> de l’échantillon.<br />

37. En outre, il faut calculer des pondérations <strong>pour</strong> chacune des unités d’échantillonnage figurant<br />

dans le fichier de données. Ces pondérations doivent refléter <strong>la</strong> probabilité de sélection de chaque<br />

unité d’échantillonnage et compenser <strong>la</strong> non-réponse et d’autres déficiences de l’échantillon. Les<br />

pondérations et <strong>les</strong> étiquettes utilisées <strong>pour</strong> identifier <strong>les</strong> variab<strong>les</strong> de <strong>conception</strong> sont nécessaires <strong>pour</strong><br />

pouvoir estimer comme il convient <strong>la</strong> variabilité et <strong>les</strong> estimations issues de l’enquête. Comme mentionné<br />

au chapitre 6 et dans <strong>les</strong> sections précédentes du présent chapitre, <strong>les</strong> pondérations d’échantillonnage<br />

sont importantes non seulement <strong>pour</strong> pouvoir générer des estimations d’enquête appropriées<br />

mais aussi <strong>pour</strong> évaluer <strong>les</strong> erreurs d’échantillonnage qui caractérisent ces estimations. Il est<br />

donc essentiel que toutes <strong>les</strong> informations concernant <strong>les</strong> pondérations figurent dans le fichier de<br />

données. En particulier, en présence d’une non-réponse, d’une post-stratification ou d’autres types<br />

d’ajustement, <strong>la</strong> documentation doit contenir une description des procédures suivies <strong>pour</strong> procéder<br />

à ces ajustements.<br />

7.5.3.<br />

Types d’estimations d’enquête<br />

38. Pour <strong>la</strong> plupart des enquêtes <strong>sur</strong> <strong>les</strong> <strong>ménages</strong>, <strong>les</strong> estimations <strong>les</strong> plus communément recherchées<br />

se présentent sous forme de totaux et de ratios. Prenons le cas d’une <strong>conception</strong> stratifiée en

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!