17.04.2013 Views

Guide pratique pour la conception d'enquêtes sur les ménages

Guide pratique pour la conception d'enquêtes sur les ménages

Guide pratique pour la conception d'enquêtes sur les ménages

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Le traitement des données dans <strong>les</strong> enquêtes <strong>sur</strong> <strong>les</strong> <strong>ménages</strong> 221<br />

• Sh<br />

= nombre de <strong>ménages</strong> faisant partie de <strong>la</strong> strate d’échantillonnage en 1982<br />

• ah<br />

= taille de <strong>la</strong> ZE sélectionnée faisant partie de <strong>la</strong> strate d’échantillonnage<br />

• Rh<br />

= nombre de subdivisions représentées dans l’échantillon tiré de <strong>la</strong> strate d’échantillonnage<br />

• bhr<br />

= nombre de ZE sélectionnées dans <strong>la</strong> subdivision<br />

• Shi<br />

= nombre de <strong>ménages</strong> faisant partie de <strong>la</strong> ZE en 1982<br />

• Mhi<br />

= nombre de <strong>ménages</strong> faisant partie de <strong>la</strong> ZE en 1987<br />

• mhi<br />

= taille du ménage faisant partie de l’échantillon de <strong>la</strong> ZE.<br />

Valeurs variab<strong>les</strong> observées: dénotent <strong>les</strong> variab<strong>les</strong> des <strong>ménages</strong>.<br />

Variab<strong>les</strong> de pondération: dénote <strong>la</strong> variable de pondération <strong>pour</strong> le ménage.<br />

117. Les fichiers d’individus sont organisés comme <strong>les</strong> fichiers de <strong>ménages</strong> présentés ci-dessus, sous<br />

réserve d’une différence mineure, à savoir que l’identification concernera <strong>la</strong> personne (PID) et que<br />

l’index (k) se rapportera à <strong>la</strong> personne visée, tandis que <strong>les</strong> « variab<strong>les</strong> » se référeront aux variab<strong>les</strong><br />

des individus.<br />

118 Au stade de leur diffusion, il suffit d’organiser <strong>les</strong> données en fichiers p<strong>la</strong>ts distincts (un <strong>pour</strong><br />

chaque type d’entrées) car le format de longueur fixe de <strong>la</strong> structure originelle vaut aussi <strong>pour</strong> le<br />

transfert des données à des systèmes standard de gestion des données (DBMS) <strong>pour</strong> d’autres opérations<br />

de traitement ou à des logiciels standard à des fins de tabu<strong>la</strong>tion et d’analyse. Il est très facile<br />

de transférer <strong>les</strong> données à des systèmes de gestion de base de données car <strong>la</strong> structure originelle peut<br />

être traduite presque directement sous le format standard DBF que tous <strong>les</strong> systèmes acceptent <strong>pour</strong><br />

l’entrée de tableaux (dans ce cas particulier, <strong>les</strong> codes d’identification des entrées constituent <strong>les</strong> liens<br />

naturels entre <strong>les</strong> tableaux) (Munoz, 2003).<br />

9.4.3.5.<br />

Procédures des estimations et calcul des pondérations<br />

119. Le chapitre 6 a donné une description détaillée de <strong>la</strong> raison d’être et de <strong>la</strong> méthode de calcul<br />

des pondérations des données d’enquêtes <strong>sur</strong> <strong>les</strong> <strong>ménages</strong> (voir également <strong>les</strong> ouvrages de Rosen cités<br />

à <strong>la</strong> fin du présent chapitre). Un algorithme de calcul qui, à partir des valeurs observées, permet<br />

d’obtenir des estimations des caractéristiques statistiques, est l’une des procédures d’estimation ponctuelle<br />

qui peuvent être suivies. Pour commencer, il est calculé une pondération <strong>pour</strong> chaque objet<br />

déc<strong>la</strong>rant. Il est ensuite calculé des estimations des « totaux » en ajoutant <strong>les</strong> valeurs d’observation<br />

pondérées (valeurs observées multipliées par <strong>la</strong> pondération correspondante).<br />

120. Munoz (2003) donne une bonne description de l’utilisation qui peut être faite du système<br />

Microsoft Excel <strong>pour</strong> appliquer <strong>la</strong> procédure d’échantillonnage tout au long de ses principa<strong>les</strong> phases:<br />

organisation du cadre à utiliser pendant <strong>la</strong> première phase; sélection des unités primaires d’échantillonnage<br />

<strong>sur</strong> <strong>la</strong> base d’une probabilité proportionnelle à <strong>la</strong> taille; et calcul des probabilités de sélection<br />

et des pondérations d’échantillonnage correspondantes.<br />

121. La construction proprement dite des estimations pondérées est simple. L’on commence par <strong>la</strong><br />

série de données originelle et l’on créé ensuite une nouvelle série de données en multipliant chaque<br />

observation par le nombre de fois spécifié par sa pondération avant d’utiliser <strong>les</strong> formu<strong>les</strong> standard<br />

<strong>pour</strong> calculer le paramètre considéré <strong>sur</strong> <strong>la</strong> base de <strong>la</strong> série de données pondérées.<br />

122. Il y a lieu de noter toutefois que, <strong>pour</strong> être exactes, <strong>les</strong> pondérations doivent comporter trois<br />

éléments (Yansaneh, 2003), y compris <strong>les</strong> divers ajustements requis (voir aussi le chapitre 6). Les pondérations<br />

de base tiennent compte de <strong>la</strong> variation des probabilités de sélection des différents groupes

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!