17.04.2013 Views

Guide pratique pour la conception d'enquêtes sur les ménages

Guide pratique pour la conception d'enquêtes sur les ménages

Guide pratique pour la conception d'enquêtes sur les ménages

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Le traitement des données dans <strong>les</strong> enquêtes <strong>sur</strong> <strong>les</strong> <strong>ménages</strong> 213<br />

Cependant, <strong>la</strong> même erreur, s’agissant des dépenses mensuel<strong>les</strong> d’alimentation, risque aisément de ne<br />

pas être détectée, car 14 dol<strong>la</strong>rs ou 41 dol<strong>la</strong>rs peuvent être des montants p<strong>la</strong>usib<strong>les</strong>. Pour éviter une<br />

telle situation, l’on demande généralement à deux opérateurs différents d’entrer deux fois <strong>les</strong> données<br />

provenant de chaque questionnaire.<br />

Données manquantes<br />

81. Lorsque commence le traitement, il y aura très certainement beaucoup de données manquantes.<br />

Il se peut que certains <strong>ménages</strong> aient déménagé ou aient refusé de répondre, qu’il n’ait pas été apporté<br />

de réponse à certaines des questions figurant dans le questionnaire, ou bien que certaines informations<br />

soient incompatib<strong>les</strong> avec <strong>les</strong> autres données figurant dans <strong>les</strong> réponses au questionnaire. Quelle<br />

que soit <strong>la</strong> raison, l’on se trouve en présence d’une rubrique manquante, vide ou incomplète.<br />

82. Il importe d’établir une distinction entre <strong>les</strong> données manquantes — c’est-à-dire <strong>les</strong> données<br />

qui devraient être présentes mais dont <strong>la</strong> valeur correcte est inconnue — et <strong>les</strong> données néant. Par<br />

exemple, un questionnaire <strong>pour</strong>ra être vide parce que le ménage a refusé de répondre à l’enquête,<br />

tandis qu’une partie d’un deuxième questionnaire <strong>pour</strong>ra être vide parce que le ménage n’a rien semé<br />

dans ses champs. Dans le deuxième cas, <strong>la</strong> variable « superficie ensemencée » devra être indiquée<br />

comme étant néant. De tel<strong>les</strong> entrées doivent être conservées dans le fichier <strong>pour</strong> analyse et tabu<strong>la</strong>tion.<br />

83. La marche à suivre dans le cas de données véritablement manquantes dépend du type de données<br />

qui fait défaut. Un élément sélectionné de l’échantillon peut être totalement absent en raison<br />

du refus du ménage de participer à l’enquête ou de l’incapacité du déc<strong>la</strong>rant de répondre à toutes <strong>les</strong><br />

questions. En pareil cas, l’on dit qu’il y a eu « non-réponse unitaire ».<br />

84. Si le déc<strong>la</strong>rant ne peut répondre qu’à certaines des questions mais pas à d’autres, il y a « nonréponse<br />

ponctuelle/partielle » parce qu’il a été obtenu au sujet du ménage certaines informations,<br />

mais pas toutes.<br />

85. Comme ce<strong>la</strong> a été souligné à maintes reprises dans le présent guide, <strong>les</strong> données manquantes,<br />

quel qu’en soit le type, débouchent <strong>sur</strong> des estimations faussées. Pour une discussion détaillée du<br />

traitement réservé aux cas de non-réponse, y compris <strong>les</strong> méthodes d’ajustement, voir le chapitre 6.<br />

86. En cas de non-réponse partielle, il peut être nécessaire, <strong>pour</strong> que <strong>les</strong> totaux correspondent, de<br />

remp<strong>la</strong>cer <strong>les</strong> valeurs manquantes par des estimations raisonnab<strong>les</strong>. C’est ce que l’on appelle l’imputation,<br />

comme on l’a vu au chapitre 6. Plusieurs méthodes peuvent être utilisées <strong>pour</strong> imputer des<br />

valeurs de remp<strong>la</strong>cement. Certaines d’entre el<strong>les</strong> sont :<br />

• L’imputation de <strong>la</strong> valeur moyenne : <strong>la</strong> valeur moyenne (de l’UPE ou de toutes <strong>les</strong> séries de<br />

données) est utilisée <strong>pour</strong> imputer <strong>la</strong> valeur manquante;<br />

• L’imputation séquentielle : <strong>les</strong> valeurs manquantes sont empruntées à un dossier (donateur)<br />

semb<strong>la</strong>ble au dossier incomplet. Le dossier donateur doit avoir été dûment vérifié;<br />

• L’imputation statistique : une re<strong>la</strong>tion (régression, ratio) est utilisée simultanément avec une<br />

autre variable tirée de données complètes <strong>pour</strong> imputer <strong>la</strong> valeur manquante.<br />

87. Ces méthodes ne sont que quelques-unes de cel<strong>les</strong> auxquel<strong>les</strong> il est possible d’avoir recours<br />

<strong>pour</strong> imputer des valeurs manquantes, mais il en existe plusieurs autres. L’efficacité de l’imputation<br />

dépendra évidemment de <strong>la</strong> me<strong>sur</strong>e dans <strong>la</strong>quelle le module d’imputation capture <strong>la</strong> non-réponse.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!