UNIVERSIT DU QUBEC MONTRAL - Laboratoire d'études de la ...
UNIVERSIT DU QUBEC MONTRAL - Laboratoire d'études de la ...
UNIVERSIT DU QUBEC MONTRAL - Laboratoire d'études de la ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
-------------+--------------------------------------------------------<br />
earng42 | 26807 28602.82 36368.41 -65000 835500<br />
-> summarize earng42 if gen<strong>de</strong>r=="female"<br />
Variable | Obs Mean Std. Dev. Min Max<br />
-------------+--------------------------------------------------------<br />
earng42 | 29409 15423.77 21238.9 -28000 410000<br />
Voir aussi help for, help foreach et help forvalues.<br />
7.4 Remo<strong>de</strong>ler une base <strong>de</strong> données<br />
Certaines enquêtes mesurent plusieurs fois les mêmes variables auprès <strong>de</strong>s mêmes unités<br />
d’observation.<br />
Dans les enquêtes biographiques, on recueille <strong>de</strong> l’information sur les différents aspects<br />
<strong>de</strong> <strong>la</strong> biographie <strong>de</strong>s individus, par exemple sur chacun <strong>de</strong> ses emplois ou chacune <strong>de</strong> ses<br />
unions. Dans une telle enquête, on recueille donc une série complète <strong>de</strong> réponses aux<br />
questions sur les caractéristiques <strong>de</strong> l’emploi pour chacun <strong>de</strong>s emplois et une série<br />
complète <strong>de</strong> réponses aux questions sur les caractéristiques <strong>de</strong> l’union pour chacune <strong>de</strong>s<br />
unions.<br />
Dans les enquêtes à passages répétés, on s’intéresse généralement à l’évolution d’une ou<br />
plusieurs caractéristiques au fil du temps. On aura donc, par exemple, plusieurs mesures<br />
du revenu ou <strong>de</strong>s résultats sco<strong>la</strong>ires réalisées auprès <strong>de</strong>s mêmes individus à <strong>de</strong>s moments<br />
différents.<br />
Dans les <strong>de</strong>ux cas, on se trouve donc à <strong>de</strong>voir stocker plusieurs séries <strong>de</strong> variables<br />
semb<strong>la</strong>bles pour chaque individu. Il existe plusieurs manières <strong>de</strong> stocker <strong>de</strong>s séries <strong>de</strong><br />
variables semb<strong>la</strong>bles et Stata permet d’en utiliser facilement <strong>de</strong>ux : <strong>la</strong> métho<strong>de</strong> dans<br />
<strong>la</strong>quelle on conserve chaque série <strong>de</strong> variables dans une ligne différente d’un fichier <strong>de</strong><br />
données et <strong>la</strong> métho<strong>de</strong> dans <strong>la</strong>quelle on ajoute les séries <strong>de</strong> variables les unes à <strong>la</strong> suite <strong>de</strong><br />
autres sur <strong>la</strong> même ligne. Dans le premier cas, le fichier peut contenir plus d’une ligne par<br />
unité d’observation; dans le second cas, il ne contient qu’une seule ligne par unité<br />
d’observation. Dans le jargon <strong>de</strong> Stata, <strong>la</strong> première métho<strong>de</strong> produit un fichier « long »<br />
(long dataset) alors que <strong>la</strong> secon<strong>de</strong> produit un fichier « <strong>la</strong>rge » (wi<strong>de</strong> dataset).<br />
Chaque métho<strong>de</strong> a ses avantages et ses inconvénients, mais peu importe celle que l’on<br />
choisit pour stocker les données, il <strong>de</strong>vient souvent nécessaire <strong>de</strong> passer d’une forme à<br />
l’autre pour préparer les données nécessaires à une analyse. L’instruction reshape<br />
permet <strong>de</strong> remo<strong>de</strong>ler sans douleur une base longue en base <strong>la</strong>rge et vice versa .<br />
Hébert (2003, p. 29) donne l’exemple suivant :<br />
reshape wi<strong>de</strong> ij_variables, i(varlist) j(varname)<br />
reshape long ij_variables, i(varlist) j(varname)<br />
37